本週AI工程動態:阿里Qwen3、Google AlphaEvolve、Meta 3D模型、OpenAI新工具等重磅登場
阿里巴巴Qwen 3:網頁開發者夢寐以求的AI模型
阿里巴巴最新推出嘅Qwen3模型,採用混合專家(Mixture of Experts, MoE)架構,結合強化推理能力。佢訓練咗大約36萬億個token(比Qwen2.5多一倍),覆蓋119種語言同方言。
– 模型規格:Qwen3-235B-A22B有2350億參數,專為編程、數學同一般推理任務優化。
– 表現:喺各大基準測試上表現出色,媲美DeepSeek-R1同Gemini-2.5-Pro等頂級模型。
– 網頁開發應用:特別擅長前端開發,可以根據設計規格自動生成高質素、回應式UI。
Qwen3喺數學、編程、推理等測試上超越舊有Qwen系列。例如Qwen3-30B-A3B(30B MoE)用更少參數都可以打敗32B QwQ模型,就算4B Qwen3都追得上Qwen2.5-72B。整體嚟講,Qwen3嘅密集底座已經同甚至超越更大規模嘅Qwen2.5模型,尤其喺STEM同編程領域。
Google AlphaEvolve:AI重新定義算法設計
Google DeepMind嘅AlphaEvolve突破傳統算法設計,效率上已經超越人類手工設計。
– 矩陣乘法突破:AlphaEvolve發現咗一種新方法,只用47步就可以完成4×4矩陣乘法,打破1969年Strassen算法49步嘅紀錄。佢仲改善咗14種矩陣乘法算法,超越之前DeepMind嘅AlphaTensor。
– 應用場景:包括數據中心排程、芯片設計、語言模型效率優化等。
– 意義:證明AI已經有能力生成全新、可證明正確嘅算法,標誌住AI創新邁向新里程碑。
測試過50多個數學同計算機公開難題,AlphaEvolve約有75%能重現已知解法,20%能進一步優化(例如11維「親吻數問題」將紀錄由592提升到593)。
Meta AssetGen 2.0:頂級AI 3D模型生成
Meta公佈咗AssetGen 2.0,係AI驅動3D內容創作嘅重大突破。呢個單階段3D擴散模型,可以直接由文字提示生成高質素3D網格,唔使經過中間表示。
– TextureGen整合:AssetGen 2.0結合咗TextureGen,能夠用物理基礎渲染(PBR)技術,生成高解像度、視角一致嘅貼圖,令3D資產幾何同視覺都極度逼真。
– 訓練數據:用大量3D資產訓練,確保輸出多元而且準確。雖然Meta未有公開數據集細節,但已知係大規模3D資產庫。
應用:AssetGen 2.0已經喺Meta內部用嚟創建VR世界內容同Avatar資產,2025年會開放俾Meta Horizon創作者,未來甚至可以自動生成完整3D場景。
IBM Bamba-9B v2:高效語言建模新選擇
– 訓練強化:多訓練咗1萬億token,效能大幅提升。
– 基準測試:喺NLP標準榜單(L1/L2)上打敗Meta嘅Llama 3.1 8B(後者訓練數據多7倍)。Bamba-9B支援超長上下文,雖然訓練時用4K序列,但實測可處理32K甚至100K+ token。
– 開源部署:完全開源(Apache 2.0),可彈性部署,支援量化高效推理。
OpenAI ChatGPT連接GitHub:開發者研究新利器
OpenAI為ChatGPT(GPT-4)推出GitHub連接器,令ChatGPT可以安全連結GitHub倉庫,讀取程式碼、文件、issue等,並提供智能分析。
– 自然語言查詢:用戶可以用自然語言問關於自己代碼庫嘅問題,ChatGPT會按上下文回應。
– 代碼摘要:自動生成函數、模組摘要,幫助理解複雜結構。
– 依賴映射:自動識別同可視化代碼依賴。
– 適用範圍:現正向ChatGPT Plus、Pro及Team用戶推出,未來會支援Enterprise同Education。
Amazon Project Kiro:AWS新AI編碼助手
AWS正開發Project Kiro,一個AI驅動嘅編碼助手,目標係簡化軟件開發流程。Kiro係網頁/桌面應用,能夠協調多個AI agent(Amazon自家同第三方),結合領域知識同擴展,自動化軟件開發任務。
– 多模態介面:支援文字、圖表、結構化數據輸入。
– 即時代碼生成:根據用戶提示同上下文,AI agent即時生成代碼片段。
– 無縫整合:可以同現有AWS工具及服務無縫配合。
– 部署計劃:預計2025年6月底進入beta,會有網頁同桌面版本,滿足唔同開發者需求。
你應該認識嘅AI工具與新發佈
WebThinker:自主網絡研究Agent
WebThinker令大型推理模型可以自主瀏覽網絡、獲取即時資訊、生成詳細研究報告。
– 深層網絡探索:動態搜尋同導航網頁。
– 自主思考—搜尋—草擬:整合推理、資料收集、報告撰寫。
– 強化學習訓練:用Direct Preference Optimization提升研究能力。
DeerFlow:社群驅動深度研究框架
ByteDance開發嘅開源框架,結合語言模型同專業工具,支援全面研究任務。
– 架構:基於LangChain同LangGraph,模組化、可擴展。
– 能力:支援網絡搜尋、爬蟲、Python執行等。
– 社群導向:整合現有工具,回饋開源社群。
SunaAI:開源通用AI Agent
Kortix AI推出嘅SunaAI,完全開源,能夠自主執行現實任務。
– 功能:與虛擬系統互動、寫文件、執行代碼、上網瀏覽。
– 部署:Apache 2.0授權,支援雲端或自架設。
– 應用:適合研究、數據分析、日常自動化。
DocuWriter.ai:自動化代碼及API文件生成
DocuWriter.ai係一個AI驅動網頁應用,能從原始代碼自動產生文件。
– 代碼註解生成:自動為代碼加上說明。
– UML圖生成:可視化代碼結構。
– AI測試套件生成:自動產生測試確保代碼可靠。
– 智能重構建議:提出更乾淨高效嘅代碼建議。
編輯評論:AI工程進化,從「工具」到「夥伴」
今期幾個重點發展,反映AI工程已經由單純「輔助工具」進化到「智能協作夥伴」階段。阿里Qwen3、Google AlphaEvolve等新模型,不再只係追求大規模數據同參數,而係開始針對專業領域(如前端開發、算法設計等)做深度優化,甚至可以自發發現新算法、突破人類極限。
Meta AssetGen 2.0則標誌住AI內容創作由2D文字、圖片,正式進入3D時代。當AI可以由幾句提示自動生成高質素3D資產,唔單止令遊戲、元宇宙、VR產業生態更豐富,仲有機會顛覆設計、建築、工業等傳統行業。
OpenAI同AWS等巨頭,則聚焦如何令開發者更易用AI。ChatGPT連接GitHub、Kiro多模態介面,目的都係降低技術門檻,令AI真正融入日常開發流程。未來,AI唔再係「外來助手」,而係變成每個工程師、設計師、研究員工作流程不可或缺嘅「智能拍檔」。
而新一代AI工具如WebThinker、DeerFlow、SunaAI等,則展現咗AI社群對「開源」、「自治」嘅追求。當AI agent可以自主探索、決策、執行複雜任務,未來「個人AI」同「企業AI」之間界線將會越嚟越模糊。
香港本地AI發展雖然仲有距離,但全球AI工程走勢已經非常明確——開源、專業化、自主化、低門檻。對本地開發者、創業者嚟講,最關鍵唔係追逐參數規模,而係點樣用好呢啲AI「新夥伴」,創造出真正屬於自己市場、文化、產業特色嘅AI應用。未來AI工程唔單止係技術競賽,更係創意、社群同價值觀嘅比拼。
下星期再見,各位AI狂熱者,繼續Happy Building!