【投資水資源】阿里巴巴Qwen系列AI大突破!1080p動畫同步生成登場




本週AI發展回顧(2025年9月27日)——阿里巴巴Qwen系列、谷歌Gemini更新及多款前沿AI產品發布

本週,阿里巴巴在其Apsara雲與AI大會期間,帶來了一系列重量級AI模型更新與開源項目,成為焦點。除此之外,谷歌、DeepMind、微軟、Meta等科技巨頭也紛紛推出新技術和產品,推動AI生態持續高速發展。以下是本週AI領域的重點動態解析:

阿里巴巴Qwen系列AI模型大爆發

阿里Qwen團隊發布了多款新型AI模型,涵蓋文本、圖像、語音及多模態領域。其旗艦產品Qwen3-Max擁有超過1兆參數,具備卓越的編碼生成和智能代理調用能力,並已上線阿里雲Model Studio平台。多模態模型Qwen3-VL專注於視覺與文本結合的推理任務,其235B版本在視覺推理表現上甚至超越GPT-5。

新推出的Qwen-Image-Edit-2509提升了多圖像像素級編輯能力,能夠自然融合“人物+產品”或“人物+場景”,避免生成怪異的“拼貼”效果。該模型已在HuggingFace及ModelScope平台開放使用。

此外,Qwen3-Omni-30B-A3B作為一款原生支持文本、圖像、音頻及視頻輸入的全模態AI模型,已開源並提供實時Demo。Qwen3-TTS-Flash則是一款多語言多音色語音合成模型,能夠生成高度表現力豐富的語音。

阿里巴巴還開源了Wan-Animate,能將真人表演視頻通過動作轉移技術映射至目標動畫角色,實現同步口型和動作。最新的Wan 2.5版本支援1080p 60fps的同步音視頻生成,支援長達10秒的視頻剪輯,並內建產品轉視頻、繪畫轉視頻及口型同步工作室功能,顯著提升視頻生成質量。

谷歌Gemini 2.5 Flash系列升級

谷歌發布了Gemini 2.5 Flash與Flash Lite版本,顯著提升了智能水平、速度與成本效率。根據Artificial Analysis報告,兩款模型在整體智能基準測試中有明顯提升,Flash版本在代碼生成及智能代理工具使用方面表現尤為突出。Flash Lite版本更成為目前最快的專有AI模型,且在保持性能的同時大幅降低了運算資源消耗。

其他重磅AI技術與產品發布

– DeepSeek推出V3.1-Terminus版本,改善輸出穩定性與語言一致性,智能代理工具使用能力提升。

– Kling發佈2.5 Turbo視頻AI模型,視頻質量提升30%,價格降低,提升了市場競爭力。

– Suno推出v5音樂生成模型,音質更高、歌聲更自然,但被部分評論形容為“過於完美而缺乏靈魂”。同時,Suno正面臨版權訴訟指控。

– Liquid AI發布Liquid Nanos系列小型任務專用AI模型,適用於邊緣設備。

– 小米推出MiMo-Audio-7B音頻語言模型,支持多任務的少樣本學習。

– Moondream預覽了Moondream 3,專注於視覺推理的混合專家模型。

– IBM推出Granite Docling-258M,輕量多模態OCR模型,提升文檔轉換效率。

– DeepMind發布Gemini Robotics 1.5,將AI代理帶入物理機器人領域,支持多步任務規劃與網絡搜索。

– OpenAI推出ChatGPT Pulse,提供每日主動個性化資訊更新,連接Gmail等個人資料源。

– Meta AI推出Vibes視頻流,鼓勵用戶創作和分享AI生成的短視頻,推動AI創作主流化。

– YouTube Music測試AI音樂電台主持人,提供曲目背景和趣聞。

– 微軟Copilot Studio新增Anthropic模型選項,擴展多模型生態。

AI研究與政策動態

Meta發布Code World Model 32B,探索利用世界模型訓練信號提升代碼生成能力,推動智能編程代理研發。

美國政府將Meta的Llama模型納入批准使用的AI工具清單,促進開源模型在政府機構的應用。

Anthropic與美國主要作者達成15億美元版權和解協議,法官初步批准。

Spotify推出新規範打擊AI生成的欺詐性音樂作品,平衡創作者創新與用戶信任。

Elon Musk旗下xAI以低於一美元的價格向美國聯邦政府銷售AI聊天機器人Grok,價格遠低於競爭對手。

編輯評論與洞見

本週的AI動態再次凸顯了中國科技巨頭阿里巴巴在多模態AI領域的強大實力,尤其是Qwen系列模型的多樣化與開源策略,顯示出其在全球AI競爭中的積極布局。Wan 2.5的視頻生成技術在解析度和同步性上的提升,標誌著生成式視頻AI正逐步實現商業級應用,未來有望顛覆傳統影視製作流程。

谷歌Gemini的升級則展現了主流AI巨頭在提升模型效率與智能的雙重努力,尤其是Flash Lite在速度與成本上的優勢,對於推動AI普及和應用至關重要。

值得注意的是,Suno音樂AI雖技術先進,但因版權爭議引發行業反思,這反映出AI生成內容在法律和倫理層面的挑戰日益嚴峻。Spotify等平台嘗試制定規範,正是對這一問題的積極回應。

此外,OpenAI與Nvidia的百億美元戰略合作,以及美國政府對AI工具的審慎採用,顯示出AI基礎設施和政策層面的快速演進,這將對全球AI產業格局產生深遠影響。

總體來看,AI技術正從純研究階段迅速走向多場景落地,從文本、圖像到視頻、語音,再到物理機器人,AI的邊界不斷被拓展。這既帶來前所未有的創新機遇,也對數據安全、版權保護和倫理規範提出了更高要求。香港及全球用戶應密切關注這場AI革命,積極探索如何在保障權益的同時,最大化利用AI技術帶來的價值。

🎬 YouTube Premium 家庭 Plan成員一位 只需 HK$148/年

不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放

立即升級 🔗

✨🎱 Instagram留言 →

AI即回覆下期六合彩預測

🧠 AI 根據統計數據即時生成分析

💬 只要留言,AI就會即刻覆你心水組合

🎁 完!全!免!費!快啲嚟玩!

IG 貼文示意圖 AI 即時回覆示意圖

下期頭獎號碼

📲 去 Instagram 即刻留言