中國AI公司MiniMax推新模型,挑戰業界頂尖水平

Ai

中國AI公司MiniMax推出新模型,聲稱具備行業競爭力

中國企業持續推出與OpenAI及其他美國AI公司開發的系統相抗衡的AI模型。本週,MiniMax這家獲得阿里巴巴和騰訊支持的初創公司,宣布推出三個新模型:MiniMax-Text-01、MiniMax-VL-01和T2A-01-HD。MiniMax-Text-01是一個純文本模型,而MiniMax-VL-01則能夠理解圖像和文本。同時,T2A-01-HD則專注於生成音頻,特別是語音。

MiniMax聲稱,MiniMax-Text-01擁有4560億個參數,並在MATH和SimpleQA等基準測試中表現優於谷歌最近推出的Gemini 2.0 Flash,這些測試旨在評估模型解決數學問題和事實性問題的能力。參數大致上與模型的解決問題能力有關,通常參數越多的模型表現越佳。

至於MiniMax-VL-01,MiniMax表示該模型在多模態理解的評估中與Anthropic的Claude 3.5 Sonnet相抗衡,特別是在ChartQA測試中,該測試要求模型回答與圖表和圖示相關的問題(例如:“這個圖表中橙色線的峰值是多少?”)。不過,MiniMax-VL-01在許多測試中未能超越Gemini 2.0 Flash,OpenAI的GPT-4o和Meta的Llama 3.1也在幾個測試中勝過它。

值得注意的是,MiniMax-Text-01擁有非常大的上下文窗口。模型的上下文窗口是指模型在生成輸出(附加文本)之前考慮的輸入(例如文本)。MiniMax-Text-01的上下文窗口為400萬個標記,這意味著它能夠一次分析約300萬個單詞,或相當於《戰爭與和平》的五份副本。

另一方面,MiniMax最新推出的T2A-01-HD是一個針對語音的音頻生成器。T2A-01-HD能夠生成可調節節奏、語調和音色的合成語音,支持包括英語和中文在內的約17種語言,並能夠僅用10秒的音頻錄音來克隆一個聲音。

MiniMax並未發布T2A-01-HD與其他音頻生成模型的基準測試結果,但根據這位記者的聽感,T2A-01-HD的輸出與Meta和PlayAI等初創公司的音頻模型相當。

除了T2A-01-HD僅可通過MiniMax的API和Hailuo AI平台獲得外,MiniMax的新模型都可以從GitHub和AI開發平台Hugging Face下載。然而,儘管這些模型“公開”可用,某些方面仍然受到限制。MiniMax-Text-01和MiniMax-VL-01並不是真正的開源,因為MiniMax並未釋出重建它們所需的組件(例如訓練數據)。此外,它們受MiniMax的限制性許可證約束,禁止開發者使用這些模型來改進競爭對手的AI模型,並要求擁有超過一億月活躍用戶的平台向MiniMax申請特殊許可。

MiniMax成立於2021年,由中國最大的AI公司之一SenseTime的前員工創立。該公司的項目包括類似於Character AI的AI角色扮演平台Talkie,以及在Hailuo發布的文本到視頻模型。

MiniMax的一些產品引發了小規模的爭議。Talkie因不明的“技術”原因於去年12月從Apple的應用商店下架,該應用擁有公共人物的AI化身,包括唐納德·特朗普、泰勒·斯威夫特、埃隆·馬斯克和勒布朗·詹姆斯,而這些人似乎並未同意出現在該應用中。

去年12月,《廣播》雜誌報導稱,MiniMax的視頻生成器可以重現英國電視頻道的標誌,暗示MiniMax的模型是在這些頻道的內容上進行訓練的。此外,MiniMax據報導正被中國視頻流媒體服務iQiyi起訴,指控其非法使用iQiyi的版權錄音進行訓練。

MiniMax的新模型發布之際,剛好在拜登政府提議對中國企業的AI技術實施更嚴格的出口規則和限制後不久。中國企業已經被禁止購買先進的AI晶片,但如果新規則按原計劃生效,這些公司將面臨對半導體技術和啟動複雜AI系統所需模型的更嚴格限制。

在周三,拜登政府宣布了額外的措施,旨在阻止高級晶片進入中國。希望出口某些晶片的晶片製造商和封裝公司將面臨更廣泛的許可要求,除非它們能有效地進行更大的審查和盡職調查,以防止其產品流入中國客戶手中。

在這篇報導中,我們看到MiniMax在AI領域的迅速崛起,尤其是在與全球知名公司的競爭中顯示出強勁的實力。這不僅反映出中國在AI技術上的進步,也引發了關於技術開放性和知識產權的討論。MiniMax的模型雖然在某些測試中表現突出,但仍需面對來自國際市場的激烈競爭和法律挑戰。未來,如何在技術創新和合規之間找到平衡,將是MiniMax及類似公司必須面對的關鍵課題。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Chat Icon