OpenAI 的 GPT-4.5「不會壓倒基準測試」,但可能會成為更好的朋友
OpenAI 最近發布了 GPT-4.5 的預覽版本,聲稱其情感智力(EQ)和創造力比以往版本更高。然而,一些觀察者認為這個新模型的價格過於昂貴。
根據 OpenAI 和早期測試者的說法,這款即將推出的模型的成本可能是其前身的 20 倍,但在對話風格上會更加創意和「自然」。OpenAI 在 2 月 27 日發布了 GPT-4.5 的研究預覽,這是其最先進的 AI 模型,能夠識別模式、建立聯繫,並在沒有推理的情況下進行創意洞察,超越了早期版本。
OpenAI 表示,GPT-4.5 更廣泛的知識基礎和改進的情感智力使其在創意任務和解決實際問題方面更具實用性。該公司在 2 月 27 日的聲明中指出:「我們還預期它的幻覺現象會減少,並在各種一般主題上提供更可靠的表現,包括更豐富的對話。」
GPT-4.5 的增強創造力和更「自然的對話風格」意味著它不太適合進行詳細的逐步邏輯推理,至少與 OpenAI 的 o 系列模型相比是這樣。該公司表示,這樣的權衡使其缺乏「思維鏈推理,並且由於其規模,可能會較慢」。此外,它也不會生成音頻或視頻等多模態輸出。
GPT-4.5 在遵循指令方面「有時更差」
OpenAI 的最新模型在 AI 和商業通訊新聞網站 Every 的首席執行官 Dan Shipper 看來,評價也類似。他表示:「這不會讓你驚訝,但它可能會成為你的朋友。」Shipper 提到他的公司已經測試了這個最新版本幾天。
他形容這更像是一個個性、溝通和創造力的升級,而不是一個巨大的智能飛躍。「OpenAI 正在將其基本模型從『平淡無奇的助手』轉變為『AI 好友』。」Shipper 也指出,GPT-4.5 在遵循指令方面「有時更差」。
AI 研究員 Aran Komatsuzaki 也表示,訪問 GPT-4.5 的 API 成本約為 GPT-4 的 15 到 20 倍。AI Compass 通訊的創始人 Ashutosh Shrivastava 補充說:「OpenAI GPT-4.5 的定價簡直瘋狂。他們究竟在想什麼?」
在 2 月 27 日的一篇推文中,OpenAI 首席執行官 Sam Altman 承認,這個新推理模型「不會壓倒基準測試」,而且是一個「巨大的昂貴模型」。
醫學影像診斷的潛力
其他專家,如生物醫學科學家和傑克遜實驗室的教授 Derya Unutmaz,聲稱 GPT-4.5 在醫學影像診斷方面「似乎非常出色」——能夠正確識別輸卵管異位妊娠。Unutmaz 教授指出,其他 AI 模型,如 Grok 3、Claude 3.7 Sonnet 和早期的 ChatGPT 模型,錯誤地將醫學影像識別為正常妊娠。
OpenAI 最新的 ChatGPT 版本推出之際,中國競爭對手 High Flyer 在 1 月推出了開源 AI 大型語言模型 DeepSeek R1,該模型的開發成本僅為 OpenAI 模型的一小部分。
然而,OpenAI 首席執行官 Sam Altman 宣稱,這些 AI 模型的建造成本每年下降十倍或更多。「你可以看到,從 2023 年初的 GPT-4 到 2024 年中期的 GPT-4o,每個標記的價格在這段時間內下降了約 150 倍。」Altman 在 2 月 10 日的推文中表示。
在 2 月 12 日,Altman 提到 GPT-5 將在幾個月內發布,並將多個版本——包括 o3——整合為一個,OpenAI 在 2 月 13 日表示。ChatGPT 的免費版將獲得無限制的 GPT-5 聊天訪問權限。
評論
OpenAI 的 GPT-4.5 版本的推出,無疑是 AI 發展的一個重要里程碑。雖然其創造力和情感智力的提升令人期待,但其高昂的成本和在某些方面的表現不如預期,讓人對其市場競爭力產生疑問。隨著中國競爭者的崛起,OpenAI 需要重新評估其定價策略和產品定位,以保持其在 AI 領域的領先地位。未來的 GPT-5 可能會帶來更大的變革,但如何平衡創新與可負擔性,將是 OpenAI 需要解決的關鍵問題。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。