OpenAI勁爆新嘢！識睇圖兼推理，AI進化到咩程度？

zero comment

OpenAI推出能夠“推理”的圖像技術

OpenAI最近介紹了一種能夠在數學、編程和科學任務中“推理”的人工智能技術，現在這項技術也能處理涉及圖像的類似任務，包括草圖、海報、圖表和圖形。

在周三的網上直播中，OpenAI公布了兩個新版本的推理技術，分別是OpenAI o3和OpenAI o4-mini。這些系統能夠同時處理涉及圖像和文本的任務。

OpenAI的研究負責人Marc Chen表示：“這些系統可以根據你想要執行的任務，操縱、裁剪和轉換圖像。”此外，這些系統還能生成圖像、搜索網絡和使用其他數字工具。

與早期版本的ChatGPT聊天機器人不同，這些推理系統在回答問題之前會花費相當多的時間進行“思考”，而不是立即給出回應。

這些系統是OpenAI更廣泛努力的一部分，旨在建立能夠推理複雜任務的人工智能。像谷歌、Meta和中國初創公司DeepSeek等企業也在開發類似技術。

這些技術的目標是構建能夠通過一系列步驟解決問題的系統，每一步都建立在前一步的基礎上，類似於人類的推理方式。這些技術對於使用人工智能系統編寫代碼的程序員特別有用。

這些推理系統基於一種稱為大型語言模型（L.L.M.s）的技術。為了構建推理系統，企業需要通過一個稱為強化學習的額外過程來處理L.L.M.s。在這個過程中，系統通過大量的試錯學習行為。

例如，通過解決各種數學問題，它可以學會哪些方法能導致正確答案，哪些則不行。如果它對大量問題重複這一過程，就能夠識別模式。

OpenAI最新的系統已經學會處理涉及圖像和文本的問題。

專家指出，推理系統不一定像人類一樣進行推理。與其他人工智能技術一樣，它們也可能出錯並編造信息，這種現象被稱為“幻覺”。

OpenAI還推出了一款名為Codex CLI的新工具，旨在進一步促進涉及o3和o4-mini系統的計算機編程任務。這款被稱為人工智能代理的工具提供了將這些人工智能系統與程序員個人計算機上現有代碼結合使用的方式。

該公司表示，將開源這個工具，意味著將其底層技術免費分享給程序員和企業，允許他們修改和基於該技術進行開發。

OpenAI表示，從周三開始，這些新系統將對所有訂閱了ChatGPT Plus（每月20美元）或ChatGPT Pro（每月200美元，提供訪問公司所有最新工具的服務）的用戶開放。

在這個人工智能快速發展的時代，OpenAI的這一新技術無疑將進一步推動編程和數據處理的效率。這不僅提高了計算機的智能化程度，也為程序員提供了更強大的工具，讓他們能夠更輕鬆地解決各種複雜的技術挑戰。然而，我們也必須警惕這些技術的潛在風險，例如數據的準確性和安全性，這些都是在推廣這些系統時需要仔細考慮的問題。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。