Anthropic推出Claude 3.5 Sonnet,具備視覺PDF分析功能,能讀取圖片、圖表和圖形
在Claude 3.5 Sonnet獲得重大更新幾天後,Anthropic推出了另一個實用功能,名為視覺PDF。這項新功能可以讀取少於100頁的PDF文件中的各種視覺內容,現在用戶可以輕鬆上傳文檔,提取完整上下文,並從PDF中消化信息,特別是對於包含圖表和技術文件的研究論文等。
視覺PDF目前是Claude 3.5 Sonnet中的一項實驗性功能。Claude現在不僅能讀取PDF中的文本,還能查看圖像,這使得Claude 3.5 Sonnet能更準確地理解複雜的文檔,尤其是那些包含大量圖表或圖形的文檔。
此外,Anthropic還將文檔大小限制從10MB提高到30MB。X平台上的一位用戶迅速指出了這一變化,現在Claude允許用戶上傳最多五個圖像或文檔,每個的大小限制為30MB。
Anthropic的Claude關係負責人Alex Albert在X平台上發文表示:“直到今天,當你在Claude.AI中附加PDF時,我們會使用文本提取服務來抓取文本並將其發送給Claude。現在,Claude可以實際上以視覺形式查看PDF,與文本並行。”
用戶可以通過首頁的彈出橫幅訪問這個功能。一旦在功能預覽選項卡中選擇視覺PDF並啟用,它將在未來的對話中可用。此外,Anthropic還宣布支持在API請求中添加PDF作為輸入。
Anthropic持續推進
就在幾天前,Anthropic推出了“計算機使用”功能,這在AI生態系統中引起了不小的轟動。最近,他們還宣布與GitHub的合作,將Claude 3.5 Sonnet納入GitHub Copilot中。
不久前,Claude還被宣布可以執行和運行JavaScript代碼,這稱為分析工具,它在編寫和執行代碼後還可以生成數據可視化。除了視覺PDF和分析工具,Claude還提供一項名為LaTex渲染的功能,以根據用戶的輸入生成數學方程式。
目前,Claude 3.5 Sonnet已經被廣泛認為是執行代碼的最佳AI模型。OpenAI最新的GPT-4尚未達到這一水平,即使是其最新產品Canvas也仍然無法與Claude的能力相提並論。
這一系列更新顯示了Anthropic在AI領域的快速進步,他們不僅在技術上持續創新,還在用戶體驗上不斷優化。這對於研究人員和開發者來說,無疑是一個好消息,因為他們現在可以更方便地從PDF文檔中提取和分析信息。
在未來,隨著更多功能的推出,Anthropic有望在AI市場上繼續擴大其影響力。這不僅顯示了他們對技術的敏銳洞察力,也反映出他們在推動AI創新方面的決心。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。