亞馬遜推出六款全新AI模型，革新文本、影像及視頻生成！

zero comment

亞馬遜推出六款全新AI模型，涵蓋文本、視頻及影像生成

亞馬遜的首席執行官安迪·賈西在re:Invent大會上宣布推出六款新AI模型——Nova系列，這些模型擁有廣泛的功能。

亞馬遜網絡服務（AWS）在此次會議上展示了Nova系列，該系列包括文本、視頻及影像生成的選項。就在上周，亞馬遜還透露，已對AI初創公司Anthropic進行了第二次40億美元的投資，並將AI融入其業務的各個方面，從Audible到網購。

文本生成選項

Nova系列中包含四款文本生成模型，其中Micro、Lite和Pro三款已於今日向AWS客戶開放，而第四款Premier則將於2025年初推出。

亞馬遜表示，所有模型均優化支持15種語言（主要是英語）。這些模型的區別在於其大小和能力。我們來逐一分析。

Micro是最小的選擇，擁有128,000個標記的上下文窗口，相當於處理約100,000個單詞。它能接收和輸出文本，並且是Nova文本生成組中延遲最低的選擇，因此速度最快。

接下來是Lite，它可以分析文本、影像和視頻。與Pro一樣，Lite擁有300,000個標記的上下文窗口，這意味著它可以處理約225,000個單詞、15,000行代碼或30分鐘的視頻內容。

Pro速度更快，但Premier則設計用於構建自定義模型，最適合處理複雜的工作負載。

賈西表示：“我們已優化這些模型以與專有系統和API搭配使用，這樣您可以更輕鬆地進行多步驟的自動化操作——代理行為。”他補充道：“我認為這些模型非常吸引人。”

亞馬遜已經承諾將進行升級，並表示在明年初，某些Nova模型的內容窗口將擴展至超過200萬個標記。

影像和視頻生成

在影像和視頻生成方面，亞馬遜推出了兩個選項，分別為Canvas和Reel。Canvas允許用戶生成並編輯影像，提供多種選擇以改變顏色方案和佈局。

Reel則允許用戶創建最多六秒長的視頻，但即將推出的版本將支持創建兩分鐘的視頻。用戶可以通過輸入提示或參考影像來創建視頻。亞馬遜在一段視頻中展示了，包括改變相機運動的工具，如平移、360度旋轉和縮放。

亞馬遜的負責任AI

賈西強調，這兩個工具都有“內建”的負責任使用控制。他表示：“我們正在努力限制有害內容的生成。”這些工具包括內容審核能力和水印選項。

在一篇博客中，亞馬遜指出，這一新系列的AI模型“擴展了我們的安全措施，以打擊虛假信息、兒童性虐待材料以及化學、生物、放射或核風險的傳播。”

亞馬遜AI的未來計劃

除了對六款現有Nova模型的更新外，亞馬遜還承諾將推出語音對語音模型和本地多模態對多模態的“任何對任何”模型，這兩款模型預計在明年初推出。

語音對語音模型將能“…理解自然語言的流式語音輸入，解讀語言和非語言線索（如語調和韻律），提供自然的人類互動。”而“任何對任何”模型則能處理文本、影像、音頻和視頻，並作為“輸入和輸出”使用。這意味著它可以作為開發應用程序的基準，執行各種任務，包括“將內容從一種模態轉換為另一種模態、編輯內容以及驅動能理解和生成所有模態的AI代理”，該公司解釋道。“這是前沿模型構建和消費的未來，”賈西補充道。

這次亞馬遜的AI新模型發布，無疑將進一步推動AI技術的發展，並在多個行業中找到應用。隨著AI技術的日益成熟，未來的應用場景將更加多元化，無論是企業還是個人，都將受益於這些創新的工具。不過，亞馬遜需要在推廣這些技術的同時，時刻關注其對社會和個人隱私的影響，確保技術的負責任使用。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Download TXT

亞馬遜推出六款全新AI模型，革新文本、影像及視頻生成！

chatgpt

發佈留言取消回覆

🔥 CHATGPT PLUS 帳戶出租

亞馬遜推出六款全新AI模型，革新文本、影像及視頻生成！

chatgpt

發佈留言 取消回覆

Related Articles

AI一晚睡眠數據預測百種疾病風險！

旅遊業未來：AI數據與安全投資關鍵

馬印封鎖Musk AI Grok防深偽色情內容

🔥 CHATGPT PLUS 帳戶出租

發佈留言取消回覆