亞馬遜推出六款全新AI模型,涵蓋文本、視頻及影像生成
亞馬遜的首席執行官安迪·賈西在re:Invent大會上宣布推出六款新AI模型——Nova系列,這些模型擁有廣泛的功能。
亞馬遜網絡服務(AWS)在此次會議上展示了Nova系列,該系列包括文本、視頻及影像生成的選項。就在上周,亞馬遜還透露,已對AI初創公司Anthropic進行了第二次40億美元的投資,並將AI融入其業務的各個方面,從Audible到網購。
文本生成選項
Nova系列中包含四款文本生成模型,其中Micro、Lite和Pro三款已於今日向AWS客戶開放,而第四款Premier則將於2025年初推出。
亞馬遜表示,所有模型均優化支持15種語言(主要是英語)。這些模型的區別在於其大小和能力。我們來逐一分析。
Micro是最小的選擇,擁有128,000個標記的上下文窗口,相當於處理約100,000個單詞。它能接收和輸出文本,並且是Nova文本生成組中延遲最低的選擇,因此速度最快。
接下來是Lite,它可以分析文本、影像和視頻。與Pro一樣,Lite擁有300,000個標記的上下文窗口,這意味著它可以處理約225,000個單詞、15,000行代碼或30分鐘的視頻內容。
Pro速度更快,但Premier則設計用於構建自定義模型,最適合處理複雜的工作負載。
賈西表示:“我們已優化這些模型以與專有系統和API搭配使用,這樣您可以更輕鬆地進行多步驟的自動化操作——代理行為。”他補充道:“我認為這些模型非常吸引人。”
亞馬遜已經承諾將進行升級,並表示在明年初,某些Nova模型的內容窗口將擴展至超過200萬個標記。
影像和視頻生成
在影像和視頻生成方面,亞馬遜推出了兩個選項,分別為Canvas和Reel。Canvas允許用戶生成並編輯影像,提供多種選擇以改變顏色方案和佈局。
Reel則允許用戶創建最多六秒長的視頻,但即將推出的版本將支持創建兩分鐘的視頻。用戶可以通過輸入提示或參考影像來創建視頻。亞馬遜在一段視頻中展示了,包括改變相機運動的工具,如平移、360度旋轉和縮放。
亞馬遜的負責任AI
賈西強調,這兩個工具都有“內建”的負責任使用控制。他表示:“我們正在努力限制有害內容的生成。”這些工具包括內容審核能力和水印選項。
在一篇博客中,亞馬遜指出,這一新系列的AI模型“擴展了我們的安全措施,以打擊虛假信息、兒童性虐待材料以及化學、生物、放射或核風險的傳播。”
亞馬遜AI的未來計劃
除了對六款現有Nova模型的更新外,亞馬遜還承諾將推出語音對語音模型和本地多模態對多模態的“任何對任何”模型,這兩款模型預計在明年初推出。
語音對語音模型將能“…理解自然語言的流式語音輸入,解讀語言和非語言線索(如語調和韻律),提供自然的人類互動。”而“任何對任何”模型則能處理文本、影像、音頻和視頻,並作為“輸入和輸出”使用。這意味著它可以作為開發應用程序的基準,執行各種任務,包括“將內容從一種模態轉換為另一種模態、編輯內容以及驅動能理解和生成所有模態的AI代理”,該公司解釋道。“這是前沿模型構建和消費的未來,”賈西補充道。
這次亞馬遜的AI新模型發布,無疑將進一步推動AI技術的發展,並在多個行業中找到應用。隨著AI技術的日益成熟,未來的應用場景將更加多元化,無論是企業還是個人,都將受益於這些創新的工具。不過,亞馬遜需要在推廣這些技術的同時,時刻關注其對社會和個人隱私的影響,確保技術的負責任使用。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。