三星投資可分析千萬小時影片的視頻AI初創公司
現時市面上不少人工智能工具能夠觀察影片並簡單總結內容,但當涉及跨多部影片及數以千計小時的片段時,AI模型便顯得力有不逮。這對需要從大量不同鏡頭錄製的監控影片中篩選資料的保安公司,以及希望研究多個影片廣告和產品拍攝的市場推廣公司來說,是一大挑戰。
初創公司Memories.ai致力解決這個問題,其AI平台最高可處理多達一千萬小時的影片。針對有大量影片需要分析的企業,Memories.ai提供一層具上下文意義的分析,包括可搜尋的索引、標籤、片段分割及資料彙整等功能。
Memories.ai的共同創辦人Shawn Shen博士曾於Meta的Reality Labs擔任研究科學家,另一位聯合創辦人Enmin(Ben)Zhou則是Meta的機器學習工程師。Shen表示:「Google、OpenAI及Meta等頂尖AI公司專注打造端對端模型,雖然這些模型功能強大,但通常只能理解一至兩小時的影片內容,難以處理更長時間的影片上下文。」他續說:「而人類的視覺記憶能過濾大量數據,我們便受此啟發,想打造一個能更好理解長時間影片的解決方案。」
為了實現這個目標,Memories.ai最近完成由Susa Ventures領投、三星Next、Fusion Fund、Crane Ventures、Seedcamp及Creator Ventures參與的800萬美元種子輪融資。Shen透露,公司原本目標是籌集400萬美元,結果因投資者熱烈反應而超額認購。
Susa Ventures合夥人Misha Gordon-Rowe稱讚Shen是一位技術極為專精的創辦人,對推進影片理解和智能技術充滿熱忱。Memories.ai的方案能釋放大量第一方視覺智能數據,市場上針對長時間視覺智能的空白正正吸引了他們的投資興趣。
三星Next的Sam Campbell則指出,他們對Memories.ai的方案感興趣,因為它可進行大量裝置端運算,無需將影片數據上傳雲端,有助提升用戶私隱安全,特別是那些擔心家中安裝監控鏡頭的用家。
Memories.ai利用自家技術堆疊和模型進行分析。首先去除影片噪音,再經過壓縮層僅儲存重要資訊。接著建立索引層,支援自然語言查詢,並配合分段和標籤,方便搜尋。最後有彙整層,協助從索引中匯總數據,生成報告。
目前公司主要為兩類企業服務:市場推廣和保安。市場推廣企業可利用Memories.ai工具分析社交媒體上品牌相關的趨勢,並決定製作何種影片,平台亦提供影片製作工具。保安公司則利用該技術分析監控影片,透過模式推理判斷影片中是否出現危險行為。
現階段,合作企業需將影片資料庫上載至平台進行分析,但Shen表示未來會推出共享雲端硬碟同步功能,客戶更可直接提問,例如「告訴我上星期我採訪過的人」。他更設想未來AI助理可透過用戶相片或智能眼鏡獲取生活上下文,甚至協助訓練人形機械人執行複雜任務或幫助自駕車記憶不同路線。
目前Memories.ai團隊有15人,將利用新一輪融資擴大團隊和優化搜尋功能。雖然市場上亦有如mem0和Letta這類提供AI記憶層的初創,尚未全面支援影片;還有TwelveLabs和Google等大公司正開發幫助AI理解影片的技術,但Shen認為Memories.ai的方案更具橫向兼容性,能與不同影片模型協同工作。
—
評論與啟發
Memories.ai這個項目正好回應了現時AI在處理長時間、多來源影片資料時的技術瓶頸。現時不少AI影片分析工具偏重於短時間或單一影片的內容識別,卻難以整合跨時間或跨鏡頭的多重資訊。Memories.ai嘗試建立一個上下文豐富、可搜尋的影片資料庫,讓用戶不只是「看見」影片,而是能「理解」背後的故事和模式,這對保安監控和市場分析都極具價值。
尤其值得注意的是,Memories.ai強調裝置端運算,避免將敏感監控影片上傳雲端,這在當今用戶對私隱愈來愈重視的環境下,無疑是非常前瞻的設計。三星Next的投資亦顯示大企業開始認同,未來AI的發展不僅是雲端強大算力的競賽,更要兼顧數據安全與私隱保護。
此外,Shen提出將視覺記憶與人類認知類比的理念,為AI影片分析開拓了新思路。未來隨著智能眼鏡、機械人和自駕車的普及,這類能跨多場景、多時段「記憶」視覺資訊的AI系統,將成為智能助理不可或缺的一環。
當然,Memories.ai面對的競爭不容小覷,從大型科技公司到其他初創都在搶佔視覺智能市場。其成功關鍵或許在於能否真正做到「橫向」整合不同影片模型,並提供用戶友善的操作體驗。對香港及全球市場來說,這類技術的成熟將推動監控安全、媒體分析、甚至個人生活管理等多重領域的革新,值得持續關注。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。