三星投資突破性AI 解析千萬小時影片技術

Ai




三星投資可分析千萬小時影片的視頻AI初創公司

現時市面上不少人工智能工具能夠觀察影片並簡單總結內容,但當涉及跨多部影片及數以千計小時的片段時,AI模型便顯得力有不逮。這對需要從大量不同鏡頭錄製的監控影片中篩選資料的保安公司,以及希望研究多個影片廣告和產品拍攝的市場推廣公司來說,是一大挑戰。

初創公司Memories.ai致力解決這個問題,其AI平台最高可處理多達一千萬小時的影片。針對有大量影片需要分析的企業,Memories.ai提供一層具上下文意義的分析,包括可搜尋的索引、標籤、片段分割及資料彙整等功能。

Memories.ai的共同創辦人Shawn Shen博士曾於Meta的Reality Labs擔任研究科學家,另一位聯合創辦人Enmin(Ben)Zhou則是Meta的機器學習工程師。Shen表示:「Google、OpenAI及Meta等頂尖AI公司專注打造端對端模型,雖然這些模型功能強大,但通常只能理解一至兩小時的影片內容,難以處理更長時間的影片上下文。」他續說:「而人類的視覺記憶能過濾大量數據,我們便受此啟發,想打造一個能更好理解長時間影片的解決方案。」

為了實現這個目標,Memories.ai最近完成由Susa Ventures領投、三星Next、Fusion Fund、Crane Ventures、Seedcamp及Creator Ventures參與的800萬美元種子輪融資。Shen透露,公司原本目標是籌集400萬美元,結果因投資者熱烈反應而超額認購。

Susa Ventures合夥人Misha Gordon-Rowe稱讚Shen是一位技術極為專精的創辦人,對推進影片理解和智能技術充滿熱忱。Memories.ai的方案能釋放大量第一方視覺智能數據,市場上針對長時間視覺智能的空白正正吸引了他們的投資興趣。

三星Next的Sam Campbell則指出,他們對Memories.ai的方案感興趣,因為它可進行大量裝置端運算,無需將影片數據上傳雲端,有助提升用戶私隱安全,特別是那些擔心家中安裝監控鏡頭的用家。

Memories.ai利用自家技術堆疊和模型進行分析。首先去除影片噪音,再經過壓縮層僅儲存重要資訊。接著建立索引層,支援自然語言查詢,並配合分段和標籤,方便搜尋。最後有彙整層,協助從索引中匯總數據,生成報告。

目前公司主要為兩類企業服務:市場推廣和保安。市場推廣企業可利用Memories.ai工具分析社交媒體上品牌相關的趨勢,並決定製作何種影片,平台亦提供影片製作工具。保安公司則利用該技術分析監控影片,透過模式推理判斷影片中是否出現危險行為。

現階段,合作企業需將影片資料庫上載至平台進行分析,但Shen表示未來會推出共享雲端硬碟同步功能,客戶更可直接提問,例如「告訴我上星期我採訪過的人」。他更設想未來AI助理可透過用戶相片或智能眼鏡獲取生活上下文,甚至協助訓練人形機械人執行複雜任務或幫助自駕車記憶不同路線。

目前Memories.ai團隊有15人,將利用新一輪融資擴大團隊和優化搜尋功能。雖然市場上亦有如mem0和Letta這類提供AI記憶層的初創,尚未全面支援影片;還有TwelveLabs和Google等大公司正開發幫助AI理解影片的技術,但Shen認為Memories.ai的方案更具橫向兼容性,能與不同影片模型協同工作。

評論與啟發

Memories.ai這個項目正好回應了現時AI在處理長時間、多來源影片資料時的技術瓶頸。現時不少AI影片分析工具偏重於短時間或單一影片的內容識別,卻難以整合跨時間或跨鏡頭的多重資訊。Memories.ai嘗試建立一個上下文豐富、可搜尋的影片資料庫,讓用戶不只是「看見」影片,而是能「理解」背後的故事和模式,這對保安監控和市場分析都極具價值。

尤其值得注意的是,Memories.ai強調裝置端運算,避免將敏感監控影片上傳雲端,這在當今用戶對私隱愈來愈重視的環境下,無疑是非常前瞻的設計。三星Next的投資亦顯示大企業開始認同,未來AI的發展不僅是雲端強大算力的競賽,更要兼顧數據安全與私隱保護。

此外,Shen提出將視覺記憶與人類認知類比的理念,為AI影片分析開拓了新思路。未來隨著智能眼鏡、機械人和自駕車的普及,這類能跨多場景、多時段「記憶」視覺資訊的AI系統,將成為智能助理不可或缺的一環。

當然,Memories.ai面對的競爭不容小覷,從大型科技公司到其他初創都在搶佔視覺智能市場。其成功關鍵或許在於能否真正做到「橫向」整合不同影片模型,並提供用戶友善的操作體驗。對香港及全球市場來說,這類技術的成熟將推動監控安全、媒體分析、甚至個人生活管理等多重領域的革新,值得持續關注。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

🎨 Nano Banana Pro 圖像生成器|打幾句說話就出圖

想畫人像、產品圖、插畫?SSFuture 圖像生成器支援 Flux Gemini Nano Banana Pro 改圖 / 合成, 打廣東話都得,仲可以沿用上一張圖繼續微調。

🆓 Flux 模型即玩,不用登入
🤖 登入後解鎖 Gemini 改圖
📷 支援上載參考圖再生成
⚡ 每天免費額度任你玩
✨ 即刻玩 AI 畫圖
一隻在香港茶餐廳喝奶茶的貓 A cinematic top-down portrait of a young woman standing on a solid deep green floor, captured from an extreme overhead angle. She looks up directly at the camera with wide, expressive eyes, creating an intimate and slightly surreal mood. She wears a soft white bucket hat, a cozy oversized green-and-beige checkered sweater, blue jeans, and white sneakers. Minimalist composition with vast negative space surrounding her, emphasizing isolation and calm. Soft diffused studio lighting, natural skin tones, subtle shadows, clean color grading with earthy greens, editorial fashion photography style, ultra-sharp focus, high resolution, modern aesthetic, cinematic framing, shot on a professional DSLR, shallow depth of field, Instagram poster vibe 人物:人物姿態表情動作衣著都不變,色調:富士底片日系風格,暖色調,日系輕透感,光影:維持照片中的光影邏輯,輕灑在少女身上,像是日系風格清爽,必須符合原本照片中的光影邏輯,背景:一片海洋與藍天,天空天氣非常晴朗,海與藍天在畫面中維持一半的比例,海的顏色是鮮紅色的海,海非常鮮紅、一片平靜的死海,海上有陽光帶來的一點光班,場景:少女坐在海堤防邊,面對著畫面,而少女的後方是一片遙遙無極的海與藍天,完美的呈現一半的比例,在一個清晨的光線中,陽光並沒有太刺眼,陽光像是輕灑在少女身上還有紅色的海面上,透視關係:構圖不改變,維持原本照片的構圖,平面構圖