人工智能研究員利用 Google Gemini 以不到一分錢的成本從35秒的屏幕錄影中提取可用數據
由 Jowi Morales 發佈於 2024 年 10 月 18 日
這可能節省數千小時的手動勞動。
人工智能研究員兼數據記者 Simon Willison 使用 Google AI Studio 工具,將一段35秒的12封電子郵件的屏幕錄影轉換為一個電子表格。這次實驗令 Willison 感到驚訝,因為他沒想到人工智能能以如此低的成本返回準確的結果。根據他的博客,AI Studio 為此操作收取了11,018個代幣,而每百萬個代幣的成本為7.5美分,這次嘗試的成本不到1美分的10%。
Willison 的情況需要從12封不同的電子郵件中獲取數值。與其花時間將源數據複製並粘貼到電子表格中,他們請求 AI 幫助查看電子郵件的屏幕截圖,並從視頻中提取數據。Willison 向 Google 的 AI Studio 提供了一個簡單的指令:「將此轉換為一個 JSON 陣列,其中每個項目都有一個 yyyy-mm-dd 日期和一個浮點數的美元金額。」
Willison 提供了一個 JSON 格式的輸出範例:
[
{
“date”: “2023-01-01”,
“amount”: 2…
},
…
]
Willison 表示,最終成本為1/10美分。AI Studio 使用11,018個代幣,其中10,326個用於視頻。Gemini 1.5 Flash 002 模型比 Gemini 1.5 Pro 更便宜,收費為每百萬個代幣0.075美元。Willison 幫助我們展示了得出這一結論的計算過程。
11018/1000000 = 0.011018
0.011018 * $0.075 = $0.00082635
不過,目前 Google AI Studio 是免費的,因此 Willison 並未花費一分錢!
評論與分析
這項技術演示了一種高效且經濟的方法來處理大量數據。利用人工智能工具從屏幕錄影中提取信息,特別是在處理大量郵件或數據時,顯得尤為有用。這不僅節省時間,還減少了手動錯誤的可能性。
然而,這種方法也引發了隱私問題。即使數據只在本地處理,持續錄製屏幕仍然可能使數據面臨風險。這提醒我們,在享受技術便利的同時,必須謹慎處理個人數據,確保其安全性。
此外,這種技術也讓人思考未來人工智能在數據處理中的應用潛力。隨著技術的進步,這類工具可能會在商業和個人應用中變得更加普及。對於那些不具備編程技能的人來說,這樣的工具提供了一種簡單易用的選擇,讓更多人能夠利用人工智能技術來提高工作效率。
總的來說,Simon Willison 的實驗展示了一個令人興奮的技術前景,但也提醒我們在採用新技術時需考慮其潛在的隱私和安全問題。隨著人工智能的發展,我們應該積極探索其應用,同時保持對數據安全的高度警惕。
以上文章由特價GPT API KEY所翻譯