Ancestry利用AI技術將掃描人口普查紀錄時間由9個月縮短至不足9天
家譜網站Ancestry的數據庫規模龐大,遠超想像。
Ancestry的首席技術官兼產品與技術執行副總裁Sriram Thiagarajan向Business Insider表示:「我們已經收集超過650億筆紀錄,覆蓋超過80個國家。光是數據量就達到約10,000TB,這些資料用來幫助用戶發掘家族歷史。」
這家成立於1983年的猶他州家譜公司,透過收集出生、死亡、婚姻、人口普查、軍事、土地、移民和報紙等各類紀錄,協助用戶追溯家族根源。Ancestry亦提供消費者DNA測試套件,並與美國國家檔案館等機構合作收集資料。
然而,龐大數據的整理一直是個巨大挑戰。Thiagarajan表示,Ancestry利用人工智能(AI)和機器學習技術,顯著提升了紀錄處理效率。
以電腦視覺技術提升數據處理效率
Thiagarajan於2017年加入Ancestry時,公司剛開始涉足AI和機器學習領域。他說:「我們嘗試尋找更有效率的方法,將全球收集來的內容數字化。」
過去,Ancestry會先掃描紀錄,然後外包人工進行手動索引和資料輸入,再由軟件建立人物、地點等關聯。以1940年人口普查為例,當年手動處理耗時約9個月,成本更高出10倍。
這促使團隊尋找突破口。Thiagarajan說:「我們嘗試用電腦視覺AI技術自動數字化內容,省去人工介入。到了2021年,我們用自家開發的手寫識別技術,將處理時間從9個月縮短至不足9天,成本也大幅降低。」
目前這項技術已擴展至其他紀錄類型,但仍會視需要由人工審核AI結果。他強調:「我們建立了自動化監控系統,大幅減少人工檢查時間。最重要的是確保AI產出的資料真實可靠。」
Thiagarajan補充,AI應用的深度和廣度已較數年前大幅提升。「用戶來我們平台尋找祖先故事時,我們希望能將最準確的紀錄呈現給他們。」
Ancestry測試全新AI功能「音頻故事」
除了在後台運用AI外,Ancestry亦推出多項面向用戶的AI功能,包括手寫識別工具。2024年開始,他們測試AI助手功能。
最近,Thiagarajan透露,Ancestry正測試一款名為「Audio Stories」的AI功能,能將紀錄轉化為敘事音頻。「我們的AI能理解印刷資料、圖片與手寫文字的上下文,並將它們串聯成一個完整故事。」
目前「音頻故事」尚未正式推出,Ancestry已構思未來將結合視覺、聲音、動態影像和影片,打造更豐富的故事體驗。
—
編輯評論:
Ancestry善用AI技術革新家譜研究,實際縮短了資料處理時間,這對於龐大且複雜的家族數據庫而言,是一大突破。過去需要耗費數月甚至數年的人力與時間,現在透過電腦視覺和手寫識別技術,能在不到兩週內完成,成本更大幅下降,這不但提升了效率,也讓更多用戶能更快獲得家族資訊。
這種AI應用的成功,展示了人工智能在文化和歷史保存領域的巨大潛力。Ancestry不僅是數據整理,也在嘗試將枯燥的家譜資料轉化為生動的音頻故事,甚至未來結合多媒體元素,讓家族歷史更具感染力和互動性。這種跨界融合,既保存了歷史,也增添了情感連結,對於吸引年輕一代探索家族史尤為重要。
然而,Thiagarajan強調人工審核的重要性,反映出AI在處理歷史資料時,仍需謹慎對待數據準確性與真實性。這是人工智能應用中不可忽視的倫理與質量控制議題。
綜合來說,Ancestry的案例不僅是技術進步的縮影,更啟示了如何以創新科技讓文化傳承更普及、更生動,也提醒我們在追求效率的同時,必須兼顧資料的真實可靠。這種平衡將是未來AI在文化與歷史領域應用的關鍵。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。
🎬 YouTube Premium 家庭 Plan成員一位 只需 HK$148/年!
不用提供密碼、不用VPN、無需轉區
直接升級你的香港帳號 ➜ 即享 YouTube + YouTube Music 無廣告播放