動物聲音翻譯成為人類語言的競賽
在2025年,我們將看到人工智能和機器學習被用來在理解動物溝通方面取得實際進展,這是人類自古以來一直困惑的問題:“動物們在彼此交談什麼?”最近的科勒-杜利特獎(Coller-Dolittle Prize)提供高達50萬美元的獎金,以獎勵那些“破解代碼”的科學家,這顯示出對於近期機器學習和大型語言模型(LLMs)技術發展的信心,讓這個目標變得觸手可及。
許多研究團隊多年來一直致力於開發算法,以理解動物的聲音。例如,Ceti計劃正在解碼抹香鯨的點擊聲和座頭鯨的歌聲。這些現代機器學習工具需要極大數量的數據,而到目前為止,缺乏高質量且標註良好的數據。
以ChatGPT等大型語言模型為例,它們的訓練數據包含了互聯網上所有的文本資料,而這些關於動物溝通的信息在過去是無法獲得的。人類的數據集比我們對野生動物的數據大得多:GPT-3的訓練使用了超過500GB的文字,而Ceti計劃對抹香鯨溝通的分析僅使用了超過8000個“音調”(即聲音)。
此外,在處理人類語言時,我們已經知道所說的內容。我們甚至知道什麼構成“單詞”,這使得理解動物溝通時的優勢顯而易見。科學家們很少知道某一特定的狼嚎是否與另一個狼嚎有不同的含義,甚至狼是否將嚎叫視為類似於人類語言中的“單詞”。
儘管如此,2025年將帶來新的進展,不僅在於可供科學家使用的動物溝通數據的數量,還有可以應用於這些數據的AI算法的類型和能力。現在,動物聲音的自動錄音已經變得對每個科學研究團隊觸手可及,像AudioMoth這樣的低成本錄音設備正迅速普及。
龐大的數據集現在正在上線,錄音設備可以在野外持續24小時收聽叢林中的長臂猿或森林中的鳥類的叫聲。過去,這樣的大型數據集無法手動管理,而現在,基於卷積神經網絡的新自動檢測算法可以快速分析數千小時的錄音,識別動物聲音並根據其自然聲學特徵將其聚類。
一旦這些大型動物數據集可用,新的分析算法也將成為可能,例如使用深度神經網絡來尋找動物發聲序列中的隱藏結構,這可能類似於人類語言中的有意義結構。
然而,仍然不清楚的基本問題是,我們究竟希望如何利用這些動物聲音?一些組織,例如Interspecies.io,明確設定目標為“將一種物種的信號轉換為另一種物種的連貫信號。”換句話說,就是將動物溝通翻譯成為人類語言。然而,大多數科學家認為非人類動物並沒有真正的語言——至少不是以我們人類的語言方式。
科勒-杜利特獎的目標稍微成熟一些,尋求“與某一生物進行交流或解碼其溝通方式”。解碼是一個稍微不那麼雄心勃勃的目標,考慮到動物可能並沒有可以翻譯的語言。今天,我們尚不清楚動物之間究竟傳遞了多少信息,或有多少信息是它們彼此之間的交流。到了2025年,人類將有潛力超越我們對動物交流的理解,了解它們究竟在彼此交談什麼。
評論:這一研究進展不僅是科學技術的突破,也讓我們重新思考人類與動物之間的關係。過去我們常常將動物視為無法理解的“他者”,而如今,隨著科技的進步,我們或許能夠逐步打破這種界限。這不僅是科學上的探索,更是對人類自我認知的挑戰。當我們試圖理解動物的語言時,我們也在重新定義“語言”的本質,以及我們與自然界的聯繫。這樣的研究若能成功,或許能促進人類對生物多樣性的尊重和保護。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。