AI聲紋識別:解開候鳥遷徙之謎

Ai

人工智能改變了我們研究鳥類遷徙的方式

在經歷數十年的挫折後,機器學習工具正在為生態學家解鎖大量聲學數據的寶藏。

在紐約伊薩卡的一個九月夜晚,一隻小型鳴禽在空中翱翔。牠是40億隻鳥類中的一員,這些鳥類每年在北美展開一場巨大的遷徙。在空中,牠發出了一種被鳥類學家稱為「夜間飛行叫聲」的信號,以與同伴溝通。這是一個短暫的信號,僅持續50毫秒,發出於夜間的樹林中。然而,人類仍然能夠捕捉到這一聲音,借助於一個帶有聚焦漏斗的麥克風。片刻之後,名為BirdVoxDetect的軟件,這是紐約大學、康奈爾鳥類學實驗室和南特中央學院的合作成果,能夠識別出這隻鳥並將其分類到物種層級。

康奈爾大學的安德魯·法恩斯沃斯等生物學家早已夢想能以這種方式窺探鳥類的生活。在一個越來越多的人類基礎設施(如玻璃摩天大樓和電力線)對鳥類構成致命威脅的溫暖世界中,遷徙鳥類面臨著許多生存挑戰。科學家們依賴多種方法來追蹤鳥類遷徙的時間和地點,但每種方法都有其缺陷。多普勒雷達在過濾掉天氣干擾後能夠檢測空中的鳥類總生物量,但無法按物種進行細分。對個別鳥類的GPS標籤和公民科學家鳥類觀察者的仔細觀察有助於填補這一空白,但大規模標記鳥類既昂貴又具侵入性。此外,還有一個關鍵問題:大多數鳥類在夜間遷徙,這使得識別它們變得更加困難,而大多數鳥類觀察者此時則在睡覺。超過一個世紀以來,聲學監測作為解決鳥類學家困境的方法一直令人垂涎但無法實現。

在19世紀末,科學家們發現遷徙鳥類發出物種特定的夜間飛行叫聲——這些可以被視為「聲學指紋」。隨著1950年代麥克風的商業化,科學家開始在夜間錄製鳥類。法恩斯沃斯在1990年代領導了一些聲學生態研究。即使在那個時候,辨識這些短促叫聲仍然面臨挑戰,因為其中一些聲音位於人類聽覺的頻率邊緣。科學家們最終得到數千個錄音帶,必須在查看音頻的聲譜時即時檢索。儘管數字技術使錄音變得更加容易,但法恩斯沃斯表示,問題在於「收集大量音頻數據變得越來越簡單,但分析這些數據卻越來越困難。」

隨後,法恩斯沃斯遇到了紐約大學音樂與音頻研究實驗室的主任胡安·巴布羅·貝略。在完成一個使用機器學習識別紐約市城市噪音污染源的項目後,貝略同意接手夜間飛行叫聲的問題。他組建了一個團隊,包括法國機器聽覺專家文森特·洛斯坦倫,於2015年啟動了BirdVox項目以自動化該過程。法恩斯沃斯表示:「每個人都在想,‘最終當這個難題被解決時,這將成為一個極其豐富的信息來源。’」但在一開始,洛斯坦倫回憶道,「甚至沒有跡象表明這是可行的。」機器學習能接近法恩斯沃斯等專家的聽力能力似乎是不可想象的。

貝略說:「安德魯是我們的英雄。我們希望模仿的整個目標就是安德魯。」

他們開始訓練BirdVoxDetect這個神經網絡,讓其忽略由雨水損壞麥克風造成的低頻噪音等故障。然後,他們訓練系統來檢測飛行叫聲,這些叫聲在物種之間(甚至在同一物種內)有所不同,且容易與汽車警報器的叫聲或春季青蛙的叫聲混淆。洛斯坦倫表示,這一挑戰類似於智能音箱在聆聽其獨特的「喚醒詞」時所面臨的情況,但在這種情況下,目標噪音與麥克風的距離要遠得多(這意味著需要補償更多的背景噪音)。當然,科學家們無法為他們的觸發詞選擇像「Alexa」或「Hey Google」這樣的獨特聲音。「對於鳥類,我們並沒有真正做這樣的選擇。查爾斯·達爾文為我們做了這個選擇。」他打趣道。幸運的是,他們有大量的訓練數據可供使用——法恩斯沃斯的團隊手動註釋了在伊薩卡收集的數千小時錄音。

在BirdVoxDetect訓練好檢測飛行叫聲後,另一個艱巨的任務隨之而來:教導它根據物種對檢測到的叫聲進行分類,這是連少數專家鳥類觀察者也難以通過耳朵完成的。為了應對不確定性,並因為並非每個物種都有訓練數據,他們決定採用分層系統。例如,對於給定的叫聲,BirdVoxDetect可能能夠識別鳥類的目和科,即使不確定具體的物種——就像鳥類觀察者至少可以將一種叫聲識別為某種鶯鳥,無論是黃臀或栗側鶯。在訓練中,當神經網絡混淆了在分類樹上相近的鳥類時,懲罰會較輕。

去年八月,在經過八年的研究後,該團隊發表了一篇論文,詳細介紹了BirdVoxDetect的機器學習算法。他們還將該軟件作為免費的開源產品發佈,以供鳥類學家使用和改編。在對總計6671小時的遷徙錄音進行的測試中,神經網絡檢測到了233,124個飛行叫聲。在2022年《應用生態學雜誌》的一項研究中,測試BirdVoxDetect的團隊發現聲學數據在估算總生物量方面與雷達同樣有效。

BirdVoxDetect專注於北美的遷徙鳴禽,但透過「少量樣本」學習,它可以用少量訓練示例來檢測其他相似的鳥類。貝略表示,這就像學習一種與你已經會的語言相似的語言一樣。利用廉價的麥克風,該系統可以擴展到全球沒有鳥類觀察者或多普勒雷達的地方,即使在錄音條件截然不同的情況下。「如果你去參加一個生物聲學會議,與許多人交談,他們都有不同的使用案例。」洛斯坦倫說。他表示,生物聲學的下一步是創建一個基礎模型,就像科學家們正在為自然語言處理和圖像及視頻分析開發的模型那樣,這樣就能為任何物種——甚至超越鳥類——重新配置。這樣,科學家就不必為每種想要研究的動物建立一個新的BirdVoxDetect。

BirdVox項目現在已經完成,但科學家們已經在其算法和方法上進行深入的研究。伊利諾伊大學香檳分校的遷徙生物學家本傑明·范多倫正在使用Nighthawk,一個基於BirdVoxDetect和流行的鳥鳴識別應用Merlin的新型用戶友好神經網絡,來研究在芝加哥及南北美洲其他地方遷徙的鳥類。而在溫莎大學運行生物聲學實驗室的丹·梅尼爾則表示,他對使用Nighthawk來分析他們目前在加拿大五大湖一側用麥克風錄製的飛行叫聲感到興奮。聲學監測的弱點之一是,與雷達不同,單個麥克風無法檢測到鳥類的飛行高度或移動方向。梅尼爾的實驗室正在實驗一組八個麥克風,通過三角測量解決這一問題。在錄音中篩選數據的過程緩慢,但有了Nighthawk,分析速度將大幅提升。

隨著鳥類和其他遷徙動物面臨威脅,梅尼爾表示,BirdVoxDetect的出現恰逢其時。準確了解實時飛越的鳥類種類可以幫助科學家監測物種的狀況和遷徙方向。這可以為實際的保護工作提供信息,例如「熄燈」倡議,鼓勵摩天大樓在夜間熄燈以防止鳥類碰撞。梅尼爾說:「生物聲學是遷徙研究的未來,我們真的只是剛剛開始擁有合適的工具。這將引領我們進入一個新時代。」

這篇文章展示了科技如何為生物學的研究帶來突破,特別是在聲學監測方面。隨著氣候變化和人類活動對生態系統的不斷影響,這種技術的發展不僅能幫助我們更好地理解鳥類的行為和生態,還能為保護工作提供重要數據。隨著BirdVoxDetect這樣的工具的出現,未來的研究可能會更加精確和高效,這對於保護瀕危物種和促進生態保育至關重要。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

Chat Icon