
驗證技術有助於科學家作出更準確的預測
麻省理工學院的研究人員開發出一種新方法,用於評估具有空間維度的預測,如天氣預報或空氣污染地圖。
在日常生活中,出門前要不要帶雨傘?如果天氣預報不準確,提前查看預報也無濟於事。空間預測問題,例如天氣預報或空氣污染估算,涉及根據已知位置的數據來預測新位置的變量值。科學家通常使用經典的驗證方法來確定這些預測的可靠性。
然而,麻省理工學院的研究人員發現,這些流行的驗證方法在空間預測任務中可能會失效,這可能導致人們誤以為某個預測是準確的,或者某種新的預測方法是有效的,實際上卻並非如此。
研究人員開發了一種技術來評估預測驗證方法,並用它來證明兩種經典方法在空間問題上可能是根本錯誤的。他們接著分析這些方法失效的原因,並創建了一種新方法,專門處理用於空間預測的數據。
在使用真實和模擬數據的實驗中,他們的新方法提供了比兩種最常見技術更準確的驗證結果。研究人員使用現實的空間問題進行評估,包括預測芝加哥奧黑爾機場的風速和預測美國五個都市地區的空氣溫度。
他們的驗證方法可以應用於多種問題,從幫助氣候科學家預測海表溫度,到協助流行病學者估算空氣污染對某些疾病的影響。
麻省理工學院電機工程與計算機科學系副教授塔瑪拉·布羅德里克表示:「希望這能促使人們在提出新的預測方法時進行更可靠的評估,並更好地理解方法的表現。」
布羅德里克在該論文中與首席作者和麻省理工學院博士後研究員大衛·R·伯特,以及電機工程與計算機科學系研究生沈雲怡共同合作。該研究將在國際人工智慧與統計會議上發表。
評估驗證
布羅德里克的團隊最近與海洋學家和大氣科學家合作,開發可用於強空間組件問題的機器學習預測模型。在這項工作中,他們注意到傳統的驗證方法在空間環境中可能不準確。這些方法會保留一小部分訓練數據,稱為驗證數據,並用來評估預測器的準確性。
為了找出問題的根源,他們進行了徹底的分析,發現傳統方法對空間數據的假設不恰當。評估方法依賴於有關驗證數據和要預測的數據(稱為測試數據)之間關係的假設。
傳統方法假設驗證數據和測試數據是獨立且同分佈的,這意味著任何數據點的值不依賴於其他數據點。但在空間應用中,這通常並不成立。例如,科學家可能使用環保署的空氣污染傳感器的驗證數據來測試預測保護區空氣污染的方法。然而,環保署的傳感器並不是獨立的——它們的設置是基於其他傳感器的位置。
此外,驗證數據可能來自城市附近的環保署傳感器,而保護區則位於農村地區。由於這些數據來自不同的位置,它們的統計特性可能不同,因此並不符合同分佈的假設。
布羅德里克表示:「我們的實驗顯示,當這些驗證方法的假設失效時,空間情況下會得出非常錯誤的結果。」
研究人員需要提出一種新的假設。
具體空間的考量
他們專注於空間背景,即數據來自不同位置的情況,設計了一種假設驗證數據和測試數據在空間上平滑變化的方法。例如,兩個相鄰房屋的空氣污染水平不太可能發生劇烈變化。
布羅德里克指出:「這種規則性假設適用於許多空間過程,並使我們能夠在空間領域中創建評估空間預測器的方法。據我們所知,還沒有人系統性地理論評估過出現問題的原因,從而提出更好的方法。」
使用他們的評估技術時,只需輸入預測器、想要預測的位置和驗證數據,然後系統自動處理其餘部分。最終,它將估算預測器在相關位置的預測準確性。然而,評估他們的驗證技術卻是一項挑戰。
布羅德里克解釋道:「我們不是在評估一種方法,而是在評估一種評估。因此,我們必須退後一步,仔細思考,並創造性地設計合適的實驗。」
首先,他們使用模擬數據設計了幾個測試,這些數據雖然不現實,但使他們能夠仔細控制關鍵參數。然後,他們通過修改真實數據創建了更現實的半模擬數據。最後,他們使用真實數據進行了幾個實驗。
利用來自現實問題的三種類型數據,例如根據位置預測英國公寓價格和預測風速,使他們能夠進行全面評估。在大多數實驗中,他們的方法比任何傳統方法都更準確。
未來,研究人員計劃將這些技術應用於改善空間環境中的不確定性量化。他們還希望找到其他可以利用規則性假設來改善預測性能的領域,例如時間序列數據。
這項研究部分由國家科學基金會和海軍研究辦公室資助。
—
這篇文章展示了麻省理工學院在空間預測領域的創新研究,強調了傳統驗證方法在特定情境中可能出現的問題。這不僅是對學術界的一項重要貢獻,也是對實際應用的啟示。隨著科技進步,數據的準確性和可靠性愈加重要,這項研究將促使科學家在未來開發出更精確的預測工具。這不僅對氣候科學、公共健康等領域有深遠影響,也可能改變我們對環境變化的理解和應對方式。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。