AI氣象模型現已能超越傳統預測
根據Google DeepMind研究人員今天在《自然》期刊發表的一篇論文,一種名為GenCast的機器學習氣象預測模型在某些情況下可以超越最佳的傳統預測系統。
這個系統採用了類似於人工智能(AI)圖像生成器的擴散模型方法,生成多個預測來捕捉大氣的複雜行為。與傳統方法相比,這樣的預測所需的時間和計算資源大幅減少。
氣象預測的運作原理
我們日常使用的天氣預測是通過多次對大氣進行數值模擬來產生的。每次模擬都是從略有不同的當前天氣估算開始。這是因為我們無法確切知道全球每個地方當前的天氣狀況。要知道這一點,我們需要在每個地方都有傳感器進行測量。
這些數值模擬使用將世界大氣劃分為三維區塊的模型。通過解決描述自然基本物理法則的方程,這些模擬預測大氣中的情況。
這些被稱為一般環流模型的模擬需要大量的計算能力,通常在高性能超級計算機設施上運行。
機器學習氣象預測
近幾年來,利用機器學習進行氣象預測模型的努力激增。通常,這些方法並不像一般環流模型那樣納入我們對自然法則的理解。
大多數這些模型使用某種形式的神經網絡來學習歷史數據中的模式,並產生單一的未來預測。然而,這種方法在預測未來時會逐漸失去細節,預測結果變得越來越“平滑”。這種平滑性與我們在真實天氣系統中所見的情況並不一致。
Google DeepMind的研究人員最近在《自然》上發表了一篇論文,描述了他們最新的機器學習模型GenCast。
GenCast通過生成多個預測來減輕這種平滑效應。每個單獨的預測較少平滑,更好地反映了自然界中觀察到的複雜性。
最接近實際未來的預測來自於對不同預測的平均。個別預測之間的差異大小則顯示了不確定性的程度。
根據GenCast的論文,這種概率性的方法能夠產生比世界上最佳的數值氣象預測系統(歐洲中期天氣預測中心)更準確的預測。
生成性AI——用於氣象預測
GenCast是基於1979年至2018年的再分析數據進行訓練的。這些數據由我們之前提到的一般環流模型生成,並進一步修正以符合實際歷史天氣觀測,從而提供更一致的全球天氣圖像。
GenCast模型對多個變數進行預測,如地面和13個不同高度的氣溫、氣壓、濕度和風速,並將世界劃分為每0.25度的緯度和經度區域。
GenCast是一種“擴散模型”,類似於AI圖像生成器。然而,它不是從文本生成圖像,而是從當前的大氣狀態生成12小時後的估計。
這一過程首先將大氣變數在12小時後的值設為隨機噪聲。然後,GenCast使用神經網絡來尋找與當前和先前天氣變數相符的噪聲結構。通過從不同的隨機噪聲開始,可以生成多個預測的集合。
預測可以延伸到15天,使用單個稱為張量處理單元(TPU)的處理器僅需8分鐘,這比一般環流模型快得多。該模型的訓練則使用32個TPU進行了五天。
隨著效率和可靠性的提高,機器學習預測在未來幾年可能會變得更加普遍。
然而,傳統的數值氣象預測和再分析數據仍然是必需的。它們不僅提供了機器學習氣象預測的初始條件,還產生了不斷微調機器學習模型所需的輸入數據。
氣候預測的挑戰
目前的機器學習氣象預測系統並不適合氣候預測,主要有三個原因。
首先,要進行數周後的天氣預測,可以假設海洋、陸地和海冰不會改變。但這對於數十年的氣候預測則不成立。
其次,天氣預測高度依賴於當前天氣的細節。然而,氣候預測則關注未來數十年的氣候統計,當前的天氣與之無關。未來的碳排放才是決定氣候未來狀態的主要因素。
第三,天氣預測是一個“大數據”問題。相關的觀測數據量龐大,這正是訓練復雜機器學習模型所需的。
氣候預測則是一個“小數據”問題,相關數據相對較少。這是因為相關的物理現象(如海平面或氣候驅動因素如厄爾尼諾現象)演變的速度遠低於天氣。
解決這些問題的方法有很多。一種方法是利用我們對物理學的理解來簡化模型,使其對機器學習所需的數據量減少。
另一種方法是使用物理知識來設計“基本規則”,然後使用機器學習來確定具體的模型參數。
機器學習在未來的氣象預測和氣候預測中將扮演重要角色。然而,基本物理學——流體力學和熱力學——將繼續發揮關鍵作用。
作為一名記者,我認為這項研究展示了機器學習在氣象預測中的潛力,尤其是它能夠捕捉到大氣的複雜性,這是傳統模型難以實現的。然而,這並不意味著傳統方法會被完全取代,兩者的結合將可能帶來更準確的預測,這對於應對氣候變化帶來的挑戰至關重要。未來的研究應更加關注如何將機器學習與物理模型有機融合,以更好地應對不確定性和變化。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。