大型語言模型加速高海拔科學研究
來源:科技日報 | 2025-04-24 10:38:47 | 作者:實習記者
這張照片顯示了中國西藏自治區西南部的珠穆朗瑪峰腳下的東戎布克冰川。 (圖片來源:新華社)
阿里巴巴的通義千問(Qwen)推理大型語言模型(LLM)QwQ-32B已被整合到中國科學院(CAS)多個研究所的科學研究中,有助於青藏高原的太陽耀斑和水資源研究。
太陽耀斑對於科學家來說是探索太陽奧秘的關鍵。由於研究人員需要處理大量的多模態數據,因此對算法有更高的要求。像QwQ-32B這樣的LLM帶來了新的解決方案。
在北京天文台,中國科學院國家天文台(NAOC)的研究人員正在使用基於QwQ-32B開發的太陽物理LLM JinWu,精確預測太陽耀斑活動。
國家天文台人工智能小組的李宇陽表示,團隊訓練JinWu模型,以理解和回答太陽物理問題,並通過監督學習和強化學習識別和分析太陽圖像。
JinWu的太陽耀斑爆發預測準確度已達到該領域的前沿水平。預測訓練和測試的數據來源包括美國國家航空航天局(NASA)太陽動力學天文台的衛星公共數據、北京懷柔基地35厘米磁場望遠鏡的數據,以及中國2022年發射的太陽探測衛星Kuafu-1的全盤矢量磁圖數據。
天文LLM“星宇3.0”與國家天文台興隆觀測站的Mini-SiTian陣列相連,可以自主控制觀測、分析數據和推薦後續計劃。
由於科學研究對數據安全性要求非常高,一些研究場景會在本地部署LLM。QwQ-32B能夠滿足LLM能力的需求,並且成本相對較低。
另一個值得注意的例子是探索青藏高原的“水密碼”。
被譽為“亞洲水塔”的青藏高原是全球對氣候變化最敏感的地區之一。第二次青藏高原科學考察和研究項目發現,高原上的固態水正在迅速融化,液態水正在增加。氣候變化帶來的不確定性可能導致高原上的水和能源安全風險。
面對這一挑戰,中國科學院青藏高原研究所(ITP)與阿里雲合作,創建了第一個關注氣候變化適應性的水-能源-食物多模態推理LLM“洛書”。
研究水-能源-食物的耦合關係——水資源、能源系統和糧食生產之間的複雜相互依存和影響關係——對於開發更具韌性的應對策略至關重要。
青藏高原研究所助理研究員夏嘴輝表示,“洛書”基於研究所自主開發的模型“思源”,並在高原的時空數據上進行訓練。其輸出由兩部分組成:直接支持水力發電預報的徑流量,以及準確描述水文過程的高維數據。
然而,人類無法直接理解和使用這些數據。將“思源”與Qwen連接後,可以實現自然語言查詢和輸出,並實現高維數據的可視化呈現,前線人員可以直接根據這些數據做出決策。
此外,結合“思源”和QwQ-32B,“洛書”可以直接分析數據得出結論。例如,關於在旱季應該觀察什麼以及未來如何適應氣候變化的問題可以通過LLM推理來解釋,從而輔助決策。
在這項研究中,團隊還借助阿里雲提供的AI計算資源、數據存儲和深度學習平台,處理了大量的數據和複雜的計算任務,實現了模型的快速實驗和迭代,顯著提高了科研效率。
未來,“洛書”還將與Qwen-VL相連,以高效識別圖像數據,並與智能體、具身智能觀測以及空天一體化動態數據中心協同工作。這將為青藏高原的生態保護和可持續發展提供科技支持。
編輯:盧子健
作為編輯,我認為這篇文章揭示了大型語言模型在高海拔科學研究中的巨大潛力。通過與阿里巴巴的通義千問(Qwen)推理大型語言模型(LLM)QwQ-32B的整合,中國科學院的多個研究所能夠更高效地開展太陽耀斑和水資源研究。這不僅提高了科研效率,也為青藏高原的生態保護和可持續發展提供了新的科技支持。
然而,我也注意到,這些技術的應用也帶來了一些挑戰。例如,科學研究對數據安全性要求非常高,而LLM的部署和訓練需要大量的數據和計算資源。因此,如何在確保數據安全的前提下,充分發揮LLM的潛力,仍然是一個需要解決的問題。
此外,我還想探討一下LLM在高海拔科學研究中的更廣泛的應用前景。例如,LLM是否可以應用於其他高海拔地區的科學研究,如環境監測、氣候變化研究等?這些都是值得進一步探討的問題。
總之,這篇文章為我們提供了新的視角和啟發,展示了大型語言模型在高海拔科學研究中的巨大潛力。我相信,隨著技術的不斷進步和創新,LLM將在更多的領域發揮重要作用,為人類的科學研究和可持續發展提供更多的支持。