天氣預(yù)報是研究大氣系統(tǒng)演變的重要科學(xué)手段,同時對社會發(fā)展和國家戰(zhàn)略至關(guān)重要。它帶來的經(jīng)濟(jì)效益和社會價值巨大。在世界范圍內(nèi),天氣預(yù)報所貢獻(xiàn)的經(jīng)濟(jì)效益高達(dá)1620億美元,至少占全球GDP的0.185%。在中國,約40%的GDP受到天氣和氣候的影響,尤其在農(nóng)業(yè)生產(chǎn)中,天氣預(yù)報的作用更為突出。近年來,全球氣候變暖加劇,極端氣象災(zāi)害頻發(fā),給人類生產(chǎn)生活帶來巨大挑戰(zhàn)。普及早期預(yù)警機(jī)制,不僅每年可避免高達(dá)130億美元的財產(chǎn)損失,更能拯救無數(shù)生命。
傳統(tǒng)天氣預(yù)報的歷史、原理和瓶頸
數(shù)值天氣預(yù)報理論源于上世紀(jì)初。1904年,挪威科學(xué)家Bjerknes便提出通過數(shù)學(xué)物理方程來預(yù)測天氣,但因算力不足難以實踐。1922年,英國氣象學(xué)家Richardson動員大量人力,歷經(jīng)6周,以手工紙筆的方式完成了首次6h“預(yù)報”。1950年,美國氣象學(xué)家Charney首次利用電子計算機(jī),“僅”花費(fèi)24h便完成了24h的預(yù)報,在氣象學(xué)界引起巨大轟動。隨著計算機(jī)性能提升,數(shù)值天氣預(yù)報逐步成熟,預(yù)報時長延長至5—7天,分辨率也從數(shù)百公里精細(xì)至幾公里。
數(shù)值天氣預(yù)報的基本原理在于,首先將雷達(dá)、衛(wèi)星等觀測資料,形成網(wǎng)格化的溫度、氣壓、濕度、風(fēng)速等氣象變量,并通過求解大氣動力學(xué)方程模擬其未來演變。數(shù)十年來,科學(xué)家們不斷完善復(fù)雜的偏微分方程系統(tǒng),力求更準(zhǔn)確地描述大氣的變化動態(tài)。
近年來,數(shù)值預(yù)報方法在精度和速度上遭遇瓶頸。精度提升緩慢,時效性平均每十年才提升一天。歐洲中期天氣預(yù)報中心(ECMWF)數(shù)據(jù)顯示,2012—2022年間,多個氣象要素的3—7天預(yù)報誤差減少不到5%,原因是偏微分方程的誤差累積和觀測數(shù)據(jù)的不完整和不準(zhǔn)確性。同時,天氣預(yù)報對計算資源的消耗巨大,需要超級計算機(jī)持續(xù)不斷地運(yùn)算才能滿足實際需求,使許多欠發(fā)達(dá)國家難以建立自己的數(shù)值預(yù)報系統(tǒng)。
人工智能大模型讓天氣預(yù)報越來越準(zhǔn)
人工智能技術(shù)的飛速發(fā)展,深刻改變了人們的生產(chǎn)和生活。當(dāng)傳統(tǒng)數(shù)值預(yù)報面臨挑戰(zhàn)時,人們好奇人工智能能否用于天氣預(yù)報,并超越傳統(tǒng)方法?2023年7月,我國科研團(tuán)隊給出了積極回應(yīng)。華為云計算技術(shù)有限公司田奇團(tuán)隊開展的“盤古氣象大模型”項目,采用適配地球坐標(biāo)的三維神經(jīng)網(wǎng)絡(luò)與層次化時域聚合策略,實現(xiàn)了精準(zhǔn)的全球中期氣象預(yù)報。經(jīng)過全球天氣再分析數(shù)據(jù)訓(xùn)練,該模型能準(zhǔn)確預(yù)報7天內(nèi)多層氣象要素等,相比全球領(lǐng)先的ECMWF系統(tǒng),預(yù)報時效提高約0.6天,熱帶氣旋路徑預(yù)報誤差降低25%。該模型僅需10秒即可完成全球7天預(yù)報,計算速度提升萬倍以上。這一成果入選了2023年度“中國科學(xué)十大進(jìn)展”。他們在《自然》雜志上發(fā)表論文,提出了可用于全球中期氣象預(yù)報的“盤古氣象大模型”,不僅首次超越了傳統(tǒng)數(shù)值預(yù)報的精度,還在臺風(fēng)路徑預(yù)報上表現(xiàn)卓越。盤古氣象大模型基于深度學(xué)習(xí)理論,不同于傳統(tǒng)數(shù)值預(yù)報:不依賴于大氣動力學(xué)方程,而是構(gòu)建深度神經(jīng)網(wǎng)絡(luò),將歷史上的氣象數(shù)據(jù)作為訓(xùn)練資料,對神經(jīng)網(wǎng)絡(luò)進(jìn)行調(diào)優(yōu)。田奇團(tuán)隊率先意識到這類方法的巨大潛力,構(gòu)建了適用于全球高分辨率中長期天氣預(yù)報的三維神經(jīng)網(wǎng)絡(luò)大模型。該模型應(yīng)用三維transformer網(wǎng)絡(luò)架構(gòu),采用經(jīng)典的編碼器—解碼器設(shè)計模式,并引入地球位置先驗和層次化時域聚合策略,有效地提升了訓(xùn)練效率,降低了推理功耗。
團(tuán)隊用1979—2017年全球再分析數(shù)據(jù)訓(xùn)練盤古氣象模型,并在2018年數(shù)據(jù)上進(jìn)行了詳盡的測試。整個訓(xùn)練過程在192塊GPU上耗時約兩個月,訓(xùn)練資料超60TB。實驗結(jié)果顯示,盤古在數(shù)值天氣預(yù)報領(lǐng)域展現(xiàn)出驚人的性能,當(dāng)以再分析數(shù)據(jù)作為輸入時,其精度甚至超越了公認(rèn)最精確的傳統(tǒng)數(shù)值預(yù)報模型,即歐洲氣象中心的集成預(yù)報系統(tǒng)(IFS)。它僅需10秒即可完成全球7天高分辨率數(shù)值天氣預(yù)報,推理速度提升了萬倍以上,而計算功耗則降低了十萬倍以上。盤古氣象大模型的優(yōu)勢,主要體現(xiàn)在這些方面。
一是在確定性天氣預(yù)報方面。盤古氣象大模型在2018年ERA5數(shù)據(jù)測試中,在溫度、氣壓、濕度、風(fēng)速等氣象變量上,預(yù)報精度均超越IFS,增加預(yù)報時效0.6天,成為首個超越IFS的人工智能模型。
二是在極端天氣預(yù)報方面。盤古氣象大模型基于其預(yù)測的平均海面氣壓(MSLP)變量,通過迭代算法,能夠精確預(yù)測未來一段時間內(nèi)每6h的臺風(fēng)眼位置,進(jìn)而推算出臺風(fēng)路徑。2018年全球88個命名臺風(fēng)的測試結(jié)果表明,其對臺風(fēng)眼位置的3天和5天預(yù)測的絕對位置誤差比歐洲氣象中心的高分辨率系統(tǒng)低25%以上。
三是在集成天氣預(yù)報方面。盤古氣象大模型的推理速度極快,能夠大幅降低集成天氣預(yù)報的計算開銷。在包含100個成員變量的集成預(yù)報中,其中長期預(yù)報精度得到了顯著提升,并能夠?qū)︻A(yù)報結(jié)果的不確定性進(jìn)行定量分析。
人工智能大模型在氣象預(yù)報場景的實際應(yīng)用
基于前述研究成果,盤古氣象大模型團(tuán)隊積極攜手中國氣象局、香港天文臺、歐洲氣象中心及世界氣象組織等合作伙伴,將科研成果轉(zhuǎn)化為實際應(yīng)用。目前,這些努力已經(jīng)取得實質(zhì)性的成果。
2023年汛期,盤古氣象大模型與中國氣象局深入合作,成功追蹤多個臺風(fēng)并將相關(guān)成果納入常態(tài)化會商機(jī)制。以2302號臺風(fēng)瑪娃和2305號臺風(fēng)杜蘇芮為例,盤古氣象大模型精準(zhǔn)預(yù)判其路徑,為大陸臺風(fēng)防御提供關(guān)鍵支持。香港天文臺亦驗證盤古氣象大模型在2309號臺風(fēng)蘇拉預(yù)報中優(yōu)于包括IFS在內(nèi)的傳統(tǒng)方法,展現(xiàn)了卓越性能。
此外,歐洲氣象中心亦對盤古氣象大模型進(jìn)行了實際測試,涵蓋了2023年2月的冬季風(fēng)暴Otto、南半球熱帶氣旋Freddy等多個極端天氣過程。同年7月,歐洲氣象中心正式將盤古氣象大模型的預(yù)報結(jié)果納入其官方網(wǎng)站,為全球用戶提供實時、準(zhǔn)確的參考數(shù)據(jù)。
世界氣象組織在聽取團(tuán)隊的技術(shù)報告后,對盤古氣象大模型給予了高度評價,認(rèn)為其低推理計算開銷的特點(diǎn)使其在發(fā)展中國家具有廣闊的應(yīng)用前景。盤古團(tuán)隊將與世界氣象組織緊密合作,計劃將盤古氣象大模型引入世界上30個最不發(fā)達(dá)國家,為這些地區(qū)提供早期災(zāi)害預(yù)警能力。
我國數(shù)值氣象預(yù)報發(fā)展可能遭受的風(fēng)險和挑戰(zhàn)
盡管以盤古為代表的人工智能方法已經(jīng)展現(xiàn)出巨大的潛力,但我國在數(shù)值氣象預(yù)報領(lǐng)域仍面臨諸多風(fēng)險和挑戰(zhàn),亟待解決。
首先,數(shù)據(jù)對外存在依賴。目前,我國在數(shù)值氣象預(yù)報中主要依賴外部數(shù)據(jù)源,如國際共享的氣象數(shù)據(jù),存在潛在風(fēng)險。一旦外部數(shù)據(jù)源出現(xiàn)問題或限制訪問,我國數(shù)值氣象預(yù)報的準(zhǔn)確性和時效性就會受到嚴(yán)重影響。因此,構(gòu)建全面、自主的天氣數(shù)據(jù)體系成為迫切需求。這需要我國加快自主研發(fā)和部署氣象觀測設(shè)備,整合衛(wèi)星、地面觀測等多源數(shù)據(jù),形成完整、可靠的數(shù)據(jù)鏈條,為數(shù)值氣象預(yù)報提供堅實的數(shù)據(jù)支撐。
其次,算力瓶頸是挑戰(zhàn)。氣象預(yù)報涉及大量的計算和分析工作,對計算資源的需求極高。然而,目前我國在高性能計算領(lǐng)域仍存在不足,難以滿足算力需求。這可能導(dǎo)致預(yù)報模型的訓(xùn)練和優(yōu)化受限,影響預(yù)報的精度和效率。因此,我國應(yīng)加大投入,研發(fā)自主可控的高性能計算硬件和軟件,加強(qiáng)人工智能算力集群的建設(shè),為數(shù)值氣象預(yù)報提供強(qiáng)大的底層算力保障。
最后,跨學(xué)科研究不足。氣象預(yù)報涉及數(shù)學(xué)、物理、計算機(jī)等多個學(xué)科領(lǐng)域,然而,目前我國還存在缺乏跨學(xué)科的研究團(tuán)隊和合作機(jī)制等不足。因此,我國應(yīng)加強(qiáng)對創(chuàng)新性理論研究和實踐探索的支持,促進(jìn)不同學(xué)科之間的交叉融合,培養(yǎng)并吸引頂尖人才,為未來技術(shù)的突破儲備強(qiáng)大的智力資源。