平起驚雷的中國人工智能大模型

上周提到過,新一代生成式人工智能大模型最大的價值是賦能各種行業的應用上,而非像ChatGPT那樣面對一般公眾用戶群。現時西方最突出的ChatGPT、Google Bard、New Bing等都是依靠背後從搜索引擎所累積的龐大數據進行訓練,這類數據的確覆蓋很廣,但卻質量不高,所生成的文本大都是概念性強而乾貨不多的東西。而且背後數據庫的內容是否準確無誤,用戶真的不會知悉。這些面向公眾的GPT特性,未必能滿足商業、學術上較嚴謹的要求。不單如此,人工智能大模型需要耗用大量的資金成本,若是只面對公眾用戶,長期下來,根本負擔不來。但ChatGPT在這裡依靠先發優勢,藉全球的焦點吸引大量的投資;傳聞某大國際科技企業已提供100億美元的資金,足夠研發和運營好一段日子。大家可能會納悶,當今在人工智能號稱能跟美國平分春色的中國,為何沒有甚麼類似ChatGPT的產品。

7月6日的一則報道,為國人大大地爭了一口氣。華為作為首間中國科技企業以獨立署名,在全球知名科技學術期刊Nature中發表論文,公開其「華為雲盤古氣象大模型」在氣象預測方面的驚人成就,並且獲得審稿專家的高度評價,認為華為這項成果讓人們重新審視氣象預報的未來,推動該領域的發展。在華為的人工智能大模型運算之下,僅用一顆V100 GPU,只需1.4秒便能完成全球24小時的氣象預報運算,就算是未來7天的高分辨率全球天氣預報,亦只需幾分鐘而已,比傳統方式快了10,000倍以上!不單在速度上有驚人的表現,在精度上也是對傳統人工智能氣象預報的準確率有重大的突破。現時利用人工智能來進行氣象預測都是使用2D結構的神經網絡,不足以很好地處理現實中複雜的3D氣象數據。

華為獨創以地球坐標系統為基礎的3D神經網絡(3D Earth-Specific Transformer),可以處理複雜不均勻的3D氣象數據。在2018年超強颱風「玉兔」的路徑預測中,相比傳統方法提早48小時判斷出正確登陸位置,而且運算出來的預測路徑與後來的實際颱風路徑驚人地貼近。歐洲氣象中心在去年底取得盤古大氣象大模型的使用權,其精度和比傳統人工智能所需更低的能耗,獲得歐洲氣象局在第19屆世界氣象大會上的高度評價。之所以獲得全球的重視,主要是在新一代人工智能大模型之下,可以讓大家看到無論在精度、速度與運算能耗方面都突破了行業現時所使用的所有傳統人工智能運算模型,展現進一步突破性發展的可能性。

正值下周會近來今年第5號颱風「杜蘇芮」,大家都在關注路徑預測,我會選擇基於盤古大模型預測的結果。因篇幅所限,我們下周再續。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *