從盤古氣象大模型思考人工智能的發展

繼上周談到華為雲的盤古氣象預測大模型一鳴驚人,而且更創新突破了傳統2D氣象模型,從中可以看到人工智能大模型的發展前景,只要放到行業應用上去,絕對是造福世界的事。大家可能沒有留意到,這次進入世人焦點的華為大模型,已是屬於第三代的。亦反映到相關團隊的突破不是偶然,這家企業在2022年投入了1,615億人民幣作為研發經費,近10年累計總投入已接近1萬億了。
其實氣象預測只是盤古大模型的其中一個應用項目而已,現時它總共分為3個層級︰L0的基礎大模型、L1的行業大模型,以及L2的細分場景推理大模型。現時表現最突出的,就是針對行業應用的L1層級,目前除氣象大模型之外,還開發出金融大模型、礦山大模型、電力大模型、製造質檢大模型、藥物分子大模型。當中較觸目是與中國科學院上海藥物研究所合作共同訓練的盤古藥物分子大模型,通過學習了17億個藥物分子的化學結構,實現對靶點蛋白質的計算和匹配,以及藥物生化屬性的預測,高效地生成藥物新分子。根據華為CEO張平安所舉的例子,傳統新藥研發需要平均10年時間,以及10億美金資金。在這個大模型之下,先導藥物的研發周期能縮短最低至1個月,研發成本減少70%。眾所周知,現時醫藥大廠大都是在北美洲,這些藥廠旱已通過人工智能進行新藥的研發,這些新藥品價格普遍昂貴,專利也掌握在這些大廠手上。對於全球發展中國家的人民而言,委實負擔不起。所以若我國能利用本身在人工智能方面的優勢,急起直追,始終有一天能做到外國大藥廠的新藥研發能力,加上規模大市場的作用下,把成本攤分,先進優質藥品的價格就能降下來,最終普惠眾生。
至於盤古大模型的L0,包括跟ChatGPT同一類別的中文語言NLP大模型、視覺CV大模型、與GPT-4相同的多模態大模型、科學計算大模型和圖網絡大模型。可見,世人常提及的ChatGPT等,在人工智能大模型中的歸類,只屬基礎應用層級,它們對社會的價值遠不及L1那些行業大模型。至於最高級的L2細分場景大模型又是啥?其實它是L1行業大模型的進階版,例如作為氣象預測的颱風場景預測、電力場景的缺陷識別,以及別開生面的時尚版權保護場景等,盡情地挖掘各種不同的人工智能應用場景。由此可見,未來的人工智能發展,在大量優質的行業數據支持下,可以滿足人工智能行業大模型的發展。根據深度學習的原理,在大量優質的數據訓練下,可以將運算精度逐漸提高。人工智能日後的橫向競爭重點,也是回到訓練數據的質量、數量上;這也是我國推動行業數字化轉型所建立的國家競爭優勢。