導讀:中國石油與中國移動、華為、科大訊飛聯(lián)手打造的 700 億參數(shù)昆侖大模型,展示了 43 個專業(yè)應用和通用應用創(chuàng)新場景。
據(jù)中國石油報,11 月 28 日,以“AI 領航?智繪能源”為主題的700 億參數(shù)昆侖大模型建設成果發(fā)布會在京舉辦。發(fā)布會上,中國石油介紹了與中國移動、華為、科大訊飛聯(lián)手打造的 700 億參數(shù)昆侖大模型,展示了 43 個專業(yè)應用和通用應用創(chuàng)新場景。
在行業(yè)大模型方面,昆侖大模型語言大模型參數(shù)從 330 億升級到 700 億,自然語言處理、語音視覺識別、多模態(tài)交互、科學計算等專業(yè)能力大幅提升;視覺大模型訓練數(shù)據(jù)進一步豐富,新增的巖石識別功能有效提升了地質(zhì)研究智能化水平;新訓練的 160 億參數(shù)多模態(tài)大模型為“人?車?生活”等營銷與服務業(yè)務提供了豐富的文、圖、音多模態(tài)交互能力。
在專業(yè)大模型方面,其構建了我國首個勘探全領域?qū)I(yè)大模型,涵蓋地震處理、地震解釋、測井處理解釋 3 個專業(yè)大模型,相比傳統(tǒng)方法,在泛化性、精度等方面都有了大幅提升。
在場景大模型方面,按需構建了 21 個場景大模型,每個場景大模型支持一類應用場景的多種應用。同時,昆侖大模型建立了場景數(shù)據(jù)集回流機制,定期將場景語料匯聚到專業(yè)、行業(yè)數(shù)據(jù)集,逐步提高專業(yè)、行業(yè)大模型能力,減少場景大模型數(shù)量。
此外,中國石油還構建了超過 280TB 的高質(zhì)量數(shù)據(jù)集,研發(fā)了集團公司集中統(tǒng)一 AI 中臺,算力、模型、應用的統(tǒng)一管理和協(xié)同調(diào)度能力有效加強。
據(jù)悉,昆侖大模型是中國能源化工行業(yè)首個通過備案的大模型,于今年 5 月正式啟動建設,3 個月后參數(shù)量級達到 330 億。