技術(shù)
導(dǎo)讀:在人們討論國(guó)內(nèi)人工智能領(lǐng)域的熱點(diǎn)話題時(shí),也有不少挑戰(zhàn)與隱憂困擾著眾多參與者
說(shuō)到科技,我們首先會(huì)聯(lián)想到的就是5G、大數(shù)據(jù)、萬(wàn)物互聯(lián)和人工智能等熱詞。不可否認(rèn)的是,人工智能是這些新興信息技術(shù)中的“當(dāng)紅炸子雞”,更是未來(lái)產(chǎn)業(yè)、社會(huì)甚至國(guó)力發(fā)展的“底氣”所在。
值得欣喜的是,國(guó)內(nèi)人工智能領(lǐng)域近年來(lái)取得了不少新的突破和成績(jī),在近期有關(guān)部門發(fā)布的《2020人工智能中國(guó)專利技術(shù)分析報(bào)告》中可以看到,截至2020年10月,中國(guó)人工智能專利申請(qǐng)量累計(jì)已達(dá)69.4萬(wàn)余件,同比增長(zhǎng)56.3 %;IDC相關(guān)調(diào)研報(bào)告中,對(duì)2020年全球各國(guó)AI計(jì)算的發(fā)展水平統(tǒng)計(jì)后發(fā)現(xiàn),中國(guó)人工智能服務(wù)器占全球市場(chǎng)三分之一左右,成為全球人工智能產(chǎn)業(yè)發(fā)展的中堅(jiān)力量;而全球知名AI計(jì)算基準(zhǔn)評(píng)測(cè)組織MLPerf在去年底也公布了一份“2020年推理測(cè)試榜單”,中國(guó)科技企業(yè)的產(chǎn)品創(chuàng)造了18項(xiàng)全球性能紀(jì)錄……
但是,在人們討論國(guó)內(nèi)人工智能領(lǐng)域的熱點(diǎn)話題時(shí),也有不少挑戰(zhàn)與隱憂困擾著眾多參與者,尤其是AI應(yīng)用及落地的進(jìn)程中,痛點(diǎn)與焦慮也隨之出現(xiàn),如果歸納總結(jié)一下,可以聚焦為這三個(gè)問(wèn)題:
1.如何解決AI算力匱乏與成本高企的矛盾?
2.能否打造類似水電供給的AI算力基礎(chǔ)設(shè)施?
3.如何協(xié)同行業(yè)在AI應(yīng)用落地過(guò)程中迎接“產(chǎn)業(yè)AI化”大潮?
破局,無(wú)疑要從滿足行業(yè)需求以及夯實(shí)發(fā)展基礎(chǔ)做起。
爆發(fā)的需求和“暴漲”的壓力
無(wú)產(chǎn)業(yè)不AI,無(wú)企業(yè)不AI——人工智能已經(jīng)迅速滲透到各行各業(yè)的發(fā)展建設(shè)中,這已經(jīng)是不爭(zhēng)的事實(shí)。
但是,太多問(wèn)題也隨之而來(lái):簡(jiǎn)單點(diǎn)兒說(shuō)就是各行各業(yè)對(duì)AI需求的“胃口”越來(lái)越大,但是AI能力的供給匱乏,而成本卻在“暴漲”。這正是AI在供需層面的痛點(diǎn)與矛盾。
關(guān)于需求的變化有兩點(diǎn)值得注意:一方面是量的增長(zhǎng),另一方面是質(zhì)的變化。
IDC在2020年6月至8月期間,針對(duì)中國(guó)企業(yè)人工智能應(yīng)用需求開(kāi)展了一項(xiàng)專題調(diào)查和研究。調(diào)研發(fā)現(xiàn),企業(yè)對(duì)于人工智能帶來(lái)的價(jià)值有了更深的認(rèn)知,企業(yè)在人工智能應(yīng)用上正在采取更多積極的舉措。
在作者看來(lái),這其中最大的變化就體現(xiàn)在人工智能新的應(yīng)用場(chǎng)景嘗試上,即除了已經(jīng)得到多個(gè)行業(yè)驗(yàn)證的通用場(chǎng)景之外,不同行業(yè)的用戶還在根據(jù)自身的行業(yè)特性在進(jìn)行積極嘗試,開(kāi)辟一些新的碎片化應(yīng)用場(chǎng)景。
數(shù)據(jù)顯示有超過(guò)九成的企業(yè)正在使用或計(jì)劃在未來(lái)三年內(nèi)使用人工智能,其中,大部分企業(yè)采用了公有云、私有云加本地部署的混合架構(gòu)來(lái)部署人工智能應(yīng)用,而74.5%的企業(yè)期望在未來(lái)可以采用具備公用設(shè)施意義的人工智能新型基礎(chǔ)設(shè)施。請(qǐng)注意:這一期望也是不同地區(qū)和不同規(guī)模的企業(yè)的共識(shí)。
除了量的變化,AI算力方面的質(zhì)變則更令人關(guān)注。
提到質(zhì)變,首先要談一下AI模型。這其中,最具代表性的就是打敗李世石的Alpha GO,以及OpenAI實(shí)驗(yàn)室去年推出的GPT3。前者因?yàn)樵趪宸矫嫠宫F(xiàn)的天賦盡人皆知,而后者則是在去年發(fā)布后就引發(fā)了AI科學(xué)領(lǐng)域的震蕩。
其實(shí)眾多AI模型的不斷出現(xiàn),終極目標(biāo)就是具備更高“等級(jí)”的智能。而每一次模型智能程度的提升,都使得模型也愈加復(fù)雜,模型尺寸也呈現(xiàn)爆發(fā)式增長(zhǎng)。這里打一個(gè)不是很恰當(dāng)?shù)谋扔鳎绻覀儗⑹┩咝粮裰餮莸摹督K結(jié)者》里面的天網(wǎng),視為AI所能達(dá)到的的最高境界,那么2012開(kāi)始出現(xiàn)的AlexNet網(wǎng)絡(luò)模型,以及此后幾年的ResNet、Transformer、BERT直至GPT-3等優(yōu)秀AI模型,就是在向天網(wǎng)這樣的終極目標(biāo)邁進(jìn)。
尤其是OpenAI實(shí)驗(yàn)室推出的自然語(yǔ)言模型GPT-3,擁有1750億語(yǔ)言模型參數(shù)量,通過(guò)訓(xùn)練已經(jīng)可以寫詩(shī)、寫樂(lè)譜,回答歷史、天文問(wèn)題,甚至涉足醫(yī)療領(lǐng)域,被一些科學(xué)家稱為“幼年期的天網(wǎng)”。與此同時(shí),它也是名副其實(shí)的“算力吞噬者”。
顯然,越先進(jìn)的大規(guī)模AI模型越需要耗費(fèi)大量的計(jì)算資源,如果沒(méi)有強(qiáng)勁的算力支撐,訓(xùn)練一個(gè)先進(jìn)的模型所耗費(fèi)的時(shí)間和金錢成本——絕對(duì)是很多人無(wú)法想象的。
舉一個(gè)簡(jiǎn)單的例子:媒體機(jī)構(gòu)量子位做了估算,訓(xùn)練一個(gè)GPT-3模型需要一塊GPU運(yùn)行355年;其訓(xùn)練成本約在600-1200 萬(wàn)美元。反觀2016年出現(xiàn)的Resnet-152模型,各方面成本不足GPT-3的萬(wàn)分之三。
你覺(jué)得這已經(jīng)很恐怖了?實(shí)際上就在2021年1月,谷歌大腦的科學(xué)家剛宣布他們?cè)O(shè)計(jì)的簡(jiǎn)化稀疏架構(gòu)(Switch Transformer)能將語(yǔ)言模型的參數(shù)量擴(kuò)展到1.6 萬(wàn)億,這已經(jīng)近十倍于GPT-3了。
無(wú)需咂舌,這就是AI進(jìn)化過(guò)程中不可逆的質(zhì)變。
中國(guó)工程院院士鄭緯民鄭緯民曾經(jīng)指出,下一代AI的發(fā)展亟需建設(shè)大規(guī)模的AI算力基礎(chǔ)設(shè)施。GPT-3取得了很好的進(jìn)步,但是離人類智能還有差距,下一代人工智能模型可能超過(guò)萬(wàn)億參數(shù)。如今,這個(gè)萬(wàn)億參數(shù)的AI“巨獸”已經(jīng)到來(lái)。
而在懂懂看來(lái),承載AI的新型算力基礎(chǔ)設(shè)施的供給水平,將成為直接影響AI創(chuàng)新迭代及產(chǎn)業(yè)AI應(yīng)用落地的關(guān)鍵因素。對(duì)算力的渴求,對(duì)AI模型的智能化追求,已經(jīng)愈發(fā)迫切地將AI算力基礎(chǔ)設(shè)施建設(shè)話題提到了重要環(huán)節(jié)。
AI算力的“地基”建設(shè)迫在眉睫
可以看到,隨著模型尺寸的不斷膨脹,如何做到高效的AI訓(xùn)練和計(jì)算,關(guān)乎到AI生產(chǎn)研發(fā)效率,實(shí)現(xiàn)高效的AI模型訓(xùn)練的一個(gè)重要的支撐是更快更強(qiáng)的算力,即可以在更短時(shí)間內(nèi)完成大規(guī)模AI計(jì)算,這對(duì)于AI產(chǎn)品的迭代效率和成功至關(guān)重要。
那么,如何打造一個(gè)強(qiáng)勁的算力支撐能力,如何有效降低訓(xùn)練先進(jìn)AI模型所需要時(shí)間和金錢?
首先強(qiáng)調(diào)一點(diǎn),算力并不完全取決于芯片的能力。隨著越來(lái)越多的高級(jí)AI模型訓(xùn)練開(kāi)始“索求”巨量的算力支撐,計(jì)算力受芯片工藝的物理限制也愈發(fā)明顯,芯片制造工藝技術(shù)層面的提升速度已經(jīng)落后于算法模型,某些模型已經(jīng)逼近AI算力的極限。算力如果受限,算法模型的不斷創(chuàng)新也會(huì)出現(xiàn)制約。因此,算力已經(jīng)成為未來(lái)人工智能應(yīng)用取得突破的決定性因素。
在此前IDC聯(lián)合浪潮集團(tuán)發(fā)布的《2020-2021 中國(guó)人工智能計(jì)算力發(fā)展評(píng)估報(bào)告》中也指出,2020年,中國(guó)的GPU服務(wù)器依然占據(jù)95%左右的市場(chǎng)份額,是數(shù)據(jù)中心人工智能加速方案的首選。未來(lái)幾年,隨著推理工作負(fù)載在各個(gè)行業(yè)應(yīng)用中不斷增加,F(xiàn)PGA和ASIC等其他類型的加速芯片將在各個(gè)領(lǐng)域采用。
IDC預(yù)計(jì)到2024年,其他類型加速芯片的市場(chǎng)份額將快速發(fā)展,人工智能芯片市場(chǎng)呈現(xiàn)多元化發(fā)展趨勢(shì)。報(bào)告強(qiáng)調(diào)——服務(wù)器是人工智能基礎(chǔ)設(shè)施的核心,到2020年,中國(guó)人工智能基礎(chǔ)設(shè)施市場(chǎng)規(guī)模將達(dá)到39.3億美元,其中服務(wù)器支出占比高達(dá)87%。
可以看到,人工智能服務(wù)器技術(shù)的不斷創(chuàng)新,包含了多種互聯(lián)方式和拓?fù)浼軜?gòu),以滿足不同的應(yīng)用場(chǎng)景需求,與此同時(shí),人工智能基礎(chǔ)設(shè)施正在向開(kāi)放架構(gòu)發(fā)展,以滿足高效、靈活、可擴(kuò)展的下一代人工智能數(shù)據(jù)中心的需求。
這里要強(qiáng)調(diào)一個(gè)關(guān)鍵詞:智算中心。實(shí)際上,在去年4月浪潮提出“智算中心”理念時(shí),就指出要讓智慧計(jì)算可以像水電一樣,成為社會(huì)基本公共服務(wù)。
智算中心的意義,就是通過(guò)算力的生產(chǎn)、聚合、調(diào)度和釋放,高效支撐數(shù)據(jù)開(kāi)放共享、智能生態(tài)建設(shè)、產(chǎn)業(yè)創(chuàng)新聚集,同時(shí)有力促進(jìn)AI產(chǎn)業(yè)化、產(chǎn)業(yè)AI化及政府治理智能化。智算中心的內(nèi)涵有著四個(gè)要點(diǎn):一是算力公共基礎(chǔ)設(shè)施;二是計(jì)算架構(gòu)技術(shù)領(lǐng)先、生態(tài)成熟;三是算力、數(shù)據(jù)和算法的融合平臺(tái);四是以產(chǎn)業(yè)創(chuàng)新升級(jí)為目標(biāo)。
這四點(diǎn),正是對(duì)前面提及的行業(yè)應(yīng)用需求爆發(fā)、算力匱乏及成本高企,以及AI技術(shù)發(fā)展對(duì)算力支撐等痛點(diǎn)的最佳解決路徑。結(jié)合國(guó)家層面對(duì)人工智能為主的戰(zhàn)略性新興產(chǎn)業(yè)的發(fā)展規(guī)劃,AI算力在基礎(chǔ)設(shè)施層面的意義就更為突出和緊迫。
一方面,從去年兩會(huì)政府工作報(bào)告中提出“新基建”,就明確了以人工智能、特高壓等新技術(shù)發(fā)力技術(shù)端的基礎(chǔ)設(shè)施建設(shè)。而在新近發(fā)布的十四五規(guī)劃建議中,提及重點(diǎn)關(guān)注的幾大前沿科技,人工智能與量子信息、集成電路位列前三位。因此,人工智能作為新一輪產(chǎn)業(yè)智能化變革的核心驅(qū)動(dòng)力量,將會(huì)推動(dòng)數(shù)萬(wàn)億美元的數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)升級(jí)轉(zhuǎn)型。另一方面,作為AI算力的重要載體,實(shí)現(xiàn)算力、算法和數(shù)據(jù)全面融合的智能計(jì)算中心,將會(huì)為新基建發(fā)展所需的未來(lái)算力基礎(chǔ)設(shè)施提供重要參考定義。
也許有人會(huì)問(wèn),政府部門、不同行業(yè)、大型中小型企業(yè)能夠從智算中心這樣的基礎(chǔ)設(shè)施上獲得什么?
首先,是推動(dòng)國(guó)內(nèi)AI產(chǎn)業(yè)化浪潮的創(chuàng)新發(fā)展進(jìn)程。智算中心作為人工智能軟硬件技術(shù)的一體化融合載體,為人工智能產(chǎn)業(yè)的發(fā)展提供了大規(guī)模數(shù)據(jù)處理和高性能智能計(jì)算支撐,可以讓人工智能技術(shù)更加高效地實(shí)現(xiàn)訓(xùn)練、推理等學(xué)習(xí)過(guò)程。一方面,智能計(jì)算中心的構(gòu)建將推動(dòng)“平臺(tái)+應(yīng)用+人才”三位一體的新型AI產(chǎn)業(yè)發(fā)展模式,另一方面,將會(huì)完善“算力+生態(tài)”體系,加速推進(jìn)從基礎(chǔ)層到應(yīng)用層的人工智能產(chǎn)業(yè)鏈的形成。
其次,是驅(qū)動(dòng)產(chǎn)業(yè)AI化轉(zhuǎn)型升級(jí)。如同公有云對(duì)于企業(yè)信息化轉(zhuǎn)型所帶來(lái)的的裨益,智算中心作為新型基礎(chǔ)設(shè)施可以幫助企業(yè)低成本、高效率地進(jìn)行數(shù)字化轉(zhuǎn)型。不同類型的企業(yè),可以根據(jù)業(yè)務(wù)需要依托智算中心提供的AI模型庫(kù)、AI算力調(diào)度平臺(tái)等自動(dòng)生成適用于實(shí)際需要的業(yè)務(wù)系統(tǒng)模型。同時(shí),智算中心通過(guò)提供算力基礎(chǔ)設(shè)施及通用軟件服務(wù),聯(lián)動(dòng)產(chǎn)業(yè)鏈上下游,可以為企業(yè)提供完整的AI服務(wù)鏈,幫助實(shí)現(xiàn)AI供給和需求的高效對(duì)接。
最后,是助力政府治理能力現(xiàn)代化。在當(dāng)下智慧城市建設(shè)的進(jìn)程中,智算中心能夠融合人工智能、互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算等信息技術(shù),迅速將線上線下各類型治理主體聚合在一起,提供數(shù)據(jù)分析、云計(jì)算平臺(tái)、算法和計(jì)算能力等工具和資源,大大提升社會(huì)治理過(guò)程中的數(shù)據(jù)計(jì)算、分析、挖掘能力,從積極推動(dòng)政府治理能力的現(xiàn)代化。
當(dāng)然,這其中最關(guān)鍵的是要算經(jīng)濟(jì)賬,提升效率、降低成本才是基礎(chǔ)設(shè)施對(duì)于所有行業(yè)最大的助力??梢钥吹?,智算中心作為算力生產(chǎn)供應(yīng)平臺(tái),在構(gòu)建過(guò)程中以融合開(kāi)放的架構(gòu)計(jì)算系統(tǒng)為平臺(tái),以數(shù)據(jù)為資源,免費(fèi)或低成本提供很多開(kāi)源的人工智能算法及其代碼,以強(qiáng)大算力驅(qū)動(dòng)AI模型來(lái)對(duì)數(shù)據(jù)進(jìn)行深度加工,源源不斷產(chǎn)生各種智慧計(jì)算服務(wù),通過(guò)服務(wù)形式向組織及個(gè)人進(jìn)行供應(yīng)。
同時(shí),智算中心可以通過(guò)平臺(tái)開(kāi)放接口的方式,將行業(yè)領(lǐng)軍企業(yè)的算法能力、數(shù)據(jù)資源及運(yùn)營(yíng)服務(wù)等輸出給IT基礎(chǔ)薄弱的企業(yè),使全社會(huì)AI應(yīng)用成本得到大幅降低。
從這幾方面來(lái)看,智算中心作為新時(shí)代基礎(chǔ)設(shè)施建設(shè)的必要性毋庸贅言,而迫切性也不言而喻。
產(chǎn)業(yè)AI化——獨(dú)樂(lè)樂(lè)不如眾樂(lè)樂(lè)
從這幾方面來(lái)看,AI算力作為基礎(chǔ)設(shè)施建設(shè)的價(jià)值和意義已經(jīng)非常明晰,那么,在打造這一“地基”的產(chǎn)業(yè)變革中,浪潮又希望扮演一個(gè)什么樣的角色?
在IDC發(fā)布的2020HI《全球人工智能市場(chǎng)半年度追蹤報(bào)告》中可以看到,目前全球半年度人工智能服務(wù)器市場(chǎng)規(guī)模達(dá)55.9億美元,浪潮以16.4%的市場(chǎng)占有率,位居全球人工智能服務(wù)器市場(chǎng)第一。從這一點(diǎn)來(lái)看,浪潮在AI產(chǎn)業(yè)化浪潮中可以繼續(xù)一路領(lǐng)先。
但是去年底在一些公開(kāi)場(chǎng)合聽(tīng)到浪潮AI&HPC總經(jīng)理劉軍分享自己的觀點(diǎn)時(shí),有一句話引人關(guān)注?!皬氖袌?chǎng)的量級(jí)來(lái)看,AI產(chǎn)業(yè)化是千億級(jí)別的市場(chǎng),產(chǎn)業(yè)AI化是萬(wàn)億級(jí)別的市場(chǎng)。我們?cè)贏I產(chǎn)業(yè)化可能走的更快一點(diǎn),在產(chǎn)業(yè)AI化上可能需要抓緊趕上去?!?/p>
AI產(chǎn)業(yè)化與產(chǎn)業(yè)AI化在文字上的細(xì)微差別,背后卻是科技行業(yè)與所有行業(yè)在AI應(yīng)用場(chǎng)景上的巨大差異。幫助所有行業(yè)落地和應(yīng)用人工智能,才是一個(gè)無(wú)限寬闊的市場(chǎng),和一個(gè)長(zhǎng)久可持續(xù)的未來(lái)。
這其中,浪潮要做的不是自己一家獨(dú)大,而且協(xié)同更多的伙伴,把這個(gè)萬(wàn)億市場(chǎng)共同做大、實(shí)現(xiàn)共贏。這,也是浪潮智算中心在新基建打造過(guò)程中所扮演的角色。
一方面,智算中心的建設(shè)要滿足三個(gè)基本條件:開(kāi)放標(biāo)準(zhǔn)、集約高效和普適普惠;另一方面,這一體系將持續(xù)投入面向AI時(shí)代的三個(gè)要素——計(jì)算力輸出、服務(wù)能力優(yōu)化及人才培養(yǎng)。在懂懂看來(lái),只有在打造以AI算力為核心的基礎(chǔ)設(shè)施過(guò)程中,幫助和促進(jìn)生態(tài)伙伴的優(yōu)勢(shì)互補(bǔ)、強(qiáng)強(qiáng)聯(lián)合,共同成就行業(yè)最終用戶,才是智算中心的商業(yè)化核心價(jià)值。而這種AI時(shí)代的“多贏”理念,確實(shí)遠(yuǎn)遠(yuǎn)超出了傳統(tǒng)意義上的“AI產(chǎn)業(yè)化”范疇。
從浪潮過(guò)去一段時(shí)間以來(lái)的各種舉措已經(jīng)可以看到,其一直在不斷推動(dòng)智算中心IT基礎(chǔ)設(shè)施建設(shè)朝著更深、更寬范疇發(fā)展。自1993年浪潮成功研制出中國(guó)首臺(tái)小型機(jī)服務(wù)器以來(lái),經(jīng)過(guò)近30年的積累,浪潮已經(jīng)攻克了高速互聯(lián)芯片、關(guān)鍵應(yīng)用主機(jī)、核心數(shù)據(jù)庫(kù)、云數(shù)據(jù)中心操作系統(tǒng)等一系列核心技術(shù)?,F(xiàn)在,圍繞智算中心,浪潮持續(xù)深耕,開(kāi)發(fā)出硬件重構(gòu)的智算中心算力系統(tǒng),以及軟件定義的智算中心操作系統(tǒng)等等。與此同時(shí),在很多業(yè)務(wù)面浪潮與合作伙伴也在共同嘗試打造智算中心的底層,向政府和行業(yè)用戶提供端到端的智慧服務(wù),輸送源源不斷的計(jì)算力。
可以確定一點(diǎn),產(chǎn)業(yè)AI化是要深入到每一個(gè)行業(yè)應(yīng)用實(shí)踐中,具體的產(chǎn)品、具體的挑戰(zhàn)都要選擇適合的算法、模型和處理方式,浪潮攜手眾多理解行業(yè)應(yīng)用場(chǎng)景的開(kāi)發(fā)商、軟件商、集成商,與這些合作伙伴共同完成行業(yè)應(yīng)用的落地,目標(biāo)不僅是利己利他,而是對(duì)人工智能與綜合國(guó)力發(fā)展之間邏輯關(guān)系的透徹理解。
【結(jié)束語(yǔ)】
正如埃森哲研究所發(fā)現(xiàn)的,通過(guò)有效應(yīng)用智能計(jì)算,中國(guó)經(jīng)濟(jì)增長(zhǎng)率有望上升至7.9%,增長(zhǎng)額高達(dá)7.1萬(wàn)億美元。未來(lái),人工智能將每年為中國(guó)經(jīng)濟(jì)增長(zhǎng)貢獻(xiàn)0.8至1.4個(gè)百分點(diǎn)。
從這一點(diǎn)來(lái)看,智能計(jì)算產(chǎn)業(yè)作為數(shù)字經(jīng)濟(jì)的重要載體,將作為一支新興力量,帶動(dòng)全球數(shù)字經(jīng)濟(jì)走向繁榮。人工智能計(jì)算需求未來(lái)將占據(jù)80%以上的計(jì)算需求,智能計(jì)算正成為未來(lái)經(jīng)濟(jì)的主要增長(zhǎng)點(diǎn)之一。那么,順勢(shì)而為的浪潮,也將在這一增長(zhǎng)勢(shì)頭中起到令人矚目的推動(dòng)作用。