技術(shù)
導(dǎo)讀:上周,2018年度的斯坦福AI報(bào)告發(fā)布,從學(xué)界、企業(yè)、政府和公眾等不同主體出發(fā),通過(guò)論文發(fā)布及引用、學(xué)術(shù)會(huì)議、初創(chuàng)公司、技術(shù)進(jìn)展等幾個(gè)主題對(duì)當(dāng)前全球人工智能格局進(jìn)行了全面的數(shù)據(jù)呈現(xiàn)和分析解讀。
上周,2018年度的斯坦福AI報(bào)告發(fā)布,從學(xué)界、企業(yè)、政府和公眾等不同主體出發(fā),對(duì)人工智能當(dāng)前的進(jìn)展進(jìn)行了數(shù)據(jù)呈現(xiàn)。經(jīng)過(guò)長(zhǎng)期的跟蹤、整理和分析人工智能相關(guān)數(shù)據(jù),報(bào)告發(fā)現(xiàn),美國(guó)目前在人工智能的學(xué)術(shù)影響力專利產(chǎn)出、和商業(yè)活躍質(zhì)量具有明顯優(yōu)勢(shì),中國(guó)則在學(xué)術(shù)論文發(fā)表方面相當(dāng)高產(chǎn),但就發(fā)展質(zhì)量而言仍有待提升。在人工智能內(nèi)部,機(jī)器學(xué)習(xí)和概率推理、神經(jīng)網(wǎng)絡(luò)、計(jì)算機(jī)視覺三個(gè)子領(lǐng)域備受學(xué)界關(guān)注,這也影響到了企業(yè)創(chuàng)業(yè)和人才需求。
以下,億歐智庫(kù)以論文發(fā)布、論文引用、學(xué)術(shù)會(huì)議、初創(chuàng)公司等幾個(gè)模塊,對(duì)報(bào)告的主要內(nèi)容進(jìn)行呈現(xiàn)整理:
從發(fā)布論文主題來(lái)看,AI相關(guān)的論文增速(8x)在2010年后已經(jīng)大幅超過(guò)計(jì)算機(jī)科學(xué)領(lǐng)域(6x),從一定程度表明人工智能領(lǐng)域的論文增長(zhǎng)不僅僅是由人們對(duì)計(jì)算機(jī)科學(xué)興趣的提高所驅(qū)動(dòng)的。
從區(qū)域來(lái)看,歐洲一直是AI論文主要的發(fā)布來(lái)源地,占到整體的28%。中國(guó)(25%)自2006年后開始超越美國(guó)(17%),并在2008年實(shí)現(xiàn)出版數(shù)的高漲,報(bào)告推測(cè)是《國(guó)家中長(zhǎng)期科學(xué)和技術(shù)發(fā)展規(guī)劃綱要(2006-2020)》和其他政府項(xiàng)目為人工智能研究提供資金和一系列激勵(lì)政策的結(jié)果。
在AI領(lǐng)域的子類目中(類別間不互相排斥),機(jī)器學(xué)習(xí)和概率推理(Machine Learning and Probabilistic Reasoning)占到最高比例,為56%,而神經(jīng)網(wǎng)絡(luò)(Neural Networks)是2014年以來(lái)增速最快的研究領(lǐng)域,年復(fù)合增長(zhǎng)率達(dá)到37%。計(jì)算機(jī)視覺也保持了較高的增速。搜索及優(yōu)化、自然語(yǔ)言處理及知識(shí)表示、模糊系統(tǒng)、規(guī)劃和決策類論文目前還未呈現(xiàn)大的增長(zhǎng)。
ArXiv是收錄科學(xué)文獻(xiàn)預(yù)印本的在線數(shù)據(jù)庫(kù)(其中預(yù)印本是指學(xué)者的還未在正式出版物上發(fā)表,而出于和同行交流目的自愿發(fā)布的科研論文或報(bào)告),投稿量每月高達(dá)上萬(wàn)篇。鑒于知識(shí)的更迭速度和研究主題的競(jìng)爭(zhēng)性,學(xué)者往往會(huì)在漫長(zhǎng)的期刊/學(xué)術(shù)會(huì)議審核期之前就投稿在ArXiv上。數(shù)據(jù)顯示投稿的AI相關(guān)論文整體呈現(xiàn)增長(zhǎng),其中計(jì)算機(jī)視覺和模式識(shí)別占最大比例,體現(xiàn)了學(xué)者較高的傳播意愿。
從關(guān)注領(lǐng)域來(lái)看,中國(guó)對(duì)AI的研究側(cè)重于工程技術(shù)和農(nóng)業(yè)科技,歐美則集中在人文和醫(yī)藥科學(xué)。
從論文發(fā)布的主體來(lái)看,學(xué)術(shù)論文仍占絕大部分,其次則來(lái)自政府、企業(yè)。以中國(guó)為例,92%的AI論文來(lái)自學(xué)術(shù)領(lǐng)域。此外,2017年中國(guó)政府主體發(fā)布的論文是企業(yè)的4倍。而美國(guó)的企業(yè)主體發(fā)布的論文不論從數(shù)量還是所占比例來(lái)講都高于中國(guó)。由此可見,美國(guó)在人工智能科研方面的商業(yè)化驅(qū)動(dòng)力相對(duì)更強(qiáng)。
FWCI(Field-Weighted Citation Impact,領(lǐng)域權(quán)重引用影響系數(shù))是指該區(qū)域AI學(xué)者收到的平均引用次數(shù)除以所有AI作者的平均引用次數(shù),能在一定程度反映論文質(zhì)量。從數(shù)據(jù)來(lái)看美國(guó)的FWCI指數(shù)達(dá)到1.83,盡管歐洲的AI論文發(fā)布量最高,但其FWCI指數(shù)略高于平均水平。中國(guó)的論文質(zhì)量則在持續(xù)穩(wěn)步的提高中。
考慮到AI學(xué)者的國(guó)際流動(dòng)性,報(bào)告也針對(duì)做出研究。數(shù)據(jù)顯示,中美歐三個(gè)區(qū)域的久居型學(xué)者(指從未遷移至外國(guó)發(fā)表論文)的產(chǎn)出率最低,而那些動(dòng)態(tài)遷出遷入的“候鳥型”作者的論文產(chǎn)出和被引用水平更高。其中中國(guó)的久居型學(xué)者所占比例最高(75%),相比歐美同類型學(xué)者更加高產(chǎn),但論文質(zhì)量仍有待提升。
在AI相關(guān)的老牌學(xué)術(shù)會(huì)議中,NeurIPS(神經(jīng)信息處理系統(tǒng)大會(huì))、CVPR(計(jì)算機(jī)視覺與模式識(shí)別會(huì)議)、ICML(國(guó)際機(jī)器學(xué)習(xí)大會(huì))人數(shù)增長(zhǎng)較快。此外,學(xué)界對(duì)深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的關(guān)注,助推ICLR(國(guó)際學(xué)習(xí)表征會(huì)議)的新興小型學(xué)術(shù)會(huì)議規(guī)??焖僭鲩L(zhǎng)。
AAAI(美國(guó)人工智能協(xié)會(huì))作為國(guó)際性的重要AI學(xué)術(shù)會(huì)議,具備較強(qiáng)的專業(yè)度和影響力。按所屬國(guó)家對(duì)會(huì)議提交和接受的論文歸類,70%均來(lái)自于中美兩國(guó),兩國(guó)的論文通過(guò)率分別為29%、21%。
如今,超過(guò)50%的人工智能相關(guān)機(jī)構(gòu)是非營(yíng)利組織,包括美國(guó)公民自由聯(lián)盟、牛津大學(xué)人類未來(lái)研究所和聯(lián)合國(guó)開發(fā)計(jì)劃署。同時(shí),人們更加認(rèn)識(shí)到性別和種族多樣性對(duì)AI進(jìn)步的重要性,AI4ALL和WiML等鼓勵(lì)多元群體參與到AI研究的組織成員數(shù)有所增加。
報(bào)告通過(guò)統(tǒng)計(jì)美國(guó)初創(chuàng)公司(接受過(guò)風(fēng)險(xiǎn)投資支持)每年的累計(jì)數(shù)量,發(fā)現(xiàn)在初創(chuàng)公司數(shù)量整體穩(wěn)步增長(zhǎng)的同時(shí),AI領(lǐng)域初創(chuàng)公司則開始呈現(xiàn)指數(shù)級(jí)增長(zhǎng)的趨勢(shì),成為創(chuàng)業(yè)主旋律。
每年獨(dú)立的風(fēng)險(xiǎn)投資數(shù)額呈現(xiàn)波動(dòng)趨勢(shì)。自2015年以來(lái),AI領(lǐng)域的投資金額迅速高漲,峰值比2014年來(lái)的風(fēng)投擴(kuò)張期來(lái)得更早。
在此背景下,企業(yè)對(duì)人工智能相關(guān)人才的需求也更加旺盛,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)尤為明顯,其中深度學(xué)習(xí)的職位需求在2015~2017年間有了35倍的增長(zhǎng)。
針對(duì)紐交所上市公司,研究發(fā)現(xiàn),財(cái)報(bào)電話會(huì)議中提及人工智能和機(jī)器學(xué)習(xí)的頻次自2015年來(lái)大幅增長(zhǎng)。而提及兩者最多的行業(yè)依次是IT、非必需消費(fèi)品、金融和醫(yī)療保健行業(yè),企業(yè)則分別是英偉達(dá)(AI提及93次)、Alphabet(機(jī)器學(xué)習(xí)提及57次)。在中國(guó),大量的科技和互聯(lián)網(wǎng)公司也呈現(xiàn)言必提AI的程度。
麥肯錫在2018年對(duì)受訪者所在公司在某些業(yè)務(wù)中嵌入AI功能的情況進(jìn)行了調(diào)研,結(jié)果發(fā)現(xiàn)不同的人工智能技術(shù)在世界各地和不同行業(yè)中得到廣泛采用,大約一半的公司已經(jīng)將人工智能嵌入到公司的業(yè)務(wù)流程中。然而,AI應(yīng)用還處在早期,大多數(shù)公司還未采取措施從人工智能大規(guī)模獲取價(jià)值。
在2015年,ImageNet視覺識(shí)別挑戰(zhàn)賽中的算法模型識(shí)別精度已經(jīng)超過(guò)人類水平,2017年進(jìn)一步提升至了97%左右。盡管競(jìng)賽在2017年已是最后一屆,ImageNet2012開放數(shù)據(jù)集仍在被引用,可以說(shuō),ImageNet所構(gòu)建的規(guī)則為研究者提供了標(biāo)準(zhǔn)的研究度量進(jìn)行比較競(jìng)爭(zhēng)。
利用ImageNet數(shù)據(jù)集培訓(xùn)能夠進(jìn)行高精度圖像分類的大型網(wǎng)絡(luò)在以往需要耗費(fèi)不少時(shí)間。對(duì)于擁有足夠資源機(jī)進(jìn)行開發(fā)的參與者而言,培訓(xùn)網(wǎng)絡(luò)所需的時(shí)間已經(jīng)從一年半前的1小時(shí)降到了大約4分鐘,速度提升了16倍,算法創(chuàng)新和硬件進(jìn)步在其中發(fā)揮了重要作用。
其他如COCO(微軟發(fā)布的圖像數(shù)據(jù)庫(kù),用于對(duì)象檢測(cè)、分割、人體關(guān)鍵點(diǎn)檢測(cè)、語(yǔ)義分割和字幕生成等)、Parsing(語(yǔ)法分析)、機(jī)器翻譯、機(jī)器問(wèn)答等競(jìng)賽或應(yīng)用領(lǐng)域在近年來(lái)的算法精度也均有不同程度的提高,此處不一一贅述。
專利:從區(qū)域來(lái)看,2014年,人工智能專利中有30%便來(lái)自美國(guó),其次則是日、韓兩國(guó),各占有16%的比例。
學(xué)校開設(shè)課程:AI的火熱也發(fā)生在高校中,學(xué)生報(bào)名注冊(cè)人工智能和機(jī)器學(xué)習(xí)的比例和數(shù)量也隨之增長(zhǎng)。在報(bào)告的統(tǒng)計(jì)的幾所美國(guó)頂尖計(jì)算機(jī)科學(xué)高校中,2017年機(jī)器學(xué)習(xí)基礎(chǔ)課程的注冊(cè)人數(shù)是2012年水平的5倍,AI課程注冊(cè)人數(shù)是2012年的3.4倍。在中國(guó),清華大學(xué)的AI及機(jī)器學(xué)習(xí)課程自2010年到2017年更是實(shí)現(xiàn)了16倍的增長(zhǎng)。
Github星數(shù):GitHub(知名開源軟件網(wǎng)站)的星數(shù)類似于關(guān)注數(shù),基本能判定AI編程語(yǔ)言的流行程度。目前TensorFlow(Google)一騎絕塵,其后是Pytorch(Facebook)、mxnet(Amazon)。
ROS安裝:ROS(robot operating system,機(jī)器人操作系統(tǒng))是目前在人工智能領(lǐng)域被廣泛使用的機(jī)器人軟件平臺(tái)。自2014年, 來(lái)自唯一IP地址的ROS安裝包下載次數(shù)實(shí)現(xiàn)了567%的增長(zhǎng)。從頁(yè)面瀏覽量來(lái)看,中國(guó)增長(zhǎng)最為明顯,值得一提的是,百度的自動(dòng)駕駛平臺(tái)Apollo就是基于ROS開發(fā)的。
工業(yè)機(jī)器人安裝量:自2012年以來(lái),中國(guó)每年的機(jī)器人安裝量增長(zhǎng)了500%,而韓國(guó)和歐洲等其他地區(qū)分別增長(zhǎng)了105%和122%。
媒體報(bào)道情緒:在包含人工智能一次的媒體文章中,情感表達(dá)正面的文章所占比例逐步增多,為30%,負(fù)面文章則一直保持低水平。
政府關(guān)注度:通過(guò)采集美國(guó)、加拿大、英國(guó)議會(huì)的記錄文本,報(bào)告發(fā)現(xiàn)自2016年來(lái)政府對(duì)人工智能和機(jī)器學(xué)習(xí)的提及次數(shù)大幅增加。
報(bào)告最后還列舉了歷年來(lái)重要的里程碑式事件、中國(guó)及歐美政府在人工智能領(lǐng)域的主要舉措、專家對(duì)人工智能目前缺陷所給的建議等內(nèi)容。以上僅對(duì)報(bào)告的主體部分進(jìn)行了闡述,如需了解報(bào)告完整內(nèi)容,官網(wǎng)鏈接如下:https://aiindex.org/