技術(shù)
導(dǎo)讀:人工智能已經(jīng)成為目前芯片行業(yè)的一個(gè)重要驅(qū)動(dòng)力?;仡櫲斯ぶ悄茉诎雽?dǎo)體行業(yè)的發(fā)展,我們可以清晰地看到一條從云到終端的演進(jìn)路線。
人工智能已經(jīng)成為目前芯片行業(yè)的一個(gè)重要驅(qū)動(dòng)力。回顧人工智能在半導(dǎo)體行業(yè)的發(fā)展,我們可以清晰地看到一條從云到終端的演進(jìn)路線。
最初,人工智能主要是作為一種服務(wù)部署在云端。本代人工智能基于大數(shù)據(jù)和神經(jīng)網(wǎng)絡(luò),因此在訓(xùn)練時(shí)候需要大量的算力,在云端部署的時(shí)候也需要算力做支撐,因此云端人工智能領(lǐng)域中以Nvidia為代表的GPU加速人工智能成為了關(guān)注焦點(diǎn),同時(shí)也有以Graphcore、Habana為代表的云端專用人工智能芯片公司與GPU分庭抗禮。2018年之后,隨著模型和芯片設(shè)計(jì)的優(yōu)化,人工智能逐漸從云端下沉到手機(jī)等強(qiáng)智能設(shè)備終端,在手機(jī)上基于人工智能算法的超分辨、美顏、人臉識(shí)別等應(yīng)用也漸漸得到了主流認(rèn)可,相應(yīng)的芯片(IP)也就成為了手機(jī)SoC上不可或缺的一部分,高通、蘋果、華為海思等都擁有自己的高性能人工智能加速IP,用以支持手機(jī)人工智能應(yīng)用。
而隨著人工智能技術(shù)的進(jìn)一步演進(jìn),我們看到它正在進(jìn)一步和物聯(lián)網(wǎng)結(jié)合,超低功耗人工智能正是這個(gè)人工智能繼續(xù)下沉的新動(dòng)向。
超低功耗人工智能芯片的應(yīng)用場(chǎng)景
超低功耗人工智能芯片(IP)的工作功耗在數(shù)十毫瓦或更低(作為比較,手機(jī)端人工智能IP的工作功耗往往在數(shù)百毫瓦到瓦級(jí)別,而云端人工智能加速卡功耗通常在數(shù)百瓦),同時(shí)往往結(jié)合事件驅(qū)動(dòng)技術(shù),即絕大部分時(shí)間計(jì)算部分都處于休眠狀態(tài),僅僅在發(fā)生相關(guān)事件時(shí)才會(huì)啟動(dòng),這樣就可以把平均功耗降低到毫瓦數(shù)量級(jí)以下。
超低功耗人工智能可以應(yīng)用在什么場(chǎng)景下呢?消費(fèi)電子領(lǐng)域中就有超低功耗人工智能的一席之地。在下一代智能設(shè)備如可穿戴設(shè)備和智能眼鏡類設(shè)備中,設(shè)備由于尺寸等原因電池容量有限,而這些設(shè)備需要執(zhí)行智能生物信號(hào)處理(例如智能手表上的心率檢測(cè))、手勢(shì)識(shí)別(例如在目前的HoloLens中,基于人工智能的手勢(shì)識(shí)別是主要用戶交互方式)、語(yǔ)音識(shí)別等等,因此需要非常高能效比的人工智能加速模塊。除此之外,在智能家庭等領(lǐng)域,超低功耗人工智能也有落地機(jī)會(huì),例如目前的智能門鎖市場(chǎng),加入人臉識(shí)別會(huì)使智能門鎖的用戶體驗(yàn)大大改善,但是智能門鎖通常必須依靠電池供電,而且預(yù)期的電池壽命至少要半年到一年,這樣一來(lái)對(duì)于執(zhí)行人工智能計(jì)算的模塊就提出了非常高的能效比需求。
除了消費(fèi)電子之外,工業(yè)應(yīng)用中也需要超低功耗人工智能。工業(yè)應(yīng)用中對(duì)于超低功耗人工智能的需求往往來(lái)源于智能傳感器。這類傳感器安裝在機(jī)器、機(jī)械臂、管道等重要環(huán)境中,需要能時(shí)刻監(jiān)測(cè)各類信號(hào)并且運(yùn)行相應(yīng)的人工智能算法來(lái)判斷運(yùn)行狀況。在這些場(chǎng)景下,傳感器必須依靠電池供電,而超低功耗人工智能可以大大減少電池消耗,這也意味著傳感器更換電池的間隔可以提升,這也就大大降低了這類傳感器系統(tǒng)的部署和維護(hù)成本。
超低功耗人工智能芯片的技術(shù)路徑
目前,超低功耗人工智能芯片大概可以分為三種技術(shù)路徑。
首先是基于數(shù)字電路的超低功耗人工智能加速模塊設(shè)計(jì)。使用數(shù)字電路向超低功耗方向的優(yōu)化方法首先是從系統(tǒng)架構(gòu)層面做優(yōu)化,盡量減小模型的體積,并優(yōu)化數(shù)據(jù)流以降低內(nèi)存訪問(wèn)開(kāi)銷。此外,在電路層面可以降低電源電壓,甚至使用亞閾值邏輯門設(shè)計(jì),以降低電路運(yùn)行時(shí)的功耗,以及漏電流。使用數(shù)字電路方法的優(yōu)勢(shì)在于可以更容易地與人工智能計(jì)算之外的模塊集成并構(gòu)成SoC,而無(wú)需在數(shù)模轉(zhuǎn)換上消耗額外能量。
第二條技術(shù)路徑是使用模擬計(jì)算來(lái)完成神經(jīng)網(wǎng)絡(luò)的計(jì)算。模擬計(jì)算往往和內(nèi)存內(nèi)計(jì)算相結(jié)合以實(shí)現(xiàn)高能效比,其具體的思路是目前人工智能計(jì)算中往往存儲(chǔ)訪問(wèn)是能量消耗最大的部分,而使用模擬計(jì)算則可以在存儲(chǔ)(如SRAM或Flash等NVM)讀出電路中直接做計(jì)算,這樣就省去了數(shù)據(jù)讀出再計(jì)算的步驟,而可以直接在內(nèi)存內(nèi)完成計(jì)算。使用模擬計(jì)算配合內(nèi)存內(nèi)計(jì)算往往可以實(shí)現(xiàn)很高的能效比,例如歐洲的著名半導(dǎo)體研究機(jī)構(gòu)IMEC宣布將在未來(lái)數(shù)年內(nèi)完成能效比高達(dá)10000TOPS/W的模擬計(jì)算人工智能加速模塊。但是模擬計(jì)算對(duì)于模型往往有較多限制,例如必須在計(jì)算精度較低時(shí)仍然能保證準(zhǔn)確率等,因此需要很好的軟件/硬件協(xié)同設(shè)計(jì)。
存內(nèi)模擬計(jì)算是超低功耗人工智能的主要技術(shù)路徑之一
第三條道路則是在模型設(shè)計(jì)上使用脈沖神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)(神經(jīng)模態(tài)芯片)。使用脈沖神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)的神經(jīng)模態(tài)芯片僅僅在神經(jīng)元被激活時(shí)消耗能量,而絕大部分神經(jīng)元在大部分情況下都處于休眠狀態(tài)而幾乎不消耗能量,因此其平均能效比可以做到比基于主流卷積神經(jīng)網(wǎng)絡(luò)的芯片高一個(gè)數(shù)量級(jí)。脈沖神經(jīng)網(wǎng)絡(luò)和神經(jīng)模態(tài)芯片的難點(diǎn)主要在于模型設(shè)計(jì)和訓(xùn)練上存在很高的門檻,此外如何對(duì)相應(yīng)的脈沖神經(jīng)網(wǎng)絡(luò)模型做電路級(jí)優(yōu)化也有很高的技術(shù)含量。
超低功耗人工智能芯片競(jìng)爭(zhēng)格局:中國(guó)公司占據(jù)有利地位
超低功耗人工智能芯片市場(chǎng)目前仍然處于起步階段,但是隨著未來(lái)物聯(lián)網(wǎng)和下一代智能設(shè)備的技術(shù)演進(jìn),預(yù)計(jì)在未來(lái)幾年內(nèi)市場(chǎng)熱度會(huì)越來(lái)越高。目前,從事超低功耗人工智能芯片開(kāi)發(fā)的主要初創(chuàng)公司,但是未來(lái)超低功耗人工智能芯片的下一代領(lǐng)導(dǎo)者很可能就出現(xiàn)在這些初創(chuàng)公司中。
在消費(fèi)電子領(lǐng)域,美國(guó)的Syntiant得到了亞馬遜Alexa Fund、微軟M12和Intel Capital等行業(yè)資本的支持,其主要產(chǎn)品是針對(duì)智能設(shè)備語(yǔ)音處理的超低功耗芯片。與此相對(duì),中國(guó)的初創(chuàng)公司在這個(gè)領(lǐng)域的布局則更加多樣。來(lái)自清華大學(xué)的清微科技使用可重構(gòu)電路技術(shù),其超低功耗產(chǎn)品能覆蓋語(yǔ)音識(shí)別、視覺(jué)識(shí)別等多個(gè)領(lǐng)域,可望為下一代智能設(shè)備賦能。另一家中國(guó)公司則是SynSense,SynSense的技術(shù)路線是使用脈沖神經(jīng)網(wǎng)絡(luò),技術(shù)來(lái)自于神經(jīng)脈沖網(wǎng)絡(luò)權(quán)威,蘇黎世大學(xué)Giacomo Indiveri教授的團(tuán)隊(duì)。目前SynSense的脈沖神經(jīng)網(wǎng)絡(luò)已經(jīng)完成了多次流片迭代和驗(yàn)證,相關(guān)的產(chǎn)品覆蓋了視覺(jué)、生物信號(hào)處理、語(yǔ)音識(shí)別等,平均功耗可以低至微瓦數(shù)量級(jí)。此外,SynSense還于最近推出了使用神經(jīng)脈沖網(wǎng)絡(luò)結(jié)合動(dòng)態(tài)視覺(jué)傳感器DVS的產(chǎn)品Speck,該產(chǎn)品能真正實(shí)現(xiàn)事件驅(qū)動(dòng),在絕大多數(shù)時(shí)間運(yùn)行于超低的功耗下,而在檢測(cè)到動(dòng)態(tài)事件后DVS能提供超高的視覺(jué)采樣頻率,并且配合脈沖神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)超高性能/超低延遲的視覺(jué)信號(hào)處理,從而兼具超低功耗和高性能。
而在工業(yè)應(yīng)用領(lǐng)域,同樣來(lái)自清華大學(xué)的湃方科技走在了全球前列,成為了在工業(yè)領(lǐng)域能真正落地的超低功耗人工智能算法和芯片解決方案公司。湃方科技的應(yīng)用場(chǎng)景涵蓋了衛(wèi)星、機(jī)械臂、發(fā)電機(jī)、電機(jī)等等重要的工業(yè)應(yīng)用,其芯片能提供高達(dá)50TOPS/W的能效比。
目前,在超低功耗人工智能芯片領(lǐng)域,中國(guó)的初創(chuàng)公司和團(tuán)隊(duì)無(wú)論是數(shù)量還是質(zhì)量都走在了全球前列。讓我們期待中國(guó)能在未來(lái)的超低功耗人工智能領(lǐng)域繼續(xù)引領(lǐng)全球的潮流。