導(dǎo)讀:世界科技飛速發(fā)展,視覺語言導(dǎo)航技術(shù)日臻成熟,高智商的機(jī)器人正向我們走來。
有專家這樣說,人類開發(fā)人工智能的未來目標(biāo),如同現(xiàn)在科幻電影所呈現(xiàn)的場景一樣,智能機(jī)器可以獨立“看、聽、思、行”,具備像人類一樣的語言理解系統(tǒng)、視覺感知系統(tǒng)、自我理解與行動的能力,最終成為人類的完美“替身”。
如今,世界科技飛速發(fā)展,視覺語言導(dǎo)航技術(shù)日臻成熟,高智商的機(jī)器人正向我們走來。
視覺語言導(dǎo)航,指的是讓智能體跟著自然語言指令進(jìn)行導(dǎo)航,同時理解指令與視角中可以看見的圖像信息,然后在環(huán)境中對自身所處狀態(tài)加以調(diào)整、修復(fù),做出對應(yīng)的動作,最終到達(dá)目標(biāo)位置。比如,我們把機(jī)器人放置在一間臥室里,讓它去取放在另一間臥室里的足球。因為房間無法通視,機(jī)器人需要走出房間,經(jīng)過走廊、客廳等場所,并通過推算看到的每一處環(huán)境信息,來判定下一步行進(jìn)方向,最終定位找到足球。
由此可見,視覺語言導(dǎo)航涉及計算機(jī)視覺、自然語言處理和自主學(xué)習(xí)三大核心技術(shù)。
先進(jìn)的科技成果往往備受軍事領(lǐng)域的青睞。世界許多國家已開始致力于視覺語言導(dǎo)航在人工智能上的拓展運用,打造智能戰(zhàn)爭機(jī)器,搶占打贏明天戰(zhàn)爭的前沿高地。
計算機(jī)視覺,讓智能機(jī)器“看清”世界
計算機(jī)視覺是一個跨領(lǐng)域的交叉學(xué)科,包括計算機(jī)科學(xué)、數(shù)學(xué)、工程學(xué)、物理學(xué)、生物學(xué)和心理學(xué)等。
在人工智能里,計算機(jī)視覺可以類比人類的眼睛,是在感知層上最為重要的核心技術(shù)之一。它能讓智能機(jī)器人靈敏地辨識“眼”前的一切,并對捕捉到的圖像數(shù)據(jù)信息進(jìn)行分析識別、檢測、跟蹤等。嵌入計算機(jī)視覺技術(shù)的智能武器,可以通過視覺系統(tǒng),精準(zhǔn)辨識和區(qū)分目標(biāo)的主次、真?zhèn)?,大大提升作?zhàn)效率。
據(jù)悉,現(xiàn)在技術(shù)人員讀取由無人機(jī)傳回的戰(zhàn)場態(tài)勢數(shù)據(jù),每天的工作時間要超過10個小時。這與瞬息萬變的未來戰(zhàn)場不相適應(yīng)。然而,當(dāng)計算機(jī)視覺技術(shù)應(yīng)用于戰(zhàn)場智能偵察裝備前端時,可從海量信息中有效過濾無關(guān)信息,向作戰(zhàn)人員提供甄別處理后的視覺態(tài)勢圖,指揮決策效率隨之提升。
當(dāng)前,世界發(fā)達(dá)國家的部分裝備已經(jīng)開始應(yīng)用該項技術(shù)。如美軍搭載計算機(jī)視覺技術(shù)的iRobot偵察機(jī)器人,就是其中之一。它可以警告作戰(zhàn)人員有伏擊或其他危險,經(jīng)過處理的態(tài)勢感知,能夠明確指出目標(biāo)坐標(biāo),或提示危險等級。該偵察機(jī)器人還可準(zhǔn)確傳回有價值的態(tài)勢視頻與相關(guān)建議指令,縮短己方在戰(zhàn)場上的決策周期,從而把握行動優(yōu)勢。
近年來,俄軍也在大力開發(fā)人工智能系統(tǒng)。其自主研制的陸戰(zhàn)機(jī)器人,可在遙控下完成巡邏、偵察、追蹤、阻截、攻擊等任務(wù);形似軍犬、快速奔跑的機(jī)器人,可供火線運輸彈藥給養(yǎng);鏟車式機(jī)器人,可將戰(zhàn)場上的傷員用鏟斗送回后方等。俄軍部分導(dǎo)彈也已裝有人工智能設(shè)備,在導(dǎo)彈飛向預(yù)定目標(biāo)時,若人工智能設(shè)備在途中甄別出價值更大的目標(biāo),導(dǎo)彈可自動轉(zhuǎn)向進(jìn)行攻擊。在這些先進(jìn)的武器中,都能看到計算機(jī)視覺的影子。
在民用領(lǐng)域,計算機(jī)視覺技術(shù)已陸續(xù)應(yīng)用到安防、自動駕駛、醫(yī)療、消費等活動中。這也是當(dāng)前人工智能細(xì)分領(lǐng)域中發(fā)展最快、應(yīng)用最廣、炙手可熱的技術(shù)之一。
隨著算法的更迭、硬件算力的升級、數(shù)據(jù)的大爆發(fā),以及5G帶來的高速網(wǎng)絡(luò),無論在民用領(lǐng)域還是軍用領(lǐng)域,計算機(jī)視覺技術(shù)的應(yīng)用將會有更大的空間。
自然語言處理,讓智能機(jī)器“聽懂”指令
簡單地說,自然語言處理就是用計算機(jī)來處理、理解以及運用人類語言(如中文、英文等),它屬于人工智能的一個分支,是計算機(jī)科學(xué)與語言學(xué)的交叉學(xué)科,又常被稱為計算語言學(xué)。
自然語言處理的歷史發(fā)展大致經(jīng)歷了3個階段:20世紀(jì)40年代到20世紀(jì)50年代屬于萌芽期,英國科學(xué)家艾倫·麥席森·圖靈的計算機(jī)算法模型為現(xiàn)代計算機(jī)科學(xué)奠定了基礎(chǔ);20世紀(jì)60年代到20世紀(jì)80年代屬于發(fā)展期,機(jī)器翻譯技術(shù)日漸成熟,并被應(yīng)用于實際生活;20世紀(jì)90年代后屬于繁盛期,隨著計算機(jī)計算量、計算速度以及萬維網(wǎng)的爆炸式發(fā)展,自然語言處理技術(shù)也隨之在更多方面得到長足進(jìn)步。
眾所周知,語言是人類區(qū)別于其他動物的根本標(biāo)志之一,沒有語言,人類的思維也就無從談起。所以,自然語言處理技術(shù)體現(xiàn)了人工智能的最高任務(wù)與境界。也就是說,只有當(dāng)智能機(jī)器具備了處理自然語言的能力,才算實現(xiàn)了真正的智能。這樣,人類才能與機(jī)器人進(jìn)行無障礙語言溝通。
如今,自然語言處理在軍事上的應(yīng)用越來越多。比如,在指揮控制上,通過高辨識度的語音系統(tǒng),指揮員可以在作戰(zhàn)中直接用語音實時控制雷達(dá)、無線電、火力等作戰(zhàn)單元,省去繁瑣的指揮流程,集中精力專注于作戰(zhàn)謀劃;在通信保障上,語音增強(qiáng)技術(shù)能夠減弱噪聲對智能機(jī)器語音信號的干擾,減少聽話人的疲勞和溝通失誤;在人機(jī)交互上,典型代表是人機(jī)口語對話系統(tǒng),人類通過自然口語與復(fù)雜的智能機(jī)器系統(tǒng)進(jìn)行交互,包括語音識別、語言理解、語言生成、語音合成、對話管理和知識庫等。
提起“臺風(fēng)”戰(zhàn)斗機(jī),相信軍迷們都不會陌生。它是由英國、德國、西班牙、意大利聯(lián)合研發(fā)的,最大的技術(shù)亮點是搭載了直接語音輸入系統(tǒng),飛行員可以通過語音下達(dá)命令,控制戰(zhàn)機(jī)的傳感器、武器以及自衛(wèi)系統(tǒng)。
除此之外,自然語言處理在不少國家的醫(yī)學(xué)、互聯(lián)網(wǎng)監(jiān)控、執(zhí)法部門的犯罪預(yù)防以及大數(shù)據(jù)反恐應(yīng)用等領(lǐng)域也很受歡迎,極大地提升了任務(wù)執(zhí)行效率。
自主學(xué)習(xí),讓智能機(jī)器“蛻變”成長
嬰兒剛出生時,只會用眼神、哭泣、歡笑與周圍的人交流。隨著一天天長大,他們不斷擴(kuò)大接觸觀察范圍,學(xué)會了走路、說話、做游戲等,慢慢建立起自己的思維體系。這就是人類的一個自我學(xué)習(xí)成長過程。人類大腦擁有860億個神經(jīng)元、數(shù)萬億個傳遞信息的結(jié)構(gòu)——神經(jīng)突觸。神經(jīng)突觸的重要特征是具有可塑性,即允許神經(jīng)元對記憶進(jìn)行編碼、學(xué)習(xí)和自我修復(fù)。
人工智能的自主學(xué)習(xí)技術(shù),就是讓機(jī)器人像擁有人類大腦、甚至超越人類大腦一樣,可以通過思考學(xué)習(xí)實現(xiàn)自我完善。在很多人眼里,自主學(xué)習(xí)能力是人工智能與人類智能的天然鴻溝。當(dāng)前,伴隨該項技術(shù)的發(fā)展,這一鴻溝正在被逐漸填平。
2019年11月,在捷克布拉格召開的第二屆計算機(jī)視覺與模式識別國際會議上,評分第一的論文主要貢獻(xiàn)就是為智能機(jī)器提供了自主學(xué)習(xí)反饋機(jī)制,讓其自主導(dǎo)航時能夠?qū)崟r詢問自己的知識儲備。
“這條路對嗎?”“到目的地了嗎?”……擁有學(xué)習(xí)反饋機(jī)制的智能機(jī)器,根據(jù)預(yù)設(shè)環(huán)境信息與實際對比,在行動過程中形成“是非”觀念,讓智能機(jī)器真正變成有思想的“機(jī)器人”。
究其根本,智能機(jī)器“是非觀”的形成,離不開強(qiáng)化學(xué)習(xí),這種學(xué)習(xí)方式是當(dāng)今人工智能最熱門的研究領(lǐng)域之一。
說到這里,我們不能不提無師自通的“圍棋高手”阿爾法元(AlphaGo Zero),它的一鳴驚人也正是利用了新的強(qiáng)化學(xué)習(xí)方式。從一個對圍棋“零”儲備的神經(jīng)網(wǎng)絡(luò)開始,接著與強(qiáng)大的搜索算法相結(jié)合,神經(jīng)網(wǎng)絡(luò)在博弈中不斷被調(diào)整更新后,與搜索算法再次重新組合,循環(huán)往復(fù),系統(tǒng)性能經(jīng)過每一次迭代持續(xù)提高,使得神經(jīng)網(wǎng)絡(luò)預(yù)測越來越精準(zhǔn),阿爾法元也擁有了“戰(zhàn)無不勝”的本領(lǐng)??梢哉f,它也讓人工智能離“像人類一樣”更近了一步。
如果把自主學(xué)習(xí)技術(shù)應(yīng)用于軍事無人裝備上,并按照戰(zhàn)斗力水平劃分等級,那么自主學(xué)習(xí)級和智能對抗級應(yīng)該屬于“王者”級別。自主學(xué)習(xí)級,就是不再局限于人為提供的學(xué)習(xí)樣本,可以邊執(zhí)行任務(wù)邊組織學(xué)習(xí),并且遇強(qiáng)更強(qiáng),靈活應(yīng)對任務(wù)過程中出現(xiàn)的未知事件;智能對抗級,是指無人裝備在具備自主學(xué)習(xí)智能水平的基礎(chǔ)上,形成自身的核心價值,能夠短時間內(nèi)適應(yīng)未知的任務(wù)環(huán)境,迅速理解周圍局勢并做出判斷,完成作戰(zhàn)任務(wù)。
從近幾年的技術(shù)突破來看,智能機(jī)器感知環(huán)境、識別語言、自主學(xué)習(xí)的能力越來越強(qiáng)大。這些能力的提升,不僅使智能機(jī)器成為人類分擔(dān)任務(wù)的得力幫手,也或?qū)⒆屗蔀槲磥響?zhàn)場的主角。