導(dǎo)讀:技術(shù)、車企合作、綜合生態(tài),人車交互產(chǎn)業(yè)或許正在跑著一場鐵人三項。但在無人駕駛真正到來之前的相當長一段時間中,車載語音交互都會是汽車場景技術(shù)與體驗進化的主旋律。在語言的迷宮下,人和車以另一種方式相遇了。
“BAT抵達車聯(lián)網(wǎng)”,是最近引發(fā)無數(shù)媒體關(guān)注的一個“風口話題”。
在熱鬧的討論中,我們知道了這個火熱的賽道上有BAT等科技巨頭,還有傳統(tǒng)車企,造車新貴,以及解決方案提供商,一時間風起云涌好不熱鬧。
但如果我們從頭琢磨一下,可能會發(fā)現(xiàn)今天對車聯(lián)網(wǎng)的討論,多少有點“失焦”:所謂車聯(lián)網(wǎng)這個賽道,究竟在爭奪什么?而BAT進場與不進場,到底有什么區(qū)別?各家科技巨頭與車企在車聯(lián)網(wǎng)領(lǐng)域的進度各有什么不同?
這些問題的答案,很可能藏在一個很多司機今天還并不重視的角落里:人車對話。
人和車聊天這事兒,真的有這么重要嗎?
咱們先來思考這么一個問題:給車連上網(wǎng),到底干嘛用?
聲音是不可代替的交互:車聯(lián)網(wǎng)賽道的真正軸心
我們知道,所謂的車聯(lián)網(wǎng),是泛指通過汽車端的信號傳輸裝置,接受網(wǎng)絡(luò)信息與服務(wù)的技術(shù)解決方案。包括車輛遠程控制、遠程安全、駕駛場景下的網(wǎng)絡(luò)服務(wù)等多個領(lǐng)域——也就是所謂的讓車變成一個終端。
而今天熱絡(luò)的車聯(lián)網(wǎng)產(chǎn)業(yè),普遍關(guān)注的是兩個問題:
1、改善駕駛效率與體驗。比如用戶可以基于互聯(lián)網(wǎng)技術(shù)控制汽車、輔助駕駛等等。
2、獲得駕駛外的增值服務(wù)。比如用戶通過車載網(wǎng)絡(luò)獲得的導(dǎo)航、內(nèi)容、天氣、支付服務(wù)等等。
那么重點來了,這兩種服務(wù)到底要怎么賦予駕駛者呢?
都集成到手機上…開車玩手機好像不對?放在車載屏幕上,讓用戶觸屏控制?哪有人那么閑沒事停車觸屏一下再開?而且既然都停車了,那干脆玩手機好不好?
所以有種說法,叫做車上最沒用的設(shè)備就是屏幕。可以說,在車聯(lián)網(wǎng)的商業(yè)想象中,讓用戶放棄方向盤來獲得網(wǎng)絡(luò)服務(wù),是一種反人性的設(shè)計。那么網(wǎng)絡(luò)服務(wù)、駕駛服務(wù)怎么才能無縫對接給駕駛者呢?答案只可能是人車語音交互。
讓駕駛者通過語音來控制一部分不方便控制的車載設(shè)備,再通過語音交互來獲得外接互聯(lián)網(wǎng)服務(wù),是車聯(lián)網(wǎng)場景中唯一成立的交互模式??梢钥吹?,在初期試水之后,無論是車廠還是科技企業(yè),都將矛頭對準了人車對話交互這一塊“車聯(lián)網(wǎng)樞紐”。
而在車載語音交互的成長過程中,科技巨頭陸續(xù)進場與獨角獸崛起,就變成了一個合乎技術(shù)邏輯的事情。
車載語音交互不長的歷史上,已經(jīng)涌現(xiàn)出了以下幾種“江湖流派”,讓“語言交互戰(zhàn)”成為了車聯(lián)網(wǎng)戰(zhàn)場上貨真價實的戰(zhàn)略高地
安卓改裝流:國產(chǎn)車的常規(guī)套路
最早認識到語音交互價值的,當然是汽車企業(yè)本身。而最早布局車聯(lián)網(wǎng)系統(tǒng)的,也是一批以自主品牌車廠為主的車企,他們普遍通過改裝原生安卓的方式來搭建自己的“車載UI”。
而在這套交互邏輯里,也涌現(xiàn)出了原生版本的車載語音交互。
這種 “原生態(tài)”語音交互系統(tǒng),一般由車企自己開發(fā),實際技術(shù)供應(yīng)商往往是長三角、珠三角的小工廠,因此沒什么技術(shù)研發(fā)成本。一般來說形式是一個安卓系統(tǒng)改裝的操作平臺,然后用戶可以在車載系統(tǒng)上安裝各種各樣的APP,形似一個安裝在車上的安卓平板。然后用戶可以使用某些APP中的語音控制,來控制FM、地圖等應(yīng)用。
吉利吉客、比亞迪Dili nk等系統(tǒng)算是這個流派中相對成熟的。這類車企自制系統(tǒng),優(yōu)點是成本低廉,可以某種程度上作為營銷噱頭。
但缺點也十分明顯:由于必須進入APP內(nèi)部的語音交互,所以用戶說什么其實與車無關(guān),只是控制APP而已。而且往往交互邏輯中有大量需要觸屏操作的地方,用戶在行駛中必須經(jīng)常觸屏,對交通安全也是個隱患。
總體而言,改裝安卓流派并不被看好。所以,有AI技術(shù)撐腰的科技巨頭們來了。
車載音箱流:科技公司進場人車交互的開端
今天更多主流車企,開始注意到了車內(nèi)語音交互能夠帶給駕駛者諸多便利,甚至可以說是車載顯示器唯一合理的解決方案,于是主流車企+車載語音技術(shù)開始熱絡(luò)了起來。而科技巨頭以自己的語音技術(shù)優(yōu)勢,切入車聯(lián)網(wǎng)領(lǐng)域,就變成了順理成章的情況。
國內(nèi)的Apollo小度車載系統(tǒng),國外亞馬遜的Alexa,都可以作為車企的語音交互解決方案來進行合作。
比如說,今年早些時候,寶馬已經(jīng)宣布將與亞馬遜的Alexa合作,在新出車型中搭載車載語音助手。駕駛者可以與語音助手直接對話,查詢地點、選擇想要收聽的內(nèi)容,以及相應(yīng)的綜合服務(wù)。而用戶可以選擇是否需要搭載Alexa。
這種模式,從技術(shù)邏輯上來看,可以被理解為在整車完成后,把語音助手集成在車載交互中,嵌入到車輛的網(wǎng)絡(luò)交互設(shè)備里。說白了,有點像在汽車中安裝一個智能音箱,只是在交互形態(tài)和使用目的上與家用音箱不同。
還有一種科技企業(yè)的進場方式,是向車企的車聯(lián)網(wǎng)項目輸送技術(shù)。比如東風風神與百度DuerOS、博泰共同打造過Windli nk 3.0。百度在其中扮演AI語音技術(shù)輸出商的角色。
目前,國外的亞馬遜、微軟,國內(nèi)的科大訊飛、百度DuerOS,都有相應(yīng)的車載交互體系,已經(jīng)被搭載到很多車輛當中。
這種嵌入式的車載音箱流,優(yōu)點是基本以成熟的AI語音交互系統(tǒng)作為底本,能夠產(chǎn)生不錯的對話體驗。無論是方言識別、自然語言處理還是對用戶的數(shù)據(jù)學習,都比原生態(tài)版本強出一大截。
相應(yīng)的問題是,這類系統(tǒng)由于大多是后裝或準后裝模式,無法與汽車建立底層的機械聯(lián)系,所以能夠帶給用戶的操作比較有局限性。說白了,這更像是車企為由需要用戶準備了一份錦上添花的禮包。
但如果語音交互向走的更遠,車企與科技企業(yè)似乎必須走的更近才行。
整車前裝流:巨頭醞釀中的下一個故事
在讀者相對更熟悉的無人駕駛領(lǐng)域,我們已經(jīng)可以得出這樣一個結(jié)論:拋開車廠玩科技,基本是條死胡同。
在人車交互領(lǐng)域同樣如此,假如離開了車企的制造基礎(chǔ),那么科技企業(yè)帶來的感知智能交互技術(shù),就像是在車內(nèi)擺放了一盆可有可無的裝飾。
只有科技企業(yè)與車企更緊密合作,將人機交互的可控范圍加大,車聯(lián)網(wǎng)技術(shù)才可能帶來真正的駕駛升級體驗。這或許也意味著,車載網(wǎng)絡(luò)交互系統(tǒng),必須有后裝改為前裝:讓AI語音系統(tǒng)可以進入汽車的機械系統(tǒng)里,甚至盡量靠近控制中樞。
換言之,語音交互能夠部分取代車輛駕駛控制,在科技企業(yè)看來才是王道。
這個領(lǐng)域已經(jīng)有科技巨頭進駐,比如阿里與上汽合作的斑馬網(wǎng)絡(luò),核心業(yè)務(wù)方向就是結(jié)合AliOS的整車底層平臺,為車企提供前裝人機交互系統(tǒng)。
前裝的直接價值,在于能夠讓語音交互控制車上更多的部件。比如車窗、雨刷、天窗、空氣凈化器等等。
另一個意義在于,前裝可以在車上安裝更多傳感器與麥克風陣列,讓人控制車的同時,車也可以主動感知到人的存在。由此能夠分清誰在說話、判斷每一個人的狀態(tài)等等。
此外還由一個區(qū)別在于,科技企業(yè)假如只提供技術(shù)解決方案,那么車聯(lián)網(wǎng)連接的將還是一般互聯(lián)網(wǎng)內(nèi)容,無法獲得專屬于車的支付、內(nèi)容、旅游等產(chǎn)品服務(wù),而前裝系統(tǒng)可以直接綁定車主ID,這是讓車變手機的一個先決條件。
當然,整車前裝AI交互系統(tǒng)的故事才剛剛開始。
一方面大量車企并未適應(yīng)這種模式,因為想要獲得更好的語音交互體驗,系統(tǒng)需要直接接入車輛的機械控制中樞,這在很多車廠看來是有安全隱患的。
但整車前裝,科技企業(yè)與車企深度合作的路子很可能會越走越遠。今年 Google I/O 大會開幕前,Google 還宣布了與沃爾沃的合作,雙方會合作打造不同于安卓的車載智能系統(tǒng)??萍计髽I(yè)走向與車企的平等合作,AI語音交互成為車輛本身的一部分,在方向上應(yīng)該沒有什么疑問。
當然了,我們更期待的,可能是語音交互成為駕駛的全部。
無人駕駛流:人類還在等待的人車對話
顯然,車聯(lián)網(wǎng)技術(shù)真正在等待的,是與無人駕駛的合流。雖然這個目標在今天來看還遠,但從技術(shù)邏輯上看,車輛語音交互有一天會成為全面取代手動的交互模式。
就像今天有些車主會堅持認為,我用手控制挺好的,為什么要說話控制車?這其實涉及很多駕駛習慣問題,難以一概而論。但不可否認的是,假如最終我們只用說說話,車就可以準確舒適地把我們帶到目的地,那么與車的對話將具有絕對價值。
這個邏輯所形容的,是L4級別無人駕駛中的語音交互。這個層級里,車輛將拋棄方向盤,也就是說駕駛場景已經(jīng)被取代。但如何獲得更舒適的出行體驗、選擇道路導(dǎo)航方式、緊急情況下的制動,今天看來還是需要人類進行主動干預(yù)的。而干預(yù)的方式,應(yīng)該還是以人車對話為主。
今天已經(jīng)有很多無人駕駛項目,開始研發(fā)無人駕駛場景下的人車對話機制。這種場景下,用戶需要下達的命令往往是復(fù)雜抽象的,有點類似我們做出租車時給司機的建議。那么要讓無人駕駛系統(tǒng)具象化這些建議,并落實成出行模式,就需要強大的自然語言處理能力、深度語義理解能力作為支撐。
作為無人駕駛的必備配套技術(shù),這個領(lǐng)域目前已經(jīng)匯集了中外各路AI豪杰和車企,但同時也存在大量機會。讓人車可以像乘客和司機一樣對話,還有很遠的路要走。
車載語音這條賽道,究竟在比什么?
綜上所述,車聯(lián)網(wǎng)這一局棋,某種程度上來看,真正在考驗的是車載語音交互的技術(shù)解決能力和綜合服務(wù)體驗。
因為駕駛時的網(wǎng)絡(luò)服務(wù)必須圍繞聲音進行,那么聲音能夠獲得的權(quán)限越大,交互技術(shù)越精準,生態(tài)服務(wù)越充沛,消費者的體驗也就會越好。
這一場關(guān)于人車對話的賽跑,無論是科技巨頭,還是新晉獨角獸、造車新貴,都必須考慮三個方面的問題:
1、AI語音技術(shù)的體驗分:AI語音交互、IoT系統(tǒng)、云計算,這些技術(shù)體系進入汽車,是一個廣泛而深刻的過程。而這個過程中,對科技企業(yè)拿出的技術(shù)解決能力是有嚴格要求的。車載場景不同于家居,有復(fù)雜的干擾環(huán)境,和必須快速執(zhí)行命令的性能要求。如何讓人車對話時,可以更好地完成遠場喚醒、方言識別、特殊語序識別,是接下來AI公司需要繼續(xù)努力的。
2、與車企合作的親密分:如果我們認同語音交互控制車輛部分越多越好,前裝優(yōu)勢大于后裝這個邏輯,那么人車交互體驗就是建立在科技企業(yè)與車企的緊密合作基礎(chǔ)上。而在今天,即使是已經(jīng)全面領(lǐng)先的斑馬和AliOS,也面臨客戶群不夠多、合作品牌相對單一的問題。如何讓高端車、合資或者外資品牌車也部署“中國智造”的AI交互系統(tǒng),或許還是任重道遠的工作。
3、外接生態(tài)的服務(wù)分:對于車主來說,真正的價值撬點可能并不在語音控車上,而在于車載系統(tǒng)能夠提供的導(dǎo)航、內(nèi)容與綜合服務(wù)生態(tài),是否真正帶來了體驗改變。而這對于人機交互技術(shù)的提供者來說,還是相對困難的。而外接生態(tài)相對成熟的互聯(lián)網(wǎng)公司,似乎在這個邏輯上更有勝率。
技術(shù)、車企合作、綜合生態(tài),人車交互產(chǎn)業(yè)或許正在跑著一場鐵人三項。但在無人駕駛真正到來之前的相當長一段時間中,車載語音交互都會是汽車場景技術(shù)與體驗進化的主旋律。在語言的迷宮下,人和車以另一種方式相遇了。
而就車聯(lián)網(wǎng)而言,一個探尋的時代,也許會從語言與聲音的魔法中,慢慢開始它的覺醒。至少相比大部分車聯(lián)網(wǎng)偽需求來說,用聲音來觸發(fā)服務(wù),是駕駛場景中無可避免的選擇。