導讀:技術、車企合作、綜合生態(tài),人車交互產業(yè)或許正在跑著一場鐵人三項。但在無人駕駛真正到來之前的相當長一段時間中,車載語音交互都會是汽車場景技術與體驗進化的主旋律。在語言的迷宮下,人和車以另一種方式相遇了。
“BAT抵達車聯網”,是最近引發(fā)無數媒體關注的一個“風口話題”。
在熱鬧的討論中,我們知道了這個火熱的賽道上有BAT等科技巨頭,還有傳統車企,造車新貴,以及解決方案提供商,一時間風起云涌好不熱鬧。
但如果我們從頭琢磨一下,可能會發(fā)現今天對車聯網的討論,多少有點“失焦”:所謂車聯網這個賽道,究竟在爭奪什么?而BAT進場與不進場,到底有什么區(qū)別?各家科技巨頭與車企在車聯網領域的進度各有什么不同?
這些問題的答案,很可能藏在一個很多司機今天還并不重視的角落里:人車對話。
人和車聊天這事兒,真的有這么重要嗎?
咱們先來思考這么一個問題:給車連上網,到底干嘛用?
聲音是不可代替的交互:車聯網賽道的真正軸心
我們知道,所謂的車聯網,是泛指通過汽車端的信號傳輸裝置,接受網絡信息與服務的技術解決方案。包括車輛遠程控制、遠程安全、駕駛場景下的網絡服務等多個領域——也就是所謂的讓車變成一個終端。
而今天熱絡的車聯網產業(yè),普遍關注的是兩個問題:
1、改善駕駛效率與體驗。比如用戶可以基于互聯網技術控制汽車、輔助駕駛等等。
2、獲得駕駛外的增值服務。比如用戶通過車載網絡獲得的導航、內容、天氣、支付服務等等。
那么重點來了,這兩種服務到底要怎么賦予駕駛者呢?
都集成到手機上…開車玩手機好像不對?放在車載屏幕上,讓用戶觸屏控制?哪有人那么閑沒事停車觸屏一下再開?而且既然都停車了,那干脆玩手機好不好?
所以有種說法,叫做車上最沒用的設備就是屏幕??梢哉f,在車聯網的商業(yè)想象中,讓用戶放棄方向盤來獲得網絡服務,是一種反人性的設計。那么網絡服務、駕駛服務怎么才能無縫對接給駕駛者呢?答案只可能是人車語音交互。
讓駕駛者通過語音來控制一部分不方便控制的車載設備,再通過語音交互來獲得外接互聯網服務,是車聯網場景中唯一成立的交互模式。可以看到,在初期試水之后,無論是車廠還是科技企業(yè),都將矛頭對準了人車對話交互這一塊“車聯網樞紐”。
而在車載語音交互的成長過程中,科技巨頭陸續(xù)進場與獨角獸崛起,就變成了一個合乎技術邏輯的事情。
車載語音交互不長的歷史上,已經涌現出了以下幾種“江湖流派”,讓“語言交互戰(zhàn)”成為了車聯網戰(zhàn)場上貨真價實的戰(zhàn)略高地
安卓改裝流:國產車的常規(guī)套路
最早認識到語音交互價值的,當然是汽車企業(yè)本身。而最早布局車聯網系統的,也是一批以自主品牌車廠為主的車企,他們普遍通過改裝原生安卓的方式來搭建自己的“車載UI”。
而在這套交互邏輯里,也涌現出了原生版本的車載語音交互。
這種 “原生態(tài)”語音交互系統,一般由車企自己開發(fā),實際技術供應商往往是長三角、珠三角的小工廠,因此沒什么技術研發(fā)成本。一般來說形式是一個安卓系統改裝的操作平臺,然后用戶可以在車載系統上安裝各種各樣的APP,形似一個安裝在車上的安卓平板。然后用戶可以使用某些APP中的語音控制,來控制FM、地圖等應用。
吉利吉客、比亞迪Dili nk等系統算是這個流派中相對成熟的。這類車企自制系統,優(yōu)點是成本低廉,可以某種程度上作為營銷噱頭。
但缺點也十分明顯:由于必須進入APP內部的語音交互,所以用戶說什么其實與車無關,只是控制APP而已。而且往往交互邏輯中有大量需要觸屏操作的地方,用戶在行駛中必須經常觸屏,對交通安全也是個隱患。
總體而言,改裝安卓流派并不被看好。所以,有AI技術撐腰的科技巨頭們來了。
車載音箱流:科技公司進場人車交互的開端
今天更多主流車企,開始注意到了車內語音交互能夠帶給駕駛者諸多便利,甚至可以說是車載顯示器唯一合理的解決方案,于是主流車企+車載語音技術開始熱絡了起來。而科技巨頭以自己的語音技術優(yōu)勢,切入車聯網領域,就變成了順理成章的情況。
國內的Apollo小度車載系統,國外亞馬遜的Alexa,都可以作為車企的語音交互解決方案來進行合作。
比如說,今年早些時候,寶馬已經宣布將與亞馬遜的Alexa合作,在新出車型中搭載車載語音助手。駕駛者可以與語音助手直接對話,查詢地點、選擇想要收聽的內容,以及相應的綜合服務。而用戶可以選擇是否需要搭載Alexa。
這種模式,從技術邏輯上來看,可以被理解為在整車完成后,把語音助手集成在車載交互中,嵌入到車輛的網絡交互設備里。說白了,有點像在汽車中安裝一個智能音箱,只是在交互形態(tài)和使用目的上與家用音箱不同。
還有一種科技企業(yè)的進場方式,是向車企的車聯網項目輸送技術。比如東風風神與百度DuerOS、博泰共同打造過Windli nk 3.0。百度在其中扮演AI語音技術輸出商的角色。
目前,國外的亞馬遜、微軟,國內的科大訊飛、百度DuerOS,都有相應的車載交互體系,已經被搭載到很多車輛當中。
這種嵌入式的車載音箱流,優(yōu)點是基本以成熟的AI語音交互系統作為底本,能夠產生不錯的對話體驗。無論是方言識別、自然語言處理還是對用戶的數據學習,都比原生態(tài)版本強出一大截。
相應的問題是,這類系統由于大多是后裝或準后裝模式,無法與汽車建立底層的機械聯系,所以能夠帶給用戶的操作比較有局限性。說白了,這更像是車企為由需要用戶準備了一份錦上添花的禮包。
但如果語音交互向走的更遠,車企與科技企業(yè)似乎必須走的更近才行。
整車前裝流:巨頭醞釀中的下一個故事
在讀者相對更熟悉的無人駕駛領域,我們已經可以得出這樣一個結論:拋開車廠玩科技,基本是條死胡同。
在人車交互領域同樣如此,假如離開了車企的制造基礎,那么科技企業(yè)帶來的感知智能交互技術,就像是在車內擺放了一盆可有可無的裝飾。
只有科技企業(yè)與車企更緊密合作,將人機交互的可控范圍加大,車聯網技術才可能帶來真正的駕駛升級體驗。這或許也意味著,車載網絡交互系統,必須有后裝改為前裝:讓AI語音系統可以進入汽車的機械系統里,甚至盡量靠近控制中樞。
換言之,語音交互能夠部分取代車輛駕駛控制,在科技企業(yè)看來才是王道。
這個領域已經有科技巨頭進駐,比如阿里與上汽合作的斑馬網絡,核心業(yè)務方向就是結合AliOS的整車底層平臺,為車企提供前裝人機交互系統。
前裝的直接價值,在于能夠讓語音交互控制車上更多的部件。比如車窗、雨刷、天窗、空氣凈化器等等。
另一個意義在于,前裝可以在車上安裝更多傳感器與麥克風陣列,讓人控制車的同時,車也可以主動感知到人的存在。由此能夠分清誰在說話、判斷每一個人的狀態(tài)等等。
此外還由一個區(qū)別在于,科技企業(yè)假如只提供技術解決方案,那么車聯網連接的將還是一般互聯網內容,無法獲得專屬于車的支付、內容、旅游等產品服務,而前裝系統可以直接綁定車主ID,這是讓車變手機的一個先決條件。
當然,整車前裝AI交互系統的故事才剛剛開始。
一方面大量車企并未適應這種模式,因為想要獲得更好的語音交互體驗,系統需要直接接入車輛的機械控制中樞,這在很多車廠看來是有安全隱患的。
但整車前裝,科技企業(yè)與車企深度合作的路子很可能會越走越遠。今年 Google I/O 大會開幕前,Google 還宣布了與沃爾沃的合作,雙方會合作打造不同于安卓的車載智能系統。科技企業(yè)走向與車企的平等合作,AI語音交互成為車輛本身的一部分,在方向上應該沒有什么疑問。
當然了,我們更期待的,可能是語音交互成為駕駛的全部。
無人駕駛流:人類還在等待的人車對話
顯然,車聯網技術真正在等待的,是與無人駕駛的合流。雖然這個目標在今天來看還遠,但從技術邏輯上看,車輛語音交互有一天會成為全面取代手動的交互模式。
就像今天有些車主會堅持認為,我用手控制挺好的,為什么要說話控制車?這其實涉及很多駕駛習慣問題,難以一概而論。但不可否認的是,假如最終我們只用說說話,車就可以準確舒適地把我們帶到目的地,那么與車的對話將具有絕對價值。
這個邏輯所形容的,是L4級別無人駕駛中的語音交互。這個層級里,車輛將拋棄方向盤,也就是說駕駛場景已經被取代。但如何獲得更舒適的出行體驗、選擇道路導航方式、緊急情況下的制動,今天看來還是需要人類進行主動干預的。而干預的方式,應該還是以人車對話為主。
今天已經有很多無人駕駛項目,開始研發(fā)無人駕駛場景下的人車對話機制。這種場景下,用戶需要下達的命令往往是復雜抽象的,有點類似我們做出租車時給司機的建議。那么要讓無人駕駛系統具象化這些建議,并落實成出行模式,就需要強大的自然語言處理能力、深度語義理解能力作為支撐。
作為無人駕駛的必備配套技術,這個領域目前已經匯集了中外各路AI豪杰和車企,但同時也存在大量機會。讓人車可以像乘客和司機一樣對話,還有很遠的路要走。
車載語音這條賽道,究竟在比什么?
綜上所述,車聯網這一局棋,某種程度上來看,真正在考驗的是車載語音交互的技術解決能力和綜合服務體驗。
因為駕駛時的網絡服務必須圍繞聲音進行,那么聲音能夠獲得的權限越大,交互技術越精準,生態(tài)服務越充沛,消費者的體驗也就會越好。
這一場關于人車對話的賽跑,無論是科技巨頭,還是新晉獨角獸、造車新貴,都必須考慮三個方面的問題:
1、AI語音技術的體驗分:AI語音交互、IoT系統、云計算,這些技術體系進入汽車,是一個廣泛而深刻的過程。而這個過程中,對科技企業(yè)拿出的技術解決能力是有嚴格要求的。車載場景不同于家居,有復雜的干擾環(huán)境,和必須快速執(zhí)行命令的性能要求。如何讓人車對話時,可以更好地完成遠場喚醒、方言識別、特殊語序識別,是接下來AI公司需要繼續(xù)努力的。
2、與車企合作的親密分:如果我們認同語音交互控制車輛部分越多越好,前裝優(yōu)勢大于后裝這個邏輯,那么人車交互體驗就是建立在科技企業(yè)與車企的緊密合作基礎上。而在今天,即使是已經全面領先的斑馬和AliOS,也面臨客戶群不夠多、合作品牌相對單一的問題。如何讓高端車、合資或者外資品牌車也部署“中國智造”的AI交互系統,或許還是任重道遠的工作。
3、外接生態(tài)的服務分:對于車主來說,真正的價值撬點可能并不在語音控車上,而在于車載系統能夠提供的導航、內容與綜合服務生態(tài),是否真正帶來了體驗改變。而這對于人機交互技術的提供者來說,還是相對困難的。而外接生態(tài)相對成熟的互聯網公司,似乎在這個邏輯上更有勝率。
技術、車企合作、綜合生態(tài),人車交互產業(yè)或許正在跑著一場鐵人三項。但在無人駕駛真正到來之前的相當長一段時間中,車載語音交互都會是汽車場景技術與體驗進化的主旋律。在語言的迷宮下,人和車以另一種方式相遇了。
而就車聯網而言,一個探尋的時代,也許會從語言與聲音的魔法中,慢慢開始它的覺醒。至少相比大部分車聯網偽需求來說,用聲音來觸發(fā)服務,是駕駛場景中無可避免的選擇。