導(dǎo)讀:聲控電梯這波熱潮帶來的化學(xué)反應(yīng)。
你是否想過,未來某一天,你可以像喚醒智能音箱一樣語音控制電梯?
在這場疫情到來之前,我不曾想過這個問題。
但是,在疫情中,它確實在某些醫(yī)院、園區(qū)、寫字樓中開始應(yīng)用。
改造一部聲控電梯,需要幾步?
2020年,復(fù)工后的生活讓在家中備受各類種疫情信息轟炸的上班族多少有些憂慮,當(dāng)從“云辦公”切換到“坐班制”的模式時,這種憂慮尤其明顯。
經(jīng)歷了封路、封城、小區(qū)戒嚴(yán),如今世衛(wèi)組織又將新冠肺炎列為“大流行病”,一百多個國家出現(xiàn)確診病例超10萬例,讓區(qū)域防控機制不斷升級??爝f、外賣、公共交通均針對疫情做出了調(diào)控,通過無接觸避免病毒傳播,因疫情而起的無接觸服務(wù)由此席卷了關(guān)乎民眾出行的各個行業(yè),甚至電梯這一狹小空間也被考慮在內(nèi)。
不得不說,物聯(lián)網(wǎng)時代對用戶體驗的高度重視,以及各廠商的響應(yīng)速度,達到了常人難以想象的地步。不少電梯廠商通過與互聯(lián)網(wǎng)廠商合作,應(yīng)用各類新興控制方案,開始對電梯進行改造。
其中,智能語音方案在此期間應(yīng)用尤其廣泛,聲控電梯也成為疫情期間被喚醒的一類“新物種”。
2月18日,思必馳位于蘇州騰飛創(chuàng)新園的總部大樓完成了聲控電梯的改造。
整部電梯的改造其實可以分為內(nèi)外兩部分,
整個聲控電梯改造過程很快,不過由于考慮到安全性、可靠性等因素,我們當(dāng)時請了原裝電梯的售后工程師來做現(xiàn)場指導(dǎo),我們邊做邊學(xué),實際上也只用了兩個小時。
思必馳IoT產(chǎn)品總監(jiān)梅劍雄告訴雷鋒網(wǎng)。
思必馳在此次疫情期間推出了智能電梯離線語音方案,這一方案在思必馳總部大樓電梯中的應(yīng)用,多少有些場景驗證的意思,其實早在2月2日,內(nèi)部就已正式立項并開始緊急研發(fā)的方案。
當(dāng)時的主要工作是將我們此前成熟的語音方案移植到電梯場景中,做一套完整的智能電梯語音方案。
到2月15日,這一方案的軟硬件其實都已經(jīng)調(diào)試完成,當(dāng)時在找實際落地設(shè)備時,想到我們公司大樓剛好有電梯,于是就和公司申請,將這一方案應(yīng)用到了我們總部大樓的電梯中。
看似一次簡單的電梯改造,看似一個簡單的語音方案研發(fā),其實中間仍有諸如語音模型訓(xùn)練、硬件方案設(shè)計等諸多細節(jié),這些細節(jié)的打磨主要解決的是拾音、降噪問題。
語音模型:電梯場景中特殊的噪音與降噪
國際上針對智能語音技術(shù)的識別率、翻譯準(zhǔn)確率等參數(shù)的相關(guān)競賽已經(jīng)進行了將近十年,智能語音技術(shù)也迭代優(yōu)化了近十年,如今智能語音技術(shù)的成熟度已經(jīng)足以支撐相關(guān)產(chǎn)品應(yīng)用到家居、車載等生活場景中,市面上也有了科大訊飛、思必馳、云知聲、聲智科技等一批以語音技術(shù)為核心的AI獨角獸企業(yè)及初創(chuàng)企業(yè)。
雷鋒網(wǎng)向多家廠商了解到,電梯場景中的語音方案與家居、車載場景中的語音方案基本類似,不過由于所需的控制功能(呼叫電梯、選層)更簡單,不需要太多定制化,最需要考慮的反而是基本的降噪問題。
電梯場景中應(yīng)用的語音控制方案需要考慮哪些噪聲?梅劍雄解釋稱:
其實在密閉的電梯空間中,噪聲分兩種,設(shè)備自身的噪聲,如開關(guān)門產(chǎn)生的摩擦聲、運行的聲音、通風(fēng)設(shè)備的風(fēng)噪;還有外部的噪聲,如乘客說話的聲音、電梯開關(guān)門產(chǎn)生的風(fēng)壓,開關(guān)門產(chǎn)生的風(fēng)壓噪聲。
其實這些因素在此前多年研發(fā)的方案中我們都有考慮到,只不過此次在電梯中應(yīng)用需要做一些特殊的定制優(yōu)化。
對于這樣的噪聲處理,思必馳通過對降噪算法進行場景化優(yōu)化,以及搭載自家生態(tài)公司深聰智能研發(fā)的語音芯片TH1520.進行降噪。
我們針對語音算法在芯片上做了很大的性能優(yōu)化,使得算法與芯片完全適配,這樣就可以通過此前80%的算力實現(xiàn)100%的性能,節(jié)省下來的算力可以通過增加算法的復(fù)雜度,進一步提升降噪能力。
正如神槍手都是用子彈喂出來的一樣,好的AI算法也都需要用大量數(shù)據(jù)來訓(xùn)練,AI語音算法顯然也是如此。據(jù)梅劍雄透露,思必馳智能電梯語音方案研發(fā)過程中,一周內(nèi),通過公司員工和思必馳的眾包平臺收集了數(shù)萬分鐘電梯場景下的錄音數(shù)據(jù)(其中80%為有效數(shù)據(jù))作為數(shù)據(jù)集對模型進行了再次訓(xùn)練和優(yōu)化。
在硬件上,我們對麥克風(fēng)的位置也做了多次調(diào)整,需要反復(fù)多次試驗,以尋求在電梯場景下的最佳位置。
據(jù)官方信息顯示,思必馳此次發(fā)布的智能電梯離線語音方案,“1-3米喚醒成功率>97%、識別率>95%”。
同樣對智能語音解決方案有深入理解的科大訊飛,也在近期對外發(fā)布了智能電梯離線語音方案,科大訊飛消費者業(yè)務(wù)群AIoT平臺產(chǎn)品研發(fā)部副總經(jīng)理周正友告訴雷鋒網(wǎng):
考慮到電梯運行噪音的干擾、封閉小空間聲場的變化、空間光滑引起的聲音反射的變化等干擾因素,訊飛智能電梯語音解決方案采用傳統(tǒng)HMM-NN模型和基于深度學(xué)習(xí)的End-to-End方案的混合模型架構(gòu),發(fā)揮End-to-End系統(tǒng)高召回率的特性,同時兼顧HMM-NN系統(tǒng)誤喚醒穩(wěn)定的特性。此外,在語音模型和聲學(xué)模型上也做了優(yōu)化:
語音模型,采用了基于深度學(xué)習(xí)的解碼網(wǎng)絡(luò),針對高頻詞匯進行了重點訓(xùn)練,增強高頻指令集的識別率,降低串?dāng)_率;
聲學(xué)模型,針對電梯密閉場景以及常用詞匯(尤其是數(shù)字)進行訓(xùn)練數(shù)據(jù)擴充,提升高頻指令集的音素切分效果。
離線語音方案只是智能語音技術(shù)中的一個分支,可以通過對本地指令的支持和識別,來滿足諸如電梯此類更為本地化、更加注重功能性的場景應(yīng)用。
然而,在此次疫情中也涌現(xiàn)出了諸多智能電梯在線語音方案,包括科大訊飛、云知聲等廠商在發(fā)布智能電梯離線智能語音方案的同時,也發(fā)布了在線版語音方案。
在線語音方案or離線語音方案?
與離線語音方案不同的是,在線語音方案需要有較好的網(wǎng)絡(luò)環(huán)境支撐,通過網(wǎng)絡(luò)連接到云端資源,提供除“選擇樓層”、“開關(guān)電梯門”這些基本功能型操作之外的語音播報信息的能力。
訊飛智能電梯在線語音方案除具備離線方案的所有功能外,還可實現(xiàn)更加豐富的語音交互功能,包括播報海量云端信息,實現(xiàn)百余種語音技能,動態(tài)切換及數(shù)十位發(fā)音人等。
對于二者功能上的差異,周正友這樣解釋。
在線語音方案在提供更豐富的語音播報功能和信息的同時,其實也提高了軟硬件成本,例如硬件層面需要加裝網(wǎng)絡(luò)相關(guān)的傳感器。當(dāng)然,即使在線語音方案成本更高,但相對于電梯成本來說,也是九牛一毛。
是該選在線語音方案,還是選離線語音方案,除去成本外,還有三個因素值得考慮:
第一,網(wǎng)絡(luò)環(huán)境是否允許。在線語音方案涉及到云端資源的應(yīng)用,因而需要有較好的網(wǎng)絡(luò)環(huán)境支撐,因而尤其在電梯這樣特殊場景,是否有優(yōu)質(zhì)網(wǎng)絡(luò)直接決定了選擇擁有更豐富功能的在線語音方案是否會有與之相匹配的更好的用戶體驗。
第二,施工周期能否接受。相對離線語音方案來說,在線方案部署更復(fù)雜,部署周期也更長。
同樣推出了智能電梯離/在線語音方案的云知聲告訴雷鋒網(wǎng),“純離線語音方案部署起來非???在線方案部署涉及到對電梯井的網(wǎng)絡(luò)部署等工作,部署會更復(fù)雜,周期也會更長。疫情期間客戶對方案部署周期很重視,所以現(xiàn)在市面上已經(jīng)落地的智能電梯語音方案采用純離線方案的會更多?!?/p>
第三,是否需要更多的語音播報等功能。電梯中的語音控制方案是否需要更多的語音播報功能,這主要看電梯廠商或酒店、地產(chǎn)等應(yīng)用方的考慮。
從功能上而言,離線語音方案已經(jīng)能夠滿足當(dāng)下基本應(yīng)用需求,而且離線語音方案的語音交互穩(wěn)定性更高、響應(yīng)速度也更快。
不過在線方案除去能夠提供更多的語音播報功能外,雷鋒網(wǎng)認為,更實用的還是在控制方式上引入了更多可能。云知聲此次在智能電梯方案中引入「小程序梯控」功能,正是基于在線語音方案用戶可以通過手機小程序遠程呼叫電梯。
在線方案的應(yīng)用,為智能電梯的控制方式提供了更多可能;在線語音方案的應(yīng)用,其實更多還是智能電梯需求側(cè)對于智能語音此類技術(shù)高智能化的期望。
具體到實際應(yīng)用場景中,還需要考慮另一個問題——該方案要覆蓋的是前裝市場,還是后裝市場。
電梯行業(yè)的前裝市場與后裝市場
前裝市場、后裝市場概念常見于汽車行業(yè)中,其實,在電梯行業(yè)中,也有類似的前裝市場與后裝市場之分。
在電梯行業(yè)中,前裝市場和后裝市場的界限可以理解為在于是否已出廠。電梯出廠前,包括沒有完成或已經(jīng)完成的電梯產(chǎn)品都可以認為是前裝市場產(chǎn)品;電梯出廠后,已經(jīng)安裝到各樓宇的電梯則是后裝市場產(chǎn)品。
電梯前裝與后裝兩類場景,由于工程部署的環(huán)境不同,電梯改造難易程度也不同,智能語音技術(shù)廠商也會提供完全不同的解決方案。
在前裝市場,由于是在原廠生產(chǎn)或改裝過程中加入的語音方案,因而只需要將語音模塊嵌入到電梯中,所以他們可能只需要一個主控模塊;
對于后裝市場而言,尤其像這次疫情中亟需改造的電梯,我們會提供一個即插即用的模塊,直接安裝到電梯中,完成簡單的接線就可以使用。
對于兩類場景所需的解決方案的差異,梅劍雄在實際項目研發(fā)中深有體會,具體針對以上兩類應(yīng)用市場,又可以將智能電梯語音解決方案從工程部署上分為兩類:
第一類,通過485或CAN總線實現(xiàn)語音模塊與電梯中控系統(tǒng)的通信,這類方案接線少,但需要通過電梯原廠或供應(yīng)商配合完成方案改造,改造周期較長;
第二類,通過線控并聯(lián)方式,通過語音模擬物理按鍵實現(xiàn)改造(典型案例如思必馳總部大樓電梯的改造),這類方案實施起來更快,但由于電梯屬于特種安全設(shè)備,仍需要有專業(yè)的電梯售后現(xiàn)場指導(dǎo)。
湖北宜昌第二人民醫(yī)院聲控電梯安裝現(xiàn)場,圖源:啟英泰倫官網(wǎng)
顯然,前裝市場對智能語音方案的需求和應(yīng)用,更符合產(chǎn)品研發(fā)的常規(guī)邏輯,這樣的產(chǎn)品研發(fā),其實早年間已經(jīng)開始,在疫情期間升溫的智能電梯語音方案,也已經(jīng)在電梯廠商發(fā)布會的PPT上,甚至部分國際電梯品牌的高端產(chǎn)品線中出現(xiàn)多年。
電梯物聯(lián)網(wǎng)的這幾年
訊飛在2016年就已經(jīng)有了智能電梯語音解決方案,此前幾年也不斷有電梯廠商來訊飛交流。
科大訊飛告訴雷鋒網(wǎng)。
科大訊飛涉足電梯行業(yè)之初,首先考慮的是前裝方案,杭州西奧電梯正是科大訊飛在電梯領(lǐng)域的早期合作廠商,雙方合作可以追溯到2018年。
2018年8月,西奧電梯到科大訊飛合肥總部進行了一次深入交流,也是在此次交流之后,雙方開始合作研發(fā)智能電梯(在線)語音方案,當(dāng)時用到的正是科大訊飛麥克風(fēng)陣列解決方案,據(jù)科大訊飛透露,這一方案其實早在2019年年初就已經(jīng)調(diào)試完成。
在2020年疫情期間的新聞報道中,西奧電梯余杭區(qū)工廠中的三臺配備智能語音功能的電梯用到的正是此前與科大訊飛合作的智能電梯在線語音方案。
智能電梯語音方案其實只是電梯行業(yè)對大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能相關(guān)技術(shù)應(yīng)用的冰山一角,近年來,隨著經(jīng)濟下行倒逼產(chǎn)業(yè)升級,傳統(tǒng)電梯產(chǎn)業(yè)對數(shù)字化、智能化技術(shù)變革的熱情已經(jīng)燃燒多年,包括奧的斯、日立、三菱、迅達、西奧等國內(nèi)外知名電梯品牌已經(jīng)早早開始將物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能技術(shù)應(yīng)用到電梯產(chǎn)品中。
電梯物聯(lián)網(wǎng)的概念由此而生。
電梯物聯(lián)網(wǎng)不僅僅是呼梯方式的一次變革,更重要是通過對電梯加裝信息采集設(shè)備(或模塊)以及多種有線、無線傳輸技術(shù),將電梯的運行狀態(tài)、故障報警、監(jiān)控視頻等信息匯聚到物聯(lián)網(wǎng)綜合管理平臺上,通過多種算法對數(shù)據(jù)進行分析處理,實現(xiàn)電梯的智能運維。
相對于智能電梯而言,電梯物聯(lián)網(wǎng)是一個更為時髦的概念,但多數(shù)電梯廠商對于這一概念并不陌生。
早在2016年,日立電梯對外發(fā)布了Lumada物聯(lián)網(wǎng)核心平臺,將大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能等技術(shù)應(yīng)用到電梯產(chǎn)品中。日立電梯副總裁賈宇輝此前在接受媒體采訪時表示,將大數(shù)據(jù)應(yīng)用于電梯上,其一可以為定向產(chǎn)品研發(fā)提供數(shù)據(jù)支持;其二進行可預(yù)見性的維護,為維修員工提前準(zhǔn)備好重點信息;其三和建筑方面的數(shù)據(jù)結(jié)合,應(yīng)用于相關(guān)場景。
2018年5月,在世界電梯博覽會上,奧的斯推出了Otis ONE物聯(lián)網(wǎng)服務(wù)平臺(又稱數(shù)字化電梯維保服務(wù)平臺);也是在此次展會上,奧的斯還展示了集成亞馬遜Alexa和微軟Cortana語音控制功能的智能電梯。
西奧電梯總裁周俊良此前也表示,“隨著智能化程度越來越高,電梯廠商需要考慮如何跟上時代的步伐。西奧電梯在2012年新工廠采購設(shè)備開始考慮數(shù)據(jù)連接問題,西奧電梯的目標(biāo)是通過人臉識別、智能語音等技術(shù)打造'會思考有溫度的電梯'。其中,如碧桂園、融創(chuàng)等西奧電梯的戰(zhàn)略合作伙伴已經(jīng)開始啟用智能電梯?!?/p>
目前西奧電梯在物聯(lián)網(wǎng)技術(shù)方面有怎樣的應(yīng)用和布局?西奧電梯告訴雷鋒網(wǎng):
幾年前,西奧就已經(jīng)啟動了物聯(lián)網(wǎng)技術(shù)和智能化技術(shù)的布局,西奧的北斗星智能服務(wù)系統(tǒng)就是采用了物聯(lián)網(wǎng)相關(guān)技術(shù),通過數(shù)據(jù)采集、平臺計算、提前預(yù)警這些措施提升我們對客戶需求的響應(yīng)速度和服務(wù)質(zhì)量。
智能化的身份識別梯控技術(shù),既保障了業(yè)主的安全,也使他們的乘梯體驗越來越好,比如業(yè)主回家通過單元門機時,就可以為他召好電梯,自動登記上樓的目的樓層,出門下樓時只需要在家里的室內(nèi)機登記上要去的樓層,電梯就會幫他自動按好下樓的按鈕,電梯到達時自動登記要去的1樓或地下車庫等樓層,全程實現(xiàn)無接觸乘梯。
對于年輕一族,我們也研發(fā)了使用手機遠程呼梯的產(chǎn)品,所有的乘梯過程操作在乘梯前手機上一次性操作完成,這個產(chǎn)品在商務(wù)辦公寫字樓尤其受歡迎。
在物聯(lián)網(wǎng)這波浪潮中,傳統(tǒng)電梯行業(yè)也在生產(chǎn)側(cè)、管理側(cè),以及產(chǎn)品側(cè)極力尋求變革。疫情期間,無接觸服務(wù)的興起,為智能電梯語音方案的落地應(yīng)用提供了一個“機會”,顯然,一些智能語音技術(shù)廠商、電梯廠商也抓住了這樣的機會,開始將聲控電梯這一青澀少年推到聚光燈下。
等待“機會”的三股力量
2016年,科大訊飛在逐步推進AIoT的行業(yè)落點的進程中了解到,在智能樓宇的體系下,電梯控制中真實存在著智能語音交互場景。
首先,從智能樓宇的發(fā)展趨勢來看,多模態(tài)交互在不同空間、場景中的應(yīng)用是一個必然趨勢;其次,電梯也是我們智能家居概念一個延伸的應(yīng)用場景。
基于這樣的邏輯,科大訊飛開始著手研發(fā)智能電梯語音方案。
雷鋒網(wǎng)向業(yè)內(nèi)人士了解到,當(dāng)時,關(guān)注智能電梯語音方案的除了電梯廠商,還有另外兩股力量:
地產(chǎn)商。諸如萬科、碧桂園等頭部地產(chǎn)商本身就在打造智能樓宇概念,電梯智能化自然也成了這些廠商的關(guān)注點;
智能家居行業(yè)集成商。這類廠商也希望將智能電梯語音方案融合到自家提供的智能家居或智能樓宇方案,不過由于此前部分智能語音技術(shù)廠商更偏重于做前裝方案,與電梯廠商合作較為緊密,集成商在二者間難以找到合適的定位;隨著智能語音技術(shù)廠商針對后裝市場推出越來越多的語音方案,集成商也將有更多的進入機會。
盡管技術(shù)已經(jīng)相對成熟、方案也已就位,甚至得到了從集成商、設(shè)備廠商、地產(chǎn)商供需鏈條上各環(huán)節(jié)的關(guān)注,但是智能電梯語音方案此前始終未能成為電梯或高端電梯的標(biāo)配,即使配有語音方案的電梯,也只是作為呼梯操作的補充方式。
對此,西奧電梯認為主要有以下兩方面原因:
第一,客戶形成一定的用戶習(xí)慣需要一個培養(yǎng)期,而目前市場尚未對語音呼梯進行全方位的推廣;
第二,語音識別系統(tǒng)在應(yīng)用過程中需要逐步適應(yīng)各類方言和口音,逐步完善其功能。
因此,三股力量都在等待一個“機會”,一個提升用戶對智能電梯語音方案的認知,讓用戶對智能電梯語音方案的接受度不再只是停留在好奇層面的“機會”;一個智能電梯語音方案成熟度足以應(yīng)付狹小電梯轎廂復(fù)雜聲學(xué)環(huán)境及各類方言的“機會”。
與此同時,智能語音技術(shù)廠商也需要一個機會來在實際應(yīng)用場景中證明自己,從而拿到一張通向(國內(nèi))年出貨量百萬臺,市場保有量超700萬臺,市場規(guī)模在2020年將超4000億的電梯行業(yè)的特別通行證。
“無接觸服務(wù)”的興起帶來正是這樣一個機會。
科大訊飛告訴雷鋒網(wǎng)(公眾號:雷鋒網(wǎng)),隨著無接觸服務(wù)的興起,從需求側(cè)來看,開始有更多的電梯廠商找我們合作,地產(chǎn)廠商對智能電梯語音方案的關(guān)注度也更高了。
思必馳市場總監(jiān)陳輝龍也向雷鋒網(wǎng)透露,目前,思必馳智能電梯語音方案已有超過80家意向客戶。
電梯按鍵會被取消嗎
經(jīng)年之后,配有語音方案的電梯終于走向市場時,傳統(tǒng)按鍵是否會被逐漸取代?
對于這個問題,各類廠商雖然觀點略有不同,但結(jié)論卻很一致:不會。
科大訊飛認為,電梯是一個對安全性要求非常高的產(chǎn)品,置身其中的用戶會認為按鍵更有安全感,因而語音方案完全取代按鍵這件事,至少現(xiàn)在還不會出現(xiàn)。
思必馳認為,至少在十年之內(nèi),電梯按鍵(物理按鍵或觸屏按鍵)不會被取代,而未來更多會是多模態(tài)交互方式,包括按鍵、語音、人臉識別,甚至手勢識別等組成的多模態(tài)交互方式將成趨勢。
西奧電梯也表示,疫情過后,雖然還是不一定會成為無接觸乘梯的主流方案,但用戶對語音呼梯的認識較之前肯定有一個明顯的接受度,隨著語音技術(shù)的越來越成熟越來越可靠,以及成本的越來越低,相信將會成為電梯智能化的一部分。比如乘電梯時雙手拿著東西不方便按電梯按鈕,殘疾盲人使用語音呼梯肯定會比去觸摸電梯盲文按鈕來的方便。
2020年,在抗擊疫情中出現(xiàn)的無接觸服務(wù)讓聲控電梯有機會走入大眾視野,也使得語音方案在未來智能電梯的多模態(tài)交互系統(tǒng)中有了一席之地;與此同時,聲控電梯這波熱潮帶來的化學(xué)反應(yīng),或?qū)⑶藙忧|級電梯市場,促使整個電梯行業(yè)的智能化進程加速并入快車道。