技術(shù)
導(dǎo)讀:將自然語言處理(NLP)技術(shù)引入BI系統(tǒng),帶來的不僅是人機(jī)交互方式的變革,更是數(shù)據(jù)分析質(zhì)量與效率的躍升。
將自然語言處理(NLP)技術(shù)引入BI系統(tǒng),帶來的不僅是人機(jī)交互方式的變革,更是數(shù)據(jù)分析質(zhì)量與效率的躍升。
數(shù)字經(jīng)濟(jì)時(shí)代,數(shù)據(jù)成為提高生產(chǎn)力、發(fā)展生產(chǎn)力的關(guān)鍵要素,蘊(yùn)含著巨大的使用價(jià)值與潛能。因此,對(duì)當(dāng)今企業(yè)而言,對(duì)數(shù)據(jù)的挖掘與利用均被放到了非常重要的戰(zhàn)略位置,與此同時(shí),企業(yè)也紛紛采用BI商業(yè)智能系統(tǒng)作為實(shí)現(xiàn)數(shù)據(jù)價(jià)值的有力工具,用以整合企業(yè)內(nèi)外部海量數(shù)據(jù),提高數(shù)據(jù)分析質(zhì)量與效率,為具體業(yè)務(wù)進(jìn)行賦能,為企業(yè)決策提供支撐。而將自然語言處理(NLP)技術(shù)引入BI系統(tǒng),帶來的不僅是人機(jī)交互方式的變革,更是數(shù)據(jù)分析質(zhì)量與效率的躍升。
什么是NLP?
NLP全稱Nature Language Processing,即自然語言處理,它是與自然語言的計(jì)算機(jī)處理有關(guān)的技術(shù)統(tǒng)稱。為了便于理解,其實(shí)可以分開來看,“自然語言”是指人與人之間書面或口語交流的形式;“處理”則是指利用計(jì)算機(jī)對(duì)數(shù)據(jù)進(jìn)行理解和分析。因此,自然語言處理實(shí)際上就是指讓計(jì)算機(jī)理解人類語言,并進(jìn)行相應(yīng)的分析;其目標(biāo)是讓計(jì)算機(jī)/機(jī)器在理解語言上像人類一樣智能,進(jìn)而彌補(bǔ)人類交流(自然語言)和計(jì)算機(jī)理解(機(jī)器語言)之間的差距。
自然語言處理讓機(jī)器善解人意
NLP,是人工智能領(lǐng)域中的重要方向之一,被譽(yù)為人工智能皇冠上的“明珠”。雖然它聽起來似乎很高深,但實(shí)際上早已與我們的生活息息相關(guān)。比如,我們所熟知的蘋果Siri、微軟Cortana (中文名:微軟小娜)、谷歌Assistant、亞馬遜Alexa等智能語音助手,以及公共場(chǎng)所里對(duì)答如流的智能服務(wù)機(jī)器人等,就是自然語言處理的典型應(yīng)用。正是有了自然處理技術(shù)的加持,它們不僅能夠理解我們所說的話,還能夠針對(duì)性地做出反饋。
不過,自然語言處理技術(shù)的應(yīng)用場(chǎng)景卻絕非僅限于我們所熟知的語音識(shí)別領(lǐng)域,在信息檢索、數(shù)據(jù)整合等領(lǐng)域也同樣擁有廣泛的應(yīng)用場(chǎng)景。比如,在信息檢索領(lǐng)域,自然語言處理能夠大大提高檢索的精準(zhǔn)度,而且能夠促使檢索引擎更加精準(zhǔn)地理解用戶的需求、更加智能化。比如,當(dāng)你在搜索引擎中搜索 “今天冷嗎?”,百度、360等主流的中文搜索引擎不僅會(huì)在結(jié)果頁顯示與搜索關(guān)鍵詞相關(guān)的網(wǎng)頁信息,更會(huì)在顯要位置以圖表形式直觀地展示當(dāng)前所處城市的實(shí)時(shí)及未來的天氣情況,而這背后實(shí)際上就有自然語言處理技術(shù)的身影,這也使得信息檢索與獲取變得更加方便快捷。在數(shù)據(jù)整合領(lǐng)域,自然語言處理技術(shù)則能提高數(shù)據(jù)處理的質(zhì)量、優(yōu)化輸出指令等;也正因如此,自然語言處理技術(shù)之于實(shí)現(xiàn)數(shù)據(jù)價(jià)值的有力工具——BI而言,也變得越來越重要。
為什么NLP技術(shù)對(duì)BI而言越來越重要?
在研究咨詢機(jī)構(gòu)Gartner發(fā)布的2020年和2021年現(xiàn)代分析與商業(yè)智能平臺(tái)應(yīng)具備的關(guān)鍵功能中,自然語言查詢(Natural Language Query,NLQ)和自然語言生成(Natural Language Generation,NLG)連續(xù)兩年被納入其中。自然語言查詢,即允許用戶在搜索框中鍵入或說出字詞來提問,查詢數(shù)據(jù)和分析內(nèi)容。自然語言生成,即自動(dòng)創(chuàng)建對(duì)數(shù)據(jù)中發(fā)現(xiàn)的見解的豐富語言描述;在分析上下文中,當(dāng)用戶與數(shù)據(jù)交互時(shí),描述會(huì)動(dòng)態(tài)變化,以解釋關(guān)鍵發(fā)現(xiàn)、圖表、儀表盤的含義。這也意味著,在現(xiàn)代分析與商業(yè)智能平臺(tái)中,NLP技術(shù)被放在了很重要的位置。
2020年和2021年現(xiàn)代分析與BI平臺(tái)應(yīng)具備的關(guān)鍵功能(來源:Gartner)
與此同時(shí),一些市場(chǎng)主流的BI廠商也已經(jīng)發(fā)現(xiàn)了NLP這項(xiàng)技術(shù)的好處,并將NLP技術(shù)與功能添加到其BI產(chǎn)品中,以改善用戶體驗(yàn)。
那么,為什么NLP技術(shù)對(duì)BI而言越來越重要呢?在筆者看來,一方面在于自然語言處理技術(shù)所帶來的人機(jī)交互方式的變革,進(jìn)而帶來更低的使用門檻;另一方面也在于自然語言處理技術(shù)所帶來的更加高效的數(shù)據(jù)分析。
在NLP技術(shù)應(yīng)用于BI系統(tǒng)之前,在人機(jī)交互方式是“人適應(yīng)機(jī)器/計(jì)算機(jī)”,也就是BI用戶需要通過編程、建模等方式,用機(jī)器懂的語言來進(jìn)行數(shù)據(jù)的探索和分析,這就帶來了很高的使用門檻,也正是如此,BI常常被調(diào)侃為IT專業(yè)人員、數(shù)據(jù)分析師以及數(shù)據(jù)科學(xué)家的數(shù)據(jù)分析工具。雖然此后為了降低使用門檻,BI也朝著“低代碼”的方向發(fā)展,但低代碼并非無代碼,一旦涉及到編程仍需IT專業(yè)人員的協(xié)助,在交互方式上也依然是“人適應(yīng)機(jī)器”。而在NLP技術(shù)應(yīng)用于BI系統(tǒng)之后,在交互方式上則是“機(jī)器/計(jì)算機(jī)適應(yīng)人”,大大降低了使用門檻,用戶無需學(xué)習(xí)機(jī)器的語言,只需使用自己所熟悉的語言即可進(jìn)行數(shù)據(jù)的探索與分析,從而實(shí)現(xiàn)“數(shù)據(jù)民主化”,BI也由此轉(zhuǎn)變?yōu)椤叭巳丝捎玫臄?shù)據(jù)分析工具”。
此外,將NLP技術(shù)與功能添加到BI產(chǎn)品之中,也相當(dāng)于增加了一個(gè)智能私人數(shù)據(jù)助手,其實(shí)現(xiàn)的界面與我們所熟知的智能語音助手或服務(wù)型聊天機(jī)器人類似,能提高數(shù)據(jù)分析的效率與質(zhì)量,使BI更具洞察力。它能驅(qū)動(dòng)各種應(yīng)用,結(jié)合商業(yè)智能分析滲入業(yè)務(wù)的方方面面,任意時(shí)刻都能提供數(shù)據(jù)驅(qū)動(dòng)的處理,使得基于數(shù)據(jù)提出問題并得到答案,如求助萬能的朋友圈一樣簡(jiǎn)單。
想象一下,你只需在BI系統(tǒng)中,與聊天機(jī)器人對(duì)話般向BI系統(tǒng)提出問題,如“XX產(chǎn)品近三個(gè)月的銷售額如何?”XX分公司過去一年的銷售目標(biāo)達(dá)成率如何?”,無需多年的數(shù)據(jù)分析經(jīng)驗(yàn),無需熟悉BI系統(tǒng)的操作方式,也無需擔(dān)心提出的問題機(jī)器是否能理解,BI系統(tǒng)即能根據(jù)所提出的問題自動(dòng)創(chuàng)建和生成圖表,并添加豐富的自然語義描述,對(duì)數(shù)據(jù)的探索、分析與洞察將變得何其簡(jiǎn)單!而實(shí)際上,正是有了自然語言處理技術(shù)與功能的加入,以上所描述的場(chǎng)景正在變成現(xiàn)實(shí)。
“觀哥”全中文NLP數(shù)據(jù)分析智能助手,自由探索數(shù)據(jù)價(jià)值
正是看到了自然語言處理技術(shù)在BI系統(tǒng)中的應(yīng)用價(jià)值,上海亦策軟件在其新一代增強(qiáng)智能協(xié)同BI平臺(tái)——觀數(shù)臺(tái)中,已融入了自然語言處理技術(shù)與功能,并推出了觀數(shù)臺(tái)機(jī)器人“觀哥”。
觀數(shù)臺(tái)機(jī)器人——觀哥Data Buddy
觀數(shù)臺(tái)是亦策軟件擁有自主知識(shí)產(chǎn)權(quán),專為中國(guó)企業(yè)量身定制的本土化、輕量級(jí)、可嵌入的商業(yè)智能(BI)平臺(tái),具有數(shù)據(jù)自動(dòng)化、增強(qiáng)智能和無處不在的嵌入式分析的特點(diǎn),為用戶提供了相關(guān)的洞察分析和可視化,供用戶進(jìn)一步考慮和探索。而觀數(shù)臺(tái)機(jī)器人——“觀哥”則是亦策軟件推出的全中文NLP數(shù)據(jù)分析智能助手,其作為觀數(shù)臺(tái)平臺(tái)的主要組件之一,可提供中文自然語言理解、意圖識(shí)別的人機(jī)交互應(yīng)用場(chǎng)景,支持上下文關(guān)聯(lián)查詢,幫助用戶自由探索數(shù)據(jù)價(jià)值。有了“觀哥”的協(xié)助,數(shù)據(jù)可智能呈現(xiàn),想到即看到;同時(shí)也不再提前固化用戶的數(shù)據(jù)關(guān)系和查詢思維,用戶可隨心所欲隨查隨看。觀數(shù)臺(tái)機(jī)器人“觀哥”具有以下特點(diǎn)與功能:
全面支持中文自然語言:“觀哥”可以接受中文命令提示,實(shí)現(xiàn)自由中文對(duì)話,并提供中文幫助文檔。在查詢過程中,“觀哥”的中文提示可幫助用戶更精確地分析數(shù)據(jù)。在自由對(duì)話的中文場(chǎng)景中,“觀哥”提供預(yù)測(cè)、上下文關(guān)聯(lián)和郵件推送等功能,用戶在與“觀哥”進(jìn)行對(duì)話時(shí),無需選擇應(yīng)用,直接輸入對(duì)話,“觀哥”即可預(yù)測(cè)應(yīng)用;完成對(duì)話后,“觀哥”也能預(yù)測(cè)用戶還想查看的數(shù)據(jù);而且,“觀哥”也附帶記憶,可以記住用戶上下文所說的對(duì)話內(nèi)容,同時(shí)“觀哥”也能將圖文報(bào)告通過郵件發(fā)送給指定用戶。中文幫助文檔則可幫助企業(yè)零成本培訓(xùn)員工。
觀數(shù)臺(tái)“觀哥”界面示例
完善的后臺(tái)管理:在后臺(tái)管理界面中,管理員可進(jìn)行一鍵數(shù)據(jù)訓(xùn)練和一鍵NLP發(fā)布,應(yīng)用數(shù)據(jù)級(jí)的安全配置,設(shè)置個(gè)性化維度及度量,添加常用交互反饋(如“方言化”交互),并可與社交通訊工具集成。
個(gè)性化助手:“觀哥”可提供預(yù)警提醒、可客制化即時(shí)報(bào)告模板、PDF報(bào)告分發(fā)以及其它開放API等。
開放性平臺(tái):“觀哥”不僅支持企業(yè)內(nèi)部應(yīng)用系統(tǒng)(如BI/CRM/OA等)、企業(yè)APP(手機(jī)客戶端需支持API接口)、社交軟件(如微信/釘釘?shù)龋┑蓉S富的API接口,而且支持Python/.Net Core源碼級(jí)別二次開發(fā),從而可進(jìn)行引擎優(yōu)化、功能模塊開發(fā)(如加入語音識(shí)別功能模塊等) 、私有化SMS/內(nèi)部消息開發(fā)等。
全平臺(tái)部署模式:“觀哥”既支持云端部署,也支持企業(yè)私有化部署。在云端部署方面,既支持基于AMS云安全模式;也支持與觀數(shù)臺(tái)數(shù)據(jù)分析集成,提供一站式體驗(yàn)。在企業(yè)私有化部署方面,“觀哥”可運(yùn)行在Windows Server、Cent OS、Fedora、Debian、Ubuntu、Linux Mint、OpenSUSE、SUSE Linux Enterprise Server(SLES)、Alpine Linux等多種操作系統(tǒng)環(huán)境中。
總的來說,依托于亦策軟件專業(yè)的開發(fā)團(tuán)隊(duì)、大數(shù)據(jù)科學(xué)家團(tuán)隊(duì)和AI科學(xué)家團(tuán)隊(duì),專業(yè)的數(shù)據(jù)分析與知識(shí),深厚的數(shù)據(jù)分析項(xiàng)目經(jīng)驗(yàn),以及龐大的客戶群體,觀數(shù)臺(tái)機(jī)器人“觀哥作為全中文NLP數(shù)據(jù)分析智能助手,具有中文理解準(zhǔn)確,響應(yīng)速度高;行業(yè)經(jīng)驗(yàn)充足,語料庫(kù)完善;推薦關(guān)注精準(zhǔn),自帶行業(yè)性;數(shù)據(jù)訓(xùn)練技術(shù)成熟;能與主流數(shù)據(jù)分析產(chǎn)品深入集成等諸多優(yōu)勢(shì)。
如今,觀數(shù)臺(tái)作為新一代增強(qiáng)智能協(xié)同BI平臺(tái),已經(jīng)在制造、零售、醫(yī)藥、教育、金融、航空與物流等眾多行業(yè)與領(lǐng)域得到廣泛應(yīng)用,而觀數(shù)臺(tái)機(jī)器人“觀哥”作為觀數(shù)臺(tái)的主要組件之一,不僅大大改善了人機(jī)交互方式,降低了使用門檻,而且也顯著提高了數(shù)據(jù)分析效率與質(zhì)量,進(jìn)而賦能各行業(yè)客戶自由探索數(shù)據(jù)價(jià)值,為其帶去更加精準(zhǔn)的分析建議與決策。