導(dǎo)讀:情感分析或情感人工智能,在商業(yè)應(yīng)用中通常被稱為意見挖掘,是自然語言處理(NLP)的一個非常流行的應(yīng)用。文本處理是該技術(shù)最大的分支,但并不是唯一的分支。情緒AI有三種類型及其組合。
情感分析或情感人工智能,在商業(yè)應(yīng)用中通常被稱為意見挖掘,是自然語言處理(NLP)的一個非常流行的應(yīng)用。文本處理是該技術(shù)最大的分支,但并不是唯一的分支。情緒AI有三種類型及其組合。它們都面臨著各自的挑戰(zhàn),目前都處于不同的發(fā)展階段。在本文中,筆者將簡要介紹這三種類型以及它們在實際應(yīng)用中的挑戰(zhàn)。
文本情感分析
作為NLP的一個子集,文本分析和書面意見挖掘是迄今為止最簡單和最發(fā)達(dá)的情緒分析類型。它們的需求量大,發(fā)展歷史長,也是企業(yè)和公共部門最常采用的技術(shù)。
基本的情緒分析,尤其是用于商業(yè)用途的,可以概括為將句子、段落、帖子或文檔分為消極、中性或積極三類。其中,更復(fù)雜的情緒和態(tài)度處理、意義提取、意圖分類和基于語言學(xué)的情感分析也越來越受歡迎。
自動情緒分析通常是通過監(jiān)督式深度機(jī)器學(xué)習(xí)、基于詞典的非監(jiān)督過程或兩者的結(jié)合來實現(xiàn)的。
我們有許多現(xiàn)成的數(shù)據(jù)集,如社交媒體、各種評論平臺和公開的問答服務(wù)。爬取受歡迎的網(wǎng)站(在受允許的情況下)來提取新數(shù)據(jù)也很受歡迎,Twitter和亞馬遜是特別受歡迎的選擇。
視覺情感分析
作為多媒體情感分析的一部分,與基于文本的分析相比,視覺情感AI在開發(fā)和商業(yè)整合方面還遠(yuǎn)遠(yuǎn)不夠。
當(dāng)前情感分析應(yīng)用的一個好例子是數(shù)字圖像存儲庫中通過情感標(biāo)識符(“幸?!?、“愛”、“喜悅”、“憤怒”)進(jìn)行視覺內(nèi)容搜索,以及自動的圖像和視頻標(biāo)簽預(yù)測。即將出現(xiàn)的應(yīng)用是出于教育、政治、文化、安全及其他目的,對人們情感的自動理解。
目前,視覺/文本分析,以及圖像注釋和伴隨文本的分析仍然是機(jī)器學(xué)習(xí)進(jìn)程的主要來源,旨在創(chuàng)建用于視覺情感分析的人工智能。
視覺情緒分析的數(shù)據(jù)也可以來自社交媒體:來自Flickr、Twitter、Tumblr的圖片;公共托管視頻平臺(YouTube等)
得益于許多著名的帶注釋的靜態(tài)圖像數(shù)據(jù)集,我們可以很容易地對面部表情進(jìn)行解釋和分類。復(fù)雜或抽象的圖像以及視頻和實時視覺的情感分析是一個更大的問題,特別是遇到缺少具體標(biāo)簽,或強(qiáng)行做出的和不準(zhǔn)確的表情等這些情況時。
復(fù)雜的視覺情感分析需要更高層次的抽象、文化知識,以及對主體性、概念和線索的理解。獲得已標(biāo)記的數(shù)據(jù)集是很難的,為學(xué)習(xí)提取和預(yù)測所表達(dá)的含義這一目的而創(chuàng)建模型也是很難的。
盡管最近的研究讓我們看到了很多希望,但更重要的是它們首先也表明了這樣一個事實:在我們發(fā)明視覺測謊儀和威脅檢測安全系統(tǒng),能夠結(jié)合下意識的面部表情和肢體語言來分析潛在的危險情況之前,還有很長的路要走。
音頻情感分析
語音聊天機(jī)器人正在成為我們生活中越來越重要的一部分,比如客戶服務(wù)電話中常聽見的某種“固定”的響應(yīng)或問候。這些語音助手要么已經(jīng)在使用,要么即將使用情感分析技術(shù),雖然還遠(yuǎn)非完美。
從語音語調(diào)和環(huán)境中檢測壓力、沮喪和其他情緒是機(jī)器已經(jīng)能夠完成的任務(wù)之一。理解和模擬韻律和調(diào)性的能力是目前語音處理和合成的一個重要部分。
現(xiàn)有的用于音頻情緒分析的情緒檢測方法通常與語音識別相結(jié)合。這種分析的參數(shù)是一組可檢測的聲學(xué)特征:音調(diào)、音強(qiáng)、節(jié)奏、頻譜系數(shù)等等。
慕尼黑開源情感與情感識別工具包(openEAR)是最受認(rèn)可的情感分析工具包之一,能夠提取4000多個特征(56個聲學(xué)低級別描述符中的39個功能)。
情緒分析和情感AI的主要挑戰(zhàn)是什么?
情感AI開發(fā)者仍然需要克服幾個挑戰(zhàn)。
現(xiàn)在機(jī)器學(xué)習(xí)的一個普遍概念是:情感人工智能“訓(xùn)練”的成功總是取決于輸入數(shù)據(jù)的質(zhì)量。更大、更好、更干凈的數(shù)據(jù)集對于避免“垃圾in、垃圾out”的情況是必要的,由這一情況引起的挑戰(zhàn)如:
文本情感分析面臨的挑戰(zhàn):無法識別雙重含義、笑話和影射;無法解釋語言和非母語語音結(jié)構(gòu)的區(qū)域差異。
例如:對于情感AI來說,處理書面演講中的諷刺可能是一項艱巨的任務(wù),可能會存在對意義和意圖的歪曲理解。雖然社交媒體通常是機(jī)器學(xué)習(xí)算法挖掘意見和意圖的來源,但其中的語言無可否認(rèn)是特定的,不一定是現(xiàn)實生活中的真實演講?!癆I聊天機(jī)器人在推特上呆了一天就變成了種族主義者”這類臭名昭著的事件很滑稽,但仍然很常見。
視覺情感分析的挑戰(zhàn):無法區(qū)分真實的和強(qiáng)迫的或夸張的情緒表達(dá);不包括肢體語言;處理概念和抽象圖像的問題。
例子:情感和情緒分析的一個顯著應(yīng)用是安全和防衛(wèi)應(yīng)用,例如,視覺測謊儀。到目前為止,與算法感知水平相關(guān)的問題在于理解真實情感的領(lǐng)域,或者缺乏真實情感的領(lǐng)域。雖然最近有一些成功的研究和發(fā)展,旨在識別真實和虛假的面部表情,但這些研究和發(fā)展仍然是相對小規(guī)模的,非常細(xì)分的,比如只涉及微笑時)。
語音情感分析的挑戰(zhàn):不考慮各種口音、地區(qū)語言模式、個人發(fā)音習(xí)慣等等。
許多非母語人士在說第二語言時仍保留著口音。在其他方面,口音可以表現(xiàn)為過渡調(diào)性、語速和停頓變化,而這些變化并不是第一語言所特有的。我們需要對其進(jìn)行明確的解釋,否則這些轉(zhuǎn)變可能導(dǎo)致對情緒和意圖的誤解。
在我們開發(fā)更好的聊天機(jī)器人、智能助手、家庭和商業(yè)環(huán)境中的機(jī)器人向?qū)?,以及最終實現(xiàn)自我意識、移情和真正理解人類表達(dá)的人工智能的道路上,這些問題都是需要重點(diǎn)克服的。