導(dǎo)讀:人是一種由規(guī)則組成的碳基生命,進食之于存續(xù),猶如生病之于凋零。企業(yè)組織是一種由規(guī)則組成的群體,在人類進化的長河中,將人所被制定的規(guī)則轉(zhuǎn)嫁到了組織之上,直到現(xiàn)在,企業(yè)成為了新的群體性生命。
圖片來自“123RF”
作者介紹:
本文作者虞兆愷Kelvin現(xiàn)就讀于普林斯頓大學(xué)計算機科學(xué)本科二年級,于2019年6月加入線性資本作為全職暑期實習(xí)生。
他的郵箱為zkyu@princeton.edu,對此話題感興趣的讀者可以與他聯(lián)系,感謝來信。
▍編者按
人是一種由規(guī)則組成的碳基生命,進食之于存續(xù),猶如生病之于凋零。
而企業(yè)組織是一種由規(guī)則組成的群體,在人類進化的長河中,將人所被制定的規(guī)則轉(zhuǎn)嫁到了組織之上,直到現(xiàn)在,企業(yè)成為了新的群體性生命。
直覺是發(fā)自內(nèi)心的,而理性則是反人性的。
企業(yè)的管理如同人的生存之道,這是一個由直覺慢慢總結(jié)為經(jīng)驗,再由經(jīng)驗出發(fā)提煉出規(guī)則的過程。
就像對于獵食動物的恐懼深植在草原部落上原始祖先的海馬體中,同樣的,對于企業(yè)組織的未雨綢繆也是企業(yè)領(lǐng)導(dǎo)記憶深處的商業(yè)案例的反射。
所以,靠直覺和經(jīng)驗管理企業(yè),是企業(yè)大腦中最直接的反射。
一套可被參照且自動執(zhí)行的智能化流程,是每一個企業(yè)最終極的理想。
從最早由經(jīng)驗管理公司,再到S.O.P.的出現(xiàn),借由網(wǎng)絡(luò)把S.O.P搬上云端變?yōu)镾aaS,最后,其實還是期望能進化成可被AI執(zhí)行的流程。
但是,對于經(jīng)驗的迷信,對于證據(jù)的直覺依賴,是存于人類碳基結(jié)構(gòu)的基因之中的。
基于硅體的人工智能不是要復(fù)制人的智能,而只是要適應(yīng)經(jīng)驗的短板。
本文作者縱覽發(fā)跡于美國硅谷與其他北美地區(qū)的SaaS企業(yè),希望能較為全面地展示一套企業(yè)組織如何利用A.I.進入到智能化的進程中,勾畫一個脫碳入硅的藍圖,為中國SaaS企業(yè)提供方法論的參考。
▍作者序
橫軸表示為公司規(guī)模(以員工數(shù)量單位);縱軸表示為SaaS產(chǎn)品的使用量
眾所周知,美國的企業(yè)們擁有世界上相對來說最深厚的技術(shù)儲備。
隨著各個體量的大小公司紛紛采購SaaS產(chǎn)品,服務(wù)于企業(yè)端的軟件數(shù)量激增,也因此造就了一條成熟的軟件供給與采購的鏈條。
以銷售科技類公司Chiefmartec為例,在2011年公司旗下?lián)碛?50名銷售人員,覆蓋了廣告、內(nèi)容管理、客戶關(guān)系管理、銷售、數(shù)據(jù)分析與公司運營管理等領(lǐng)域。
這一數(shù)字在2017年達到了5000名,在如今的2019年更是達到了7040名。
2011年度的銷售科技板塊:共有150家供貨商
2017年度的銷售科技板塊:共有5000家供貨商,到了2019年,數(shù)字為7040家供應(yīng)商
現(xiàn)如今的美國SaaS市場以趨近于飽和,且已經(jīng)出現(xiàn)了許多平臺級的解決方案。
為了用來區(qū)分這些產(chǎn)品,我們將傳統(tǒng)的SaaS公司歸納為四個不同屬性的戰(zhàn)略:
1. 用戶精準(zhǔn)型
區(qū)別于傳統(tǒng)通用的解決方案,比如Salesforce所提供的,用戶精準(zhǔn)型的企業(yè)擅于在一個絕對垂直領(lǐng)域為其客戶細分提供適配且精準(zhǔn)的服務(wù),在一定程度上放棄了廣闊的市場來達成市場與產(chǎn)品的高度匹配,即「Product-Market-Fit」。
2. 市場細分型
與前者不同的是,市場細分型的企業(yè)是從一個市場大小的絕對值來看的,這類企業(yè)專注在一個體量比較有限的市場細分下,比如專門服務(wù)中小型企業(yè),即「Small and Medium-sized Businesses, SMBs」。
3. 產(chǎn)品精耕型
產(chǎn)品精耕型企業(yè)的產(chǎn)品通常強調(diào)極大限度地優(yōu)化產(chǎn)品,可能僅以20%的產(chǎn)品功能便獲得了80%的回報,以一個極簡化的姿態(tài)來參與市場競爭。
4. 雙邊優(yōu)化型
雙邊指的是客戶端與企業(yè)端,雙邊優(yōu)化型的企業(yè)擅于在產(chǎn)品戰(zhàn)略上讓企業(yè)端與客戶端同時產(chǎn)出價值,讓客戶成為產(chǎn)品自傳播的渠道,從而提升企業(yè)價值。
但是,在過去幾年中,我們開始看到一種更為獨特的企業(yè)戰(zhàn)略,并且因此孕育了一大批新興企業(yè)。
盡管在這些企業(yè)中,他們擁有不同的行業(yè)區(qū)分和業(yè)務(wù)區(qū)分,但是他們都擁有一個共同的「人工智能先行的戰(zhàn)略」,即「AI-First Strategy」。
AI為傳統(tǒng)SaaS賦能的過程,可以被看作是一場范式的躍遷。
因為AI賦能之后的軟件行業(yè),將呈現(xiàn)出一些從未有過的業(yè)務(wù)形態(tài)、一種千人千面的使用體驗、一個未曾想過的商業(yè)潛能。
但這也不是說所有的商業(yè)模型都適合被AI智能化,企業(yè)需要考慮的是從傳統(tǒng)架構(gòu)遷移到智能化平臺后所帶來的投資回報,一味地追求數(shù)字化與智能化,并不會簡單地提升所有業(yè)務(wù)的價值。
因此,本文的核心訴求是給予讀者一個價值判斷的框架,去理解這個時代變遷后的商業(yè)新格局,從新的緯度來看目前格局的企業(yè)劃分,以及思考一下人工智能為行業(yè)和企業(yè)帶來的結(jié)果。
在接下來的章節(jié)中,將要為讀者展示三種獨特的AI結(jié)合SaaS戰(zhàn)略,正式他們讓這些新興企業(yè)與傳統(tǒng)SaaS服務(wù)提供商區(qū)別開來,以及五個來自不同公司的AI應(yīng)用。
另外,在最后一個章節(jié)中,將要討論為什么SaaS企業(yè)的AI賦能卻不能帶來一個贏者通吃的終局。
值得一提的是,企業(yè)AI智能化產(chǎn)業(yè)的先驅(qū)之一李開復(fù)博士是極為看好AI賦能的未來,但是在這里本文根據(jù)三個緯度的數(shù)據(jù)分析,來一一駁斥其中玄機。
▍三種獨特的AI+SaaS結(jié)合戰(zhàn)略
AI+SaaS結(jié)合型的企業(yè)在功能上也具備之前提到的四種戰(zhàn)略的特征,并且在一定程度上,大部分企業(yè)可以很輕易使用用戶精準(zhǔn)型戰(zhàn)略的。
但是AI為這些新興企業(yè)賦予了一個全新的產(chǎn)品形態(tài),這點是傳統(tǒng)SaaS企業(yè)難以望其項背的。
舉例來說,隨著計算機視覺技術(shù)的演進,一個基于面部捕捉和情感分析的商業(yè)智能化產(chǎn)業(yè)就被開辟出來了。
如今,經(jīng)銷商可以根據(jù)客戶在購物過程中的體態(tài)和表情變化來分析哪一類商品更受歡迎,大學(xué)課堂上的演講和當(dāng)堂反應(yīng)也可以被用來分析哪一位老師更能吸引學(xué)生注意力。
所以,「AI先行」的公司可以被歸納為三種獨特的戰(zhàn)略模式:
1. 能借助AI運行超復(fù)雜系統(tǒng)和超負荷任務(wù)。
以Invenica為例,憑借基于機器學(xué)習(xí)開發(fā)的預(yù)測模型能夠通過預(yù)測多個單點電力柵極的活動狀態(tài)來管理整個復(fù)雜的電力網(wǎng)。憑借此項技術(shù),Invenica更是拿下多個訂單,為多個管理系統(tǒng)提供預(yù)測模型。
2. 能夠借助AI轉(zhuǎn)錄和分析以往并不能被數(shù)字化的數(shù)據(jù)形式(e.g. 計算機視覺)。
拿Tractable AI來說,其AI+SaaS的解決方案被應(yīng)用于汽車保險領(lǐng)域,通過一套成熟的計算機視覺算法,在經(jīng)過成千上萬張受損汽車的圖片集訓(xùn)練之后,能夠精準(zhǔn)快速的分揀車禍保單并移交到相應(yīng)的流程化處理環(huán)節(jié)。
3. 能夠借助AI將傳統(tǒng)SaaS的體驗提升10倍以上。
在這里舉一個中國公司的例子,助理來也通過搭建智能化的自動應(yīng)答機器人為企業(yè)提供了一個定制化場景的客服應(yīng)答體驗。
「AI先行」的定義可以被詮釋為「缺少了AI的賦能,產(chǎn)品所提供的核心價值將一無是處」。
換言之,一個真正的以「AI先行」為核心戰(zhàn)略的企業(yè)應(yīng)將AI納入其價值主張之中。
如果剔除掉AI技術(shù),「AI先行」企業(yè)將運行超復(fù)雜系統(tǒng)和超負荷任務(wù);同理,缺少了AI,「AI先行」企業(yè)將無法理解極為抽象的數(shù)據(jù)形態(tài),更談何在其上建構(gòu)邏輯關(guān)系;如果沒有了AI,那與傳統(tǒng)SaaS企業(yè)和企業(yè)服務(wù)產(chǎn)品有何不同,在已經(jīng)飽和的市場何來容身之地。
▍三種獨特的AI+SaaS結(jié)合戰(zhàn)略
如前文所述,「AI先行」的SaaS企業(yè)與傳統(tǒng)SaaS企業(yè)在本質(zhì)上是不同的,接下來我們將探討一下AI在企業(yè)級服務(wù)中的實際作用。
盡管AI的功能性劃分不盡其數(shù),我們不妨以一種終局的思維分類一下AI多起的作用。傳統(tǒng)的功能性劃分將AI拆解如下:
首先,智能應(yīng)用的目的是為了分析商業(yè)形式,即「模式識別Pattern Recognition」;其次,便是對未來可能性的預(yù)測,即「預(yù)測分析Predictive Analytics」;然后,是針對特定限制條件的行為設(shè)定以達成結(jié)果優(yōu)化,即「行為優(yōu)化Optimization」;接著,將這套方法融合進特定的應(yīng)用場景中,即「場景定制Personalization」;最后,達成在復(fù)雜數(shù)據(jù)之上建立邏輯關(guān)聯(lián),以此將這套算法推廣,即「數(shù)據(jù)商用Data-as-a-Commodity」。
我們沿著這個邏輯,將公司分別在垂直業(yè)務(wù)和平行行業(yè)兩個緯度做更細化的解讀:
模式識別
在「模式識別」這個語境中的企業(yè)往往擅于從龐大的歷史數(shù)據(jù)中找出隱藏著的關(guān)聯(lián)性,但是這樣僅僅是幫助他們理解過去、分析現(xiàn)在,卻不能預(yù)測未來。
舉例來說,Tractable公司從車禍照片的數(shù)據(jù)中判斷出肇事者、損傷程度以及其他的數(shù)據(jù)樣本。
但需要注意的是,Tractable是在利用過去的數(shù)據(jù)來判斷當(dāng)下所發(fā)生的交通事故,并不能對何時何地發(fā)生交通事故做出預(yù)判。
承上,主要圍繞「模式識別」發(fā)展業(yè)務(wù)的公司在自動化決策上是有點薄弱的。
這類公司雖然詬病粗放的人工操作,但是一定不會用機器取而代之。
因為,他們認為人工智能還沒有發(fā)展足夠可靠的地步,而往往項目的沉沒成本讓公司難以在一個機器程序上試錯。
但是也有公司在嘗試跳出「模式識別」固有模式,這里有兩個典型的案例:
首當(dāng)其沖的是CB Insights公司,其業(yè)務(wù)核心便是利用聚合和分析私有公司底層數(shù)據(jù)的能力為投資機構(gòu)提供商業(yè)決策。
私有化投資其實和其他品類的投資產(chǎn)品類似,要求挖掘和分析跨行業(yè)的、極細顆粒度的行為數(shù)據(jù),這原本是人更擅長的抽象工作,而非機器。
第二個例子是利用「模式識別」在早期癌癥診斷上的應(yīng)用。
雖然基于AI技術(shù)的癌癥診斷工具在許多準(zhǔn)確性測試中都優(yōu)于人類,但是萬分之一誤診的可能性都是災(zāi)難性的,所以人類常常作為機器診斷的補充,在其后充當(dāng)著最后一道關(guān)卡。
預(yù)測分析
應(yīng)用「預(yù)測分析」技術(shù)的這類企業(yè)很好的詮釋了一個問題- “你從哪里來,要到哪里去?”
其實,這類企業(yè)所預(yù)測和分析的遠遠超出了簡單地匹配模型并給出可能的預(yù)測。
在這個預(yù)測的基礎(chǔ)上,系統(tǒng)會給出一套可供人做執(zhí)行的深度建議或直接用機器自動執(zhí)行任務(wù)。
以Zest Finance為例,這家企業(yè)利用機器學(xué)習(xí)幫助借款人可以做更快、更精準(zhǔn)的貸款信用的評判。
另一個例子是InsideSales,這家企業(yè)通過一個基于人工智能的智能系統(tǒng)為客戶做推薦,并實現(xiàn)了15% - 30%的轉(zhuǎn)化。
大多數(shù)情況下,預(yù)測過程呈現(xiàn)了一個黑箱狀態(tài),有一些分析預(yù)測型企業(yè)往往是將最終決策丟回給人工來操作。
但是,需要指出的是,由機器來做也無非是一個典型的二選一,比如對于Zest Finance來說就是「借」與「不借」的區(qū)別。
行為優(yōu)化
專注于「行為優(yōu)化」的企業(yè)們在解決的問題是- “如何才能在特定路徑上通過優(yōu)化自身決策來接近企業(yè)目標(biāo)?”
在過去,企業(yè)只能依靠一些不盡完美的標(biāo)的,諸如點擊率等來推測一個模糊的用戶動向。
但是,自從有了人工智能技術(shù),各項業(yè)務(wù)都可以在極細分的數(shù)據(jù)集下來做分析,像是光標(biāo)路徑分析、頁面停留時間等等,以此來提升利潤空間和留存率等。
舉例來說,Nextail和Focal System這兩家零售領(lǐng)域的商業(yè)智能平臺通過分析存貨量和跨門店的購買歷史,以此給出一個合理的進貨數(shù)量或是建議周轉(zhuǎn)調(diào)配到其他門店。
另一個例子是Amplero,它是一個主要做市場營銷的智能平臺,所做出的商業(yè)分析都是圍繞企業(yè)的績效指標(biāo)來指定的,而非傳統(tǒng)的諸如點擊率等提升銷售、利潤空間和留存率等。
表面上看,「行為優(yōu)化」與「預(yù)測分析」類似,兩者都是在做面向未來的決策。
但是,不同之處就在于「行為優(yōu)化」會給出現(xiàn)在可執(zhí)行的「行為建議」;而「預(yù)測分析」,正如其名,是提出可能的「未來走向」。
這就像是一個病人走進醫(yī)院告訴醫(yī)生她感到胃疼,這種情況下,「預(yù)測分析」算法通常會基于病人的病史以及現(xiàn)在的胃部病癥來預(yù)測「未來走向」,接下來胃疼程度是會緩解還是更糟.
相較而言,「行為優(yōu)化」算法會給出一個「行為建議」來指導(dǎo)如何控制疼痛、判斷生存預(yù)期等等。
甚至,還是在這個例子中,「模式識別」算法也會利用相同的數(shù)據(jù)來判斷病人再次患病的概率。
場景定制
主要做「場景定制」業(yè)務(wù)的企業(yè)會利用人工智能技術(shù)營造一種私人訂制的體驗給終端用戶。
還記得第三章第一節(jié)所著的Salesforce是如何打敗Oracle和SAP的嗎?
其勝利的主要原因就是傳統(tǒng)大廠即使提供了一系列產(chǎn)品服務(wù),但是很少能匹配云端的需求。
如今又是風(fēng)水輪流轉(zhuǎn),當(dāng)Salesforce身為SaaS大廠在做幾乎所有的事情的時候,也不能做到十全十美,因為在各個細分領(lǐng)域都需要做到定制化和功能優(yōu)化。
根據(jù)細分需求是可以讓商業(yè)決策變得更加精準(zhǔn)的,以MailChimp為例,這是一個價值40億美金的市場營銷自動化生意,這家企業(yè)為客戶提供郵件訂閱服務(wù)的營銷內(nèi)參,讓企業(yè)用戶們掌握客戶畫像以及點擊數(shù)據(jù)。
企業(yè)用戶可以輕易掌握到這些數(shù)據(jù),了解其客戶的所做所想,但是沒有「場景定制」的弊端就在于,這家企業(yè)的郵件訂閱內(nèi)容在同一時段給不客戶提供的是同樣的內(nèi)容。
客戶根據(jù)各自的需求去挑選合適的產(chǎn)品,但是大部分的SaaS營銷工具并不能提供場景定制化的功能。
但是有一家目前走過B輪的中國創(chuàng)業(yè)公司能提供不一樣的角度,那就是由人工智能驅(qū)動的數(shù)字內(nèi)容平臺特贊,它為企業(yè)客戶提供了千人千面的網(wǎng)頁頭版和橫幅等的設(shè)計。
在一份埃森哲于2018年發(fā)布的調(diào)查中,來自歐洲和北美的8000名受訪者中有接近91%的人認為基于個人需求定制的廣告和推薦是更受歡迎的,另有74%的人愿意提供個人數(shù)據(jù)以供運營商為他們推送定制化內(nèi)容。
對于直接那些需要與客戶直接打交道的SaaS產(chǎn)品來說,諸如CRM平臺、市場營銷平臺還有聊天機器人應(yīng)用等等,擁有定制化的功能和內(nèi)容將為公司在早期建立起一定的競爭壁壘。
但是隨著人工智能商業(yè)化的普及,定制化需求正在成為必要的前提,提供定制化的服務(wù)一定是未來「AI+SaaS」的發(fā)展方向。
數(shù)據(jù)商用
當(dāng)數(shù)據(jù)收集的需求和對人工智能技術(shù)的依賴在不斷增加時,便會產(chǎn)生平臺效應(yīng),一些高階的技術(shù)工具聚集在平臺之上可供各個量級的用戶調(diào)取,這就像是用戶在使用亞馬遜云服務(wù)平臺一樣方便。
谷歌便是利用其自身的人工智能和機器學(xué)習(xí)的技術(shù)儲備在向這樣一個開放的數(shù)據(jù)平臺發(fā)展,但是與其同時,這一領(lǐng)域已經(jīng)匯集不少玩家。
比如說,有提供計算機視覺引擎API的Clarifai公司、提供人工數(shù)據(jù)整合服務(wù)的MostlyAI公司、為企業(yè)客戶提供原始銷售數(shù)據(jù)的Tonic公司等。
這些公司甚至不必成為一家真正的、以「AI」為核心的公司,因為在他們所處的各自領(lǐng)域都在享受到有人工智能增值帶來的二階效應(yīng)。
以Segment和Snowflake為例,這兩家公司都推出了企業(yè)客戶系統(tǒng)化管理數(shù)據(jù)的服務(wù),但是他們都不是典型的有人工智能技術(shù)起家的公司,而且他們現(xiàn)在分別估值15億美元和39億美元。
「數(shù)據(jù)商用」型企業(yè)和此前提到的「場景定制」型企業(yè)類似,都是為典型的垂直領(lǐng)域用戶服務(wù),因為他們真正在售賣的是一種企業(yè)后臺工具。
不過數(shù)據(jù)/AI商用型公司與只服務(wù)于垂直場景的AI定制化公司的規(guī)模似乎比較能看到天花板,當(dāng)這個細分場景的掘金潮來臨時,似乎是一門好生意。
Domino Data Lab的發(fā)跡歷史就是很好的證明,他們向數(shù)據(jù)科學(xué)家出售軟件解決方案,以此幫助他們的客戶進行模型的快速搭建和配置。
自然地,他們也獲得了來自風(fēng)險投資機構(gòu)的超過8000萬美元的融資。
▍為什么AI技術(shù)不會導(dǎo)向贏者通吃的市場終局
此前,我們已經(jīng)基本遍歷了AI在SaaS企業(yè)中的應(yīng)用前景。
而至于AI在SaaS企業(yè)中的應(yīng)用弊端,這就說來話長了。
不過,似乎有一種聲音正在出現(xiàn),即是通過應(yīng)用AI技術(shù)可以讓企業(yè)走向一個相對壟斷的市場地位。
因為AI行業(yè)的入門門檻是相對高的,只有資源頂端的公司可以為如此高成本的人力買單。
與此同時,AI的產(chǎn)業(yè)鏈條中,數(shù)據(jù)收集、將數(shù)據(jù)喂給AI模型、打造AI產(chǎn)品、收集更多數(shù)據(jù)來正向反饋給這個鏈條,可以看出這是一個贏者愈贏、強者愈強的局面。
表面上看,這是符合邏輯的,因為模型是依賴于更精確的數(shù)據(jù)源,只要是能獲取到精準(zhǔn)的數(shù)據(jù),那么占據(jù)在這個身位上就一定能比后來者更有先手優(yōu)勢。
而所訓(xùn)練出來的模型,反過來會讓先發(fā)企業(yè)創(chuàng)造更好的產(chǎn)品,這樣一來就擁有更多的資源去投入到獲取數(shù)據(jù)中。
知名的技術(shù)領(lǐng)域風(fēng)險投資人、AI領(lǐng)域的研究專家李開復(fù)博士曾經(jīng)在其著作《AI·未來》中有總結(jié)到:
AI在某些行業(yè)內(nèi)是一定會取得贏者通吃的局面。深度學(xué)習(xí)與數(shù)據(jù)挖掘的關(guān)系造就了一個閉環(huán),并且在不斷地為優(yōu)秀的公司和產(chǎn)品賦能。
因為更充足的數(shù)據(jù)會造就更優(yōu)秀的產(chǎn)品,這也會吸引更多的用戶,而用戶會產(chǎn)生更多的數(shù)據(jù)為產(chǎn)品迭代產(chǎn)生動力。
這些數(shù)據(jù)池和其帶來的巨大利潤會為頭部的公司們吸引來頭部的開發(fā)人員,這樣一來,公司與公司之間的差距就愈發(fā)明顯
其實,爭議主要圍繞三個最基本的假設(shè):
1. 頭部玩家可以在很長的一段時間持續(xù)獲取到有效數(shù)據(jù)。
2. 更多的數(shù)據(jù)和更好的模型之間存在線性正相關(guān)的關(guān)聯(lián)。
3. 未來AI方面的人才仍然處于一個供應(yīng)短缺的高價狀態(tài)。
顯然,這些假設(shè)并不能成立,而以下是三個駁斥點:
1. AI技術(shù)和數(shù)據(jù)的商用化正在崛起。
2. 數(shù)據(jù)和數(shù)據(jù)產(chǎn)生的價值正逐漸成負相關(guān)。
3. AI技術(shù)從業(yè)者的入門門檻正在降低。
▍AI技術(shù)和數(shù)據(jù)的商用化正在崛起
當(dāng)數(shù)據(jù)收集的需求和對人工智能技術(shù)的依賴在不斷增加時,便會產(chǎn)生平臺效應(yīng),一些高階的技術(shù)工具聚集在平臺之上可供各個量級的用戶調(diào)取,這就像是用戶在使用亞馬遜云服務(wù)平臺一樣方便。
谷歌便是利用其自身的人工智能和機器學(xué)習(xí)的技術(shù)儲備在向這樣一個開放的數(shù)據(jù)平臺發(fā)展,但是與其同時,這一領(lǐng)域已經(jīng)匯集不少玩家。
比如說,有提供計算機視覺引擎API的Clarifai公司、提供人工數(shù)據(jù)整合服務(wù)的MostlyAI公司、為企業(yè)客戶提供原始銷售數(shù)據(jù)的Tonic公司等。
這些公司甚至不必成為一家真正的、以「AI」為核心的公司,因為在他們所處的各自領(lǐng)域都在享受到有人工智能增值帶來的二階效應(yīng)。
以Segment和Snowflake為例,這兩家公司都推出了企業(yè)客戶系統(tǒng)化管理數(shù)據(jù)的服務(wù),但是他們都不是典型的有人工智能技術(shù)起家的公司,而且他們現(xiàn)在分別估值15億美元和39億美元。
開復(fù)老師認為的頭部公司所具有的顯著優(yōu)勢是持續(xù)獲得有效數(shù)據(jù)的能力,但是在未來這一點很可能不復(fù)存在。
真實的數(shù)據(jù)生產(chǎn)過程是為了能測試和改進AI模型的人工數(shù)據(jù)生產(chǎn)過程。
一個實現(xiàn)的基本路徑是記錄真實世界的數(shù)據(jù)是如何分布的,之后根據(jù)分布結(jié)果來做統(tǒng)計。
問題的復(fù)雜之處在于這個過程需要足夠先進的收集方法,但是正如讀者所見,在文章開頭的板塊圖中,已經(jīng)有創(chuàng)業(yè)公司在嘗試「數(shù)據(jù)創(chuàng)造即服務(wù),Data-Generation-as-a-Service」。
此項技術(shù)已經(jīng)被Waymo和Tesla應(yīng)用在自動駕駛的模擬中。
在2019年7月,Waymo已經(jīng)完成了1千萬英里的模擬駕駛,但于此同時,真人駕駛的數(shù)據(jù)累計也才1千萬英里,此處可以看到模擬數(shù)據(jù)在執(zhí)行時的效率。
總結(jié)來說,獲取、管理、應(yīng)用數(shù)據(jù)正日益變得漸變,當(dāng)真實數(shù)據(jù)的生產(chǎn)方式讓相關(guān)數(shù)據(jù)變得更容易獲取時,獨角獸企業(yè)Segmet和Snowflake證明了數(shù)據(jù)管理可以更簡化10倍,Clarifai和Google將AI集成到棧也可以更簡化10倍。
▍數(shù)據(jù)和數(shù)據(jù)產(chǎn)生的價值正逐漸成負相關(guān)
風(fēng)險投資基金Andreessen Horowitz的投資人Martin Casado和Peter Lauten曾經(jīng)對于數(shù)據(jù)領(lǐng)域的護城河效應(yīng)有一個著名的論調(diào):
誠然,這個行業(yè)是有規(guī)模效應(yīng)的,但是我們觀察到數(shù)據(jù)領(lǐng)域的護城河并不穩(wěn)固。
因為和傳統(tǒng)行業(yè)的規(guī)模化不同,傳統(tǒng)行業(yè)往往越早吸引到投資,相對優(yōu)勢就越發(fā)明顯。
而數(shù)據(jù)領(lǐng)域其實有些背道而馳,獲取特異性的數(shù)據(jù)資源讓成本陡升,但是數(shù)據(jù)所累計的價值缺越來越不明顯。
有一種論調(diào)是說數(shù)據(jù)的門檻是當(dāng)收集了更多的數(shù)據(jù)之后能正向促進模型的精準(zhǔn)度。
在某些語境下這是對的,比如當(dāng)AI可以很顯著地達成網(wǎng)絡(luò)效應(yīng)的地方(e.g. Tiktok)。
但是更多的時候,數(shù)據(jù)收集和清洗帶來的成本往往高居不下或持續(xù)增加,而新數(shù)據(jù)的多樣性卻不能被保證。
最終數(shù)據(jù)采集的價值曲線持續(xù)放緩,甚至?xí)兴芈洹?/p>
a16z基金還表示
以上圖表來自于Eloquent Labs的Aru Chaganty,顯示了客戶支持領(lǐng)域內(nèi)提交給智能問答機器人的一些提問。
在這其中,在20%的系統(tǒng)資源臨界點,系統(tǒng)一共處理了20%的客戶請求。
在這個臨界點之上,數(shù)據(jù)處理的效率曲線不但明顯增長緩慢,處理成本也隨著數(shù)據(jù)抓去和清洗量上升而陡增。
另外一個值得注意的點是,數(shù)據(jù)分布的極限是往40%這個點無限趨近,這就意味著自動應(yīng)答可被執(zhí)行的內(nèi)容范圍的極限就是這個量。
如果讀者熟悉機器學(xué)習(xí)的話,還可以從另一個角度來思考這個問題,那就是「主成分分析Principal Component Analysis」,即「PCA」。
「PCA」是一種數(shù)據(jù)降維算法,將n維特征映射到k維上,這k維是全新的正交特征也被稱為主成分,是在原有n維特征的基礎(chǔ)上重新構(gòu)造出來的k維特征。
事實上,在噪音較大的數(shù)據(jù)集中,在前幾個緯度內(nèi)捕捉到了大部分信號內(nèi)容,而之后的緯度充滿了噪音。
同樣的,數(shù)據(jù)收集在達到某一個臨界點之后,再增加的新數(shù)據(jù)邊際效應(yīng)就很有限了。
換言之,數(shù)據(jù)收集呈現(xiàn)了一種明顯的冪次法則,或者說帕累托分布:在某一個臨界點之下,數(shù)據(jù)對于達成更精準(zhǔn)的模型是很重要的,但是當(dāng)數(shù)據(jù)的采集量逐漸逼急10倍或100倍時,對于模型精準(zhǔn)度的貢獻在成本和功能上都十分有限。
AI對于有些終端是管用的,比如最終目的是提升用戶體驗和用戶價值的,而不是模型本身。
至此,再回過頭來看一下「AI贏者通吃論」的前兩個假設(shè)條件。
第一,頭部玩家可以在很長的一段時間持續(xù)獲取到有效數(shù)據(jù);第二,更多的數(shù)據(jù)和更好的模型之間存在線性正相關(guān)的關(guān)聯(lián)。
本文所秉承的觀點就是「AI/數(shù)據(jù)商用化」企業(yè)會有效降低行業(yè)的入門門檻,因此第一個假設(shè)不攻自破。
第二點,也是更重要的一點,即更多的數(shù)據(jù)并不一定會造就更精確的模型。
▍AI技術(shù)從業(yè)者的入門門檻正在降低
如果「AI/數(shù)據(jù)的商用化」正在從技術(shù)層面上讓AI模型的搭建變得簡易,但是為什么這拉低AI從業(yè)者的入門門檻呢?
接下來需要用軟件工程來做一下類比。
比方說,讀者想要學(xué)習(xí)如何在iPhone上搭建一個移動端應(yīng)用,在早期會怎么做呢?
很大可能是買來一本厚重的編程書,或是雇傭一個助教,又或者是在網(wǎng)上鉆研晦澀難懂的文章。
在過去的十年中,這一局面獲得了很大的改觀。
如今,根本用不上翻閱難啃的開發(fā)教程或是上昂貴的編程課,在網(wǎng)絡(luò)上已經(jīng)擁有了龐大的、已用的公開教學(xué)資源,而且大部分還是免費的。
比如,在StackOverflow上,無需依靠閱讀文檔來艱難地找出Bug,論壇里的帖子能回答幾乎所有新手會犯的錯誤。
但是不僅如此,AWS和Heroku提供的SaaS、PaaS和IaaS的解決方案能夠顯著地帶來簡單易用的機會去視覺化、檢測、運維和發(fā)布任何客戶端應(yīng)用產(chǎn)品。
讀者也許會反駁到,這個論述只看到了產(chǎn)業(yè)中下游的提升,在上游的精英級別從業(yè)者們并不會因此改變太多。
在此,本文的立場應(yīng)該是與這種反駁完全對立的。
當(dāng)一個行業(yè)的信息壁壘降低,有機會讓足夠多的人持續(xù)進入這個行業(yè)時,處于頂層的精英人數(shù)一定有機會同比增加。
不過,在這里還是引用一下行業(yè)專家李開復(fù)自己的話。
他的這段文字闡述了他認為的為什么科技人才可能造就AI領(lǐng)域成為領(lǐng)頭行業(yè)的原因:
頂尖的公司把充足的數(shù)據(jù)量與資本結(jié)合起來,就能吸引到頂尖的人工智能人才,進一步擴大產(chǎn)業(yè)領(lǐng)先者與落后者之間的差距。
同意。我們繼續(xù)來看他在書中是如何比較研究領(lǐng)域和應(yīng)用領(lǐng)域的:
許多人之所以誤認為美國在人工智能領(lǐng)域具有重大優(yōu)勢,主要是因為他們還停留在我們生活在「發(fā)明的年代」的印象中:
在發(fā)明的年代,人工智能的頂尖研究人員不斷打破舊有典范,最終破解存在已久的謎題,媒體不斷報道人工智能的最新成就,更是助長了這種印象。
例如在某些癌癥的診斷上,人工智能做得比醫(yī)生更好;在德州撲克的人機大賽中,人工智能擊敗了人類冠軍;不用人為干預(yù),人工智能就自己學(xué)會并精通新技能等。
媒體如此關(guān)注報道人工智能的每一項新成就,也難怪一般觀察者甚至是專業(yè)分析師會認為人工智能研究將不斷獲得突破性的新發(fā)現(xiàn)。
他認為,這種現(xiàn)象有誤導(dǎo)作用,因為在這些「新里程碑」中,很多成就其實只是把過去10年的技術(shù)性突破應(yīng)用到新問題上。
其中主要是深度學(xué)習(xí),但還有一些互補的技術(shù),例如強化學(xué)習(xí)(reinforcement learning)和遷移學(xué)習(xí)(transfer learning)。
研究人員做這些事,需要卓越的技能和深度的專業(yè)知識,不僅要有能力思考、撰寫復(fù)雜的數(shù)學(xué)算法,還要能夠處理巨量數(shù)據(jù),針對不同問題調(diào)整人工神經(jīng)網(wǎng)絡(luò)。
這往往需要博士級的專業(yè)知識技能,但這些發(fā)展都不過是依賴著深度學(xué)習(xí)這項科技的大發(fā)展所做的漸進式改善和優(yōu)化。
這些漸進式的改善和優(yōu)化,其實是把深度學(xué)習(xí)在模式識別與預(yù)測上的強大能力應(yīng)用到種種不同的領(lǐng)域上,如疾病診斷、核發(fā)保單、開車、中英翻譯等。
這其中理由也很簡單:
但這些改善和優(yōu)化并不代表我們正在朝著「通用人工智能」的方向快速前進,或是出現(xiàn)了類似深度學(xué)習(xí)的重大技術(shù)性突破。
簡單來說,人工智能正式進入了實干的年代,想要利用這個時期賺錢的公司,需要擁有有遠見和才干的創(chuàng)業(yè)者、工程師和產(chǎn)品經(jīng)理。
他還補充到:
想要訓(xùn)練處成功的深度學(xué)習(xí)算法,需要運算力、工程能力以及大量的數(shù)據(jù)。
在未來這三點中最重要的是數(shù)據(jù)量,因為工程能力達到一定水平后,就會開始出現(xiàn)收益遞減,這時數(shù)據(jù)量才能決定一切。
只要數(shù)據(jù)量足夠大,由優(yōu)良但非頂尖的工程師設(shè)計出的深度學(xué)習(xí)算法,也有機會超過全球頂尖專家設(shè)計的算法。
行業(yè)精英們肯定可以幫助頭部企業(yè)鞏固住他們的地位。
但是,我們是處于一個增量的時代,是不是普通工程師也能完成實操,因為畢竟數(shù)據(jù)為王?
答案是否定的,不,這并不能說得通。
持續(xù)吸引優(yōu)秀的人才和保持人才的運轉(zhuǎn)是創(chuàng)造任何壁壘的必要條件,但是開復(fù)博士自己也坦言,這在AI并不是至關(guān)重要的。
雖然AI的核心人才還是相對稀缺的,但是需要指出的是,行業(yè)的入門門檻正在降低。
此外,市場的流動性給越來越多的從業(yè)者提供了機會,類似于1997年和2014年計算機從業(yè)者數(shù)量翻番。
中國發(fā)布了將要在2030年引領(lǐng)全球AI市場的國家戰(zhàn)略,因此2019年已有超過400所高校開展并設(shè)立了AI、大數(shù)據(jù)、機器人相關(guān)的專項教育。
這樣的宏觀刺激會顯著提升AI從業(yè)者的基數(shù),而且技術(shù)工具的使用壁壘也在下降,所以AI從業(yè)者的總體數(shù)量會比預(yù)計樂觀很多。
▍總結(jié)
來到最后。
這樣的宏觀刺激會顯著提升AI從業(yè)者的基數(shù),而且技術(shù)工具的使用壁壘也在下降,所以AI從業(yè)者的總體數(shù)量會比預(yù)計樂觀很多。
回到本文所給出的三個最終結(jié)論:
1. AI技術(shù)和數(shù)據(jù)收集管理正在被大幅度簡化和商用化;
2. 數(shù)據(jù)和數(shù)據(jù)產(chǎn)生的價值正逐漸成負相關(guān);
3. AI技術(shù)從業(yè)者的入門門檻和使用工具的學(xué)習(xí)壁壘正在降低,人才供應(yīng)會逐步提升且成本會降低。
我們可以得出一個結(jié)論,AI技術(shù)并不能確保運用它的企業(yè)走向贏者同者通吃的局面。
在一個行業(yè)中的絕對優(yōu)勢是建立在能夠同時在多個緯度處于領(lǐng)先:人才儲備、數(shù)據(jù)廣度、數(shù)據(jù)深度、產(chǎn)品體驗還有資本儲備。
無數(shù)的例子證明,曾經(jīng)的領(lǐng)先者會因為相同的原因而落沒。
首先,他們獲得資金;然后,安于舒適區(qū);最后,他們死去。
AI是某些終端的解決辦法之一,但是不要讓這個技術(shù)本身蒙蔽了企業(yè)未來的發(fā)展道路。
保持多條路徑并行,持續(xù)饑渴、不斷迭代,去尋找未來新的增長點。