技術(shù)
導(dǎo)讀:在大數(shù)據(jù)的研究上,樊院士奠定了大數(shù)據(jù)計(jì)算復(fù)雜性的基礎(chǔ),重塑了數(shù)據(jù)質(zhì)量研究領(lǐng)域。“大數(shù)據(jù)具有四個(gè)主要特征:規(guī)模大(量)、類型多、變化速度快以及真實(shí)性(質(zhì)量)。國(guó)內(nèi)外目前在數(shù)據(jù)規(guī)模方面做的功課比較多,但在其他三個(gè)方面的研發(fā)相對(duì)比較少,還有很多未解問題”。樊院士認(rèn)為,針對(duì)數(shù)據(jù)類型多樣性的異源異構(gòu)數(shù)據(jù)共享模型與方法,針對(duì)數(shù)據(jù)變化速度的自動(dòng)增量計(jì)算理論,以及針對(duì)數(shù)據(jù)真實(shí)性的數(shù)據(jù)質(zhì)量模型與方法等都有很多痛點(diǎn),有待發(fā)展。
緊隨著先行示范區(qū)落地,由粵港澳大灣區(qū)和中國(guó)特色社會(huì)主義先行示范區(qū)組成的“雙區(qū)驅(qū)動(dòng)”給深圳帶來(lái)了改革開放之后又一重大且嶄新的歷史機(jī)遇。基于此,“2019前海世界數(shù)字論壇”于12月6日如期舉辦。
在本次論壇上,物聯(lián)傳媒有幸采訪到了數(shù)據(jù)庫(kù)專家、中國(guó)科學(xué)院外籍院士的樊文飛。熟悉樊院士的人都知道,他給人印象最深的可能就是那純粹的笑容,讓人感覺親切而踏實(shí)。
而樊院士純粹的笑容背后,我們看到的是讓人肅然起敬的成就。2019年11月,樊文飛當(dāng)選中國(guó)科學(xué)院外籍院士,這是他繼英國(guó)皇家學(xué)會(huì)院士(FRS),歐洲科學(xué)院院士(MAE),英國(guó)愛丁堡皇家學(xué)會(huì)院士(FRSE),國(guó)際計(jì)算機(jī)學(xué)會(huì)會(huì)士(ACM Fellow)之后獲得的第5個(gè)院士稱號(hào)。作為享譽(yù)國(guó)內(nèi)外的知名院士,樊文飛在接受采訪中談到,“我是搞技術(shù)的”,將自己定位為技術(shù)從業(yè)人員?;蛟S,這就是真正潛心研究技術(shù)、深挖理論潛力的科學(xué)家該有的淳樸。
樊院士對(duì)于數(shù)據(jù)庫(kù)科學(xué)最卓著的貢獻(xiàn)是從理論突破到系統(tǒng)的落地,英國(guó)皇家學(xué)會(huì)提名詞上寫道,樊文飛是世界上極少數(shù)同時(shí)在數(shù)據(jù)庫(kù)理論與系統(tǒng)兩個(gè)領(lǐng)域做出突破性貢獻(xiàn)的學(xué)者之一。同時(shí),樊院士也是國(guó)際數(shù)據(jù)庫(kù)領(lǐng)域歷史上僅有的兩個(gè)“大滿貫”得主之一,囊括了數(shù)據(jù)庫(kù)四大頂級(jí)理論和系統(tǒng)會(huì)議的最佳論文獎(jiǎng)和時(shí)間檢驗(yàn)獎(jiǎng)(SIGMOD 2017, PODS 2010 和2015,VLDB 2010, ICDE 2007)。
在大數(shù)據(jù)的研究上,樊院士奠定了大數(shù)據(jù)計(jì)算復(fù)雜性的基礎(chǔ),重塑了數(shù)據(jù)質(zhì)量研究領(lǐng)域?!按髷?shù)據(jù)具有四個(gè)主要特征:規(guī)模大(量)、類型多、變化速度快以及真實(shí)性(質(zhì)量)。國(guó)內(nèi)外目前在數(shù)據(jù)規(guī)模方面做的功課比較多,但在其他三個(gè)方面的研發(fā)相對(duì)比較少,還有很多未解問題”。樊院士認(rèn)為,針對(duì)數(shù)據(jù)類型多樣性的異源異構(gòu)數(shù)據(jù)共享模型與方法,針對(duì)數(shù)據(jù)變化速度的自動(dòng)增量計(jì)算理論,以及針對(duì)數(shù)據(jù)真實(shí)性的數(shù)據(jù)質(zhì)量模型與方法等都有很多痛點(diǎn),有待發(fā)展。
解決痛點(diǎn)既是挑戰(zhàn),更是創(chuàng)新的機(jī)遇。樊院士在接受采訪的時(shí)候表示:“做科研,我一直堅(jiān)持創(chuàng)新,創(chuàng)新的關(guān)鍵不在于你的論文數(shù)量、引用率、發(fā)表平臺(tái),而重在提出的基礎(chǔ)、原創(chuàng)理論和系統(tǒng)能否領(lǐng)跑國(guó)際學(xué)術(shù)界并且在工業(yè)界落地。”
在樊院士的創(chuàng)新基礎(chǔ)理論當(dāng)中,最讓筆者印象深刻的是有界計(jì)算理論。通俗來(lái)講,有界計(jì)算理論就是把大數(shù)據(jù)變小,用聰明的方法找到大數(shù)據(jù)中滿足需要的那一部分小數(shù)據(jù)集,并且滿足查詢結(jié)果的精確解要求。
“這項(xiàng)研究的攻克,我們花了五年時(shí)間,如何找到小數(shù)據(jù)集成為關(guān)鍵,其中涉及邏輯性和計(jì)算的復(fù)雜性,而這個(gè)問題從當(dāng)時(shí)的理論上來(lái)看是不可計(jì)算的,所以我們要從理論出發(fā)實(shí)現(xiàn)創(chuàng)新”。據(jù)樊院士日前透露,一家國(guó)際領(lǐng)先公司在數(shù)十億條數(shù)據(jù)的實(shí)時(shí)查詢場(chǎng)景下,91%的查詢可以用有界計(jì)算來(lái)解決,并且查詢效率提升25倍到10萬(wàn)倍。從企業(yè)的角度來(lái)看,這項(xiàng)理論的落地能夠解決大多數(shù)企業(yè)因資源受限無(wú)力從事真正的大數(shù)據(jù)計(jì)算的現(xiàn)實(shí)問題,做到企業(yè)無(wú)論大小都能享受大數(shù)據(jù)分析的利益。
本次來(lái)到前海,樊院士正式受聘進(jìn)入前??萍紕?chuàng)新專家咨詢委員會(huì)。在聊到深圳在大數(shù)據(jù)這一領(lǐng)域發(fā)展?jié)摿r(shí),樊院士認(rèn)為,深圳的政策相對(duì)較為寬松,本地優(yōu)秀企業(yè)的工程人才也比較集中,有與硅谷媲美的創(chuàng)新環(huán)境,因此我們?cè)谏钲谑姓妄埲A區(qū)的支持下,組建了深圳計(jì)算科學(xué)研究院。希望通過這個(gè)平臺(tái),做出中國(guó)自己的大數(shù)據(jù)基礎(chǔ)理論和計(jì)算引擎,并和深圳的本地企業(yè)合作,打造屬于中國(guó)的大數(shù)據(jù)基礎(chǔ)軟件國(guó)際品牌。
“要實(shí)現(xiàn)創(chuàng)新才能不讓別人牽著鼻子走。此前,我們和國(guó)際領(lǐng)先的國(guó)內(nèi)企業(yè)在異構(gòu)數(shù)據(jù)處理和開源社區(qū)方面有著良好的合作”。樊院士表示,“在做好自己的同時(shí),也要與國(guó)際接軌,吸納國(guó)外的優(yōu)秀技術(shù)和人才”。
可見,樊院士對(duì)于深圳以及前海的大數(shù)據(jù)發(fā)展持有非常樂觀的態(tài)度。從行業(yè)發(fā)展的角度來(lái)看,樊院士表示大數(shù)據(jù)行業(yè)的研究者更需要沉下心來(lái),解決目前理論研究和實(shí)際應(yīng)用中存在的問題,從理論到系統(tǒng),做出對(duì)社會(huì)有價(jià)值的原創(chuàng)研究和突破。