技術(shù)
導(dǎo)讀:十年前Cloud Computing火爆的時(shí)候,大家自然而然開始了想站在生物云計(jì)算的風(fēng)口,可是沒起風(fēng),豬肉去漲價(jià)了。生物云計(jì)算究竟是遺失的美好,還是霧里看花,水中望月;究竟是出身未捷身先死,還是懷才不遇,壯志未酬。
十年前Cloud Computing火爆的時(shí)候,大家自然而然開始了想站在生物云計(jì)算的風(fēng)口,可是沒起風(fēng),豬肉去漲價(jià)了。生物云計(jì)算究竟是遺失的美好,還是霧里看花,水中望月;究竟是出身未捷身先死,還是懷才不遇,壯志未酬。
生物云計(jì)算,看上去很美
首先,我們的定義是什么?
按照字面定義,目的就是做生物的計(jì)算,主要包括各種生物序列的分析工作,加上云,就是能夠在云端處理。其實(shí)和其他云計(jì)算也沒太大的不同。這是非常好的想法,后面在結(jié)合上5G技術(shù),就更好了。比如在野外利用孔測序儀進(jìn)行測序,數(shù)據(jù)實(shí)時(shí)傳輸?shù)皆贫碎_始處理,然后結(jié)果返回結(jié)果。通過各種終端都可以直接查看結(jié)果,看起來非常完美是不是。
然而現(xiàn)實(shí)情況是,這些年很多公司推出的生物云計(jì)算,大方向都是在炒概念,生物大數(shù)據(jù),生物云計(jì)算,5G,物聯(lián)網(wǎng),人工智能,精準(zhǔn)醫(yī)學(xué)……都是當(dāng)前時(shí)髦的熱詞,如果不帶幾個(gè)這樣的詞兒,都不好意思和別人打招呼。但是當(dāng)街頭老大媽都準(zhǔn)備入市賺錢的時(shí)候,也就說明股市泡沫要來了。
硅谷有一個(gè)臭名昭著的技術(shù)成熟度曲線,也叫做技術(shù)循環(huán)曲線,或者直接叫做炒作周期,是指新技術(shù)、新概念在媒體上曝光度隨時(shí)間的變化曲線。是指經(jīng)過新聞媒體和學(xué)術(shù)會(huì)議的大肆宣傳之后,新技術(shù)趨勢一下子跌倒了谷底。生物云計(jì)算就是這樣的一個(gè)例子。
生物云計(jì)算的烏托邦之夢
云計(jì)算其實(shí)是一種非常好的解決方案。然而目前為何還沒有完全普及,雖然市面上有很多產(chǎn)品,有些做得確實(shí)也還可以,但依然不是主流。能效升近7萬倍!新興超導(dǎo)量子技術(shù)實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)硬件加速系統(tǒng)
很多公司的產(chǎn)品是想做成傻瓜式的操作,有一個(gè)圖形化界面,用戶購買之后,登錄賬戶,然后上傳數(shù)據(jù),選擇要分析的流程,點(diǎn)擊運(yùn)行,然后等待結(jié)果就行,用戶體驗(yàn)非常好是不是,你甚至不需要任何生物信息經(jīng)驗(yàn)就可以了。
利用這段時(shí)間,去樓下點(diǎn)上一杯咖啡,曬曬太陽,伸個(gè)懶腰,刷刷手機(jī),然后回來等待結(jié)果就行了,生活真美好……
甚至還有很多人預(yù)言,已經(jīng)不需要做生物信息的人了,這些工作會(huì)像精算師一樣逐漸被生物云計(jì)算以及人工智能所取代,這個(gè)我不肯定也不否定。
夢醒時(shí)分
喝完咖啡回來,查看一下結(jié)果?!皐ow,fxxx”,出錯(cuò)了,到底哪里有問題呢?這就是當(dāng)前生物云計(jì)算的問題所在。將所有分析封裝起來,如果中間環(huán)節(jié)有問題,就比較麻煩。
舉個(gè)簡單的例子,例如做人全基因組的變異檢測。從拿到原始測序數(shù)據(jù),到最終得到可靠的結(jié)果,中間可能需要10幾個(gè)處理過程。這些過程都是承上啟下的,有一個(gè)過程有問題,整個(gè)流程就斷掉。如果斷掉在查找原因,重新從這里開始,這反而更加繁瑣。
其次,像這種非常標(biāo)準(zhǔn)化的分析過程,采用目前的云計(jì)算是沒有問題的。但如果是做科學(xué)研究??茖W(xué)研究本身就是一個(gè)反復(fù)探索的過程,需要反復(fù)測試,不斷調(diào)參,使用這種圖形化反而更加復(fù)雜。
第三:所有圖形化本質(zhì)上只不過是給命令行添加上一個(gè)按鈕,本質(zhì)上內(nèi)容都是一樣的,根本不存在不懂生物信息也能使用的情況,如果不懂的話那些參數(shù)就只能按照默認(rèn)的來處理了。
回到未來
由于當(dāng)前的生物云計(jì)算現(xiàn)實(shí)情況,就會(huì)造成一種現(xiàn)象:懂分析的人不喜歡圖形界面,不懂分析的人有了圖形界面也還是不會(huì)用。我并不是一棒子打死各種生物云計(jì)算,每個(gè)用戶的具體需求不同,具體分析內(nèi)容也不同,有些分析云計(jì)算非常方便。相反,我覺得需要生物云計(jì)算,甚至我們自己也運(yùn)營生物云計(jì)算平臺(tái),只不過不是圖形化界面,需要用戶自己熟悉敲命令。
其實(shí)云計(jì)算有諸多的優(yōu)勢。
首先,方便數(shù)據(jù)管理,也就是同一份文件不需要進(jìn)行多個(gè)拷貝,測序完成之后直接上傳到云服務(wù)器,用戶可以在任何地點(diǎn)聯(lián)網(wǎng)訪問。
第二,軟件和數(shù)據(jù)庫也無需進(jìn)行多個(gè)拷貝,并且可以第一時(shí)間進(jìn)行更新,省去很多麻煩,例如,只需要在云端下載一份nt數(shù)據(jù)庫,所有的用戶都可以與之進(jìn)行比對,而不需要下載很多份。
第三,云計(jì)算可以進(jìn)行彈性計(jì)算,也就是資源可以充分利用,需要多大資源,就提供多大資源,不會(huì)像本地資源存在計(jì)算資源不足的情況。
第四,云計(jì)算不需要很多的配置以及系統(tǒng)維護(hù)。