導(dǎo)讀:近年來,云計算的實踐者從最初的互聯(lián)網(wǎng)科技行業(yè),正逐步向金融、公共事業(yè)、零售、生產(chǎn)制造等傳統(tǒng)行業(yè)滲透。同時,隨著產(chǎn)業(yè)數(shù)字化的推進(jìn),企業(yè)中也產(chǎn)生了不同的業(yè)務(wù)形態(tài)。
報告編委
報告指導(dǎo)人
張 揚 愛分析 聯(lián)合創(chuàng)始人&首席分析師
報告執(zhí)筆人
李 喆 愛分析 合伙人&首席分析師
馮 偉 愛分析 分析師
外部專家(按姓氏筆劃排序)
劉 辰 京東智聯(lián)云 副總裁
劉汪根 星環(huán)科技 聯(lián)合創(chuàng)始人&研發(fā)總監(jiān)
張 瑋 安暢網(wǎng)絡(luò) CTO
庫依楠 SmartX CMO&戰(zhàn)略合作總監(jiān)
苗 權(quán) 觀脈科技 CTO
特別鳴謝(按拼音排序)
前言
近年來,云計算的實踐者從最初的互聯(lián)網(wǎng)科技行業(yè),正逐步向金融、公共事業(yè)、零售、生產(chǎn)制造等傳統(tǒng)行業(yè)滲透。同時,隨著產(chǎn)業(yè)數(shù)字化的推進(jìn),企業(yè)中也產(chǎn)生了不同的業(yè)務(wù)形態(tài)。
在這一過程中,無論是單一的公有云,還是單一的私有云、虛擬機都逐漸難以滿足企業(yè)需求,許多企業(yè)的IT架構(gòu)正在逐步從單一的物理機、虛擬機逐步走向多云、混合云、分布式邊緣云并存的局面。在這樣的背景下,云計算產(chǎn)業(yè)生態(tài)呈現(xiàn)多元化、多層次發(fā)展的趨勢。
因此,如何將云計算生態(tài)中的不同元素進(jìn)行深度整合,形成能夠穩(wěn)定、安全、高效、靈活地支撐多形態(tài)業(yè)務(wù)的混合云、邊緣云平臺解決方案,已經(jīng)成為企業(yè)上云的主要課題。
面對這樣的課題,企業(yè)應(yīng)當(dāng)采用何種解決方案?又應(yīng)當(dāng)如何在市場上選擇合適的云廠商來構(gòu)建解決方案?對于這些問題的答案,來自市場的信息往往十分紛繁雜亂,而下面這三類企業(yè)都十分希望獲得一些來自專業(yè)、中立、客觀的第三方研究與咨詢機構(gòu)的建設(shè)性意見:
1) 近期有上云計劃,或正在進(jìn)行云廠商采購決策的企業(yè);
2) 正在進(jìn)行云計算實施落地的企業(yè);
3) 已經(jīng)進(jìn)行了云計算的實施落地,但仍然打算持續(xù)優(yōu)化和創(chuàng)新云計算應(yīng)用模式的企業(yè)。
因此,本報告將向以上三類企業(yè)闡述混合云和分布式邊緣云誕生的背后邏輯,分析它們在實踐過程中面臨的挑戰(zhàn),并提出應(yīng)對這些挑戰(zhàn)的最佳方案。此外,本報告還將對未來云計算的發(fā)展趨勢進(jìn)行判斷,從而幫助企業(yè)更好地對未來的業(yè)務(wù)創(chuàng)新進(jìn)行提前布局。
目錄
一. 企業(yè)級云計算形態(tài)向混合云與邊緣云演進(jìn)
二. 混合云的實踐路徑選擇與面臨挑戰(zhàn)
三. 混合云基礎(chǔ)設(shè)施平臺建設(shè)
四. 多云架構(gòu)的云原生技術(shù)中臺建設(shè)與應(yīng)用交付
五. 哪些云計算新趨勢將為企業(yè)創(chuàng)造更多價值?
結(jié)語
關(guān)于愛分析
法律聲明
1.企業(yè)級云計算形態(tài)向混合云與邊緣云演進(jìn)
1.1 企業(yè)數(shù)字化轉(zhuǎn)型驅(qū)動業(yè)務(wù)上云
近年來,隨著國內(nèi)外經(jīng)濟環(huán)境的變化,企業(yè)要想在新形勢下持續(xù)獲取業(yè)務(wù)增長的新動能,亟需改變過去以人力疊加和經(jīng)驗積累來驅(qū)動業(yè)務(wù)增長的經(jīng)營模式,通過更前沿的信息技術(shù)手段來重塑企業(yè)業(yè)務(wù)流程和模式,已經(jīng)成為中國企業(yè)的當(dāng)務(wù)之急。
2020年新冠疫情的蔓延對于企業(yè)在疫情期間的業(yè)務(wù)應(yīng)對能力提出了更高的挑戰(zhàn),企業(yè)對前沿技術(shù)的采納和應(yīng)用程度成為決定其應(yīng)對能力的重要因素。
從發(fā)展歷程來看,中國企業(yè)對信息技術(shù)的采納和應(yīng)用經(jīng)歷了三個連續(xù)的發(fā)展階段,即從早期的以傳統(tǒng)信息技術(shù)驅(qū)動的信息化轉(zhuǎn)型,到中期的以互聯(lián)網(wǎng)和通訊技術(shù)驅(qū)動的互聯(lián)網(wǎng)化轉(zhuǎn)型,再到新時期以云計算、人工智能、大數(shù)據(jù)等新興信息技術(shù)為驅(qū)動的數(shù)字化轉(zhuǎn)型。
在這三個發(fā)展階段中,信息化轉(zhuǎn)型階段深刻塑造了企業(yè)早期的IT能力和技術(shù)架構(gòu),也在企業(yè)中沉淀了大量的傳統(tǒng)應(yīng)用系統(tǒng)。而互聯(lián)網(wǎng)化轉(zhuǎn)型階段則催生了企業(yè)商業(yè)模式的變革,誕生了大量基于互聯(lián)網(wǎng)業(yè)務(wù)形態(tài)的新興企業(yè),而這些企業(yè)中的佼佼者則包括美國的亞馬遜和中國的阿里巴巴,而這些互聯(lián)網(wǎng)巨頭也成為云計算技術(shù)最早的探索者、實踐者。
隨著中國企業(yè)數(shù)字化進(jìn)程的進(jìn)一步推進(jìn),云計算技術(shù)的實踐者逐步從新興的互聯(lián)網(wǎng)行業(yè)拓寬到金融、零售、政府、能源、電信、交通、制造業(yè)、醫(yī)療、教育等傳統(tǒng)行業(yè),從而進(jìn)一步帶動了云計算應(yīng)用場景的不斷進(jìn)化,這又反過來推動了云計算的技術(shù)、產(chǎn)品與服務(wù)形態(tài)不斷演進(jìn)。
在企業(yè)數(shù)字化轉(zhuǎn)型過程中,云計算能夠為企業(yè)降低成本、提升效益,為企業(yè)業(yè)務(wù)創(chuàng)新、AI等新興技術(shù)的應(yīng)用創(chuàng)新提供有力支撐,還能夠通過虛擬化技術(shù)降低其對硬件設(shè)備的要求來提升基礎(chǔ)設(shè)施自主可控水平,在整個企業(yè)數(shù)字化轉(zhuǎn)型過程中居于基礎(chǔ)設(shè)施地位。
為了適應(yīng)企業(yè)的業(yè)務(wù)創(chuàng)新、技術(shù)創(chuàng)新帶來的敏捷性需求,同時滿足企業(yè)在效率、成本、安全等方面的需求,云計算的形態(tài)從最初的公有云、私有云,逐步發(fā)展出混合云與分布式邊緣云等多種云計算形態(tài)。
1.2 多重因素驅(qū)動云計算形態(tài)演進(jìn)
愛分析認(rèn)為,在云計算形態(tài)演進(jìn)過程中發(fā)揮推動作用的三大因素是:擴容成本、擴容效率、數(shù)據(jù)存儲安全性,它們影響云計算形態(tài)演進(jìn)的邏輯如下圖所示。
擴容成本:隨著企業(yè)IT架構(gòu)的發(fā)展,IT系統(tǒng)之間出現(xiàn)了“穩(wěn)態(tài)”和“敏態(tài)”業(yè)務(wù)的差異,而它們工作負(fù)載的波動性差異,導(dǎo)致它們所期望的基礎(chǔ)設(shè)施擴容比例不同。
面對這種差異,不同云形態(tài)的擴容成本支出存在一次性硬件建設(shè)支出和訂閱式收費支出兩種模式,使得其擴容成本不同,因此企業(yè)需要采取不同的策略來實現(xiàn)成本優(yōu)化。
注:“穩(wěn)態(tài)”與“敏態(tài)”源自Gartner于2014年提出的“雙模IT”概念?!胺€(wěn)態(tài)IT”指業(yè)務(wù)目標(biāo)相對明確、流程相對成熟的IT系統(tǒng),“敏態(tài)IT”指業(yè)務(wù)模式處于不斷創(chuàng)新和迭代中的IT系統(tǒng)。但本文中的“穩(wěn)態(tài)”與“敏態(tài)”更加側(cè)重于業(yè)務(wù)部署后的來自業(yè)務(wù)訪問端的工作負(fù)載量的差異,即敏態(tài)業(yè)務(wù)常常會經(jīng)歷明顯的負(fù)載高峰,而穩(wěn)態(tài)業(yè)務(wù)則很少經(jīng)歷這樣的高峰。
擴容效率:穩(wěn)態(tài)和敏態(tài)業(yè)務(wù)由于單位時間內(nèi)產(chǎn)生負(fù)載大幅度波動的頻次不同,因此期望基礎(chǔ)設(shè)施具備的擴容效率不同。
面對這種差異,不同云形態(tài)所具有的計算、存儲資源數(shù)量,以及其底層架構(gòu)的特性不同,使得它們的擴容效率、擴容成本都存在差異,即擴容彈性能力存在差異,因此企業(yè)需要采取不同的策略來實現(xiàn)擴容效率提升。
數(shù)據(jù)安全性:企業(yè)的業(yè)務(wù)也存在核心和傳統(tǒng)性業(yè)務(wù)、互聯(lián)網(wǎng)和創(chuàng)新性業(yè)務(wù)的安全級別差異,它們對于基礎(chǔ)設(shè)施所具備的等保合規(guī)級別、數(shù)據(jù)隱私性強弱存在差異。比如,等保2.0要求企業(yè)的云計算平臺為等保四級業(yè)務(wù)應(yīng)用系統(tǒng)劃分獨立資源池,而對數(shù)據(jù)隱私較為關(guān)注的企業(yè)往往對于業(yè)務(wù)等保級別的要求更高。
面對這種差異,不同云形態(tài)的底層物理資源池的劃分和歸屬方式、數(shù)據(jù)存儲的物理隔離性存在差異,這也意味著其等保級別的滿足性存在差異,因此企業(yè)需要采取不同的策略來實現(xiàn)安全合規(guī)性提升。
基于在不同業(yè)務(wù)場景下,企業(yè)對于降低成本、提升效率、提升安全三方面的需求強弱差異,云計算出現(xiàn)了從基于公有云、私有云的單一云形態(tài),向以混合云、分布式邊緣云為主的多云形態(tài)的演進(jìn)。
1.3 面向雙模IT,公有云與私有云優(yōu)勢各異
眾所周知,云計算技術(shù)的先行者亞馬遜AWS最早定義的云計算模式,就是依托于數(shù)據(jù)中心資源,通過互聯(lián)網(wǎng)基礎(chǔ)設(shè)施,為企業(yè)提供集中化、共享式的服務(wù)器資源租用,這也就是公有云的服務(wù)模式,但它在實踐中被證明更加適合互聯(lián)網(wǎng)科技型企業(yè)的需求。
而當(dāng)云計算逐步進(jìn)入到金融、政府、電信、能源、交通、制造業(yè)、醫(yī)療、教育等傳統(tǒng)行業(yè)時,公有云的服務(wù)模式逐漸難以滿足企業(yè)需求,在企業(yè)數(shù)或第三方數(shù)據(jù)中心內(nèi)部建設(shè)私有云成為必然選擇。
這種差異的驅(qū)動因素是不同類型的企業(yè)的業(yè)務(wù)對于擴容成本、擴容效率、數(shù)據(jù)存儲安全性三方面需求的差異,其中前兩者的需求可以歸結(jié)為彈性需求,如下圖所示。
彈性需求:敏態(tài)業(yè)務(wù)、互聯(lián)網(wǎng)和創(chuàng)新型業(yè)務(wù)的工作負(fù)載波動性較高且難以預(yù)測,開發(fā)測試環(huán)境處于快速迭代中,隨時會需要新的開發(fā)測試資源,更適合由具備高彈性的公有云來承載。穩(wěn)態(tài)業(yè)務(wù)、核心業(yè)務(wù)和傳統(tǒng)性業(yè)務(wù)的工作負(fù)載相對穩(wěn)定,一般不需要進(jìn)行頻繁擴容,而且常常擁有大量的本地硬件基礎(chǔ)設(shè)施,需要考慮利舊的需求,因此更適合由一次性建設(shè)投入為主、無持續(xù)訂閱投入的私有云來承載。
安全性需求:敏態(tài)業(yè)務(wù)、互聯(lián)網(wǎng)和創(chuàng)新型業(yè)務(wù)、開發(fā)測試環(huán)境對安全性要求較低,而采取共享物理資源池的公有云完全能夠滿足這類業(yè)務(wù)的安全性需求。穩(wěn)態(tài)業(yè)務(wù)、核心業(yè)務(wù)和傳統(tǒng)性業(yè)務(wù)對安全性要求高,部分業(yè)務(wù)甚至要求達(dá)到等保四級,因此具有專屬資源池、能夠滿足等保四級要求的私有云才能夠滿足這類業(yè)務(wù)的安全性需求。
從以往企業(yè)的信息化和數(shù)字化程度來看,互聯(lián)網(wǎng)和創(chuàng)新型企業(yè)的業(yè)務(wù)以敏態(tài)業(yè)務(wù)、互聯(lián)網(wǎng)和創(chuàng)新型業(yè)務(wù)為主,同時需要擁有大量的開發(fā)測試環(huán)境,而傳統(tǒng)型企業(yè)的業(yè)務(wù)以穩(wěn)態(tài)業(yè)務(wù)、核心業(yè)務(wù)和傳統(tǒng)性業(yè)務(wù)為主。
因此,我們看到的以往狀況是互聯(lián)網(wǎng)和創(chuàng)新型企業(yè)更多地會采用公有云,傳統(tǒng)型企業(yè)更多地會采用私有云。這種企業(yè)之間、業(yè)務(wù)之間的需求差異性,使得過去公有云和私有云之間的關(guān)聯(lián)較少,很少需要進(jìn)行緊密配合。
但是,隨著企業(yè)數(shù)字化進(jìn)程的深入和業(yè)務(wù)模式的創(chuàng)新,傳統(tǒng)型、創(chuàng)新型企業(yè)的應(yīng)用場景出現(xiàn)了拓展和融合。在這種背景下,公有云與私有云的優(yōu)勢和特性可能是越來越多的企業(yè)希望同時享有的。
1.4 IT成本優(yōu)化訴求之下,混合云已成大勢所趨
隨著企業(yè)數(shù)字化轉(zhuǎn)型的深入,傳統(tǒng)型企業(yè)、互聯(lián)網(wǎng)和創(chuàng)新型企業(yè)的業(yè)務(wù)需求都發(fā)生了變化:
1)一方面,越來越多的傳統(tǒng)企業(yè)開始探索“互聯(lián)網(wǎng)+”、“AI+”等創(chuàng)新業(yè)務(wù),這部分業(yè)務(wù)一般屬于工作負(fù)載量波動較大的敏態(tài)業(yè)務(wù)。此外,在業(yè)務(wù)創(chuàng)新過程中,傳統(tǒng)企業(yè)也需要敏捷的開發(fā)能力和高效獲取的各類資源。因此,傳統(tǒng)企業(yè)在持續(xù)使用私有云的同時,也需要公有云來承載創(chuàng)新業(yè)務(wù)和開發(fā)測試環(huán)境。
2)另一方面,大量互聯(lián)網(wǎng)和創(chuàng)新型企業(yè)在業(yè)務(wù)發(fā)展到穩(wěn)定階段后,盡管其敏態(tài)業(yè)務(wù)的工作負(fù)載波動性仍然較大,但是其波谷的負(fù)載量也達(dá)到了相當(dāng)水平,而這部分負(fù)載量將會持續(xù)存在很長時間,可以視為“敏態(tài)業(yè)務(wù)中的穩(wěn)態(tài)業(yè)務(wù)”。因此,互聯(lián)網(wǎng)和創(chuàng)新型企業(yè)除了維持一部分公有云資源來應(yīng)對負(fù)載高峰的同時,還會將這部分持續(xù)存在的工作負(fù)載遷移到私有云上。
以上傳統(tǒng)型企業(yè)、互聯(lián)網(wǎng)創(chuàng)新型企業(yè)的兩種業(yè)務(wù)邊界拓展方式,使得原來他們與私有云、公有云的緊密綁定關(guān)系被打破,由公有云、私有云共同提供服務(wù)成為越來越明顯的趨勢。在這種背景下,混合云的應(yīng)用空間大大擴展了。
總體來看,相比于公有云、私有云方案,混合云方案的優(yōu)勢主要體現(xiàn)在成本方面,而效率方面幾乎能夠獲得等同于公有云的特性,安全方面則能夠獲得幾乎等同于私有云的特性:
(1)與互聯(lián)網(wǎng)和創(chuàng)新型企業(yè)原有的純公有云方案相比,混合云的成本之所以更加優(yōu)化,并非是單純的由私有云來取代一部分公有云,而在于讓私有云承載了適合其特性的穩(wěn)態(tài)業(yè)務(wù)類型,實現(xiàn)了私有云部分成本最優(yōu)。
(2)與傳統(tǒng)型企業(yè)原有的純私有云方案相比,混合云的成本之所以更加優(yōu)化,并非是單純的由公有云來取代一部分私有云,而在于讓公有云承載了適合其特性的敏態(tài)、創(chuàng)新型業(yè)務(wù)以及開發(fā)測試環(huán)境,實現(xiàn)了公有云部分成本最優(yōu)。
因此,探索能夠融合公有云、私有云兩種云形態(tài)優(yōu)勢的混合云架構(gòu),同時實現(xiàn)良好的協(xié)同管理,成為未來企業(yè)級云計算的必然趨勢。正如全球基礎(chǔ)云架構(gòu)方案商VMware所定義,混合云(Hybird Cloud)主要指公有云和私有云協(xié)同工作的應(yīng)用方式,以及任意的能夠通過辦公場所內(nèi)和場外的工作協(xié)同來提供云計算服務(wù)的解決方案組合。
現(xiàn)階段,混合云的市場滲透率還處于較低水平。據(jù)中國信通院數(shù)據(jù)顯示,2018年中國使用云計算的企業(yè)比例為58.6%,其中混合云的采用率為8.1%,而公有云、私有云分別是36.4%和14.1%。據(jù)Gartner數(shù)據(jù)顯示,2019年全球云計算IaaS市場規(guī)模達(dá)455億美元,在全球4581億美元的IT軟件支出為中僅占不到10%的比例,而云計算在中國的滲透率相對更低。
由此來看,中國未來的混合云市場將有極大的發(fā)展動力與潛力,而率先應(yīng)用混合云的企業(yè)在相當(dāng)長的時間內(nèi)將代表企業(yè)數(shù)字化轉(zhuǎn)型的最先進(jìn)力量,在企業(yè)效能的競爭中將占據(jù)領(lǐng)先地位。
1.5 萬物互聯(lián)時代背景下,分布式邊緣云方興未艾
在更大意義上,混合云僅僅是多云架構(gòu)的類型之一。根據(jù)Flexera旗下的全球云管理服務(wù)廠商RightScale每年發(fā)布的云狀態(tài)報告的定義,多云(Multi-Cloud)同時包括了多公有云(Multiple public)、多私有云(Multiple private)和混合云(Hybird Cloud)。
在傳統(tǒng)多云架構(gòu)中,無論是多公有云、多私有云還是混合云,數(shù)據(jù)處理能力都是集中式的,即大部分?jǐn)?shù)據(jù)都統(tǒng)一匯集到這些云平臺中進(jìn)行處理。
但是隨著萬物互聯(lián)時代的來臨,企業(yè)的云計算應(yīng)用場景發(fā)生了明顯的變化,來自企業(yè)邊緣側(cè)的高數(shù)據(jù)密度、時延敏感的應(yīng)用場景明顯增加,比如面向互聯(lián)網(wǎng)企業(yè)的音視頻加速需求的內(nèi)容分發(fā)網(wǎng)絡(luò)(CDN)、工業(yè)互聯(lián)網(wǎng)的工業(yè)設(shè)備數(shù)據(jù)、智慧安防中的安防攝像頭數(shù)據(jù)、智慧交通中的路況和車輛數(shù)據(jù)的采集、處理和分析等等。
面對這類對于網(wǎng)絡(luò)效率的要求較高的應(yīng)用場景,集中式云的計算、存儲擴容能力逐漸產(chǎn)生瓶頸,迫切要求云廠商和企業(yè)將計算能力下沉到網(wǎng)絡(luò)邊緣側(cè),實現(xiàn)中心節(jié)點與邊緣節(jié)點的職能分化,構(gòu)建“分布式邊緣云”,并進(jìn)一步對中心節(jié)點、邊緣節(jié)點進(jìn)行深度協(xié)同以實現(xiàn)成本優(yōu)化。
1.5.1 分布式邊緣云的定義及價值
《Gartner2020年規(guī)劃指南》指出,分布式云是這一年的十大戰(zhàn)略趨勢之一,而Gartner對分布式云的定義是:將公有云服務(wù)分布到不同的物理位置,而服務(wù)的運行、治理、更新和演化則由最初的公有云提供商負(fù)責(zé)的一種云服務(wù)架構(gòu)。
這里我們需要明確“分布式云”與“邊緣計算”的差異。首先,并非所有的邊緣計算系統(tǒng)都需要以云架構(gòu)作為其中心節(jié)點、邊緣節(jié)點的底層架構(gòu),即邊緣計算系統(tǒng)不一定是基于分布式邊緣云的。但是反過來講,所有的分布式邊緣云的最終目的都是為了讓邊緣計算系統(tǒng)走進(jìn)云計算體系,即所有分布式邊緣云都是邊緣計算系統(tǒng)。
在后文中,為了強調(diào)分布式云的邊緣計算屬性,同時讓大家更容易理解這一概念,我們將其稱之為“分布式邊緣云”,同時將邊緣計算系統(tǒng)中擔(dān)負(fù)中心節(jié)點計算能力的云稱為“中心云”,將擔(dān)負(fù)邊緣節(jié)點計算能力的云稱為“邊緣云”。
邊緣云根據(jù)位置的不同,又可分為近場邊緣云和現(xiàn)場邊緣云兩大類,近場邊緣云強調(diào)高可靠性的基礎(chǔ)云服務(wù)能力,多采用OpenStack架構(gòu),而現(xiàn)場邊緣云強調(diào)超強的彈性、快速的啟停速度和高并行計算能力,多采用Docker和Kubernetes架構(gòu)。
華為云IEF邊緣計算解決方案就是一個典型的基于Docker和Kubernetes的分布式邊緣云,如下圖所示。
總體來看,分布式邊緣云產(chǎn)生和發(fā)展的驅(qū)動因素在于網(wǎng)絡(luò)響應(yīng)效率和擴容成本兩方面:
1)網(wǎng)絡(luò)響應(yīng)效率:在分布式邊緣云架構(gòu)中,采集到的數(shù)據(jù)可以首先在邊緣節(jié)點進(jìn)行初步的處理再上傳到中心節(jié)點進(jìn)行AI模型訓(xùn)練,訓(xùn)練完畢的模型被下放到邊緣節(jié)點,基于持續(xù)產(chǎn)生的數(shù)據(jù)進(jìn)行模型的推理和優(yōu)化,從而避免了因大量數(shù)據(jù)的網(wǎng)絡(luò)傳輸和集中式計算存儲帶來的網(wǎng)絡(luò)性能瓶頸,提升了網(wǎng)絡(luò)響應(yīng)效率。
2)擴容成本:計算、存儲能力下沉到邊緣之后,中心云的資源擴容壓力以及帶來的成本被大大減輕。
1.5.2 分布式邊緣云的統(tǒng)一管理與邊云協(xié)同
分布式邊緣云實現(xiàn)網(wǎng)絡(luò)響應(yīng)效率、擴容成本兩方面優(yōu)勢的根本原因在于統(tǒng)一管理與邊云協(xié)同,即通過中心云的統(tǒng)一遠(yuǎn)程運維管理平臺,實現(xiàn)中心云、邊緣云之間的行為協(xié)調(diào),充分將計算、存儲能力下沉到邊緣,同時不影響中心云自身的正常工作。
邊云協(xié)同能力主要包括數(shù)據(jù)協(xié)同、應(yīng)用協(xié)同兩個層面,如下圖所示。
1)數(shù)據(jù)協(xié)同:它解決的問題本質(zhì)上是數(shù)據(jù)密集型業(yè)務(wù)如何在中心云和邊緣云之間進(jìn)行合理負(fù)載分配,進(jìn)一步可以分為數(shù)據(jù)處理協(xié)同和AI能力協(xié)同兩個層次。
在數(shù)據(jù)處理協(xié)同過程中,首先由中心云負(fù)責(zé)制定數(shù)據(jù)上傳策略并下發(fā)到邊緣云,然后由邊緣云負(fù)責(zé)數(shù)據(jù)采集,并基于中心云制定的策略進(jìn)行預(yù)處理后上傳到中心云,最后由中心云進(jìn)行數(shù)據(jù)的集中存儲和進(jìn)一步挖掘分析。
AI能力協(xié)同過程本質(zhì)上是數(shù)據(jù)處理協(xié)同過程的升級,區(qū)別在于其工作流程需要由邊緣云發(fā)起,由邊緣云將供AI模型訓(xùn)練的數(shù)據(jù)上傳到中心云,然后由中心云基于數(shù)據(jù)進(jìn)行AI模型訓(xùn)練并推送到邊緣云,最后由邊緣云基于AI模型和終端輸入進(jìn)行模型推理,并將推理結(jié)果返回中心云。
2)應(yīng)用協(xié)同:它解決的問題本質(zhì)上是非數(shù)據(jù)密集型的常規(guī)性業(yè)務(wù)如何在中心云和邊緣云之間進(jìn)行合理負(fù)載分配,進(jìn)一步可以分為應(yīng)用交付協(xié)同和應(yīng)用編排協(xié)同兩個層次。
為了實現(xiàn)這兩類邊云協(xié)同能力,一方面需要邊緣云具備一定的自治能力,在網(wǎng)絡(luò)出現(xiàn)故障的情況下仍然維持正常工作狀態(tài),不完全依賴于中心云的運維管理能力,另一方面需要中心云具備對邊緣云集群的統(tǒng)一管理能力,尤其是對于異構(gòu)邊緣云的納管,并進(jìn)一步對邊緣云進(jìn)行統(tǒng)一的應(yīng)用交付生命周期管理和服務(wù)編排管理,如下圖所示。
目前,分布式邊緣云的技術(shù)成熟度尚處于早期,且應(yīng)用價值尚未被充分挖掘。從長期來看,分布式邊緣云的主要價值在于充分彌合了萬物互聯(lián)的趨勢下,集中式云計算的有限計算能力與現(xiàn)實世界中無限的數(shù)據(jù)維度之間的鴻溝。
2.混合云的實踐路徑選擇與面臨挑戰(zhàn)
當(dāng)企業(yè)選擇實行混合云戰(zhàn)略,需要選擇良好的實踐路徑。按照主導(dǎo)廠商類型的不同來區(qū)分,混合云方案存在兩種實踐路徑:
從公有云向下延伸,提供技術(shù)同構(gòu)的專有云產(chǎn)品,從而形成混合云解決方案;
從私有云向上延伸,將公有云進(jìn)行集成,從而形成混合云解決方案。
本章將論述這兩種實踐路徑的產(chǎn)生邏輯,以及針對特定企業(yè)和場景的選擇建議。
2.1從公有云到混合云:滿足基礎(chǔ)架構(gòu)一致性需求
云計算的最早商業(yè)化形式是公有云,其早期的實踐者和推動者是亞馬遜、阿里巴巴等互聯(lián)網(wǎng)巨頭,后來其他互聯(lián)網(wǎng)公司、傳統(tǒng)ICT廠商和創(chuàng)業(yè)型公司也持續(xù)加入。同時,為了滿足企業(yè)級客戶的專屬資源池的需求,這些公有云廠商陸續(xù)推出了專有云、私有云方案,從而形成了全棧式的混合云方案。
按照廠商背景來看,提供全棧式混合云解決方案的公有云廠商有三類:第一類是互聯(lián)網(wǎng)大廠旗下的公有云廠商,第二類是傳統(tǒng)ICT廠商旗下的公有云廠商,第三類是中立性的公有云廠商。
從共同點來看,這些公有云廠商的混合云發(fā)展路徑都是最終實現(xiàn)公有云架構(gòu)與專有云&私有云架構(gòu)的完全統(tǒng)一,但是不同點在于它們公有云誕生的目的不同使得其特性不同,由此造成的專有云&私有云、混合云的適用場景也有所差異,如下圖所示。
2.1.1 互聯(lián)網(wǎng)大廠公有云+專有云的混合云方案
阿里云、騰訊云、百度智能云、京東智聯(lián)云等互聯(lián)網(wǎng)大廠旗下的公有云,其誕生初衷都是為了通過公有云服務(wù)更好地支撐自己集團內(nèi)部的業(yè)務(wù),實現(xiàn)自身IT能力的敏捷化轉(zhuǎn)型,同時降低對于專業(yè)服務(wù)器、存儲和網(wǎng)絡(luò)設(shè)備廠商的依賴。
這類廠商的公有云架構(gòu)大部分都是基于高度自主研發(fā)的分布式架構(gòu),為了應(yīng)對極高并發(fā)的互聯(lián)網(wǎng)業(yè)務(wù),普遍需要較大數(shù)量的管理節(jié)點以保證服務(wù)的穩(wěn)定性。
這類廠商早期的公有云客戶一般以互聯(lián)網(wǎng)企業(yè)和中小企業(yè),逐步轉(zhuǎn)向服務(wù)大型政企客戶時,提出了“專有云”的概念,即通過對公有云架構(gòu)進(jìn)行適當(dāng)?shù)目s減,形成一套規(guī)模相對較小、能夠適應(yīng)本地化部署的專有云方案,典型如阿里云+Apsara Stack,騰訊云+TCE、京東智聯(lián)云+JD Cloud Stack、百度智能云+ABC Stack、金山云+Galaxy等。
由于專有云與公有云采取一致性的基礎(chǔ)架構(gòu),IaaS、PaaS資源具備一致性,因此一般能夠支持應(yīng)用在公有云、專有云之間進(jìn)行低成本快速遷移,同時保證了公有云、專有云實現(xiàn)功能和特性的同步進(jìn)化,防止了碎片化的專有云版本出現(xiàn)。
但是由于互聯(lián)網(wǎng)大廠公有云的基礎(chǔ)架構(gòu)特性,其專有云對于物理節(jié)點數(shù)量下限要求較高,一般都要求至少提供幾十到近百的物理節(jié)點,更加適合于業(yè)務(wù)規(guī)模較大、預(yù)算充足的腰部以上企業(yè)。
京東智聯(lián)云構(gòu)建多云資源一致的混合云方案
京東智聯(lián)云(JD Cloud & AI)是京東集團旗下的智能技術(shù)提供商,依托京東集團在人工智能、大數(shù)據(jù)、云計算、物聯(lián)網(wǎng)等方面的業(yè)務(wù)實踐和技術(shù)積淀,打造服務(wù)于數(shù)字企業(yè)、數(shù)字政府的多維場景解決方案。
京東智聯(lián)云提供的專有云服務(wù)包括專有云(Stack)、敏捷專有云(Swift)、敏捷專有云超融合版(Swift HCI)三個不同版本,以及能夠?qū)崿F(xiàn)多云納管的混合云平臺(Mesh)。
京東智聯(lián)云在混合云方案的優(yōu)勢體現(xiàn)在以下兩方面。
首先,京東智聯(lián)云的公有云平臺(Public Cloud)和專有云平臺(Stack)基礎(chǔ)架構(gòu)一致,可搭建同構(gòu)混合云平臺實現(xiàn)在功能、資源方面的同步更新和一致性。
其次,針對異構(gòu)多云的資源,京東智聯(lián)云借助混合云平臺(Mesh)也可構(gòu)建統(tǒng)一納管,資源一致的混合云解決方案,它具備以下幾方面能力:
1)全方位支持:提供從網(wǎng)絡(luò)層的拉通,到跨云資源管理、業(yè)務(wù)調(diào)度、服務(wù)組件管理、容器云平臺、多云服務(wù)平臺、資源監(jiān)控以及成本控制等全方位的混合云場景支持能力;
2)一站式管理:兼容多種異構(gòu)云平臺,整合私有云、公有云等多種底層資源,實現(xiàn)一站式資源管理控制、對資源的跨平臺融合編排及多租戶訪問;
3)解除廠商綁定:具備行業(yè)核心業(yè)務(wù)系統(tǒng)架構(gòu)的最佳實踐,可無縫連接異構(gòu)硬件與上層業(yè)務(wù),解除廠商綁定,使得企業(yè)聚焦于業(yè)務(wù)。
4)AI賦能:深度集成AI能力,實現(xiàn)極簡和智能的資源調(diào)度和穩(wěn)態(tài)與敏態(tài)業(yè)務(wù)的動態(tài)平衡,資源利用率平均可提升30%。
混合云平臺(Mesh)從以下兩方面實現(xiàn)多云資源的一致性:
1)跨云的云原生技術(shù)中臺:基于容器化、微服務(wù)基礎(chǔ)技術(shù),提供涵蓋應(yīng)用、部署和治理的技術(shù)中臺,兼容傳統(tǒng)與創(chuàng)新應(yīng)用的一致性管理和平滑遷移,實現(xiàn)多云環(huán)境下敏捷的持續(xù)集成、發(fā)布、運營。通過云原生技術(shù)承載AI能力,實現(xiàn)云的數(shù)字化、智能化,更加貼合企業(yè)業(yè)務(wù),提升業(yè)務(wù)創(chuàng)新迭代速度。
2)跨云遷移:支持以不停服全量和增量遷移的方式遷移不同環(huán)境及不同類型的數(shù)據(jù)庫,通過VPN、專線等網(wǎng)絡(luò)環(huán)境接入京東智聯(lián)云的RDS數(shù)據(jù)庫、自建數(shù)據(jù)庫等,支持國內(nèi)外主流公有云、私有云、虛擬機、X86物理服務(wù)器的遷移。
京東智聯(lián)云的混合云解決方案應(yīng)用于某知名車企的汽車產(chǎn)業(yè)云,該車企集團為滿足集團轉(zhuǎn)型和信息系統(tǒng)及應(yīng)用上云的需求,實現(xiàn)混合云架構(gòu)的藍(lán)圖,需要采用成熟穩(wěn)定的商業(yè)化云平臺替換現(xiàn)有的開源架構(gòu)的云平臺。
為此,京東智聯(lián)云為該車企建設(shè)了集成公有云(Public Cloud)、專有云(Stack)、混合云平臺(Mesh)的混合云解決方案,方案具備以下特點:
1)多云整合:構(gòu)建了混合云統(tǒng)一服務(wù)平臺,統(tǒng)一納管現(xiàn)有的OpenStack平臺。
2)硬件利舊:通過專有云(Stack)將現(xiàn)有各分公司的物理機云化,并通過混合云平臺(Mesh)直接納管,提高了資源利用率。
3)遷移擴容:實現(xiàn)全量應(yīng)用跨云一鍵式平滑遷移,并結(jié)合DNS解析分流,實現(xiàn)跨云負(fù)載擴容。
4)跨云災(zāi)備:該混合云平臺具備災(zāi)備能力,將京東智聯(lián)云公有云作為災(zāi)備中心,構(gòu)建了穩(wěn)定可靠的同城跨云災(zāi)備。
混合云方案實施后,該車企獲得了以下實施效果:
1) 資源整合優(yōu)化:實現(xiàn)集團的混合IT基礎(chǔ)架構(gòu)資源整合優(yōu)化,統(tǒng)一平臺靈活調(diào)配,大幅提升資源的利用率和運維運營效率;
2) 靈活擴容:業(yè)務(wù)系統(tǒng)實現(xiàn)全局調(diào)配,合理部署,應(yīng)用負(fù)載能力成倍提升;
3) 跨云災(zāi)備:充分利用公有云的無限量存儲,實現(xiàn)核心業(yè)務(wù)數(shù)據(jù)多副本容災(zāi)備份,提升了服務(wù)的穩(wěn)定性和可靠性;
4)戰(zhàn)略落地:加強集團信息化、數(shù)字化建設(shè),推動集團化2.0戰(zhàn)略落地,打造自主知識產(chǎn)權(quán)的服務(wù)和產(chǎn)品,為集團“兩個轉(zhuǎn)型”和四化發(fā)展提供可靠支撐。
整體來看,互聯(lián)網(wǎng)大廠“公有云+同構(gòu)專有云”的混合云方案,適合業(yè)務(wù)規(guī)模較大、預(yù)算較為充足、服務(wù)商生態(tài)較為完善的企業(yè),公有云、專有云間的基礎(chǔ)架構(gòu)一致性有助于其在漫長的IT建設(shè)周期內(nèi)保證技術(shù)能力的持續(xù)同步進(jìn)化。
2.1.2 傳統(tǒng)ICT廠商與中立云廠商公有云+私有云的混合云方案
與互聯(lián)網(wǎng)大廠旗下的公有云不同,華為云等傳統(tǒng)ICT廠商旗下的公有云,以及UCloud、青云等中立性公有云廠商,其公有云的定位更加單純,主要用于對外提供商業(yè)化的公有云服務(wù),同時期望能夠?qū)⒐性频募軜?gòu)無縫地移植到私有云之中。
因此,這類公有云廠商的基礎(chǔ)架構(gòu)相對較為輕量化,從而保證了其私有云產(chǎn)品既能具備與開源架構(gòu)一樣的低節(jié)點數(shù)量要求,同時又能保證私有云的基礎(chǔ)架構(gòu)與公有云之間的一致性,典型如華為云+華為云Stack、UCloud+UCloud Stack、青云+青云私有云。
整體來看,傳統(tǒng)ICT廠商或中立云廠商的“公有云+同構(gòu)私有云”的混合云方案能夠更加靈活有效地支撐中小規(guī)模業(yè)務(wù)場景,同時保證公有云和私有云的基礎(chǔ)架構(gòu)一致性,因此更加適合于當(dāng)前業(yè)務(wù)規(guī)模一般,但未來可能具備一定成長性,并期望長期保持技術(shù)創(chuàng)新和迭代能力的企業(yè)。
2.2從私有云到混合云:滿足企業(yè)差異化需求
相比于從公有云到混合云的實踐路徑,從私有云到混合云的實踐路徑更為復(fù)雜,這是因為私有云廠商從一開始就需要考慮來自企業(yè)客戶的差異化需求,這種差異性體現(xiàn)在兩個方面:
企業(yè)技術(shù)和運維能力的差異性:科技創(chuàng)新型企業(yè)和頭部企業(yè)常常更加追求私有云的定制化、與企業(yè)流程的匹配性,技術(shù)和運維能力不足的大部分傳統(tǒng)型企業(yè)更加追求私有云的易管理性;
企業(yè)數(shù)據(jù)中心規(guī)模的差異性:超大規(guī)模企業(yè)具備豐富的數(shù)據(jù)中心資源,更加追求IT架構(gòu)的成熟性、穩(wěn)定性,中大規(guī)模企業(yè)數(shù)據(jù)中心資源相對有限,更加追求IT投入的高性價比。
基于這些差異化需求,私有云架構(gòu)出現(xiàn)了開源技術(shù)和閉源技術(shù)的差異,以及分離式架構(gòu)與超融合架構(gòu)的差異。
2.2.1 分離式架構(gòu)的私有云
早期的私有云采取分離式架構(gòu),即計算、存儲能力通過不同的設(shè)備或服務(wù)器集群來提供。按照技術(shù)架構(gòu)的不同,它又分為開源和閉源兩類。
開源分離式架構(gòu)私有云:OpenStack是當(dāng)下最為流行的開源云計算管理平臺,具備較強的定制化能力,因此通過OpenStack對接KVM、VMware vSphere、XenServer等計算虛擬化平臺,以及Ceph等開源分布式存儲平臺,在過去一段時間曾是個性化需求較多的大中型企業(yè)客戶構(gòu)建私有云的一種流行方式。
但是由于OpenStack架構(gòu)的復(fù)雜性問題,近些年在產(chǎn)品化、標(biāo)準(zhǔn)化、商用化等方面開始面臨大量痛點,因此開源云廠商基于OpenStack進(jìn)行閉源深度自主研發(fā),從而提高產(chǎn)品的標(biāo)準(zhǔn)化程度,實現(xiàn)產(chǎn)品無縫升級已經(jīng)成為大勢所趨。
閉源分離式架構(gòu)私有云:VMWare等成熟廠商在商用虛擬化技術(shù)方面一直占據(jù)主導(dǎo)地位,其閉源分離式架構(gòu)私有云主體由VMWare vSphere對接SAN商用存儲設(shè)備構(gòu)建而成,而云管的部分可以選擇VMware vRealize Automation或獨立的云管理軟件(CMP),前者僅支持VMWare自身產(chǎn)品,后者更加開放。
閉源私有云的優(yōu)勢在于其長期實踐經(jīng)驗和產(chǎn)品迭代帶來的高度穩(wěn)定性,但由于其核心技術(shù)往往由國外虛擬化廠商、商用存儲設(shè)備廠商所控制,會使得企業(yè)面臨自主可控性差、廠商綁定等因素的困擾。此外,商用存儲擴展性不足也成為困擾企業(yè)的一大痛點。
總體來看,無論是開源技術(shù)還是閉源技術(shù),計算、存儲分離部署模式由于采用了單獨的存儲集群,在面向具備龐大數(shù)據(jù)中心資源的超大規(guī)模客戶時存在以下三點優(yōu)勢:
能夠?qū)崿F(xiàn)存儲性能的大規(guī)模獨立擴展,保證了以往計算和存儲分離的IT管理模式的可延續(xù)性。
充分兼容異構(gòu)化的計算資源,支持裸機等非虛擬化的計算平臺。
提供完全獨立的存儲空間,不至于因為計算工作負(fù)載的提升而使得存儲性能出現(xiàn)瓶頸。
但是,分離式私有云架構(gòu)同樣存在兩點劣勢:
需要采用單獨的存儲集群,對數(shù)據(jù)中心規(guī)模一般的中等規(guī)模企業(yè)來說性價比偏低,如果采用商用存儲設(shè)備,成本就更加高昂。
計算、存儲、網(wǎng)絡(luò)拓?fù)漭^為復(fù)雜,對部分缺乏運維能力的企業(yè)和分支機構(gòu)造成大量運維管理難題。
2.2.2 超融合架構(gòu)的私有云
當(dāng)企業(yè)追求私有云的易于管理、高性價比等特性時,計算、存儲融合部署的超融合架構(gòu)成為最合適選擇,目前這種方案已經(jīng)開始在中型乃至大型客戶中出現(xiàn)。
Gartner認(rèn)為,超融合架構(gòu)(HCI)是一種以軟件為中心的體系結(jié)構(gòu),將計算、存儲、網(wǎng)絡(luò)和虛擬化資源(以及可能的其他技術(shù))緊密集成在單一的供應(yīng)商提供的一臺硬件設(shè)備中。相比于分離式架構(gòu)的私有云,超融合架構(gòu)的私有云真正實現(xiàn)了完全的軟件定義、完全的虛擬化、完全的分布式。
與分離式架構(gòu)私有云類似,超融合架構(gòu)私有云同樣存在開源、商用兩類生態(tài)。
開源超融合架構(gòu)私有云:基于Openstack、KVM、Ceph等開源產(chǎn)品整合的超融合方案,優(yōu)勢是可以快速從社區(qū)獲得最新的功能,但同時存在著諸多問題,比如:Openstack架構(gòu)復(fù)雜、大量模塊在超融合中并不需要,商用程度差,且計算資源要求高;基于開源的Ceph模塊和代碼復(fù)雜,服務(wù)商對產(chǎn)品核心問題無法有效支持,且Ceph對計算資源消耗高較高,IO密集型場景性能也表現(xiàn)欠佳;一般無法有效支持VMWare等商用虛擬化平臺。
閉源超融合架構(gòu)私有云:該種模式最典型的廠商案例是VMWare的vSphere+vSAN+vCenter超融合架構(gòu)配合vRealize Automation,以及國內(nèi)超融合廠商SmartX的SMTX OS超融合架構(gòu),并可對接國內(nèi)多家成熟的商用多云管理平臺實現(xiàn)計算存儲的資源池化、分布式化、軟件定義化和自服務(wù)化。
如上圖所示,SmartX的超融合架構(gòu)除了包括自有的虛擬機服務(wù)和分布式塊存儲,還可兼容VMWare、Citrix等其他廠商的虛擬機服務(wù)。據(jù)了解,SmartX結(jié)合云管理形成的超融合私有云已經(jīng)在大型國有銀行和大型券商等客戶形成實際案例。
相比于分離式架構(gòu)私有云,超融合架構(gòu)私有云的有兩點明顯優(yōu)勢:
易于管理:超融合幫助私有云非常簡單地完成基礎(chǔ)架構(gòu)的虛擬化,包括計算、存儲、網(wǎng)絡(luò)的虛擬化,無須為不同的設(shè)備考慮虛擬化的方案,降低方案的復(fù)雜性;支持集成VMware vSphere和KVM等主流虛擬化軟件,用戶端幾乎沒有學(xué)習(xí)成本。
高性價比:超融合技術(shù)實現(xiàn)了完全的軟件定義架構(gòu),支持普通商用服務(wù)器硬件以及使用以太網(wǎng)進(jìn)行傳輸,避免使用價格高昂的專用硬件,有效降低私有云中的硬件采購成本;超融合技術(shù)的特性是在每個服務(wù)器節(jié)點都能同時提供計算與存儲能力,架構(gòu)精簡,資源占用更低。
2.2.3 從私有云出發(fā)的混合云生態(tài)
兩類私有云部署架構(gòu)(分離式/超融合)、兩類私有云技術(shù)生態(tài)(開源/閉源),與公有云一同構(gòu)成的混合云生態(tài)體系如下圖所示。
總體來看,不同混合云生態(tài)在定制化能力、易管理性、成熟穩(wěn)定性、性價比等四方面的對比如下。
2.3 混合云實踐過程對企業(yè)的多重挑戰(zhàn)
無論從公有云走向混合云,還是從私有云走向混合云,對于企業(yè)來說,都是一個解決方案越來越復(fù)雜、面臨的技術(shù)挑戰(zhàn)越來越多的過程。
據(jù)中國信通院數(shù)據(jù)顯示,缺少適合的解決方案,以及現(xiàn)有技術(shù)不夠成熟是阻礙企業(yè)應(yīng)用混合云的兩大最主要因素,網(wǎng)絡(luò)連接不夠穩(wěn)定、基礎(chǔ)功能不完善是企業(yè)在混合云應(yīng)用過程中面臨的兩大最主要挑戰(zhàn)。
但是,缺乏合適的解決方案與技術(shù)的具體原因可能分布在混合云與分布式邊緣云的各個層次中。為了分析這些原因,我們必須明確混合云與分布式邊緣云建設(shè)的混合云和分布式邊緣云的基礎(chǔ)架構(gòu)圖來進(jìn)行分析,如下圖所示。
1)混合云基礎(chǔ)設(shè)施平臺:它是混合云、分布式邊緣云建設(shè)的基礎(chǔ)環(huán)節(jié),主要包括公有云/私有云、中心云/邊緣云等多種不同基礎(chǔ)架構(gòu)的云形態(tài),以及其中不同的計算、存儲、網(wǎng)絡(luò)架構(gòu),還有跨云連接網(wǎng)絡(luò)、多云管理平臺(CMP)等多云間的融合機制。
2)云原生技術(shù)中臺:它是企業(yè)開發(fā)云原生應(yīng)用或遷移、改造傳統(tǒng)應(yīng)用,最終實現(xiàn)業(yè)務(wù)創(chuàng)新的核心環(huán)節(jié),主要包括aPaaS(DevOps、微服務(wù)治理、中間件服務(wù))、iPaaS、Database PaaS(數(shù)據(jù)庫PaaS)、Business Analytics PaaS(業(yè)務(wù)分析PaaS)、ITOM平臺(CMP、APM工具),共同服務(wù)于云原生應(yīng)用交付生命周期。其中,aPaaS(應(yīng)用PaaS)是云原生應(yīng)用交付的主要平臺。
在本報告的第三章、第四章中,我們將詳細(xì)分析這兩個環(huán)節(jié)中的挑戰(zhàn)構(gòu)成,如下圖所示。
此外,為了應(yīng)對這些挑戰(zhàn),企業(yè)還需要選擇合適的廠商來提供混合云解決方案,因此本報告還將提供一些典型廠商的最佳實踐案例。在這些挑戰(zhàn)環(huán)節(jié)中提供解決方案的典型廠商如下圖所示。
3.混合云基礎(chǔ)設(shè)施平臺建設(shè)
云計算基礎(chǔ)設(shè)施層的構(gòu)成形態(tài),直接決定了云計算的架構(gòu)和形態(tài)。企業(yè)在對混合云與分布式邊緣云的落地實踐中,首先要面臨基礎(chǔ)設(shè)施平臺建設(shè)的挑戰(zhàn)。
3.1 混合云基礎(chǔ)設(shè)施的三個應(yīng)用階段
根據(jù)公有云、私有云之間在基礎(chǔ)設(shè)施層面的協(xié)同深度,我們可以將混合云基礎(chǔ)設(shè)施的應(yīng)用階段分為三個層次:多云網(wǎng)絡(luò)互通、多云管理與協(xié)同、多云資源一致。
1)多云網(wǎng)絡(luò)互通:在多云之間實現(xiàn)廣域網(wǎng)的連接,從而實現(xiàn)信息的跨云傳輸;在這一階段,企業(yè)面臨的挑戰(zhàn)主要是混合云對跨云連接網(wǎng)絡(luò)的穩(wěn)定性、配置敏捷性、成本優(yōu)化能力等方面具有較高要求;
2)多云管理統(tǒng)一:通過多云統(tǒng)一資源管理,實現(xiàn)工作任務(wù)在多個計算存儲資源池的靈活分配,從而實現(xiàn)多云業(yè)務(wù)協(xié)同和成本優(yōu)化;在這一階段,企業(yè)面臨的主要挑戰(zhàn)在于多云環(huán)境承載業(yè)務(wù)形態(tài)多樣、資源類型多樣、權(quán)限分配復(fù)雜,對企業(yè)的IT統(tǒng)一管理帶來大量痛點;
3)多云資源一致:通過在多云之間保持IaaS、PaaS資源的相對一致性,從而允許應(yīng)用和資源在多云之間自由遷移或漂移,同時盡可能減少過程中的人工干預(yù);在這一階段,企業(yè)面臨的主要挑戰(zhàn)在于如何克服多云基礎(chǔ)架構(gòu)的異構(gòu)性。
本章將對以上三個階段企業(yè)面臨的挑戰(zhàn)及對策進(jìn)行詳細(xì)闡述和分析,同時提供相關(guān)類型廠商在企業(yè)中的實踐案例。
3.2多云網(wǎng)絡(luò)互通
企業(yè)組網(wǎng)是企業(yè)IT基礎(chǔ)設(shè)施建設(shè)的核心訴求之一,它保證了企業(yè)分布在不同地點、不同環(huán)境中的計算資源能夠?qū)崿F(xiàn)在一張局域網(wǎng)中自由互訪,并滿足企業(yè)內(nèi)部的網(wǎng)絡(luò)管控需求。
在混合云架構(gòu)中,公有云、私有云計算與存儲設(shè)施往往分布在不同地域和數(shù)據(jù)中心,需要通過廣域網(wǎng)進(jìn)行連接,從而實現(xiàn)企業(yè)組網(wǎng)。
在分布式邊緣云架構(gòu)中,從骨干網(wǎng)、城域網(wǎng)到接入網(wǎng),均需要通過廣域網(wǎng)進(jìn)行連接,從而構(gòu)成包括眾多邊緣云的邊緣計算網(wǎng)絡(luò)。
無論是混合云還是分布式邊緣云,它們的廣域網(wǎng)連接質(zhì)量對其應(yīng)用效果乃至成敗至關(guān)重要。
現(xiàn)階段,VPN、專線和SD-WAN是企業(yè)采用最多的三種網(wǎng)絡(luò)連接技術(shù),其中MPLS VPN是最為普遍的VPN技術(shù)類型,它們分別具備不同的優(yōu)勢和適用場景,其對比如下圖所示。
隨著企業(yè)對云計算應(yīng)用程度的加深,以及混合云、邊緣云的出現(xiàn),專線和MPLS VPN面臨著三個方面的嚴(yán)峻的挑戰(zhàn)。
第一,隨著業(yè)務(wù)工作負(fù)載量的增加,專線、MPLS VPN的帶寬也需要不斷增加,而高帶寬的專線和VPN的租用費用較為昂貴,給企業(yè)造成了越來越高的網(wǎng)絡(luò)運維成本;
第二,隨著分布式邊緣云架構(gòu)的發(fā)展,部分偏遠(yuǎn)或小型分支機構(gòu)的規(guī)模不足以支撐專線和MPLS高昂的成本;
第三,在云計算環(huán)境下,企業(yè)業(yè)務(wù)創(chuàng)新與迭代速度不斷加快,對企業(yè)的網(wǎng)絡(luò)響應(yīng)能力,對增加帶寬、增加線路等網(wǎng)絡(luò)配置的敏捷性要求都越來越高,而專線、MPLS的配置靈活性相對不足。
為了解決專線和MPLS VPN面臨的困境,SD-WAN(軟件定義廣域網(wǎng))這一新興網(wǎng)絡(luò)技術(shù)在近些年崛起,其主要技術(shù)在于實現(xiàn)網(wǎng)絡(luò)控制與數(shù)據(jù)轉(zhuǎn)發(fā)功能的分離,以及傳統(tǒng)網(wǎng)絡(luò)功能的虛擬化,同時基于對網(wǎng)絡(luò)環(huán)境實時狀態(tài)的感知來控制虛擬化的網(wǎng)絡(luò)功能,從而為每個數(shù)據(jù)包選擇最佳路徑,保障了分發(fā)的高效性和通訊的實時性。
SD-WAN助力多點網(wǎng)絡(luò)互聯(lián),觀脈科技NaaS網(wǎng)絡(luò)服務(wù)為企業(yè)網(wǎng)絡(luò)降本增效
觀脈科技是國內(nèi)領(lǐng)先的基于SD-WAN技術(shù)的NaaS服務(wù)商,擁有覆蓋全球的虛擬私有網(wǎng)絡(luò),是國內(nèi)較早實現(xiàn)對多個公有云的網(wǎng)絡(luò)全自動化接入的公司之一,利用自身的SD-WAN網(wǎng)絡(luò)對網(wǎng)絡(luò)資源進(jìn)行統(tǒng)一的優(yōu)化和管理,服務(wù)包括中國移動,網(wǎng)易,獵豹移動、VIPKID 、墨跡天氣,傲世堂等游戲,教育,互聯(lián)網(wǎng),運營商類客戶。
觀脈科技推出的AllWAN是一款NaaS網(wǎng)絡(luò)服務(wù)產(chǎn)品,融合專線網(wǎng)絡(luò)的穩(wěn)定性和互聯(lián)網(wǎng)的經(jīng)濟性,具備可編程的API和極強的擴展性,可解決實時傳輸中的瓶頸,能夠在全球范圍跨地域和網(wǎng)絡(luò)使用,能夠?qū)崿F(xiàn)多公有云之間、公有云與數(shù)據(jù)中心/私有云之間,以及多數(shù)據(jù)中心之間的網(wǎng)絡(luò)互聯(lián)。
觀脈科技某客戶是一家全球化企業(yè),在國內(nèi)采用A云、B云、C云來提供公有云服務(wù),在國外采用AWS來提供公有云服務(wù)。此外,該企業(yè)還需要在廣州A云和北京A云部署兩臺堡壘機,并對部署在全球的50余個VPC、超過5千臺云主機進(jìn)行管理。
為了提升業(yè)務(wù)響應(yīng)的速度,實現(xiàn)多個公有云之間的業(yè)務(wù)訪問,針對業(yè)務(wù)流量進(jìn)行統(tǒng)一管理,并基于網(wǎng)絡(luò)流量提供及時的告警信息,該企業(yè)采用觀脈AllWAN實現(xiàn)多云互聯(lián)。
方案實施后,該企業(yè)的網(wǎng)絡(luò)開通速度、靈活性、使用體驗大大改善,能夠在一天內(nèi)完成不同云之間的業(yè)務(wù)對接,可以根據(jù)使用情況靈活調(diào)整帶寬,可以根據(jù)需求開通網(wǎng)絡(luò)用量統(tǒng)計等功能,能夠基于業(yè)務(wù)情況進(jìn)行網(wǎng)絡(luò)測試,可以實時查看網(wǎng)絡(luò)使用情況。
觀脈科技另一家客戶為國內(nèi)著名的人工智能公司,該公司網(wǎng)絡(luò)全部使用互聯(lián)網(wǎng),希望優(yōu)化現(xiàn)有辦公區(qū)訪問數(shù)據(jù)中心的網(wǎng)絡(luò)質(zhì)量,提升整體網(wǎng)絡(luò)的健壯性,并為Salesforce等訪問速度慢的應(yīng)用進(jìn)行加速。
為此,觀脈基于AllWAN網(wǎng)絡(luò)為客戶提供混合云聯(lián)網(wǎng)解決方案,將該企業(yè)的數(shù)據(jù)中心、云和辦公室通過專線或互聯(lián)網(wǎng)的方式就近接入到觀脈科技的AllWAN網(wǎng)絡(luò),還增加了A、B云作為業(yè)務(wù)數(shù)據(jù)的備份節(jié)點,與現(xiàn)有數(shù)據(jù)中心組成混合云架構(gòu)。
方案實施后,該企業(yè)辦公區(qū)之間網(wǎng)絡(luò)訪問質(zhì)量比之前提升50%,Salesforce等軟件的訪問速度明顯提升,網(wǎng)絡(luò)穩(wěn)定性超過99.99%,網(wǎng)絡(luò)安全性獲得提升,實現(xiàn)更加簡化的可視化運維。
總體來看,SD-WAN相比于專線和MPLS VPN的優(yōu)勢體現(xiàn)在成本和效率兩方面:
擴容成本:SD-WAN可完全基于互聯(lián)網(wǎng)鏈路,無需依賴任何專線線路;可有效提升網(wǎng)絡(luò)鏈路的利用率,無需維持空閑鏈路。
擴容效率:SD-WAN通過智能路由實現(xiàn)流量高效轉(zhuǎn)發(fā),傳輸時延相比于MPLS VPN大幅降低;通過Portal即可進(jìn)行網(wǎng)絡(luò)部署和變更,所需時間大幅縮短,技術(shù)門檻也大幅度降低。
近些年,SD-WAN的安全性技術(shù)也不斷完善,支持通過IPsec、TLS、DTLS等多種加密技術(shù)來實現(xiàn)數(shù)據(jù)加密。但現(xiàn)階段,許多企業(yè)出于對安全性的顧慮,會采用MPLS VPN與SD-WAN的混合架構(gòu),使用MPLS來承擔(dān)核心業(yè)務(wù)流量,而使用SD-WAN來承擔(dān)互聯(lián)網(wǎng)業(yè)務(wù)流量。
綜上所述,在混合云與邊緣云時代,SD-WAN能夠有效提升企業(yè)網(wǎng)絡(luò)管理效能,從而進(jìn)一步提升企業(yè)競爭力。
3.3 多云管理統(tǒng)一
盡管成本優(yōu)化是推動混合云、分布式云的主要因素,但是成本優(yōu)化方案的落地實施卻并不容易。公有云、私有云、中心云、邊緣云等不同的云,其成本最優(yōu)的業(yè)務(wù)類型不同,同時這些業(yè)務(wù)的工作負(fù)載同樣是在動態(tài)變化中的。
這種復(fù)雜性帶來的管理困難,使得企業(yè)亟需通過統(tǒng)一的多云資源管理平臺,對多云平臺的資源使用、任務(wù)調(diào)度進(jìn)行統(tǒng)一管理,最終實現(xiàn)多云成本優(yōu)化。
混合云成本優(yōu)化分為兩個部分:
1)在公有云、私有云之間進(jìn)行工作負(fù)載分配,以盡可能降低因擴容帶來的額外成本;
2)對多個公有云賬號所擁有的資源進(jìn)行統(tǒng)一管理與分配,以盡可能降低因部門或團隊獨占資源帶來的資源利用率降低。
3.3.1 公有云、私有云間成本優(yōu)化
混合云產(chǎn)生與發(fā)展的主要驅(qū)動因素之一是成本與效率的平衡,即讓私有云和公有云發(fā)揮各自的優(yōu)勢,實現(xiàn)最大的投入產(chǎn)出比。在這里,我們將投入產(chǎn)出比定義為:在一定時間內(nèi),混合云承載的總工作負(fù)載量與軟硬件成本投入的比值。
在混合云實踐中,企業(yè)面臨成本優(yōu)化的挑戰(zhàn)主要來自敏態(tài)業(yè)務(wù),這是由穩(wěn)態(tài)和敏態(tài)業(yè)務(wù)的特性決定的。
穩(wěn)態(tài)業(yè)務(wù):其負(fù)載峰值與負(fù)載低谷相比,差距一般不超過數(shù)倍,因此選擇私有云來完全承載其工作負(fù)載,其計算資源利用率仍然相對可接受。同時,由于私有云成本主要集中在前期的建設(shè)投入,在更長時間尺度上的成本相比于公有云更低。因此,大部分穩(wěn)態(tài)業(yè)務(wù)都可以通過私有云來完全承載,不存在太多跨云優(yōu)化的空間。
敏態(tài)業(yè)務(wù):其負(fù)載峰值往往高達(dá)負(fù)載低谷的數(shù)十倍到上百倍,如果選擇私有云來完全承載其工作負(fù)載,在低谷期會產(chǎn)生嚴(yán)重資源閑置,難以通過后期的低成本來抵消前期的高建設(shè)成本。這種情況下,通過公有云來承載其工作負(fù)載高峰變得十分必要。
但是,在敏態(tài)業(yè)務(wù)的生命周期中,并非采用公有云的比例越高越好,這是因為在整個敏態(tài)業(yè)務(wù)的生命周期內(nèi),盡管其工作負(fù)載的總體波動性較大,但是仍然可能在某些時間段內(nèi)展現(xiàn)出一定程度的穩(wěn)態(tài)特性。
比如,下面的曲線圖就表示了某敏態(tài)業(yè)務(wù)在生命周期內(nèi)經(jīng)歷的工作負(fù)載變化情況。
增長期:當(dāng)業(yè)務(wù)處于增長期,負(fù)載的波動幅度較大且不斷增長,其下一時間段的波動幅度,以及生命周期長度往往不可預(yù)料,需要云平臺具備彈性的擴容縮容能力。因此,選擇公有云來完全承載其負(fù)載是投入產(chǎn)出比最優(yōu)的方案。
穩(wěn)定期:當(dāng)業(yè)務(wù)進(jìn)入到穩(wěn)定期后,由于用戶群體、數(shù)據(jù)源的相對穩(wěn)定,其負(fù)載波動特性會變得比較容易預(yù)測,低谷期的工作負(fù)載也會相對穩(wěn)定。在這個階段,企業(yè)往往對于業(yè)務(wù)的生命周期長度有相對樂觀的預(yù)計。因此在穩(wěn)定期內(nèi),企業(yè)逐步采用私有云來承載一部分固定存在的工作負(fù)載,是相對成本更優(yōu)的方案。
衰退期:當(dāng)業(yè)務(wù)進(jìn)入衰退期,工作負(fù)載在波動中呈現(xiàn)下滑趨勢,但由于在穩(wěn)定期投入了大量支撐私有云的硬件成本,而且這部分硬件成本顯然無法回收,所以整體的投入產(chǎn)出比也呈現(xiàn)下滑趨勢。在這種情況下,繼續(xù)盡可能地利用現(xiàn)有私有云資源,同時不斷回收公有云資源,更加有利于投入產(chǎn)出比的維持和優(yōu)化。
當(dāng)然,上圖僅僅是企業(yè)在一個較粗的時間顆粒度上可能采取的混合云成本優(yōu)化方案。在實際生產(chǎn)環(huán)境中,優(yōu)化粒度可以更加精細(xì),在每個波動周期內(nèi)快速啟停公有云資源。
此外,在企業(yè)實際生產(chǎn)環(huán)境中,本地資源池的情況往往更加復(fù)雜,不僅會有私有云,還可能有物理機、VMware虛擬機等異構(gòu)資源,它們在混合云成本優(yōu)化過程中也可以作為私有云來對待。
面對這樣的優(yōu)化背景,僅僅依靠割裂在不同資源池內(nèi)的運維管理界面難以滿足需求,企業(yè)運維人員亟需有能夠納管多種資源、提供多維度運維數(shù)據(jù)的管理平臺,實現(xiàn)統(tǒng)一、高效的成本優(yōu)化,這就是云管理平臺(CMP)。
作為能夠?qū)崿F(xiàn)多云資源納管的運維管理工具,云管理平臺(CMP)能夠納管包括VMware虛擬機、裸金屬機器、私有云、公有云、存儲設(shè)備、SDN網(wǎng)絡(luò)等多種資源,同時提供運維監(jiān)控、統(tǒng)計報表以及相應(yīng)的可視化功能。
基于CMP的這一系列功能特性,企業(yè)能夠?qū)崿F(xiàn)對公有云、私有云各自的資源使用情況的分析,從而做出相應(yīng)的優(yōu)化策略:
1)如果企業(yè)通過CMP監(jiān)控到公有云中有長期存在的固定工作負(fù)載量,企業(yè)可將其逐步遷移到私有云、VMWare上。這時如果私有云、VMWare的使用率已經(jīng)很高,難以擴容,則考慮擴大規(guī)模來承載這部分業(yè)務(wù)。
2)對于私有云、VMWare、物理機中存在的負(fù)載波動性較大、出現(xiàn)了明顯的性能瓶頸的業(yè)務(wù),企業(yè)可將這部分超出正常承載能力的工作負(fù)載轉(zhuǎn)移到公有云。
3.3.2 多公有云間的成本優(yōu)化
多公有云的成本優(yōu)化是建立在公有云、私有云間成本優(yōu)化的基礎(chǔ)上,進(jìn)一步實現(xiàn)混合云成本優(yōu)化的另一個階段。
造成多公有云的原因是復(fù)雜的,其中典型的原因包括實現(xiàn)多云災(zāi)備、減少廠商綁定、希望利用不同云的特有能力等。此外,出于內(nèi)部組織架構(gòu)的原因,企業(yè)也有可能創(chuàng)立多個公有云賬號來歸多個部門管理和使用。
無論是單一公有云廠商的多個賬號,還是多個公有云廠商的多個賬號,由于其資源之間的割裂性,都可能會帶來資源閑置,從而造成成本升高。資源閑置的典型原因包括兩類:
1)不同部門擁有不同的賬號,使得這部分公有云資源被獨占,在不使用的情況下無法被分配給其他部門來使用,也無法被統(tǒng)一釋放,造成資源閑置和成本浪費;
2)某些公有云的資源被釋放后,它所占用的資源未被同時釋放,比如服務(wù)器被釋放后,占用的存儲、彈性IP可能未被釋放,在多公有云賬號的情況下,這樣的情況更加突出,造成資源閑置和成本浪費。
基于CMP提供的多云納管、權(quán)限管理和運維監(jiān)控能力,企業(yè)能夠采取以下策略來解決資源閑置問題:
1)針對第一類情況,企業(yè)可將公有云賬號的權(quán)限收歸企業(yè)統(tǒng)一管理,基于CMP的多云納管能力,實現(xiàn)多個公有云賬號的打通,并基于CMP的權(quán)限管理能力,為不同部門創(chuàng)建有不同操作權(quán)限的業(yè)務(wù)組,同時提供資源統(tǒng)一申請流程,對資源進(jìn)行統(tǒng)一分配和回收;
2)針對特定資源被釋放后,被其占用的其他資源未被同時釋放,最后出現(xiàn)閑置的問題,企業(yè)可基于CMP的運維監(jiān)控能力實現(xiàn)資源利用率監(jiān)控和回收。
基于SmartOps云管理平臺,安暢網(wǎng)絡(luò)為某大型集裝箱制造集團實現(xiàn)混合云成本優(yōu)化
安暢網(wǎng)絡(luò)是中國市場領(lǐng)先的云托管服務(wù)商(Cloud MSP),面向企業(yè)客戶提供云原生技術(shù)服務(wù)和數(shù)字化解決方案,主要服務(wù)之一是基于SmartOps云管理平臺為企業(yè)客戶提供訂閱式、托管式的運維服務(wù),幫助企業(yè)實現(xiàn)多云環(huán)境下的成本優(yōu)化。
安暢網(wǎng)絡(luò)某客戶是某大型集裝箱制造集團,在上市準(zhǔn)備階段,該企業(yè)需要對集團組織進(jìn)行拆分,但是卻面臨著多重挑戰(zhàn):
1)缺乏專業(yè)運維工具:該企業(yè)作為一家傳統(tǒng)大型制造業(yè)集團企業(yè),IT系統(tǒng)龐大而繁雜,系統(tǒng)大量部署在物理/虛擬化設(shè)備上,也有各分公司公共云環(huán)境,而拆分出的企業(yè)IT團隊面對這種復(fù)雜環(huán)境,缺乏專業(yè)的云環(huán)境運維平臺來進(jìn)行運維管理,并對分公司的資源使用權(quán)限進(jìn)行管控;
2)成本優(yōu)化難題:復(fù)雜的IT和多云環(huán)境,要求企業(yè)有效把控整體IT成本,控制多云賬戶的成本消耗,整合云資源;
3)上云難題:設(shè)備業(yè)務(wù)系統(tǒng)面臨快速遷移上云難題,同時面臨安全合規(guī)、備份容災(zāi)、多地域網(wǎng)絡(luò)互聯(lián)的復(fù)雜需求;
4)人力成本難題:現(xiàn)有IT團隊的人力難以支撐起業(yè)務(wù)系統(tǒng)的7x24運維管理。
因此,該企業(yè)迫切的需要一種全方位的IT服務(wù)管理手段和資源管理平臺來治理目前復(fù)雜的環(huán)境,并利用云計算優(yōu)勢整合資源降低成本。
項目啟動后,安暢網(wǎng)絡(luò)成立專門的遷移運維團隊,做了如下工作:
1)實現(xiàn)資源統(tǒng)一納管:逐一摸清客戶總部、各分公司的資源環(huán)境情況,將客戶原VMware虛擬化環(huán)境和物理服務(wù)器加入SmartOps平臺進(jìn)行統(tǒng)一監(jiān)控、統(tǒng)一生命周期管理(開/關(guān)/新建/銷毀/配置調(diào)整),同時將各項目各分公司已存在云賬號進(jìn)行導(dǎo)入,將客戶所有混合云環(huán)境納入統(tǒng)一平臺進(jìn)行監(jiān)控和生命周期及配置管理。
2)實現(xiàn)業(yè)務(wù)組權(quán)限劃分:通過SmartOp平臺的“業(yè)務(wù)組”功能,自由劃分資源池和業(yè)務(wù)組人員的權(quán)限控制。
3)實現(xiàn)IT即服務(wù):將客戶所有資源都接入SmartOps平臺后,通過平臺ITSM功能模塊將客戶、軟件供應(yīng)商、安暢運維服務(wù)三者流程化有機集合,向客戶提供IT服務(wù)化,客戶建設(shè)新系統(tǒng)、軟件變更、運維問題處理等事件都以IT服務(wù)的形式交付給客戶,大大提升了客戶管理復(fù)雜多云環(huán)境的難度。同時也避免了自身建立多云運維團隊的人力資源投入。
4)實現(xiàn)運維安全統(tǒng)一管控:依托Ops平臺的堡壘機功能,在一個平臺即可運維登陸 集團所有公有云、物理還是虛擬化服務(wù)器內(nèi)部,進(jìn)行業(yè)務(wù)部署和運維管理。
5)實現(xiàn)成本優(yōu)化:SmartOps平臺通過客戶云賬號AK與各大公有云同步云賬單信息,結(jié)合Ops平臺的監(jiān)控系統(tǒng)、來分析主機使用率和 預(yù)算設(shè)置管理,為客戶分析那些資源需要降配節(jié)約成本、那些資源沒有使用閑置狀態(tài)、那些資源負(fù)載高需要升配并將變化后的預(yù)估成本變化進(jìn)行分析展示給客戶,客戶根據(jù)自身業(yè)務(wù)特性或規(guī)則來優(yōu)化成本。
經(jīng)過安暢網(wǎng)絡(luò)遷移運維團隊的工作,該企業(yè)面向混合云和復(fù)雜IT環(huán)境的運維效果得到了如下提升:
1) 運維管理的運維流程得到了簡化,運維和故障響應(yīng)的效率得到了提升,節(jié)省了自建運維團隊的人力成本。
2) 利用SmartOps平臺的監(jiān)控和費用分析自動得出優(yōu)化建議,同時實現(xiàn)預(yù)算控制,降低云計算平臺使用中的成本消耗,充分發(fā)揮云計算的按需收費的優(yōu)勢。
3.4 多云資源一致
隨著企業(yè)雙模態(tài)業(yè)務(wù)之間的深度融合,以及混合云和分布式邊緣云在企業(yè)內(nèi)的應(yīng)用程度加深,應(yīng)用和各類資源在多云之間進(jìn)行平滑遷移的需求逐步顯現(xiàn),這就需要多云資源一致能力,即“互操作”能力。
多云資源一致的含義在于應(yīng)用和資源能夠無縫地訪問公有云、私有云、中心云、邊緣云的計算、存儲、網(wǎng)絡(luò)等IaaS資源,乃至數(shù)據(jù)庫、中間件、微服務(wù)等PaaS資源,這有賴于多云間的基礎(chǔ)架構(gòu)與標(biāo)準(zhǔn)的統(tǒng)一或兼容。
但是,由于公有云、私有云、中心云、邊緣云往往來自不同廠商,而這些廠商出于差異性競爭、產(chǎn)品創(chuàng)新等需求,都可能會在相對統(tǒng)一的原生技術(shù)標(biāo)準(zhǔn),如KVM、OpenStack、Kubernetes、Ceph之上增加自己的特性或限制,這使得不同廠商的云在計算、網(wǎng)絡(luò)、存儲等基礎(chǔ)架構(gòu)以及其上的IaaS、PaaS資源都會存在大量異構(gòu)性,其影響主要體現(xiàn)在兩個方面:
1)資源深度耦合:不同云廠商的云原生資源與基礎(chǔ)架構(gòu)深度耦合,云原生應(yīng)用同樣與云原生資源相互耦合,對應(yīng)用和資源的跨云遷移造成障礙。
2)功能進(jìn)化不同步:公有云、私有云、中心云、邊緣云之間的基礎(chǔ)能力無法保證同步進(jìn)化,這阻礙了私有云、邊緣云中的云原生應(yīng)用采用公有云、中心云提供的最新服務(wù),進(jìn)一步增加了應(yīng)用跨云漂移的難度。
現(xiàn)階段來看,多云資源一致仍然難以建立在開放生態(tài)的基礎(chǔ)上,因為這有賴于云廠商之間的共識,從而在未來實現(xiàn)某些統(tǒng)一的底層標(biāo)準(zhǔn)。
目前,在混合云、分布式邊緣云中實現(xiàn)資源一致性的階段性方案有三種:
1)采用統(tǒng)一廠商的全棧式方案:即由同一家云廠商來提供包括公有云、私有云、中心云、邊緣云產(chǎn)品,這樣做的好處在于完全保證了多云之間基礎(chǔ)架構(gòu)和資源的一致性,能夠讓企業(yè)在私有云、邊緣云中享受到與公有云較為一致的資源服務(wù),保證了上層應(yīng)用無需改造、無需專門的遷移工具就能實現(xiàn)自由遷移。
2)搭建跨云的云原生技術(shù)中臺:通過Docker容器鏡像、Kubernetes容器編排技術(shù)實現(xiàn)跨云的統(tǒng)一云原生技術(shù)中臺搭建,能夠同時解決資源一致性和跨云遷移自動化的問題,并且能夠進(jìn)一步服務(wù)于應(yīng)用的全生命周期的跨云統(tǒng)一管理,這將在第四章中詳細(xì)介紹。
3)采用第三方云遷移工具:它盡管并沒有改變多云基礎(chǔ)架構(gòu)異構(gòu)的現(xiàn)實,但是卻提供了一種多云資源一致性的替代方案,即通過自動化、標(biāo)準(zhǔn)化的跨云遷移解決方案,降低了應(yīng)用跨異構(gòu)云遷移的成本,這樣的平臺可能是多云管理平臺(CMP),也可能是專業(yè)的云遷移工具。
與混合云解決方案類似,分布式邊緣云同樣存在全棧式、資源一致性的解決方案,較為典型的是華為云的九霄智能邊緣解決方案。
華為云九霄智能邊緣解決方案包括現(xiàn)場邊緣云IEF智能邊緣平臺(Intelligent EdgeFabric)和近場邊緣云IEC智能邊緣云(Intelligent Edge Cloud)兩部分,其中IEC智能邊緣云與華為公有云、華為云Stack基礎(chǔ)架構(gòu)完全一致,主要面向AR/VR、云游戲、互動直播等近場邊緣場景,主要職責(zé)是提供基礎(chǔ)云服務(wù)能力,一般部署在城域網(wǎng)中的地市級、區(qū)縣級機房中。
相比于電信運營商的分布式邊緣云,華為云等云廠商的邊緣云解決方案在基礎(chǔ)架構(gòu)一致性方面的優(yōu)勢,有助于其實現(xiàn)邊云深度協(xié)同。
4.多云架構(gòu)的云原生技術(shù)中臺建設(shè)與應(yīng)用交付
企業(yè)上云和數(shù)字化轉(zhuǎn)型的主要動力之一是為了實現(xiàn)業(yè)務(wù)創(chuàng)新,從而獲得快速的商業(yè)增長。
因此,盡管企業(yè)在上云初期主要關(guān)注基礎(chǔ)設(shè)施平臺的擴容成本、擴容效率、數(shù)據(jù)存儲安全性等問題,但是隨著其云計算應(yīng)用程度加深而不斷加強,企業(yè)對于應(yīng)用交付過程的關(guān)注會持續(xù)加強。
4.1多云架構(gòu)對應(yīng)用交付過程的挑戰(zhàn)
企業(yè)在數(shù)字化轉(zhuǎn)型和業(yè)務(wù)創(chuàng)新過程中,為了快速地實現(xiàn)業(yè)務(wù)迭代和體驗提升,需要不斷通過快速上線新功能的方式來收集用戶反饋,從而用于指導(dǎo)下一步的開發(fā),從而實現(xiàn)業(yè)務(wù)創(chuàng)新的敏捷化轉(zhuǎn)型。
因此,企業(yè)除了關(guān)注基礎(chǔ)設(shè)施層面的成本、效率優(yōu)化,以及安全合規(guī)等問題,必然會還會關(guān)注實現(xiàn)業(yè)務(wù)創(chuàng)新的云原生應(yīng)用的交付效能。
混合云、分布式邊緣云的出現(xiàn),對于應(yīng)用交付效能提出了新的挑戰(zhàn)。如果企業(yè)無法有效解決異構(gòu)多云環(huán)境下的應(yīng)用交付效能降低,將阻礙混合云、分布式邊緣云的成功實踐。
如果要想找到評價企業(yè)應(yīng)用交付過程是否能夠為企業(yè)創(chuàng)造足夠價值的一個評價標(biāo)準(zhǔn),那么“應(yīng)用交付效能”將是十分合適的一個指標(biāo)。應(yīng)用交付效能的含義是應(yīng)用在開發(fā)與構(gòu)建、測試、部署、運維管理的生命周期過程中,在吞吐量和穩(wěn)定性兩方面的綜合表現(xiàn)。
注:交付效能、吞吐量、穩(wěn)定性等定義來自谷歌旗下DORA(DevOps Research and Assessment)發(fā)布的《全球DevOps現(xiàn)狀調(diào)查報告》。
1)吞吐量:含義是應(yīng)用在單位時間內(nèi)更新的功能點的總量,它主要受到變更前置時間和部署頻率的影響。變更前置時間代表應(yīng)用從研發(fā)人員提交代碼到成功在生產(chǎn)環(huán)境中部署所經(jīng)歷的時間長度。部署頻率則與變更前置時間密切相關(guān),一般來說前置時間越短,能夠達(dá)到的部署頻次就越高。
2)穩(wěn)定性:含義是應(yīng)用交付完成后,在實際生產(chǎn)環(huán)境中持續(xù)發(fā)揮價值的能力,它主要受到變更及服務(wù)失敗率和服務(wù)恢復(fù)時間的影響。變更及服務(wù)失敗率主要指應(yīng)用新功能上線后,由于功能缺陷、體驗性、系統(tǒng)故障等原因,導(dǎo)致應(yīng)用被迫回退到上一版本或重新啟動的概率。服務(wù)恢復(fù)時間指應(yīng)用在因系統(tǒng)故障、性能壓力等原因而停止后到恢復(fù)正常服務(wù)能力所需的時間。
隨著基于容器的DevOps、微服務(wù)治理等產(chǎn)品與方案的成熟,整個云計算的云原生技術(shù)中臺體系逐步形成,它也成為推動云計算時代的企業(yè)應(yīng)用交付效能進(jìn)一步提升的主要動力。云原生技術(shù)中臺對于應(yīng)用交付效能的影響表現(xiàn)在吞吐量和穩(wěn)定性兩方面,如下圖所示。
1)吞吐量:DevOps平臺完全替代了過去開發(fā)、測試人員的手動打包提交、手動部署測試環(huán)境的過程,人工干預(yù)的頻次被極大降低,從而縮短了變更前置時間,提升了部署頻率,最終提升了吞吐量。微服務(wù)架構(gòu)和開發(fā)體系進(jìn)一步將研發(fā)顆粒度細(xì)化,團隊協(xié)作分工更加順暢,縮短了變更前置時間,同時提升了部署頻率,同樣提升了吞吐量。
2)穩(wěn)定性:DevOps平臺實現(xiàn)了從開發(fā)、測試人員到運維人員的流程自動化,容器技術(shù)的可移植性、跨環(huán)境一致性的特性消除了因環(huán)境異構(gòu)導(dǎo)致的變更失敗可能,使得變更及服務(wù)失敗率大幅降低。微服務(wù)治理的路由控制、流量控制、負(fù)載均衡、熔斷限流等服務(wù)大幅降低了故障率,從而減少了服務(wù)恢復(fù)時間。這兩方面因素都使得應(yīng)用交付的穩(wěn)定性極大提升。
但是,以混合云和分布式邊緣云為代表的多云架構(gòu)帶來的異構(gòu)的資源環(huán)境,必然需要打破單一云環(huán)境下的應(yīng)用交付和管理生命周期,在應(yīng)用交付的吞吐量、穩(wěn)定性兩方面都會給企業(yè)帶來新的挑戰(zhàn)。因此,在多云異構(gòu)環(huán)境下,云原生技術(shù)中臺的價值再次凸顯。
4.2 構(gòu)建跨云的云原生技術(shù)中臺
由于以Docker技術(shù)為代表云原生技術(shù)在相當(dāng)程度上能夠屏蔽很大一部分多云間的異構(gòu)性,實現(xiàn)應(yīng)用開發(fā)測試環(huán)境的相對標(biāo)準(zhǔn)化、統(tǒng)一化,因此如果實現(xiàn)云原生技術(shù)中臺的跨云構(gòu)建,那么多云架構(gòu)之上的應(yīng)用交付效能將得到有效提升,如下圖所示。
因此,如何構(gòu)建一套兼容不同廠商的公有云、私有云、中心云和邊緣云的云原生技術(shù)中臺,成為企業(yè)在這一過程中將面臨的主要挑戰(zhàn)。
除了基于不同的云基礎(chǔ)設(shè)施平臺構(gòu)建云原生技術(shù)中臺之外,一些大型政企客戶往往還擁有大量的數(shù)據(jù)中心資源,其中存在各類物理機、VMWare虛擬機。盡管這些資源中并沒有建設(shè)云基礎(chǔ)設(shè)施,但仍然是資源異構(gòu)性的另一種表現(xiàn)。云原生技術(shù)中臺可直接搭建在物理機、虛擬機之上,實現(xiàn)跨異構(gòu)資源、跨地域、跨機構(gòu)的應(yīng)用交付生命周期的統(tǒng)一管理,成為多云架構(gòu)的另一種形式。
在這樣的挑戰(zhàn)下,獨立的容器云廠商的價值得到凸顯,其優(yōu)勢在于中立性、產(chǎn)品化和服務(wù)能力:
1)中立性:獨立容器廠商盡管可能與某些公有云廠商建立緊密的戰(zhàn)略合作關(guān)系,但總體來說其產(chǎn)品并不綁定IaaS平臺,而是能夠充分兼容各類IaaS層資源,包括VMware、OpenStack和主流公有云廠商,從而使得企業(yè)能夠在多公有云上部署同構(gòu)的Kubernetes集群,從而有效支撐統(tǒng)一DevOps平臺的搭建。
2)產(chǎn)品化:獨立容器廠商的產(chǎn)品本質(zhì)上是對原生Kubernetes進(jìn)行二次開發(fā)和產(chǎn)品化封裝,增加大量面向企業(yè)使用場景的功能模塊,并提供友好的部署安裝和用戶交互界面,大幅降低了容器平臺的使用門檻?;谌萜髌脚_,容器廠商一般還提供高度產(chǎn)品化的DevOps平臺,集成面向開發(fā)、構(gòu)建、測試等各階段的中間件和工具,為企業(yè)提供一套端到端的DevOps方案。
3)服務(wù)能力:獨立容器廠商一般具備專業(yè)的服務(wù)團隊,可以為尚不熟悉容器和DevOps的企業(yè)提供培訓(xùn)、咨詢和技術(shù)支持服務(wù)。對于部分具有復(fù)雜定制化要求的企業(yè),公有云廠商一般不會提供深度的交付服務(wù),而許多獨立容器廠商則能夠提供此類服務(wù)。
總體來看,基于容器云廠商提供的跨云的云原生技術(shù)中臺,企業(yè)能夠?qū)崿F(xiàn)包含開發(fā)、構(gòu)建、測試、部署與運維過程在內(nèi)的DevOps敏捷開發(fā)過程,避免了因多云異構(gòu)環(huán)境造成的人工操作增多、應(yīng)用交付效能降低的情況。
3.3多云架構(gòu)下“云原生閉環(huán)”的構(gòu)建
盡管在跨云的云原生技術(shù)中臺的搭建過程中,我們看到了獨立容器云廠商的獨特價值,但是它也并非唯一的答案。
實際上,云原生技術(shù)中臺的最初目的,就是為了服務(wù)于云原生應(yīng)用交付的全生命周期。而考慮到敏捷開發(fā)過程周而復(fù)始的過程,這個生命周期顯然不可能是一條單向的直線,而一定會構(gòu)成一個“云原生閉環(huán)”。
根據(jù)一般企業(yè)的軟件研發(fā)及上線流程,這個完整的“云原生閉環(huán)”應(yīng)該包括:業(yè)務(wù)部門流程,即需求提出;研發(fā)和測試部門流程,即需求確定、開發(fā)測試資源申請、開發(fā)與構(gòu)建、測試;運維部門流程:部署、運維管理、問題與需求反饋。隨著運維部門將應(yīng)用在部署或運維中出現(xiàn)的問題反饋到研發(fā)測試部門,整個閉環(huán)周期才完全流轉(zhuǎn)結(jié)束,如下圖所示。
正如上圖所展示,在云原生應(yīng)用交付的生命周期里,除了需求確定、云原生應(yīng)用開發(fā)、測試、應(yīng)用部署等環(huán)節(jié)由容器云廠商占據(jù)主導(dǎo),在資源申請、監(jiān)控與災(zāi)備這兩個連接開發(fā)測試部門與運維部門的核心環(huán)節(jié)中,企業(yè)都需要相應(yīng)的工具平臺進(jìn)行支撐。
當(dāng)多云異構(gòu)環(huán)境成為企業(yè)中的主流以后,如何實現(xiàn)跨云的資源統(tǒng)一申請、統(tǒng)一監(jiān)控與災(zāi)備,從而有效提升“云原生閉環(huán)”的效率成為企業(yè)的主要痛點之一。
此外,云原生技術(shù)的普遍應(yīng)用也改變了所謂“資源”的定義。傳統(tǒng)IT和云原生出現(xiàn)之前的資源更多的是指的物理資源和虛擬化資源,以及傳統(tǒng)的數(shù)據(jù)庫和中間件資源。但云原生技術(shù)成熟之后,容器、云原生數(shù)據(jù)庫、云原生中間件等云原生資源同樣需要進(jìn)行統(tǒng)一申請、統(tǒng)一運維監(jiān)控和災(zāi)備。
在這種背景下,許多廠商的CMP、APM等ITOM工具,正在逐步從基礎(chǔ)設(shè)施層向云原生層進(jìn)行拓展,從而融入到“云原生閉環(huán)”中。
因此,基于“云原生閉環(huán)”的重要價值,我們把面向云原生資源進(jìn)行管理、監(jiān)控并提供IT服務(wù)的云管理工具CMP,以及應(yīng)用性能監(jiān)控工具APM等ITOM工具,都定義為云原生技術(shù)中臺的重要組成部分。
4.3.1 多云架構(gòu)下的資源申請
在單一云的環(huán)境下,企業(yè)往往直接通過公有云、私有云的后臺管理界面來申請資源。但是在越來越復(fù)雜的多云環(huán)境下,有大量獨立的資源申請入口,并且需要通過這些獨立的入口來對資源進(jìn)行管理,對企業(yè)的資源分配造成較大管理困難,多云管理平臺CMP的價值得到充分凸顯。
CMP的最初意義在于提供對異構(gòu)的多云環(huán)境,包括VMware虛擬機、OpenStack私有云、公有云、容器、存儲、SDN等各類資源的統(tǒng)一納管,為企業(yè)優(yōu)化云服務(wù)成本,統(tǒng)計云資源使用情況。
但是,在企業(yè)日益復(fù)雜的多云管理需求下,CMP逐步從單純的資源管理工具,發(fā)展為能夠為IT部門乃至業(yè)務(wù)部門提供服務(wù)化能力的ITSM平臺。
在服務(wù)化趨勢下,CMP可作為對內(nèi)服務(wù)門戶,提供統(tǒng)一的資源申請入口,對包括虛擬主機、存儲、SDN網(wǎng)絡(luò)在內(nèi)的IaaS資源,容器、DevOps、中間件、數(shù)據(jù)庫在內(nèi)PaaS資源實現(xiàn)集中化、服務(wù)化交付。其中,對于VMware這類單租戶、缺乏自服務(wù)能力的傳統(tǒng)虛擬化平臺,CMP能夠有效地為其增加多租戶、自服務(wù)特性,與私有云、公有云等資源實現(xiàn)統(tǒng)一化的管理和交付。
總體來說,CMP的服務(wù)化趨勢提升了IT資源申請、審批和創(chuàng)建的自動化水平,降低了應(yīng)用交付的變更前置時間,提升了應(yīng)用交付吞吐量。
4.3.2 多云架構(gòu)下的監(jiān)控與災(zāi)備
多云異構(gòu)環(huán)境對IT運維管理的挑戰(zhàn)主要體現(xiàn)在性能監(jiān)控、容災(zāi)備份兩方面:
1)性能監(jiān)控:在多云異構(gòu)環(huán)境下,IT系統(tǒng)的隱患和故障類型更加復(fù)雜,多因素故障成為主要的故障類型,故障排查難度上升,而傳統(tǒng)的、單點式的故障監(jiān)控分析工具已經(jīng)難以滿足運維人員的需求,成為提升服務(wù)恢復(fù)時間、應(yīng)用交付穩(wěn)定性的主要瓶頸之一。
面對大量的多因素、關(guān)聯(lián)性故障,APM工具能夠幫助企業(yè)進(jìn)行更加深度和多維度的監(jiān)控分析,能夠通過基礎(chǔ)監(jiān)控協(xié)議、字節(jié)碼探針、SDK/API等方式觸達(dá)包括IaaS、PaaS、應(yīng)用層、日志文件等在內(nèi)的各類IT資源,獲取指標(biāo)數(shù)據(jù)并進(jìn)行關(guān)聯(lián)分析,實現(xiàn)跨越異構(gòu)云環(huán)境的故障定位。
相比于APM,CMP更傾向于提供針對多云環(huán)境的整體運維管理解決方案,在提供多云資源納管和成本優(yōu)化的基礎(chǔ)上,同樣能夠針對多云異構(gòu)的IaaS、PaaS資源提供一系列監(jiān)控告警服務(wù)。此外,容器云廠商的微服務(wù)治理平臺在面向微服務(wù)架構(gòu)應(yīng)用的監(jiān)控方面存在明顯優(yōu)勢。
因此,APM、CMP、微服務(wù)治理平臺等性能監(jiān)控工具的價值,在于能夠幫助企業(yè)降低服務(wù)恢復(fù)時間,提升應(yīng)用交付的穩(wěn)定性和總體效能。
2)容災(zāi)備份:在多云異構(gòu)環(huán)境下,因為私有云、VMWare虛擬機、公有云、跨云網(wǎng)絡(luò)中的各類故障而造成的業(yè)務(wù)中斷風(fēng)險明顯增加,同時由于業(yè)務(wù)創(chuàng)新需求,多云架構(gòu)往往需要進(jìn)行更加頻繁的資源變更,這些都對于應(yīng)用的交付穩(wěn)定性、業(yè)務(wù)連續(xù)性能力提出了更高要求。因此,企業(yè)的容災(zāi)備份需求大大提升。但是,傳統(tǒng)IOE廠商的災(zāi)備技術(shù)較為笨重,難以適應(yīng)云計算環(huán)境下高頻的災(zāi)備需求。
因此,基于云計算技術(shù)的云災(zāi)備平臺能夠有效提升多云環(huán)境中的災(zāi)備效率,同時降低成本,優(yōu)勢主要體現(xiàn)在兼容性、高效性兩方面。在兼容性方面,云災(zāi)備支持平臺架構(gòu)解耦,兼容各種虛擬化平臺和云平臺,如VMWare、KVM、OpenStack等,無廠商綁定限制。在高效性方面,云災(zāi)備平臺支持精簡復(fù)制、斷點續(xù)傳、即時負(fù)載接管應(yīng)急、多副本負(fù)載演練等功能,能夠提升災(zāi)備的成功率和靈活性,將災(zāi)備演練的周期縮短,并通過應(yīng)急接管能力提升多云服務(wù)的業(yè)務(wù)連續(xù)性。
因此,云災(zāi)備平臺的價值在于能夠有效提升企業(yè)的業(yè)務(wù)連續(xù)性,最終提升應(yīng)用交付的穩(wěn)定性和整體效能。
總體來看,多云異構(gòu)環(huán)境下的監(jiān)控災(zāi)備環(huán)節(jié),主要挑戰(zhàn)在于復(fù)雜的異構(gòu)環(huán)境對性能監(jiān)控、容災(zāi)備份的自動化、標(biāo)準(zhǔn)化程度帶來挑戰(zhàn),運維人員可能會因此增加人工操作頻次,從而增加失敗率和服務(wù)恢復(fù)時間,最終降低應(yīng)用交付的穩(wěn)定性和總體效能。
而解決這一挑戰(zhàn)的主要途徑是通過CMP、APM、微服務(wù)治理平臺、云災(zāi)備平臺等ITOM工具實現(xiàn)面向多云異構(gòu)環(huán)境的運維過程自動化和標(biāo)準(zhǔn)化。
5.哪些云計算新趨勢將為企業(yè)創(chuàng)造更多價值?
展望未來,隨著云計算技術(shù)深入到企業(yè)的業(yè)務(wù)中,必然會催生兩方面需求:一方面是更好地讓云計算的低成本、高性能算力為企業(yè)的數(shù)據(jù)利用服務(wù),加速企業(yè)的業(yè)務(wù)創(chuàng)新;另一方面是將云計算與傳統(tǒng)網(wǎng)絡(luò)拓?fù)溥M(jìn)行無縫融合,從而更好地為擁有大量歷史遺留IT資源的傳統(tǒng)型、集團型企業(yè)提供全面上云的支撐。
5.1面向數(shù)據(jù)密集型應(yīng)用的云原生技術(shù)中臺
5.1.1數(shù)據(jù)密集型應(yīng)用面臨的生命周期管理挑戰(zhàn)
相比于底層的IT基礎(chǔ)設(shè)施,數(shù)據(jù)和企業(yè)業(yè)務(wù)的聯(lián)系更加緊密。因此,對數(shù)據(jù)普遍應(yīng)用是企業(yè)數(shù)字化轉(zhuǎn)型的最直接表現(xiàn),它能夠為企業(yè)帶來業(yè)務(wù)營收和生產(chǎn)效率的增長,同時有效改善客戶體驗。
企業(yè)對數(shù)據(jù)進(jìn)行利用的歷史非常悠久,從早期的面向主題的數(shù)據(jù)倉庫建設(shè)與OLAP分析,到后來的大數(shù)據(jù)技術(shù)、機器學(xué)習(xí)與深度學(xué)習(xí)的興起,數(shù)據(jù)的利用深度以及產(chǎn)生的價值也在不斷進(jìn)化。
但是企業(yè)數(shù)字化轉(zhuǎn)型進(jìn)程的不斷推進(jìn),數(shù)據(jù)維度、數(shù)據(jù)類型的越來越復(fù)雜,企業(yè)面臨的業(yè)務(wù)訴求越來越復(fù)雜,對數(shù)據(jù)利用效率的要求越來越高,使得原有的數(shù)據(jù)利用過程遇到了效率瓶頸。
在這樣的背景下,如何從應(yīng)用管理的角度出發(fā),將數(shù)據(jù)利用過程轉(zhuǎn)化為包括開發(fā)、部署、編排、持續(xù)測試和優(yōu)化等環(huán)節(jié)在內(nèi)的數(shù)據(jù)密集型應(yīng)用的生命周期管理過程,已經(jīng)成為企業(yè)IT與組織能力的核心挑戰(zhàn)之一。
但是,DevOps過去僅僅關(guān)注的是非數(shù)據(jù)密集型的的應(yīng)用,對于以數(shù)據(jù)密集型應(yīng)用的關(guān)注較少,但兩者存在截然不同的需求:
1)數(shù)據(jù)帶來的管理挑戰(zhàn):面向非數(shù)據(jù)密集型應(yīng)用的DevOps主要關(guān)注代碼、工具、基礎(chǔ)設(shè)施和人員之間的關(guān)系,而數(shù)據(jù)密集型應(yīng)用的開發(fā)過程則增加了數(shù)據(jù)這一額外的元素,它比其他幾者的管理難度更高,需要通過有效的數(shù)據(jù)治理過程來整合多個數(shù)據(jù)源,同時保證數(shù)據(jù)質(zhì)量,最終使得數(shù)據(jù)達(dá)到“業(yè)務(wù)就緒”狀態(tài)。
2)數(shù)據(jù)帶來的工具和人員的挑戰(zhàn):數(shù)據(jù)密集型應(yīng)用的開發(fā)和維護(hù)過程需要依賴于不同于非數(shù)據(jù)密集型應(yīng)用開發(fā)的技術(shù)棧和工具,包括數(shù)據(jù)建模語言,以及傳統(tǒng)的ETL/ELT、元數(shù)據(jù)管理、主數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量工具,再到數(shù)據(jù)可視化BI工具和數(shù)據(jù)科學(xué)工具,而涉及到的人員也發(fā)生了改變,比如數(shù)據(jù)庫管理員、數(shù)據(jù)分析師、數(shù)據(jù)科學(xué)家、業(yè)務(wù)或運營人員等。
因此,近些年業(yè)內(nèi)有人提出了面向數(shù)據(jù)密集型應(yīng)用的生命周期管理理念——DataOps,它嘗試將數(shù)據(jù)、代碼、工具、基礎(chǔ)架構(gòu)和人員進(jìn)行標(biāo)準(zhǔn)化的流程管理,最終提高數(shù)據(jù)開發(fā)過程的生產(chǎn)能力、可重復(fù)性、敏捷性和自助服務(wù)能力,最終實現(xiàn)數(shù)據(jù)科學(xué)模型持續(xù)部署和優(yōu)化。但目前DataOps的具體模式尚不成熟,仍然在持續(xù)探索中。
同時,云計算逐步發(fā)展出為數(shù)據(jù)型應(yīng)用提供計算、存儲、分析、服務(wù)和生命周期管理能力的PaaS——DaaS(既包括了面向數(shù)據(jù)存儲的DB PaaS,又包括了面向數(shù)據(jù)分析和AI建模的Business Analytics PaaS),也就是通常所說的數(shù)據(jù)中臺和AI中臺,它將數(shù)據(jù)開發(fā)過程變成一項能夠在云計算平臺中按需取用的服務(wù)。
5.1.2 云原生技術(shù)實現(xiàn)提供多云、多數(shù)據(jù)中心數(shù)字化應(yīng)用解決方案
然而,面向數(shù)據(jù)密集型應(yīng)用的DaaS與生命周期管理過程,在云計算平臺上的實踐中仍然會面臨一系列挑戰(zhàn):
1)環(huán)境異構(gòu)性的挑戰(zhàn):傳統(tǒng)領(lǐng)域企業(yè)在數(shù)據(jù)應(yīng)用實踐中,往往會面臨多云、多數(shù)據(jù)中心等異構(gòu)環(huán)境,而異構(gòu)環(huán)境會直接影響數(shù)據(jù)匯集和利用的效率,從而影響數(shù)據(jù)密集型應(yīng)用開發(fā)的整體效率。
2)生產(chǎn)環(huán)境性能的挑戰(zhàn):數(shù)據(jù)密集型應(yīng)用在生產(chǎn)部署環(huán)境中需要進(jìn)行大量的數(shù)據(jù)處理和模型推理,對于計算的并發(fā)性要求更高,單臺服務(wù)器上部署多個業(yè)務(wù)會產(chǎn)生資源競爭,但虛擬化會產(chǎn)生明顯的性能損耗,需要輕量化的隔離部署環(huán)境。
3)數(shù)據(jù)交換合規(guī)性的挑戰(zhàn):非數(shù)據(jù)密集型應(yīng)用的開發(fā)測試過程可以不依賴于真實數(shù)據(jù)源,但是數(shù)據(jù)密集型應(yīng)用則不同,由于其需要進(jìn)行數(shù)據(jù)建模和機器學(xué)習(xí)等過程,必然需要依賴于大量真實數(shù)據(jù)。但是,在多云、多數(shù)據(jù)中心的環(huán)境中,企業(yè)或組織往往需要對割裂在不同地域、不同組織中的數(shù)據(jù)進(jìn)行統(tǒng)一匯集,共同進(jìn)行數(shù)據(jù)分析和建模。但是,部分行業(yè)和領(lǐng)域?qū)?shù)據(jù)的合規(guī)性限制往往阻礙了數(shù)據(jù)的跨地域、跨組織的匯集與利用。
面對這些挑戰(zhàn),基于Docker、Kubernetes等云原生技術(shù)構(gòu)建跨多云、多數(shù)據(jù)中心的DataOps成為企業(yè)的必然選擇。
星環(huán)科技“聯(lián)邦云”助力上海市數(shù)據(jù)交換共享中心實現(xiàn)“一網(wǎng)通辦”
星環(huán)科技是一家專注于企業(yè)級容器云計算、大數(shù)據(jù)和人工智能核心平臺產(chǎn)品研發(fā)的科技服務(wù)商,旗下的Transwarp Data Cloud(TDC)是一個涵蓋了基于容器的數(shù)據(jù)中心云操作系統(tǒng)、數(shù)據(jù)平臺服務(wù)、分析平臺服務(wù)、應(yīng)用平臺服務(wù)的全棧數(shù)據(jù)云平臺,實現(xiàn)了“大數(shù)據(jù)+云+人工智能”的融合,幫助企業(yè)構(gòu)建從底層IT基礎(chǔ)設(shè)施,到數(shù)據(jù)服務(wù)化和應(yīng)用化的企業(yè)級IT基礎(chǔ)設(shè)施能力平臺,產(chǎn)品架構(gòu)如下圖所示。
在TDC產(chǎn)品的基礎(chǔ)上,星環(huán)科技推出了TDC聯(lián)邦云解決方案,通過將跨多個數(shù)據(jù)中心甚至公有云的數(shù)據(jù)、應(yīng)用和基礎(chǔ)設(shè)施資源進(jìn)行統(tǒng)一管理,協(xié)同管理企業(yè)內(nèi)部已有的資源和數(shù)據(jù),從而構(gòu)建一套完整、統(tǒng)一、互聯(lián)互通的數(shù)字化基礎(chǔ)設(shè)施。
聯(lián)邦云解決方案具備數(shù)據(jù)聯(lián)邦、聯(lián)邦計算、聯(lián)邦學(xué)習(xí)等多方面的數(shù)據(jù)共享利用能力:
1)數(shù)據(jù)聯(lián)邦通過多租戶的方式對數(shù)據(jù)進(jìn)行匯集和共享,保證數(shù)據(jù)安全;
2)聯(lián)邦計算實現(xiàn)跨數(shù)據(jù)中心和云的數(shù)據(jù)庫全局視圖,實現(xiàn)在不移動數(shù)據(jù)的情況下進(jìn)行SQL查詢和合規(guī)性審核;
3)聯(lián)邦學(xué)習(xí)實現(xiàn)跨數(shù)據(jù)中心和云的AI模型訓(xùn)練和迭代,無需進(jìn)行數(shù)據(jù)遷移。
星環(huán)科技TDC“聯(lián)邦云”解決方案的典型客戶是上海市人民政府主管的上海市大數(shù)據(jù)中心,其成立背景是上海市市委辦公廳、市政府辦公廳頒布《上海市全面推進(jìn)“一網(wǎng)通辦”加快建設(shè)智慧政府工作方案》,明確提出“以電子政務(wù)云為基礎(chǔ),以跨部門、跨層級應(yīng)用為抓手,統(tǒng)籌構(gòu)建‘云數(shù)聯(lián)動’的數(shù)據(jù)共享交換平臺,實現(xiàn)重要信息系統(tǒng)通過統(tǒng)一平臺進(jìn)行數(shù)據(jù)共享交換,打通各部門信息系統(tǒng)、打破‘?dāng)?shù)據(jù)孤島’”。
為了實現(xiàn)這一目標(biāo),上海市大數(shù)據(jù)中心建設(shè)上海市數(shù)據(jù)共享交換平臺,包含市級數(shù)據(jù)交換子系統(tǒng)、市級數(shù)據(jù)湖、市級數(shù)據(jù)庫、數(shù)據(jù)集成子系統(tǒng)、市級數(shù)據(jù)治理子系統(tǒng)、數(shù)據(jù)服務(wù)子系統(tǒng)等業(yè)務(wù)模塊。
其中,市級數(shù)據(jù)湖匯聚“四大庫”、“市級統(tǒng)建系統(tǒng)”、“各市級委辦系統(tǒng)”、“各行政區(qū)系統(tǒng)”的經(jīng)過初始治理的原始數(shù)據(jù),市級數(shù)據(jù)庫主要用于存放經(jīng)過一系列清洗、轉(zhuǎn)換、加載、治理步驟后的高質(zhì)量的政務(wù)數(shù)據(jù)資源,其數(shù)據(jù)來源主要來自數(shù)據(jù)湖;數(shù)據(jù)集成子系統(tǒng)實現(xiàn)對數(shù)據(jù)湖數(shù)據(jù)的存儲管理、共享與交換,推送數(shù)據(jù)到治理平臺,并建立與市級數(shù)據(jù)庫的連接。
在項目中,星環(huán)科技基于TDC為上海市大數(shù)據(jù)中心數(shù)據(jù)共享交換平臺提供大數(shù)據(jù)支撐管理子系統(tǒng),匯集了統(tǒng)一、標(biāo)準(zhǔn)、完整的人口信息數(shù)據(jù)庫、法人單位基礎(chǔ)信息庫、自然和地理基礎(chǔ)信息庫及電子證照信息庫四大庫信息,49家市級委辦政務(wù)數(shù)據(jù)及交換日志數(shù)據(jù),構(gòu)建三級數(shù)據(jù)共享交換體系,保障數(shù)據(jù)安全,支撐“一網(wǎng)通辦”、“市民主頁”等數(shù)據(jù)服務(wù)能力。
星環(huán)科技的項目實施成果主要體現(xiàn)在一網(wǎng)通辦、政務(wù)大屏、政務(wù)決策支持三方面。
1)一網(wǎng)通辦:把政務(wù)數(shù)據(jù)歸集到共享交換平臺,打通分散的信息和材料;提供政務(wù)服務(wù)、便民服務(wù)、企業(yè)服務(wù)等類服務(wù);解決企業(yè)和群眾“辦不完的手續(xù)、蓋不完的章、跑不完的路”等麻煩,提高政府辦事效率;將面向企業(yè)和群眾的所有線上線下服務(wù)事項,逐步做到一網(wǎng)受理、只跑一次、一次辦成。
2)政務(wù)大屏:通過挖掘和提煉數(shù)據(jù)庫中不同主題的政務(wù)數(shù)據(jù)的詳盡指標(biāo),將領(lǐng)導(dǎo)決策層最關(guān)心的數(shù)據(jù)指標(biāo)維度形象化、直觀化、具體化地“一站式”展現(xiàn),達(dá)到為智慧政務(wù)管理做決策支撐的目的。典型的應(yīng)用包括宏觀經(jīng)濟地圖、人口與信用地圖、低碳能耗地圖等。
3)政務(wù)決策支持:在經(jīng)濟預(yù)測、科技創(chuàng)新、城市規(guī)劃等方面為政府提供決策支持,比如:從宏觀到微觀、行業(yè)和區(qū)域等幾個維度的關(guān)聯(lián)展示,層層揭示各個層級的經(jīng)濟發(fā)展?fàn)顩r,并通過最終需求法等宏觀建模對經(jīng)濟增長水平進(jìn)行預(yù)測和敏感度分析;根據(jù)流行的SCP(結(jié)構(gòu)-行為-績效)范式,從科技政策、人才與資金投入切入,分析科技產(chǎn)業(yè)結(jié)構(gòu)、發(fā)展現(xiàn)狀和產(chǎn)業(yè)績效,并從科技園區(qū)、項目申報等角度展示科技政策的成效;通過對特定功能區(qū)、土地板塊、自貿(mào)區(qū)等城市功能承載區(qū)的量化分析,并疊加相關(guān)人員流動和分布狀況,綜合分析城市規(guī)劃效果和優(yōu)化空間。
總體來看,跨云和數(shù)據(jù)中心的DataOps所應(yīng)具備的核心能力包括:
1)能夠為數(shù)據(jù)密集型應(yīng)用的開發(fā)、測試、部署過程提供一致性的環(huán)境,從而有效提升數(shù)據(jù)開發(fā)效率,降低人工介入頻次;
2)能夠為數(shù)據(jù)分析和模型推理過程提供輕量級隔離的生產(chǎn)部署環(huán)境,以達(dá)到高并發(fā)的計算性能,可直接部署在物理機、公有云的裸金屬服務(wù)器中,以降低因虛擬化而產(chǎn)生的性能損耗;
3)為跨地域、跨機構(gòu)的數(shù)據(jù)匯集與利用提供權(quán)限相互隔離的多租戶環(huán)境,有效保證數(shù)據(jù)的安全合規(guī)性。
按照數(shù)據(jù)利用的階段來看,面向數(shù)據(jù)密集型應(yīng)用的云原生技術(shù)中臺又大體包括云原生數(shù)據(jù)中臺、云原生AI中臺兩類。
1)云原生數(shù)據(jù)中臺:基于各類數(shù)據(jù)庫、數(shù)據(jù)倉庫、數(shù)據(jù)集市,承擔(dān)數(shù)據(jù)接入、數(shù)據(jù)治理、數(shù)據(jù)資產(chǎn)管理、數(shù)據(jù)建模等工作,降低開發(fā)門檻,提升開發(fā)效率。
2)云原生AI中臺:一般需要建立在云原生數(shù)據(jù)中臺的基礎(chǔ)上,打通從數(shù)據(jù)存儲、數(shù)據(jù)分析、數(shù)據(jù)建模到AI算法的數(shù)據(jù)管道,實現(xiàn)面向自然語言、音視頻、非結(jié)構(gòu)化數(shù)據(jù)等多模態(tài)數(shù)據(jù)的機器學(xué)習(xí)、深度學(xué)習(xí),提供低門檻、高效率的AI模型訓(xùn)練、部署與持續(xù)優(yōu)化能力。
綜上所述,云計算技術(shù)未來如果要進(jìn)一步深入企業(yè)業(yè)務(wù)中,進(jìn)一步推動企業(yè)數(shù)字化轉(zhuǎn)型和業(yè)務(wù)創(chuàng)新,并幫助企業(yè)克服因異構(gòu)的傳統(tǒng)IT、多云、多數(shù)據(jù)中心環(huán)境帶來應(yīng)用交付困難,云原生的數(shù)據(jù)中臺與AI中臺將成為其重要的發(fā)展趨勢。
5.2云網(wǎng)融合趨勢重塑傳統(tǒng)網(wǎng)絡(luò)管理模式
隨著云計算深度地融入到傳統(tǒng)型、集團型企業(yè)的業(yè)務(wù)之中,它必然要與企業(yè)原有的網(wǎng)絡(luò)技術(shù)架構(gòu)發(fā)生融合。在這樣的背景下,通過“云網(wǎng)融合”重塑傳統(tǒng)ICT架構(gòu)正在成為云計算發(fā)展的另一項前沿趨勢。
云網(wǎng)融合的主要驅(qū)動力可以歸結(jié)為傳統(tǒng)型、集團型企業(yè)上云過程中的兩個IT架構(gòu)變化趨勢:
1)資源的異地化:正如第一章所述,傳統(tǒng)型企業(yè)的業(yè)務(wù)創(chuàng)新驅(qū)動了各類創(chuàng)新型應(yīng)用的誕生,常常會產(chǎn)生對公有云的需求。此外,為了滿足企業(yè)在不同地域的IT服務(wù)能力,實現(xiàn)核心系統(tǒng)的全面上云,企業(yè)還可能會在多個地域、多個分支機構(gòu)建設(shè)數(shù)據(jù)中心或機房,并進(jìn)行私有云、虛擬化的建設(shè)。以上這兩種因素都推動了企業(yè)IT與云資源的異地化趨勢。
在這樣的背景下,企業(yè)為了提升對外和對內(nèi)的IT服務(wù)和響應(yīng)能力,需要通過專線、VPN、SD-WAN等廣域網(wǎng)技術(shù)實現(xiàn)在異地資源之間實現(xiàn)低延時網(wǎng)絡(luò)互聯(lián),并提升網(wǎng)絡(luò)開通和變更的效率。
2)資源異構(gòu)化:由于創(chuàng)新型業(yè)務(wù)、傳統(tǒng)型和核心型業(yè)務(wù)的不同需求,企業(yè)在這些資源進(jìn)行IT建設(shè)和上云過程中,必然會產(chǎn)生包括各類物理資源與虛擬資源、專屬資源與共享資源在內(nèi)的異構(gòu)資源池。由于傳統(tǒng)型企業(yè)業(yè)務(wù)的相對穩(wěn)定性,這些異構(gòu)資源池將會長期存在于IT架構(gòu)中,因此隨著時間推進(jìn),它們內(nèi)部的、之間的網(wǎng)絡(luò)拓?fù)浼軜?gòu)都會變得越來越復(fù)雜。
對于電信運營商、第三方數(shù)據(jù)中心運營商、廣電等對網(wǎng)絡(luò)服務(wù)能力具有苛刻要求的行業(yè)來說,過去依托于專業(yè)物理設(shè)備、依賴人工操作的網(wǎng)絡(luò)配置過程極大影響了網(wǎng)絡(luò)配置和變更效率。因此,這類企業(yè)亟需通過SDN、NFV等技術(shù)實現(xiàn)網(wǎng)絡(luò)的自動配置、拓?fù)潇`活調(diào)整、自動化編排、協(xié)同調(diào)度等能力,即網(wǎng)絡(luò)的云化。
云間互聯(lián)、網(wǎng)絡(luò)云化這兩種云網(wǎng)融合方式在具有多數(shù)據(jù)中心和公有云的企業(yè)內(nèi),表現(xiàn)方式如下圖所示。
分布式邊緣云是多云異構(gòu)環(huán)境的另一種表現(xiàn),它在地市、區(qū)縣、園區(qū)等各個級別的邊緣云由于一般不具備駐場的專業(yè)網(wǎng)絡(luò)人員,同樣需要通過SDN/NFV等技術(shù)來實現(xiàn)網(wǎng)絡(luò)配置的自動化和網(wǎng)絡(luò)服務(wù)的編排,如下圖所示。
此外,由于邊緣云的機房環(huán)境條件的差異往往十分巨大,比如,地市級機房的網(wǎng)絡(luò)資源相對充足,但區(qū)縣級以下機房的網(wǎng)絡(luò)資源相對緊缺,因此SDN部署同樣應(yīng)當(dāng)做出相應(yīng)的適配,實現(xiàn)輕量化的部署方案。
結(jié)語
2010年代,混合云與多云是云計算應(yīng)用的前沿趨勢,它是云計算不斷滿足企業(yè)差異化業(yè)務(wù)形態(tài)過程中出現(xiàn)的必然結(jié)果。
2020年代,除了混合云與多云的趨勢將進(jìn)一步深化,近場化、場景化、融合化將成為云計算應(yīng)用的三大最新趨勢。
邊緣計算驅(qū)動的近場化趨勢,讓云計算算力的空間位置更加貼近企業(yè)現(xiàn)場,加強了云計算對邊緣側(cè)的數(shù)據(jù)利用能力,從而為企業(yè)提供更加低時延、低成本、沉浸式的數(shù)據(jù)利用支撐;
DaaS與DataOps驅(qū)動的場景化趨勢,讓云計算算力的邏輯層次更加貼近企業(yè)業(yè)務(wù),加強了云計算的數(shù)據(jù)利用效能,從而進(jìn)一步驅(qū)動了企業(yè)的業(yè)務(wù)創(chuàng)新;
云網(wǎng)融合驅(qū)動的融合化趨勢,讓云計算基礎(chǔ)架構(gòu)與企業(yè)、地方、全國、全球等各個范圍的ICT基礎(chǔ)設(shè)施實現(xiàn)高度融合,雙方開始呈現(xiàn)“你中有我,我中有你”的狀態(tài),最終使得企業(yè)經(jīng)營、個人生活都與云計算結(jié)合得更加緊密而深刻。
未來,愛分析將持續(xù)而深入地追蹤云計算的最前沿趨勢在各個行業(yè)內(nèi)的落地進(jìn)展和最佳實踐。