導(dǎo)讀:在最近對(duì)云計(jì)算的所有關(guān)注中,存儲(chǔ)更多地被視為基礎(chǔ)平臺(tái)。時(shí)至今日,許多云計(jì)算提供的僅僅局限于CPU內(nèi)核的集合,定量的內(nèi)存分配,低轉(zhuǎn)速存儲(chǔ),或者還有一些面向互聯(lián)網(wǎng)的IP技術(shù)。近來(lái),出現(xiàn)了有趣的與云計(jì)算和存儲(chǔ)相關(guān)的高級(jí)技術(shù),特別是使用Web Services訪(fǎng)問(wèn)方式,使得訪(fǎng)問(wèn)存儲(chǔ)不再受限于設(shè)備文件或者NFS加載點(diǎn)。
在最近對(duì)云計(jì)算的所有關(guān)注中,存儲(chǔ)更多地被視為基礎(chǔ)平臺(tái)。時(shí)至今日,許多云計(jì)算提供的僅僅局限于CPU內(nèi)核的集合,定量的內(nèi)存分配,低轉(zhuǎn)速存儲(chǔ),或者還有一些面向互聯(lián)網(wǎng)的IP技術(shù)。近來(lái),出現(xiàn)了有趣的與云計(jì)算和存儲(chǔ)相關(guān)的高級(jí)技術(shù),特別是使用Web Services訪(fǎng)問(wèn)方式,使得訪(fǎng)問(wèn)存儲(chǔ)不再受限于設(shè)備文件或者NFS加載點(diǎn)。
典型的數(shù)據(jù)存儲(chǔ)和管理的“企業(yè)級(jí)特征”在IT架構(gòu)創(chuàng)新上不斷推成出新。存儲(chǔ)架構(gòu)師意識(shí)到這些特征對(duì)于關(guān)鍵業(yè)務(wù)和生產(chǎn)應(yīng)用非常重要,但目前的云計(jì)算還缺乏這些特征。本篇白皮書(shū)的目標(biāo)是描述企業(yè)云計(jì)算中存儲(chǔ)必備的6個(gè)要素。
一、要素1:性能
性能需要付出成本。在一個(gè)架構(gòu)良好的應(yīng)用里,性能和成本處于平衡狀態(tài)。達(dá)到這點(diǎn)的關(guān)鍵是使用合適的技術(shù)去匹配企業(yè)業(yè)務(wù)應(yīng)用的性能,首先要求將企業(yè)的業(yè)務(wù)語(yǔ)言轉(zhuǎn)換成IT模式。因?yàn)檫@種轉(zhuǎn)換困難,通常企業(yè)止步于靜態(tài)的IT架構(gòu),無(wú)法應(yīng)對(duì)業(yè)務(wù)變化著的性能需求。企業(yè)云計(jì)算提供了一個(gè)更能應(yīng)對(duì)變化著的性能需求的平臺(tái)。
在早期的云計(jì)算平臺(tái)里,存儲(chǔ)I/O一般都會(huì)有較高的延遲。這是因?yàn)閺S(chǎng)商注意到使云計(jì)算的數(shù)據(jù)更容易訪(fǎng)問(wèn),但沒(méi)注意到提高與性能、帶寬和IOPS相關(guān)的服務(wù)級(jí)別。有兩個(gè)原因?qū)е卵舆t較高:訪(fǎng)問(wèn)的模式和類(lèi)型,以及存儲(chǔ)分布的配置。
訪(fǎng)問(wèn)模式包括位于OSI模型物理層之上的多層協(xié)議的組合(如SOAP, NFS, TCP, IP和FCP)。數(shù)據(jù)訪(fǎng)問(wèn)包括共享的物理服務(wù)層(如以太網(wǎng))和幾個(gè)協(xié)議層(如SOAP或NFS),一般比專(zhuān)門(mén)的物理層(如FC)產(chǎn)生更多的延遲。市場(chǎng)上大多數(shù)云計(jì)算平臺(tái)包括Internet的數(shù)據(jù)訪(fǎng)問(wèn),產(chǎn)生了更多的數(shù)據(jù)訪(fǎng)問(wèn)延遲。
對(duì)于存儲(chǔ)介質(zhì),大多數(shù)云計(jì)算的市場(chǎng)在RAID或JBOD配置中使用SATA磁盤(pán)。因?yàn)镾ATA(有段時(shí)間被視為近線(xiàn)磁盤(pán))的性能一般比企業(yè)磁盤(pán)(一般指FC盤(pán))稍差一些,導(dǎo)致存儲(chǔ)設(shè)備的性能低于應(yīng)用的需求。
當(dāng)你采用低性能存儲(chǔ)介質(zhì)的相對(duì)低帶寬和高延遲的訪(fǎng)問(wèn)模式時(shí),使用整個(gè)存儲(chǔ)子系統(tǒng)的企業(yè)無(wú)法支持更多的關(guān)鍵業(yè)務(wù)應(yīng)用的需求。其結(jié)果是,這種方案通常僅適用于測(cè)試和開(kāi)發(fā)。
相比來(lái)說(shuō),企業(yè)云計(jì)算平臺(tái)需要提供更多不同性能存儲(chǔ)層的選擇。當(dāng)性能需求的變化時(shí),例如,應(yīng)用從測(cè)試遷移到生產(chǎn)環(huán)境,存儲(chǔ)平臺(tái)應(yīng)該能使用這種變化。理想的企業(yè)云計(jì)算的存儲(chǔ)應(yīng)該有多種性能區(qū),能夠被調(diào)整,以提供合適的I/O性能級(jí)別給業(yè)務(wù)性能的需求。
最后,為了滿(mǎn)足企業(yè)高端存儲(chǔ)的性能需求,云計(jì)算方案必須采用高于或者目前正在使用的企業(yè)級(jí)技術(shù)。一般使用FC SAN。此外,如何使用技術(shù)與技術(shù)本身同等重要。在一個(gè)系統(tǒng)管理環(huán)境里,企業(yè)級(jí)需求下的虛擬機(jī)配置必須能夠持續(xù)提供高性能
二、要素2:安全性
安全性和虛擬化通常被視為相互矛盾的。畢竟虛擬化使得應(yīng)用從物理硬件和網(wǎng)絡(luò)邊界中解放出來(lái)。安全性,換而言之,就是建立邊界。企業(yè)需要考慮虛擬化設(shè)計(jì)的初始架構(gòu)。
在大多數(shù)云計(jì)算市場(chǎng)里,無(wú)論公有的還是私有的,數(shù)據(jù)安全性都是基于信任的,這信任通常都在管理程序里。當(dāng)多數(shù)虛機(jī)共享物理LUN,CPU和內(nèi)存時(shí),由管理程序確保數(shù)據(jù)是否毀壞或者被錯(cuò)誤的虛機(jī)訪(fǎng)問(wèn)。這與集群服務(wù)器多年來(lái)面臨的基本挑戰(zhàn)相同。任何也許需要接管進(jìn)程的物理服務(wù)器必須能訪(fǎng)問(wèn)數(shù)據(jù)/應(yīng)用/操作系統(tǒng)的權(quán)限。例如,為了主機(jī)外備份,LUN也許需要映射給公共的備份服務(wù)器。
在企業(yè)云計(jì)算中,有兩種方式去保護(hù)業(yè)務(wù)數(shù)據(jù)。第一種涉及系統(tǒng)程序管理安全。主要的目標(biāo)是:系統(tǒng)盡可能少地被使用,避免任何虛擬機(jī)被其他虛擬機(jī)造成負(fù)面的影響。企業(yè)也需要保護(hù)LUN被其他服務(wù)器訪(fǎng)問(wèn),如同主機(jī)外備份服務(wù)器。
其他需要注意的地方是數(shù)據(jù)通道。企業(yè)必須注意只能給需要維護(hù)必要功能的物理服務(wù)器提供訪(fǎng)問(wèn)路徑。這可以通過(guò)NPIV(SAN N端口 ID虛擬化)使用得Zoning、LUN Masking、訪(fǎng)問(wèn)列表、權(quán)限配置來(lái)完成。
三、要素3:自動(dòng)ILM存儲(chǔ)
信息生命周期管理(ILM)曾經(jīng)成為非常有效的市場(chǎng)行為的重心,被那些出售分層存儲(chǔ)的廠(chǎng)商所推崇。雖然ILM本質(zhì)上非常簡(jiǎn)單 - 存儲(chǔ)的成本與數(shù)據(jù)的業(yè)務(wù)價(jià)值相匹配,實(shí)際的挑戰(zhàn)來(lái)自于真正的執(zhí)行效果,眾多所謂的ILM方案,粒度都不夠細(xì),難以達(dá)到這樣的目標(biāo)。
今天,傳統(tǒng)的ILM并沒(méi)有部署到市場(chǎng)上的大多數(shù)云計(jì)算平臺(tái)中。原因有兩個(gè),第一,在許多云計(jì)算中,大部分磁盤(pán)介質(zhì)采用處于典型ILM方案中的最低層存儲(chǔ),這樣就沒(méi)法把數(shù)據(jù)往更底層遷移,ILM也就無(wú)法部署。第二,許多企業(yè)不需要為云計(jì)算常用的計(jì)算類(lèi)型而更長(zhǎng)時(shí)間地管理數(shù)據(jù),因?yàn)閭鹘y(tǒng)云計(jì)算通常用于功能測(cè)試/開(kāi)發(fā)、概念驗(yàn)證(POC)、Web服務(wù)器測(cè)試等。考慮到多種因素,實(shí)施ILM策略所需細(xì)粒度的復(fù)雜性和成本與經(jīng)濟(jì)節(jié)省的云計(jì)算不相符。
根據(jù)一些行業(yè)報(bào)告,70%的數(shù)據(jù)是靜態(tài)的。通過(guò)將合適的數(shù)據(jù)存儲(chǔ)在合適的介質(zhì)上,企業(yè)能削減成本。他們能意識(shí)到通過(guò)部署云平臺(tái)能節(jié)省成本,在云計(jì)算中實(shí)施ILM帶來(lái)的經(jīng)濟(jì)效益意義重大。但前提是無(wú)需中斷應(yīng)用,而且不能增加不必要的操作復(fù)雜性。
為了做到這些,企業(yè)必須使用基于策略的塊級(jí)ILM方法,無(wú)論訪(fǎng)問(wèn)方式和應(yīng)用類(lèi)型。通過(guò)在數(shù)據(jù)塊一級(jí)跟蹤數(shù)據(jù)的屬性,就無(wú)需在操作系統(tǒng)這一級(jí)執(zhí)行數(shù)據(jù)歸檔或數(shù)據(jù)遷移。這種方法還能獨(dú)立于操作系統(tǒng)類(lèi)型,且獨(dú)立于用于存儲(chǔ)數(shù)據(jù)的訪(fǎng)問(wèn)方式。它不僅在保持性能(所有的數(shù)據(jù)寫(xiě)入都在高速層完成)的同時(shí)優(yōu)化存儲(chǔ)的成本,而且通過(guò)將不使用的數(shù)據(jù)塊沉淀到低速層減少電能的消耗。這很合理,因?yàn)榻€(xiàn)存儲(chǔ)僅消耗企業(yè)存儲(chǔ)的大約20%的能耗。為此,要做到真正適合企業(yè)級(jí)應(yīng)用的自動(dòng)分級(jí)存儲(chǔ),卷級(jí)或文件級(jí)數(shù)據(jù)遷移無(wú)法勝任,顆粒度必須細(xì)化到數(shù)據(jù)塊級(jí)。只有數(shù)據(jù)塊級(jí)的數(shù)據(jù)遷移才可能獨(dú)立于操作系統(tǒng)類(lèi)型,且獨(dú)立于存儲(chǔ)數(shù)據(jù)的訪(fǎng)問(wèn)方式,做到對(duì)應(yīng)用支持的隨需相應(yīng)。
四、要素4:存儲(chǔ)訪(fǎng)問(wèn)模式
訪(fǎng)問(wèn)存儲(chǔ)空間有三種主流方式:基于數(shù)據(jù)塊(FC SAN或iSCSI)、基于文件(CIFS/NFS)、或通過(guò)Web服務(wù)。基于塊和文件的訪(fǎng)問(wèn)方式在企業(yè)應(yīng)用中最常見(jiàn),能更好地控制性能、可用性和安全性。在這點(diǎn)上,市場(chǎng)上大多數(shù)云計(jì)算平臺(tái)利用Web服務(wù)的接口,如SOAP和REST(代表性狀態(tài)傳輸)訪(fǎng)問(wèn)數(shù)據(jù)。雖然,這是最靈活的方式,但有性能的影響。理想的情況是,企業(yè)云提供全部的三種訪(fǎng)問(wèn)存儲(chǔ)的方式來(lái)支持不同應(yīng)用架構(gòu)。
五、要素5:可用性
IT架構(gòu)的維護(hù)窗口被大量的縮減,因?yàn)槠髽I(yè)需要支持在不同時(shí)區(qū)的用戶(hù)并保證全天候的可用性。雖然服務(wù)級(jí)別協(xié)議(SLA)一般與可用性密不可分,從業(yè)務(wù)角度看,它難以衡量,因?yàn)橛兄喾N架構(gòu)的復(fù)合SLA的重疊。
在前面提到,在市場(chǎng)上大多數(shù)云計(jì)算平臺(tái)中,I/O性能最先得到考慮。如果云平臺(tái)依賴(lài)于不被內(nèi)部IT集團(tuán)管理的部分架構(gòu),那么冗余的架構(gòu)部分和途徑是減少停機(jī)風(fēng)險(xiǎn)的最佳方式。雖然,云存儲(chǔ)服務(wù)提供商在考慮成本的同時(shí)繼續(xù)增加可用性,但是目前市場(chǎng)上的服務(wù)級(jí)別協(xié)議不能滿(mǎn)足企業(yè)關(guān)鍵應(yīng)用的需求。
在高端的企業(yè)級(jí)云計(jì)算中,存儲(chǔ)系統(tǒng)夠出來(lái)企業(yè)內(nèi)的企業(yè)級(jí)存儲(chǔ)方案,包括多路徑、控制器、不同的光纖網(wǎng)、RAID技術(shù)、端到端的架構(gòu)控制/監(jiān)控,和成熟的變更管理過(guò)程。在低端的企業(yè)級(jí)云計(jì)算中,存儲(chǔ)可用性與今天市場(chǎng)上云計(jì)算平臺(tái)的服務(wù)水平相當(dāng)。為了提供企業(yè)需要的服務(wù)水平,企業(yè)級(jí)云存儲(chǔ)供應(yīng)商必須利用健全的架構(gòu)設(shè)計(jì)和被充分驗(yàn)證過(guò)的創(chuàng)新技術(shù)。
六、要素6:主數(shù)據(jù)保護(hù)
主數(shù)據(jù)指的是在線(xiàn)運(yùn)行的數(shù)據(jù)。主數(shù)據(jù)能夠采用單一技術(shù),或者結(jié)合多種技術(shù)進(jìn)行保護(hù)。一些常用的方法包括:RAID保護(hù)、多份拷貝、遠(yuǎn)程復(fù)制、快照、和持續(xù)數(shù)據(jù)保護(hù)。
在市場(chǎng)上大多數(shù)云計(jì)算平臺(tái)里,主數(shù)據(jù)保護(hù)的問(wèn)題常常留給用戶(hù)。今天,很少發(fā)現(xiàn)上述的方法在大眾云計(jì)算平臺(tái)中使用,因?yàn)榧夹g(shù)的復(fù)雜性和成本。有一些大眾云存儲(chǔ)方案通過(guò)維護(hù)數(shù)據(jù)的多份拷貝來(lái)保護(hù)主數(shù)據(jù),整個(gè)系統(tǒng)運(yùn)行沒(méi)有RAID保護(hù)的存儲(chǔ)里,以此降低成本。
企業(yè)級(jí)云的主數(shù)據(jù)保護(hù)應(yīng)該基于內(nèi)部企業(yè)級(jí)方案。當(dāng)方案的業(yè)務(wù)影響分析(BIA)需要時(shí),例如快照和容災(zāi)等可靠的技術(shù)應(yīng)該就緒。
內(nèi)部企業(yè)方案和企業(yè)云存儲(chǔ)的主要差別在于,主數(shù)據(jù)保護(hù)在方案中是如何綁定的。為了延續(xù)根據(jù)需要部署云環(huán)境的經(jīng)驗(yàn),各種選項(xiàng)必須打包,這樣服務(wù)能自動(dòng)部署。其結(jié)果是,將一系列綁定的選項(xiàng)打包,能夠應(yīng)對(duì)大量需求。也許不存在可以利用快照、遠(yuǎn)程復(fù)制等與客戶(hù)需求相匹配的技術(shù)。無(wú)論如何,多數(shù)用戶(hù)將意識(shí)到,常常需要犧牲靈活性去獲取在企業(yè)云中其它的管理好處。