導讀:北京2023年4月21日 -- 隨著云計算、大數(shù)據(jù)、人工智能等技術快速發(fā)展,越來越多的企業(yè)和組織加速數(shù)字化、智慧化轉型,并不斷擴大其數(shù)據(jù)中心計算、存儲和網(wǎng)絡設備的規(guī)模。據(jù)IDC統(tǒng)計,目前全球有600個超大規(guī)模的數(shù)據(jù)中心,每個都擁有超過5000臺服務器,預計到2025年,超大規(guī)模數(shù)據(jù)中心數(shù)量將超過890個。
北京2023年4月21日 -- 隨著云計算、大數(shù)據(jù)、人工智能等技術快速發(fā)展,越來越多的企業(yè)和組織加速數(shù)字化、智慧化轉型,并不斷擴大其數(shù)據(jù)中心計算、存儲和網(wǎng)絡設備的規(guī)模。據(jù)IDC統(tǒng)計,目前全球有600個超大規(guī)模的數(shù)據(jù)中心,每個都擁有超過5000臺服務器,預計到2025年,超大規(guī)模數(shù)據(jù)中心數(shù)量將超過890個。
數(shù)據(jù)中心規(guī)模持續(xù)、快速地增長創(chuàng)造了巨大的市場機遇,但隨著IT設備的數(shù)量不斷增加,IT環(huán)境和運維環(huán)境的復雜性與日俱增,任何的錯誤都可能導致數(shù)據(jù)中心系統(tǒng)故障,甚至業(yè)務中斷,對用戶造成巨大影響。對此,浪潮信息全新升級物理基礎設施管理平臺ISPIM,面向互聯(lián)網(wǎng)、金融、通信等行業(yè)的云邊數(shù)據(jù)中心,提供服務器、存儲、網(wǎng)絡設備的全生命周期統(tǒng)一智能化管理,讓數(shù)據(jù)中心設備運行全程無憂,保障用戶業(yè)務的穩(wěn)定運行。
IT設備繁多,數(shù)據(jù)中心運維面臨效率與穩(wěn)定性等多重挑戰(zhàn)
傳統(tǒng)數(shù)據(jù)中心運維人員要進行大量的設備上架、系統(tǒng)更新、運維等一系列的工作。隨著數(shù)據(jù)中心的規(guī)模化發(fā)展,服務器數(shù)量爆發(fā)式增長,設備種類多,各類故障發(fā)生的不確定性大,而且隨著數(shù)據(jù)中心設備的增加,原來粗放的能耗運維管理也需要更加精細化的管理。
首先是設備種類多,統(tǒng)一管理難度大。比如浪潮信息某跨國IT客戶,在美國加州、馬來西亞擁有多個數(shù)據(jù)中心,其中的服務器供應商、機型、配置多種多樣,運維人員工作量大且容易出錯。因此如何對多地數(shù)據(jù)中心,數(shù)萬臺甚至數(shù)百萬臺的異構設備進行跨地域、統(tǒng)一管理和監(jiān)控面臨很大的挑戰(zhàn)。
其次是存在的各類故障讓數(shù)據(jù)中心安全面臨不確定性。目前數(shù)據(jù)中心的故障率為1%~5%,故障出現(xiàn)概率雖然較低,但仍有可能對數(shù)據(jù)中心業(yè)務穩(wěn)定性造成嚴重的影響。如果不能有效進行故障精準定位、快速預警以及更進一步的處理,會增加服務器非計劃停機時間,對用戶造成重大影響。
同時還有數(shù)據(jù)中心能耗成本居高不下的問題。隨著數(shù)據(jù)中心設備規(guī)模不斷增長,能耗成本越來越高,能耗管理也成為了IT設備全生命周期管理的一部分。但傳統(tǒng)服務器運維模式無法單獨對服務器的功耗進行實時的監(jiān)控和統(tǒng)計,只能通過供電設備對整個機房(包含空調、照明、服務器等)耗電進行統(tǒng)計,能耗管理粒度粗。
浪潮信息ISPIM,數(shù)據(jù)中心設備的360度智能管家
面對數(shù)據(jù)中心的全新運維挑戰(zhàn),浪潮信息研發(fā)了一套完整的服務器全生命周期運維方案ISPIM,幫助企業(yè)用戶統(tǒng)一管理服務器、存儲、網(wǎng)絡等設備,提高運維效率、降低運維成本,保障數(shù)據(jù)中心穩(wěn)定的運行。
針對用戶多地數(shù)據(jù)中心設備種類多,統(tǒng)一管理難度大的問題,ISPIM通過統(tǒng)一接口,協(xié)議,能夠納管多達400種機型,設備數(shù)量最多可達10萬臺,是目前最大的數(shù)據(jù)中心服務器運維平臺。在自動化運維管理方面,ISPIM平臺資產(chǎn)快捷清查功能支持設備快速盤點、自動錄入系統(tǒng)、3D全景巡查、統(tǒng)一報表等。在某客戶數(shù)據(jù)中心系統(tǒng)BMC、BIOS升級、軟件部署更新等工作中,通過浪潮信息ISPIM平臺,幫助客戶將3500臺設備的部署周期從原來預計的幾十天,縮短至7天,運維效率提升450%以上,實現(xiàn)固件/OS/軟件快速更新,保障數(shù)據(jù)中心穩(wěn)定的運行。同時ISPIM提供豐富的北向API接口,為客戶后續(xù)業(yè)務應用拓展提供更多靈活選擇。
除了大規(guī)模數(shù)據(jù)中心運維需求,針對小規(guī)模部署場景,運維人員無需設置單獨的集群管理軟件,通過浪潮信息ISPIM SaaS版本將服務器系統(tǒng)運維工作上云,也可享受浪潮信息服務器運維專家的360度服務,實現(xiàn)數(shù)據(jù)中心服務器的遠程托管。同時運維人員還可通過手機APP對服務器進行帶外管理和監(jiān)控,自動完成服務器的快速健康體檢,并輸出檢測報告。
隨著數(shù)據(jù)中心IT基礎設施需求的快速增長,IT環(huán)境和部署環(huán)境愈加復雜,潛在的各類故障讓數(shù)據(jù)中心安全面臨不確定性。而故障運維管理從最初的腳本運維、工具運維到平臺運維演進至今,已接近人力極限,亟需更加智能化和人性化的運維工具。浪潮信息ISPIM平臺的智能實時預警功能覆蓋數(shù)萬種服務器宕機案例,窮盡服務器CPU、硬盤、內存、故障案例,可對非宕機類故障進行實時預警降低服務器高負荷運行下突然失效的風險。
同時,開機過程中ISPIM會進行故障實時檢測與隔離,CPU、存儲等各子模塊進行自檢檢測,若有問題會及時隔離,運行階段會對內存進行實時的巡檢檢測,主板、電源也會設置故障智能診斷,故障日志分析、故障預警等前沿技術,包括了浪潮信息ISBMC、InService、AIOPS等故障處理能力。此外,ISPIM的故障診斷定位精度領先,精準度達到95%,遠高于業(yè)界50%的平均標準,讓數(shù)據(jù)中心故障運維效率提升80%。
針對數(shù)據(jù)中心設備能耗優(yōu)化,浪潮信息ISPIM設計了數(shù)據(jù)中心能耗實時監(jiān)測,可以實時采集服務器在運行時耗費的電能,并根據(jù)數(shù)據(jù)中心溫度、濕度、氣流等因素綜合調整優(yōu)化,可以動態(tài)管理單機和數(shù)據(jù)中心的功耗,進一步優(yōu)化、均衡服務器運行負載,提升整體業(yè)務運行的可靠性,節(jié)省約15%~20%的能耗。
目前,浪潮信息ISPIM憑借著這些優(yōu)勢,在海內外收獲了廣泛的認可,為全球互聯(lián)網(wǎng)、金融、通信、IT、教科研等用戶的數(shù)據(jù)中心,提供全程無憂的運維服務,保障數(shù)據(jù)中心業(yè)務安全、穩(wěn)定地運行。