數(shù)據(jù)中心基礎(chǔ)設(shè)施管理監(jiān)控工具的出現(xiàn),引發(fā)了一些問題。什么因素使得DCIM對您的企業(yè)是有價值的呢?其是否會有助于提高您企業(yè)的盈利能力呢?其能否執(zhí)行您企業(yè)最初所需要的一切工作需求,并能夠隨著您企業(yè)的發(fā)展一起成長呢?部署實施DCIM及保持其更新需要花費您數(shù)據(jù)中心工作人員的多少工時呢?這些都是在您數(shù)據(jù)中心選擇采用任何一款DCIM系統(tǒng)之前,所需要詢問您的供應(yīng)商,并問問您企業(yè)自己的問題。
在今天的數(shù)據(jù)中心行業(yè)中,最熱門的流行術(shù)語可能非數(shù)據(jù)中心基礎(chǔ)設(shè)施管理(DCIM)莫屬了?,F(xiàn)如今的幾乎每款產(chǎn)品似乎提供了某種DCIM功能,并且還有幾款獨立的DCIM系統(tǒng)聲稱能夠覆蓋一切。但DCIM到底是什么?其到底應(yīng)該做些什么呢?
早期的DCIM是關(guān)于管理樓層空間,跟蹤資產(chǎn)。電源使用效率(PUE)的度量推動其成為了一款更為全面的用于監(jiān)控整個數(shù)據(jù)中心的基礎(chǔ)設(shè)施的工具。如果您的數(shù)據(jù)中心真的關(guān)心的數(shù)據(jù)中心的能源效率,提高PUE值,并節(jié)約能源成本,那么您將需要掌握關(guān)于您數(shù)據(jù)中心的全方位的電力和冷卻信息以及資產(chǎn)管理信息,而這些信息均可以儲存在一款DCIM系統(tǒng)中。鑒于當(dāng)前業(yè)界的減少能源消耗使用和節(jié)約成本的挑戰(zhàn)壓力,那句老話:“您無法對您不能測量的的設(shè)備實施管理!”從未沒有變得如此真實。
對于許多一般性的數(shù)據(jù)中心而言,掌握操作空間的室溫數(shù)據(jù)、機架功率電源消耗數(shù)據(jù)和不間斷電源(UPS)的報警數(shù)據(jù)、以及空調(diào)故障數(shù)據(jù)就足夠了。而來自多家硬件和軟件供應(yīng)商的DCIM選項有多種形式——從制造商的智能插座板,計算機室空調(diào)(CRAC)和濕度傳感器到資產(chǎn)跟蹤和機柜安全訪問,并許多將這些基本參數(shù)集成整合為一個成本效益數(shù)據(jù)包,以便可以實現(xiàn)更多的效益。但是對于大型數(shù)據(jù)中心設(shè)施而言,特別是對于那些想要跟蹤PUE值,并最大限度地提高能源和計算使用效率的企業(yè),掌握更多的信息則是必要的。
您數(shù)據(jù)中心可以從每家供應(yīng)商那里部署采用離散的DCIM方法——獨立的UPS和空調(diào)單元、機架電源、中央冷卻設(shè)備、發(fā)電機和資產(chǎn)管理。但是以這種方式創(chuàng)建一個主要的DCIM系統(tǒng)將導(dǎo)致一系列顯示、報告和數(shù)據(jù)列表的混亂,甚至某些數(shù)據(jù)可能會重疊并且變得不方便。更可能的情況是,大多數(shù)系統(tǒng)將被淘汰,導(dǎo)致大量的資金花費在技術(shù)上,但卻沒有收到管理的益處。
現(xiàn)在,數(shù)據(jù)中心中的一切都是相互關(guān)聯(lián)和相互依賴的。隨著處理器使用的增加,服務(wù)器獲得更多的功率,然后減少計算負載。這影響了數(shù)據(jù)中心的冷卻要求,在較新的數(shù)據(jù)中心設(shè)施中,應(yīng)該通過具有變速控制的空調(diào)提供冷卻。這些反過來又會引起泵速,冷卻器容量和冷卻塔操作的變化。在設(shè)計良好的基礎(chǔ)設(shè)施中,這一切都應(yīng)該自動平衡,但仍需要實施監(jiān)控,以確保其正常工作。
來自DCIM系統(tǒng)的信息應(yīng)該還有助于確定如何在數(shù)據(jù)中心內(nèi)部部署和使用計算硬件,以便盡可能實現(xiàn)高效地運行。假設(shè)您的冷卻設(shè)備可以處理集中的刀片服務(wù)器,但只有在當(dāng)CRAC以最大速度運行時才行。采用不同的部署方法可能會使用消耗更少的能量,但除非您可以看到這條鏈上的所有設(shè)備的功耗和操作點,否則您是不會知道的。同樣,除非您數(shù)據(jù)中心可以對替代品進行模擬建模,看看其真實的意義,否則您無法知道能夠做些什么以便改善操作。
簡而言之,DCIM在數(shù)據(jù)中心的角色作用的顯著擴展,也使得其復(fù)雜性隨之明顯增加,故而企業(yè)數(shù)據(jù)中心需要采用一套良好集成的解決方案。
集成DCIM系統(tǒng)的要求
在考察現(xiàn)代的DCIM方法時,有兩項主要的事情需要考慮:通用性和數(shù)據(jù)處理。
真正通用的DCIM產(chǎn)品必須滿足兩項大的要求。首先,系統(tǒng)必須能夠連接到空調(diào)、UPS系統(tǒng)、電源插座、電源配電單元、服務(wù)器、冷卻機組、水泵、溫度濕度和壓力傳感器、電表、冷卻塔、發(fā)電機、電池監(jiān)控器、照明控制、消防和安全系統(tǒng)、計算硬件以及與數(shù)據(jù)中心的操作有關(guān)的任何其它事物。第二,其必須在執(zhí)行上述所有這一切時是與供應(yīng)商無關(guān)的。必須無縫連接到每家制造商的硬件,并將所有可用的數(shù)據(jù)信息傳遞給DCIM系統(tǒng),具有完全透明性??紤]到數(shù)據(jù)中心的復(fù)雜基礎(chǔ)設(shè)施中的所有不同設(shè)備以及所使用的各種數(shù)據(jù)和報警協(xié)議,這可能是相當(dāng)困難的。
當(dāng)然,一款完整的DCIM系統(tǒng)還應(yīng)包括跟蹤資產(chǎn)的基本能力。
在選擇一款DCIM系統(tǒng)時所需考慮的第二大要求是數(shù)據(jù)處理。DCIM廣泛的擴張帶來了數(shù)據(jù)爆炸。如果您數(shù)據(jù)中心真的測量和跟蹤了數(shù)據(jù)中心的所有方面,那么您將所獲太多的數(shù)據(jù)任何人都無法完全吸收。大多數(shù)數(shù)據(jù)中心設(shè)備現(xiàn)在都是網(wǎng)絡(luò)連接和IP可尋址的??照{(diào)和UPS系統(tǒng)可以提供多達256個數(shù)據(jù)點。較新的計算硬件可以就內(nèi)部溫度、空氣流、風(fēng)扇速度和處理器利用率等方面生成大量的測量數(shù)據(jù)。
這些數(shù)據(jù)量遠遠超出了您的預(yù)期——或者遠遠超出了您所實際關(guān)注的領(lǐng)域——除非您是一家制造商,需要隨著時間的推移收集設(shè)備的磨損,性能和能源效率的歷史數(shù)據(jù)。對于普通用戶來說,這些大部分?jǐn)?shù)據(jù)是無意義的。
但是,您數(shù)據(jù)中心的DCIM系統(tǒng)需要捕獲它,以避免丟失對您重要的參數(shù)。
那么,您要如何處理每天所收集的大量數(shù)據(jù)呢?將所有這些數(shù)據(jù)轉(zhuǎn)換成信息,就是區(qū)分一套及格的解決方案和好的解決方案的差別所在了。為了能夠作為管理工具而發(fā)揮作用,所有物理,電氣,機械和操作方面均需要集成,并做到以下幾個方面:
通過圖形化的突出顯示,指示異常和操作參數(shù)的變化,以便在其發(fā)生之前,提醒您潛在問題。
具備快速演示,并容易地深入探索的能力,以便獲取有關(guān)任何條件的更多詳細信息,其應(yīng)以清晰的圖形格式提交顯示原始數(shù)據(jù)。
這肯定是一個具有挑戰(zhàn)性的任務(wù)。隨著各種的設(shè)備類型和制造商組成一處現(xiàn)代的數(shù)據(jù)中心,僅僅只是顯示漂亮的3D圖片、以及在問題已經(jīng)發(fā)生后,才發(fā)出警報是遠遠不夠的。重要的是,對于實施操作管理所必要的全部信息是否都是在第一位的。只有這樣,才能考慮以3D圖片顯示是否提升了人們的理解,并使用戶得以能夠更快的掌握相關(guān)的意義并采取行動。
關(guān)于DCIM系統(tǒng)的更多優(yōu)點
在確定了您數(shù)據(jù)中心的DCIM系統(tǒng)涵蓋了上述基礎(chǔ)層面之后,您可以繼續(xù)研究構(gòu)成全功能的DCIM系統(tǒng)的其他三個選項。
1、了解您數(shù)據(jù)中心是否可以運行“假設(shè)”場景來查看添加設(shè)備的效果,或者查看如果基礎(chǔ)架構(gòu)中的某些內(nèi)容發(fā)生故障,會導(dǎo)致什么情況。在規(guī)劃在何處安置新硬件時,這可以說是相當(dāng)有幫助的。一些系統(tǒng)甚至具有計算流體動力學(xué)(CFD)集成。由具有空氣流量和CFD系統(tǒng)的相關(guān)知識背景的人員來解釋正確構(gòu)造的CFD模型可以是相當(dāng)有價值的補充。然而,輸出數(shù)據(jù)的質(zhì)量取決于輸入數(shù)據(jù)的質(zhì)量。CFD模型可以被構(gòu)造為顯示任何事物的好或壞,因此當(dāng)其作為DCIM部署的一部分時,必須定期對照實際的條件進行驗證。
2、該系統(tǒng)還必須能夠增長并適應(yīng)未來的需求。數(shù)據(jù)中心總會有新的硬件和持續(xù)不斷涌現(xiàn)的關(guān)于現(xiàn)代化的數(shù)據(jù)中心基礎(chǔ)設(shè)施的新的方法和技術(shù),故而DCIM系統(tǒng)應(yīng)該能夠整合您企業(yè)的未來需求。理想情況下,這可以通過模塊化的方法完成,要求您在開始時只購買所需的零件組建,并根據(jù)需求的變化以協(xié)調(diào)的方式增長。
3、最后,關(guān)于數(shù)據(jù)中心最初創(chuàng)建時的基本信息,數(shù)據(jù)庫,圖形,并持續(xù)支持對其實施維護更新的需求。許多DCIM系統(tǒng)被淘汰的原因就在于數(shù)據(jù)中心工作人員無法使其保持更新。
現(xiàn)如今,沒有某種形式的DCIM,甚至即使是運行一處小型的數(shù)據(jù)中心也變得不切實際。僅僅依靠設(shè)備顯示面板的報警和零星讀數(shù)是不夠的。您數(shù)據(jù)中心需要問問自己需要監(jiān)控多少設(shè)備,需要監(jiān)控哪些資源的消耗,并保持所需的控制級別。如果基本監(jiān)測是必要的,那么比您最初所需要監(jiān)控的范圍監(jiān)控更多,可能是更好的;畢竟,您企業(yè)的需求會隨著時間的推移而增加。
但是,如果您知道您需要一套完整的數(shù)據(jù)中心基礎(chǔ)架構(gòu)管理工具來處理主要操作,那么,在確保所有必要的接口都是可用的之后,最重要的是要將數(shù)據(jù)轉(zhuǎn)換為有價值信息,并以恰當(dāng)?shù)男问斤@示。