完善的機(jī)房監(jiān)控系統(tǒng)應(yīng)該具備三大特點(diǎn):能夠?qū)崿F(xiàn)從設(shè)備運(yùn)行情況到機(jī)柜微環(huán)境再到機(jī)房整體環(huán)境這樣多層次的監(jiān)控;能夠有豐富的閾值設(shè)置以監(jiān)測(cè)出危機(jī)的存在,并能有豐富的預(yù)警方式和預(yù)警流程保證相關(guān)人員能夠收到警訊,達(dá)到預(yù)警的目的;具備網(wǎng)絡(luò)化、智能化,能夠隨時(shí)隨地通過(guò)網(wǎng)絡(luò)查看機(jī)房?jī)?nèi)的情況。
然而,傳統(tǒng)機(jī)房環(huán)境監(jiān)控是把重點(diǎn)放在對(duì)機(jī)房整體環(huán)境、空調(diào)及配電柜的監(jiān)控上,而忽視了對(duì)設(shè)備內(nèi)部的監(jiān)控。另外,傳統(tǒng)機(jī)房環(huán)境監(jiān)控系統(tǒng)也缺少豐富的閾值、預(yù)警方式和預(yù)警流程設(shè)置,不能在真正意義上實(shí)現(xiàn)預(yù)警功能。
機(jī)房監(jiān)控的三大特點(diǎn)
對(duì)設(shè)備內(nèi)部進(jìn)行監(jiān)控
機(jī)房監(jiān)控的目的在于保護(hù)機(jī)房?jī)?nèi)IT系統(tǒng)的正常、有效運(yùn)行,在事故發(fā)生之前偵測(cè)出潛在危機(jī),并通過(guò)各種方式將警情信息發(fā)送給相關(guān)人員及時(shí)進(jìn)行處理。因此,機(jī)房監(jiān)控的核心應(yīng)該是對(duì)IT系統(tǒng)運(yùn)行狀態(tài)的監(jiān)控,而最直接有效的監(jiān)控應(yīng)該是直接對(duì)IT設(shè)備運(yùn)行狀態(tài)進(jìn)行監(jiān)控。
IT設(shè)備內(nèi)部的運(yùn)行環(huán)境,例如服務(wù)器內(nèi)風(fēng)扇轉(zhuǎn)速與CPU溫度等是最直接、最迅速影響IT設(shè)備正常運(yùn)行的因素。有時(shí)候即使機(jī)房?jī)?nèi)空調(diào)運(yùn)轉(zhuǎn)正常,機(jī)房整體環(huán)境參數(shù)值也在預(yù)設(shè)范圍內(nèi),但某服務(wù)器卻因?yàn)槟撤N原因出現(xiàn)服務(wù)器內(nèi)風(fēng)扇的轉(zhuǎn)速不正常、CPU過(guò)熱。如果只監(jiān)控機(jī)房整體環(huán)境,此時(shí)機(jī)房的管理人員是不會(huì)得到這種危險(xiǎn)信息的,整個(gè)系統(tǒng)就會(huì)因?yàn)樵摲?wù)器潛在危機(jī)沒(méi)有得到及時(shí)處理而意外癱瘓。
多層次的機(jī)房監(jiān)控
完善的機(jī)房監(jiān)控系統(tǒng)應(yīng)該是能夠?qū)崿F(xiàn)對(duì)從設(shè)備運(yùn)行情況到機(jī)柜微環(huán)境再到機(jī)房整體環(huán)境這樣多層次的監(jiān)控,并能重點(diǎn)實(shí)現(xiàn)對(duì)設(shè)備內(nèi)部的監(jiān)控。
空調(diào)機(jī)的運(yùn)行是為了降低機(jī)房?jī)?nèi)的溫度,使機(jī)房?jī)?nèi)的整體溫濕度保持在一個(gè)合適的范圍內(nèi),機(jī)房各個(gè)點(diǎn)的溫度參數(shù)值是不同的。空調(diào)機(jī)出風(fēng)口的溫度值不能說(shuō)明機(jī)房的整體溫度和機(jī)柜微環(huán)境溫度,空調(diào)的正常運(yùn)行不能說(shuō)明設(shè)備就能正常運(yùn)行。因此對(duì)空調(diào)的監(jiān)控不能代表甚至取代對(duì)設(shè)備的監(jiān)控。
漏水監(jiān)測(cè)系統(tǒng)是為了監(jiān)測(cè)機(jī)房?jī)?nèi)是否有漏水,以防止因漏水影響設(shè)備的正常運(yùn)行。線式探測(cè)器是成線型布置在機(jī)房可能漏水的最低處,而實(shí)際上點(diǎn)式漏水探測(cè)器同樣可以反映機(jī)房的漏水情況且比線式探測(cè)器經(jīng)濟(jì)實(shí)惠、安裝方便、維護(hù)簡(jiǎn)單。
機(jī)房?jī)?nèi)設(shè)備由于非常重要,一般都是采用UPS供電,并且UPS是雙供電,只要對(duì)UPS進(jìn)行監(jiān)控就能確保設(shè)備正常供電并且能反映市電的情況。因此,對(duì)電源的有效監(jiān)控是在不增加任何投資的情況下通過(guò)協(xié)議實(shí)現(xiàn)對(duì)UPS的監(jiān)控,通過(guò)監(jiān)控其電壓、電流、電池使用情況、市電情況來(lái)確保設(shè)備的正常運(yùn)行。
機(jī)房監(jiān)控的預(yù)警功能
報(bào)警(alarm)是報(bào)告事件的發(fā)生,是在故障或危害發(fā)生之后向管理人員發(fā)送警訊,及時(shí)地發(fā)送警訊可以縮短故障修復(fù)時(shí)間(MTTR),最大程度地保障系統(tǒng)運(yùn)行。但故障還是不可避免地發(fā)生了,影響了系統(tǒng)的正常運(yùn)行。
預(yù)警(alert)則是在故障或危害發(fā)生之前向管理人員報(bào)告潛在危機(jī),提示相關(guān)人員進(jìn)行處理,是事前的,可以防止事故的發(fā)生。有效的預(yù)警可以增加系統(tǒng)平均無(wú)故障工作時(shí)間(MTBF),并可以根據(jù)危機(jī)情況自動(dòng)延伸到報(bào)警。
預(yù)警與報(bào)警的區(qū)別就在于它是事前預(yù)防性報(bào)警,機(jī)房監(jiān)控系統(tǒng)只有具有良好的預(yù)警功能才能偵測(cè)出潛在危機(jī)并分層次逐步擴(kuò)大警訊發(fā)送范圍,有效地防止事故的發(fā)生,將損失降低到最小。越來(lái)越多的機(jī)房管理人員也開(kāi)始意識(shí)到預(yù)警的重要性,因此機(jī)房監(jiān)控系統(tǒng)必須有預(yù)警功能。