文章來源:IDCparadise
文章標(biāo)簽:【DCIM】【機(jī)房環(huán)境監(jiān)控】【數(shù)據(jù)中心】【數(shù)據(jù)中心管理】【基礎(chǔ)設(shè)施管理】【基礎(chǔ)設(shè)施監(jiān)控】
停機(jī)時(shí)間仍然是現(xiàn)代數(shù)據(jù)中心專業(yè)人員面臨的最大數(shù)據(jù)中心管理難題之一。對于IDC運(yùn)營商和托管業(yè)主而言,意外中斷可能會對業(yè)務(wù)關(guān)鍵型系統(tǒng)和應(yīng)用程序造成嚴(yán)重破壞,從而導(dǎo)致客戶不滿意。此外,停機(jī)時(shí)間造成的損失可能非常昂貴。
避免意外停機(jī)始于解決其主要原因之一:人為錯(cuò)誤。根據(jù)Ponemon Institute的數(shù)據(jù),人為錯(cuò)誤占計(jì)劃外數(shù)據(jù)中心中斷的22%。雖然很多數(shù)據(jù)中心培訓(xùn)和認(rèn)證計(jì)劃可以幫助員工降低人為錯(cuò)誤的風(fēng)險(xiǎn),但您如何管理設(shè)施中的設(shè)備和環(huán)境同樣重要。
這就是數(shù)據(jù)中心監(jiān)控可以發(fā)揮作用的地方。數(shù)據(jù)中心基礎(chǔ)設(shè)施管理(DCIM)軟件可以幫助您跟蹤數(shù)據(jù)中心項(xiàng)目的電源、環(huán)境和安全狀態(tài),并提供信息以減少因人為錯(cuò)誤導(dǎo)致的停機(jī)時(shí)間。
考慮這四種數(shù)據(jù)中心監(jiān)控的常見用例:
監(jiān)控健康狀況
確保數(shù)據(jù)中心內(nèi)的智能PDU、UPS和其他設(shè)備可通過網(wǎng)絡(luò)運(yùn)行并可訪問,這對于維護(hù)數(shù)據(jù)中心的運(yùn)行狀況至關(guān)重要。但是,通常情況下,PDU或其他設(shè)備可能會在您和您的團(tuán)隊(duì)意識不到的情況下停機(jī)。技術(shù)人員或工程師可能會意外地將PDU置于維護(hù)模式,忘記打開新配置的資源,甚至使用錯(cuò)誤的電纜或端口連接設(shè)備。
DCIM軟件和其他數(shù)據(jù)中心監(jiān)控工具可以通過健康狀況調(diào)查來限制由于硬件故障導(dǎo)致的中斷的可能性。數(shù)據(jù)中心軟件以用戶可配置的間隔輪詢智能PDU或其他設(shè)備,以確保連接正常。如果無法連通,則DCIM軟件立即發(fā)送提醒,以便您第一時(shí)間了解數(shù)據(jù)中心的潛在問題。
數(shù)據(jù)中心監(jiān)控閾值,警報(bào)和報(bào)告
如果您沒有密切關(guān)注數(shù)據(jù)中心電源管理和環(huán)境監(jiān)控,則可能會出現(xiàn)因過載或過熱而導(dǎo)致意外停機(jī)的情況。數(shù)據(jù)中心工作人員很容易錯(cuò)誤地計(jì)算或錯(cuò)誤設(shè)置預(yù)算功率或?yàn)闄C(jī)柜分配的最高溫度,從而導(dǎo)致冷卻不充分和數(shù)據(jù)中心容量管理不準(zhǔn)確。
DCIM軟件提供閾值、警報(bào)和數(shù)據(jù)中心統(tǒng)計(jì)報(bào)表功能,以避免過度冷卻和產(chǎn)能過剩的情況。通過配置溫度和功率閾值,您可以為數(shù)據(jù)中心設(shè)置一個(gè)舒適的范圍,而如果您接近極限,警報(bào)和通知會立即發(fā)出警告。智能PDU的實(shí)時(shí)負(fù)載監(jiān)控還可以幫助您立即對產(chǎn)能過剩問題做出反應(yīng),從而幫助您提高數(shù)據(jù)中心團(tuán)隊(duì)的工作效率。數(shù)據(jù)中心電源管理報(bào)告為您提供切片和切塊的數(shù)據(jù),以便更好地了解和可視化您的電源和溫度趨勢,從而實(shí)現(xiàn)萬無一失的數(shù)據(jù)中心容量規(guī)劃。
故障轉(zhuǎn)移情況下的電源冗余
當(dāng)PDU發(fā)生故障或容量過剩時(shí),數(shù)據(jù)中心會發(fā)生什么?許多數(shù)據(jù)中心團(tuán)隊(duì)如此專注于充分利用現(xiàn)有資源并推遲資本支出,以至于他們可能沒有意識到他們已經(jīng)超載了他們的內(nèi)閣,直到為時(shí)已晚。
設(shè)備故障時(shí)的電源冗余是任何停機(jī)時(shí)間減少策略的簡單而有效的組件。通過故障轉(zhuǎn)移模擬報(bào)告,您可以識別存在風(fēng)險(xiǎn)的機(jī)柜,并確定在一個(gè)PDU發(fā)生故障時(shí)設(shè)備是否可以繼續(xù)運(yùn)行,而不會影響設(shè)備。因此,您的團(tuán)隊(duì)可以在這些有風(fēng)險(xiǎn)的機(jī)柜成為問題之前對其負(fù)載進(jìn)行適當(dāng)?shù)母摹?/span>
安全監(jiān)控
雖然數(shù)據(jù)中心電源監(jiān)控和環(huán)境管理是DCIM軟件最常見的使用場景,但隨著對設(shè)備的威脅普及,數(shù)據(jù)中心安全性變得越來越突出。未經(jīng)授權(quán)的訪問占據(jù)了數(shù)據(jù)中心違規(guī)的18%。無論此訪問是惡意還是偶然,了解誰有權(quán)訪問您的數(shù)據(jù)中心對于保護(hù)您的數(shù)據(jù)和物理資源至關(guān)重要。
DCIM軟件和其他數(shù)據(jù)中心工具可以幫助您跟蹤進(jìn)出數(shù)據(jù)中心的人員。數(shù)據(jù)中心軟件可以監(jiān)控機(jī)柜上的觸點(diǎn)閉合傳感器和門鎖。它還可用于管理您的RFID卡以及為特定用戶分配特定門的權(quán)限。自動重新鎖定計(jì)時(shí)器可監(jiān)控門被鎖定的時(shí)間長度,并在一段時(shí)間后重新鎖定,因此您無需擔(dān)心技術(shù)人員忘記鎖門。安全和審計(jì)報(bào)告可以顯示您有權(quán)訪問數(shù)據(jù)中心的不同區(qū)域,以防您需要對事件進(jìn)行取證分析。
降低停機(jī)風(fēng)險(xiǎn)是保持?jǐn)?shù)據(jù)中心平穩(wěn)運(yùn)行的關(guān)鍵。當(dāng)與整個(gè)數(shù)據(jù)中心的智能PDU,環(huán)境傳感器和其他儀器配合使用時(shí),數(shù)據(jù)中心監(jiān)控可以提供所需的檢查和平衡,以降低人為錯(cuò)誤的風(fēng)險(xiǎn)并保持正常運(yùn)行時(shí)間和可用性。
【深圳計(jì)通】深圳市計(jì)通智能技術(shù)有限公司成立于1998年,屬國家高新技術(shù)企業(yè)、廣東省專精特新企業(yè),是國內(nèi)領(lǐng)先的智能監(jiān)控?cái)?shù)字化解決方案提供商。公司以“客戶安、員工安、企業(yè)安”的“計(jì)通三安文化”為基石,始終秉承“智能監(jiān)控 計(jì)通好用”的理念,致力為全球數(shù)智化建設(shè)提供優(yōu)質(zhì)的產(chǎn)品和服務(wù)。
公司充分融合物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等創(chuàng)新技術(shù),打造出一系列具有行業(yè)特色的智能監(jiān)控?cái)?shù)字化解決方案,廣泛應(yīng)用于民航機(jī)場、金融系統(tǒng)、軌道交通、電力系統(tǒng)、工業(yè)互聯(lián)網(wǎng)、IDC數(shù)據(jù)中心等行業(yè)?,F(xiàn)已擁有3000+核心客戶,10000+精品案例,客戶遍布全國及海外。