隨著服務(wù)器、存儲設(shè)施、中間件、應(yīng)用程序、網(wǎng)絡(luò)設(shè)備、數(shù)據(jù)庫,甚至虛擬機器的加入,數(shù)據(jù)中心的基礎(chǔ)設(shè)施正變得越來越復(fù)雜,數(shù)據(jù)中心的復(fù)雜性已經(jīng)成為一個眾所周知的事實。如此復(fù)雜的系統(tǒng)要保證長時間穩(wěn)定運轉(zhuǎn),并不是一件非常容易的事,這里面暗藏著不少危險,一旦忽視,將可能引發(fā)大面積的業(yè)務(wù)中斷。表面上看,數(shù)據(jù)中心無非是一個各種數(shù)據(jù)處理設(shè)備集中的場所,機房里整齊的機柜,寬敞明亮的通道,溫濕度適宜的環(huán)境,一切都看起來那么祥和。而實際上,這里面也有很多容易被人忽視的地方,存在不少潛在的危險,這些危險若說出來,肯定要嚇死寶寶了。但如果不將這些危險說出來,萬一真的發(fā)生了,肯定會嚇死寶寶,所以本文將著重講述那些容易被人忽視的潛在危險,發(fā)現(xiàn)這些危險,及時進行修正。
老鼠愛上“線”
數(shù)據(jù)中心什么最多?那一定是各種各樣的線,包括網(wǎng)線、電源線、光纖、跳線等等,這些可都是老鼠喜歡的玩意。老鼠若發(fā)現(xiàn)這些線,也許是好奇心在做崇,總會情不自禁地上去啃上兩口。若不幸老鼠還將這些線啃壞了,自然會造成部分業(yè)務(wù)運行異常,所以數(shù)據(jù)中心一定不要忽略老鼠的闖入。現(xiàn)在很多數(shù)據(jù)中心建在遠離城市的郊區(qū),這些地方老鼠不少,萬一闖進了數(shù)據(jù)中心就可能帶來危險。有些數(shù)據(jù)中心在進入機房門口放置了遮擋板,這對于善于攀爬的老鼠們來說就是小菜一碟,根本就攔不住,最好的方式還是關(guān)閉機房門窗,保持數(shù)據(jù)中心機房內(nèi)部與外部保持隔離,保持數(shù)據(jù)中心機房的密封性,不給老鼠可乘之機。在機房內(nèi)部通風(fēng)道附近放置防鼠的蟲藥,將老鼠可能進入到數(shù)據(jù)中心的通道都堵死,禁止鼠蟲進入。
設(shè)備會帶“電”
數(shù)據(jù)中心里有成千上萬的電子設(shè)備,不可避免要產(chǎn)生靜電。靜電本身并不會帶來危險,但若靜電發(fā)生了放電,就可以造成危險。靜電放電主要是在瞬間放電電流對電路的感應(yīng)所產(chǎn)生的噪聲,以及放電電流使基準地電位如機殼地、信號地的電位發(fā)生偏移移動,從而導(dǎo)致對電路正常工作的干擾,這種電磁脈沖干擾有可能引起電子產(chǎn)品的誤動作以及信息的丟失,使設(shè)備程序出錯或數(shù)據(jù)丟失。很多時候,我們觸碰帶有靜電的設(shè)備時,經(jīng)常會感到一陣觸麻,這就是靜電發(fā)生了放電,如果電量大的話甚至可以將人擊暈,對人體造成損害。還有些技術(shù)人員在對設(shè)備進行操作時,將筆記本電腦的串口線接到設(shè)備上,同時筆記本電腦的電源線插到插排上,當(dāng)設(shè)備和插排之間形成壓差,很可能會擊穿筆記本,造成筆記本損壞。數(shù)據(jù)中心里的靜電是不可能完全消除的,只能盡量減少產(chǎn)生高壓差的靜電,接觸設(shè)備時要帶防靜電衣帽,避免產(chǎn)生靜電放電過程。靜電雖然存在,只要不發(fā)生放電,就不會造成危險。數(shù)據(jù)中心里所有的設(shè)備都要接地完好,與大地的壓差為零,不形成壓差,就可避免產(chǎn)生靜電。
人為操作會出“錯”
數(shù)據(jù)中心發(fā)生的故障中,其中80%的都是人為操作故障。本來人最不希望出現(xiàn)故障的,而故障卻大部分是自己帶來的,這個邏輯多少讓人顯得尷尬,天天喊捉賊,而最大的賊卻是自己。絕大部分的人為操作故障起因都是無意的,也許是經(jīng)驗不足,也許是誤操作,也許考慮不完善等等,人為事故絕大部分都不是人的本意,操作的人不曾想到如此操作會帶來嚴重后果。人為操作是數(shù)據(jù)中心里最平常、最頻繁使用的,要加強對人員的管理,不同級別的人,不同技能水平的人,可以操作的命令和權(quán)限是不同的,要精細化管理,規(guī)范操作,對任何設(shè)備配置變更都要提交組織評審,得到明確確認后再去執(zhí)行,避免誤操作給數(shù)據(jù)中心帶來無法挽回的損失。
拔插線小心“亂”
其實,這部分也應(yīng)該算是人為操作故障,只不過這類更為低級。比如在拔插網(wǎng)線的時候,拔插錯端口,拔插設(shè)備供電電源線時,本來想拔插一臺服務(wù)器的,結(jié)果拔錯了,將一臺接入交換機的電源線拔了。如此操作帶來的后果是嚴重的,將互連光纖交叉連錯,往往會造成聚合無法聚合成功,當(dāng)然直連也無法互通。這樣錯誤的連接還可能出環(huán)路,形成廣播風(fēng)暴,這些錯誤的操作都會對業(yè)務(wù)造成嚴重影響??杀氖?,這類故障出現(xiàn)并不少見。為避免出現(xiàn)這類錯誤,就需要對設(shè)備和網(wǎng)線做好標注,標注標簽放置到最明顯的位置,讓人容易看懂。在進行這些拔插操作時,要仔細對比標簽,確認操作的正確性。
窗門莫要隨意“開”
數(shù)據(jù)中心是一個封閉的自循環(huán)環(huán)境,出了通風(fēng)口,數(shù)據(jù)中心內(nèi)外是隔離的,數(shù)據(jù)中心內(nèi)部常年保持恒溫恒濕。有時技術(shù)人員為了節(jié)省空調(diào)能耗,比如在冬天,數(shù)據(jù)中心外面溫度較低,打開一會兒門窗,就可以快速將內(nèi)部溫度降低下來,這比空調(diào)要快得多。不過外面的空氣含量復(fù)雜,經(jīng)常隨意打開門窗,容易將外面的霧霾、粉塵、冰露等都帶入數(shù)據(jù)中心中來。這些對數(shù)據(jù)中心里運行著的電子設(shè)備有嚴重影響,長此以往,往往會造成設(shè)備過早出現(xiàn)故障,設(shè)備的可靠性降低。
數(shù)據(jù)中心里危險無處不在,在此就不再逐一述說了。這些最容易被人所忽視的危險,若不加以重視,一旦危險變成了故障,必然給數(shù)據(jù)中心帶來嚴重損失。這說起來絕不是聳人聽聞,已經(jīng)有太多的故障事實證明,千萬不要因小失大。我們要將這些危險找出來,逐一消滅,給數(shù)據(jù)中心一個安全運行環(huán)境。
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。