今天和大家談一談虛擬磁帶庫備份的性能問題,工作當(dāng)中,有的客戶會反映DD VTL備份速度比較慢,甚至比物理帶庫還要慢。因此他們就會懷疑DD不過爾爾,沒有傳說中牛叉之類的。對于這樣的懷疑,我通常都會淡然一笑,其實(shí)80%以上的性能問題都和Data Domain無關(guān),而是由于前期實(shí)施階段沒有規(guī)劃好導(dǎo)致的后遺癥或者是主機(jī)、網(wǎng)絡(luò)壓力過大產(chǎn)生的性能瓶頸。
因此,我會簡單地和大家分享一下我的個人心得體會,希望對大家有所幫助。眾所周知,性能調(diào)優(yōu)向來是一個極其復(fù)雜而且繁瑣的系統(tǒng)工程,因?yàn)樗婕暗礁鞣N操作系統(tǒng),不同的通信協(xié)議。在這里,一是由于本人知識有限,二是真往細(xì)了說估計(jì)三天三夜也說不完,因此我只會談一些和VTL相關(guān)的點(diǎn),不做很深入的展開。
既然都說了性能問題這么復(fù)雜,那么到底有哪些因素可以影響到數(shù)據(jù)備份和恢復(fù)的性能呢?
備份服務(wù)器硬件配置,包括CPU,內(nèi)存,硬盤以及網(wǎng)卡等;
備份服務(wù)器操作系統(tǒng);
備份服務(wù)器日常工作壓力;
客戶端硬件配置,包括CPU,內(nèi)存,硬盤以及網(wǎng)卡/光口等;
客戶端操作系統(tǒng);
客戶端日常工作壓力;
備份網(wǎng)絡(luò)硬件和配置情況;
備份網(wǎng)絡(luò)擁塞情況;
光纖存儲網(wǎng)絡(luò)硬件和配置情況;
光纖網(wǎng)絡(luò)擁塞情況;
光纖傳輸距離以及交換機(jī)互聯(lián)的帶寬和跳數(shù);
不同的通信協(xié)議;
通信協(xié)議優(yōu)化;
最終備份設(shè)備磁帶庫的硬件和配置
怎么樣,看了是不是有點(diǎn)暈?你一定沒想到平時(shí)僅占工作一小部分的備份會這么復(fù)雜吧?我們先來看張圖,看看從存儲節(jié)點(diǎn)到VTL的數(shù)據(jù)流走向從而加深對上面各種性能因素的理解。
我們說的性能分析一定要結(jié)合上面所說的各種因素以及數(shù)據(jù)流走向通盤分析,從數(shù)據(jù)流的源端開始自上而下來看到底哪里是瓶頸的所在。其實(shí),我一直喜歡把備份比喻成礦產(chǎn)運(yùn)輸。
運(yùn)輸前,首先是挖掘機(jī)在挖礦,然后卸到卡車?yán)?,卡車?jīng)過指定的路線到達(dá)目的地卸貨,然后返回到礦區(qū)繼續(xù)運(yùn)輸。在這個過程中,總的運(yùn)輸窗口完全取決于客戶需求,假如客戶不急那么可以這樣慢慢拉礦甚至可以用更小的車?yán)?。那么假如客戶要求加急,那就會投入更多工程車、運(yùn)輸車。多輛挖機(jī)同時(shí)采礦,裝到更大的卡車?yán)铮脦纵v卡車同時(shí)跑運(yùn)輸運(yùn)到指定的不同倉庫,從而大大縮短運(yùn)輸時(shí)間來滿足客戶需求,當(dāng)然加急費(fèi)是免不了的。
所以,對備份而言也是如此,只要能夠滿足你的備份時(shí)間窗口就可以了,沒有最快只有更快,如果你想達(dá)到更好的備份性能,意味著你必須投入更多。
回過頭來看數(shù)據(jù)備份。讀取源數(shù)據(jù)的速度,一次讀的大小好比有多少輛挖機(jī)同時(shí)在挖礦,然后傳輸?shù)絺浞莘?wù)器(卡車),一次傳輸?shù)拇笮∫约耙淮慰梢詡鞫嗌贁?shù)據(jù)流(卡車的大小以及數(shù)量),再經(jīng)過多少傳輸距離,網(wǎng)絡(luò)堵不堵(道路交通狀況)等諸多因素決定了備份窗口時(shí)間。對應(yīng)到相關(guān)的專用術(shù)語就是:TCP window size, send/receive buffer size, buffer size, block size, multipule streams, multiplexing and ISL bandwidth...
下面,就具體的每個節(jié)點(diǎn)展開一下。
備份服務(wù)器。備份服務(wù)器是整個數(shù)據(jù)備份恢復(fù)的指揮所,它控制著所有資源以及負(fù)責(zé)協(xié)調(diào)相關(guān)事件的運(yùn)作。本文不會就具體的服務(wù)器系統(tǒng)內(nèi)核調(diào)優(yōu)作闡述,詳細(xì)可以參見不同備份軟件廠商的性能調(diào)優(yōu)指南。但是千萬不要讓服務(wù)器過于繁忙,否則會影響整體數(shù)據(jù)備份/恢復(fù)的性能,我們可以用具體命令來查看服務(wù)器是否過于繁忙。比如-‘vmstat,sar,top’等命令。另外網(wǎng)絡(luò)的擁塞情況也要具體查看,是不是需要多個網(wǎng)卡做聚合?DNS服務(wù)器解析有沒有延時(shí)等等,這些都會影響性能。
媒體服務(wù)器,這是一個關(guān)鍵。媒體服務(wù)器是指直接可以和VTL通過光纖網(wǎng)絡(luò)通信的服務(wù)器,因此它可以識別到VTL分配給它的磁帶機(jī)設(shè)備。
在整個備份恢復(fù)環(huán)節(jié)中,媒體服務(wù)器既接收來自網(wǎng)絡(luò)客戶端的備份數(shù)據(jù)流,同時(shí)通過內(nèi)存又將數(shù)據(jù)寫到磁帶設(shè)備。除了需要有足夠強(qiáng)的硬件支撐以外,通常我們還需要在它的進(jìn)口和出口下點(diǎn)功夫。進(jìn)口就是服務(wù)器的網(wǎng)卡,是不是做了多網(wǎng)口聚合?有沒有提高TCP window size以及收發(fā)的buffer size?如果是千兆網(wǎng)卡的話,有沒有提高M(jìn)TU的大???出口的話有幾個光纖口通往VTL,有沒有做負(fù)載均衡等等。光纖卡的話frame size默認(rèn)值是不是夠大?比如,windows 32bit 2003/2008默認(rèn)的frame size只有64K,需要調(diào)整注冊表以及安裝相應(yīng)的驅(qū)動程序才能調(diào)整到1M以上。
備份客戶端,顧名思義,客戶端指的是真正需要做備份和恢復(fù)的服務(wù)器群體。除了上面提到的服務(wù)器負(fù)載,網(wǎng)絡(luò)出口的帶寬等等,我們還要注意備份的時(shí)候千萬要把殺毒進(jìn)程停掉,否則速度會非常慢。現(xiàn)在的應(yīng)用服務(wù)器都掛載存儲硬盤,所以RAID的配置以及LVM卷的管理也很重要。良好的卷管理,往往會整體提升IO數(shù)據(jù)讀的響應(yīng)時(shí)間。
最后,備份軟件以及數(shù)據(jù)庫。我們不提倡應(yīng)用軟件和數(shù)據(jù)庫打開壓縮和加密功能,因?yàn)檫@會直接影響到Data Domain數(shù)據(jù)壓縮比以及備份速度,而且DD本身也提供數(shù)據(jù)壓縮和加密服務(wù),所以沒有必要在應(yīng)用端開啟這些功能。多數(shù)據(jù)流備份這塊,設(shè)多少個流合理呢?通常的話根據(jù)物理硬盤的數(shù)量,一個物理硬盤可以對應(yīng)一個數(shù)據(jù)流這樣可以確保在讀數(shù)據(jù)的時(shí)候磁頭不會來回找多個文件而浪費(fèi)時(shí)間。
當(dāng)今,RAID陣列環(huán)境中適當(dāng)增加數(shù)據(jù)流還是可以幫助提升性能的,但是并不是越多越好,有時(shí)候過多的數(shù)據(jù)流反而會降低性能以及占用過多的系統(tǒng)資源。對于小文件,我們建議采用snap image技術(shù)進(jìn)行備份,再加上增加讀的buffer size可以大大提升效率。除了上面所有提到的之外,相當(dāng)重要的一點(diǎn)就是磁帶設(shè)備的block size,很多備份廠商默認(rèn)的值都較小只有64K左右,所以千萬要增加塊的大小,至少要256K以上,這點(diǎn)尤為重要。
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。