HP最新發(fā)布的高端存儲3PAR 20800系列,西瓜哥認(rèn)為其最大的改進(jìn)就是RPO了。
高端存儲由于對可靠性的追求,大部分都可以實(shí)現(xiàn)秒級的RPO(指異步復(fù)制),而原來3PAR 10000只能實(shí)現(xiàn)5分鐘的RPO(下面這個(gè)圖寫10分鐘,其實(shí)應(yīng)該可以做到5分鐘的)。
為什么異步復(fù)制的RPO如此重要,因?yàn)檫@是很多用戶認(rèn)為其是區(qū)別中高端的一個(gè)關(guān)鍵的區(qū)別指標(biāo)。加上HP 3PAR 20850是全閃存配置,這種情況下幾乎不會采用同步復(fù)制,因?yàn)檫@樣閃存的時(shí)延優(yōu)勢就體現(xiàn)不出來了,但用戶希望RPO越小越好,減少丟失的數(shù)據(jù)量。
這個(gè)HP管理界面的截圖,可以看出,如果同步復(fù)制,時(shí)延在1.5ms,但如果采用異步復(fù)制,時(shí)延小于0.5ms。
國外一個(gè)blogger參加了HP的大會,說HP宣傳其流復(fù)制(Async Streaming)可以做到RPO<1s,而EMC的SRDF/Async的RPO是15s,相差15倍。
但另外一個(gè)blogger提供的截圖,只是宣傳比SRDF/A的RPO低1/3而已,并沒有15倍的差距。
從HP官方的blogger的信息看,HP的流復(fù)制采取了其最新的ASIC+Cache隊(duì)列相結(jié)合的技術(shù)來實(shí)現(xiàn)。
解釋一下,就是主陣列的數(shù)據(jù)寫到Cache里,先不要落盤,這些變化的數(shù)據(jù)打上序號,嚴(yán)格保證寫順序。然后在用ASIC每隔100ms打一個(gè)包(dataset),這個(gè)包里面的寫順序是有保障的,也就是寫一致性是OK的。這些包放到傳輸隊(duì)列里,如果帶寬足夠,就會馬上傳輸?shù)竭h(yuǎn)端。
如果真是100ms打包一次,那么按照異步傳輸?shù)脑?,其RPO應(yīng)該最少是2個(gè)100ms,也就是200ms。因?yàn)楫?dāng)鏈路故障的時(shí)候,正在傳輸?shù)膁ataset收到了影響,同時(shí),主存儲正在準(zhǔn)備的下一個(gè)dataset也收到影響。因此,丟失的數(shù)據(jù)量就是2個(gè)dataset,也就是200ms。這個(gè)是在不考慮帶寬的情況下。
HP官方blogger說,采取這種技術(shù),每次dataset的數(shù)據(jù)量一般都是幾MB級別,比如下面的管理界面截圖,是11MB。這樣少的數(shù)據(jù)量,使得傳輸非常快,1s的RPO還真不是吹的。
但如果帶寬不夠,寫數(shù)據(jù)太多,cache滿了,來不及傳輸,HP目前的機(jī)制是自動切換到原來的周期復(fù)制方式。但HP說目前只能實(shí)現(xiàn)所有的RG(復(fù)制組)全部切換為周期復(fù)制的方式,不能選擇某些優(yōu)先級高的業(yè)務(wù)保留流復(fù)制的模式。據(jù)說下一個(gè)版本才能實(shí)現(xiàn)這個(gè)功能。
看到這里,是否你也認(rèn)為HP新高端可以做到小于1S的RPO呢?
實(shí)際使用情況下,西瓜哥認(rèn)為是不太現(xiàn)實(shí)的。如果是一般的應(yīng)用,這么宣傳是可以的,但如果是數(shù)據(jù)庫這類應(yīng)用,這個(gè)RPO是不現(xiàn)實(shí)的。
我們來一塊分析一下。假設(shè)是ORACLE數(shù)據(jù)庫的應(yīng)用,大家知道,ORACLE在主機(jī)是有cache機(jī)制的,如果要采用陣列的復(fù)制技術(shù),為了保證遠(yuǎn)端的副本可以直接拉起來,那么你是需要快照來保證一致性的。
HP的流復(fù)制,雖然采用ASIC來保證了寫的順序,但如果沒有主機(jī)快照代理,把ORACLE主機(jī)的臟數(shù)據(jù)刷到陣列里再做快照,那么遠(yuǎn)程的副本也可能是不能直接使用的。
我沒有從HP官方或者blogger的資料里面看到HP的流復(fù)制和快照的聯(lián)動(也沒有看到流模式是否可以做兩地三中心組網(wǎng))。我們假設(shè)HP 3PAR流復(fù)制支持快照聯(lián)動,由于數(shù)據(jù)庫的快照你不能打得太密,否則會影響數(shù)據(jù)庫的性能,因此,1-2s打一次快照,能夠?qū)崿F(xiàn)3-5s的RPO應(yīng)該是比較合理的。這個(gè)水平,其實(shí)高端存儲大家差距不是不大。
兩年前華為發(fā)布高端存儲Oceanstor 18000 V1的時(shí)候,就宣傳支持秒級RPO。其原理是采用基于Cache時(shí)間戳的異步復(fù)制技術(shù),數(shù)據(jù)寫入Cache的時(shí)候都帶有時(shí)間戳,因此打快照的時(shí)候,可以直接在Cache里完成,這樣就可以實(shí)現(xiàn)秒級的RPO,而且,這個(gè)快照可以和ORACLE主機(jī)的快照代理聯(lián)動,保證遠(yuǎn)端的數(shù)據(jù)是可以直接拉起來的。其實(shí)所有高端存儲能做到秒級RPO的,基本都是在Cache上做文章。
分析完3PAR的Streaming異步復(fù)制,我們來看看HP新高端的樣子。這個(gè)是主控柜,上面6個(gè)是磁盤框,下面那個(gè)大家伙就是3PAR 2K的控制框了。
這個(gè)控制框,感覺好像可以分為上下兩個(gè),每個(gè)4個(gè)節(jié)點(diǎn),一共8節(jié)點(diǎn)。8個(gè)節(jié)點(diǎn)后面通過無源背板連接在一起。由于沒有細(xì)節(jié)的圖片,不知道后面是兩個(gè)背板拼在一起,還是一個(gè)大背板。
每個(gè)節(jié)點(diǎn)就是一個(gè)控制器,里面有兩塊SATA SSD(sandisk的),上面保存OS(估計(jì)做鏡像)。有8個(gè)內(nèi)存插槽給數(shù)據(jù)cache使用(每插槽最大支持32GB),他們直接連接到2塊 ASIC(圖中右部兩個(gè)黑色塊)上。左邊帶大大散熱片的是兩個(gè)INTEL的CPU,連接6個(gè)內(nèi)存插槽作為控制cache(OS,元數(shù)據(jù)等),也是每個(gè)槽位 最大32GB。
大家可以看到,3PAR的cache設(shè)計(jì)和其他廠商不同,控制cache和數(shù)據(jù)cache是分開的。
據(jù)說HP正在準(zhǔn)備SPC-1和SPC-2測試,可能很快就會發(fā)布。從目前的跡象看,西瓜哥懷疑HP采用全閃存的方式,可能會超過HDS VSP G1000 200萬IOPS(宣傳320萬),奪下SPC-1的性能冠軍的寶座。華為據(jù)說要采用混合介質(zhì),要達(dá)到300萬SPC-1 IOPS,可能從絕對值來說,也許不是第一。具體HP和華為那家先發(fā)布SPC-1的值,到底誰能勝出,只能靠時(shí)間來驗(yàn)證。從上市時(shí)間看,HP和華為基本都是在8月份開始出貨,加上HP國內(nèi)改姓紫光(H3C),大戰(zhàn)在所難免。
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。