EMC的高端存儲(chǔ)VMAX3的機(jī)柜是帶藍(lán)色燈光的,藍(lán)色曾經(jīng)被網(wǎng)友評選為最喜歡的機(jī)柜顏色,那是以前西瓜哥首次用女性的視角寫高端存儲(chǔ)的技術(shù)的一篇文章調(diào)查出來的結(jié)果:
存儲(chǔ)其實(shí)也可以很“色”
在今年的EMC WORLD 2015上,EMC有一個(gè)演講是“VMAX3:BEHIDE THE BLUE LIGHT",這個(gè)演講比較系統(tǒng)講解了EMC VMAX3的架構(gòu)特點(diǎn)。雖然西瓜哥寫過很多關(guān)于EMC VMAX3的文章,但基本都比較零碎。因此,今天就拿EMC的演講材料,再系統(tǒng)介紹一下VMAX3,然后結(jié)合華為高端存儲(chǔ)發(fā)布會(huì)了解到的信息,來橫向點(diǎn)評一下。
讓我們開始吧。
幾乎EMC所有VMAX3膠片都有這一頁,體現(xiàn)其定位:工業(yè)的第一個(gè)企業(yè)數(shù)據(jù)服務(wù)平臺(tái)。
VMAX3包含3款型號(hào),100K\200K\400K。指標(biāo)非常高大上,相比上一代產(chǎn)品,增長最大是Cache,增長了8倍。但最奇怪的參數(shù)是可用容 量,還是4PB,這個(gè)和上一代產(chǎn)品一樣。按理來說硬盤數(shù)從3000多增長到了5000多,可用容量應(yīng)該增長的啊?西瓜哥一直沒有想通EMC這個(gè)限制的原 因,可能是軟件的限制吧?
這是EMC的軟件架構(gòu)的規(guī)格,其中打星號(hào)的是設(shè)計(jì)規(guī)格,具體的產(chǎn)品實(shí)現(xiàn)要比這個(gè)小。track的尺寸從原來64KB變化到128KB,thin extent則從原來的1個(gè)track768KB變?yōu)?28KB,也就是空間的分配更加精細(xì)了。分層特性遷移的粒度是42個(gè)track,也就是 5.5MB,這個(gè)雖然沒有華為的規(guī)格小(512KB-64MB),但比HDS VSP G1000的42MB要小不少了,HP 3PAR 10000是128MB,最大的是IBM的DS8000,1GB。
至于硬件平臺(tái),變化就更大了。首先fabric從原來的Rapid IO切換到Infiniband 56G,后端DAE的連接也從FC切換到SAS。所有的型號(hào)都可以支持第三方機(jī)柜了。
Engine和DAE都可以獨(dú)個(gè)增長,DAE有2.5"和3.5”規(guī)格,可以混配,但都是高密磁盤框了。
VMAX3支持一個(gè)機(jī)柜雙引擎的高密配置,由于磁盤框都是高密框,一般情況這種配置就能滿足大部分客戶的要求了。
這種高密配置情況下,最高端的VMAX 400K也僅僅需要4個(gè)機(jī)柜而已,大大節(jié)省了機(jī)房空間。不過這對機(jī)房的承重和散熱要求都很高。
當(dāng)然,也可以每個(gè)機(jī)柜只配置一個(gè)引擎,這樣就有更多空間來放磁盤柜。
這種情況下,400K最大配置是8個(gè)機(jī)柜。
由于采取松耦合的架構(gòu),因此可以分散布局。由于IB交換機(jī)在系統(tǒng)柜1,其他的系統(tǒng)柜都可以散落在機(jī)房的各個(gè)位置,只要和IB交換機(jī)的距離不超過25m。華 為的高端存儲(chǔ)采用的是PCIE技術(shù),宣傳規(guī)格是75m。HDS的VSP G1000采用的也是PCIE技術(shù),宣傳的距離是100m,不過,HDS只有兩個(gè)控制柜。
當(dāng)然,一般不會(huì)全部分散,能擺在一起最好,否則管理配置的時(shí)候都看不見機(jī)器,O(∩_∩)O哈!因此,一般情況部分分散布局就足夠了。
引擎支持scale up和scale out。可惜后端的SAS連接還是6G的技術(shù),HDS VSG G1000和華為的OceanStor 18000 V3都切換到了12G SAS??刂破鞯膕cale out個(gè)數(shù),目前三家都是16控,保持一致,很默契啊,讓西瓜哥都忘了大家是競爭對手了。
VMAX3的引擎其實(shí)就是重用VNX8000的硬件,因此4U高度,插槽數(shù)量,外觀都一樣一樣的。但應(yīng)該CPU型號(hào)和內(nèi)存數(shù)量有所不同。
EMC和HDS都是采取控制器方式的加密,對硬盤沒有要求。IBM和HP 3PAR則采用加密磁盤的方式。
VMAX3最大的改變是對CPU的計(jì)算資源調(diào)度更加靈活。把計(jì)算資源池化,然后在各種服務(wù)(EMULATION)上動(dòng)態(tài)分配。
EMC的EMULATION類型比較復(fù)雜,有DS、DX、IM、EDS、FA、RF等等各種類型,但大家不用太關(guān)注,知道這些emulation可以動(dòng)態(tài)得到需要的CPU資源就可以了。
VMAX3引擎的插槽排列,其實(shí)也是有規(guī)律的。從左到右分別是管理卡、閃存卡(掉電保護(hù)用)、通用接口卡、后端SAS卡、閃存卡、通用接口卡、IB交換卡。
目前VMAX3支持的前端I/O模塊只有FC和以太兩種。
DAE有兩種規(guī)格,60個(gè)3.5"盤位的和120個(gè)2.5“盤位的。
連接采用菊花鏈方式分別連接到同一個(gè)引擎的兩個(gè)控制器上。不能跨引擎和機(jī)柜進(jìn)行連接了。雖然沒有單點(diǎn)故障,但有些用戶還是擔(dān)心引擎故障期間更換引擎(一般 承諾是4小時(shí)到現(xiàn)場)再壞一個(gè)引擎引起數(shù)據(jù)不能訪問。這個(gè)也是華為的新高端改進(jìn)后采用一個(gè)引擎4控全互聯(lián)的一個(gè)原因。當(dāng)然,HP VSP G1000是緊耦合架構(gòu),不存在這個(gè)問題。
DAE設(shè)計(jì)了4個(gè)電源分區(qū)做故障隔離。3.5”框的可以支持每個(gè)硬盤15w功耗。
如果是2.5“的框,只能支持每個(gè)硬盤10w功耗。
由于DAE不能跨引擎,因此,為了提高重構(gòu)速度,EMC采用了LOCAL RAID技術(shù),也就是RAID組不跨引擎。不過,EMC的RAID組設(shè)計(jì)是跨DAE的電源分區(qū)的,也就是RAID組可在電源分區(qū)故障情況下存活。不 過,EMC的這個(gè)設(shè)計(jì),雖然重構(gòu)快了,但還是有些用戶擔(dān)心可用性降低,用戶可以采用SRDF或者雙活等技術(shù)來提高可用性。
EMC VMAX3一般建議配置2.5" 10K的磁盤,同時(shí)配置10%左右的flash。如果需要大容量的磁盤,只能采用3.5”的大盤。
EMC一般也建議一個(gè)機(jī)柜配置2個(gè)引擎,即4控制器。
這種情況下可以配置4個(gè)高密DAE,可以滿足大部分場景的需求了。
這種高密配置,相對上一代產(chǎn)品,對機(jī)房的面積要求少多了。新產(chǎn)品2個(gè)機(jī)柜比老產(chǎn)品9個(gè)機(jī)柜性能和容量都好。
總的來說,EMC的VMAX3架構(gòu)相比上一代產(chǎn)品,有很大的改變:
1、交換矩陣從Rapid IO轉(zhuǎn)變?yōu)镮nfiniband;
2、后端從FC-AL切換到SAS;
3、CPU核數(shù)和Cache規(guī)格大幅提升;
4、磁盤框均切換為高密框;
5、采用LOCAL RAID,提高重構(gòu)速度但可用性有所減低;
產(chǎn)品的定位也把VMAX3當(dāng)做一個(gè)數(shù)據(jù)服務(wù)的平臺(tái),而不是單純的高端存儲(chǔ)產(chǎn)品。包括最近把全閃存陣列XtremeIO通過FAST.X也納入進(jìn)來,可以看到EMC對這個(gè)產(chǎn)品的期望。
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。