7月1日,黨的生日,中國股市下跌的日子。富士通也在那天向全球發(fā)布了其高端存儲(chǔ)第三代領(lǐng)導(dǎo)集體ETERNUS DX8000 S3。
其最大的領(lǐng)導(dǎo)DX8900 S3最令人驚訝的參數(shù)是最大支持24控,為目前所有的高端之最。EMC VMAX3,HDS VSP G1000,包括一向以硬件規(guī)格自豪的華為OceanStor 18000 V3都是16控。一向低調(diào)的日系廠商,終于也高調(diào)了一回。至于400萬隨機(jī)IOPS,其實(shí)在24控的情況下,絕對(duì)值雖然最高,但平均到每一控也不算高。因此倒是沒有令西瓜哥太驚訝。
至于供貨時(shí)間,這個(gè)月底這兩個(gè)產(chǎn)品就可以供貨,但大于8控的DX8900 S3,供貨時(shí)間推遲到11月底了。
富士通S3如何做到24控?其架構(gòu)比S2到底有哪些改進(jìn),又有哪些trade-off(取舍)呢?
其實(shí),架構(gòu)最大的變化就是從緊耦合轉(zhuǎn)向了松耦合。如果大家熟悉EMC VMAX的架構(gòu),一眼就看懂了富士通的DX8000 S3架構(gòu)。幾乎是一模一樣的,只是EMC采用兩臺(tái)Infiniband交換機(jī),而富士通采用了4臺(tái)PCIe交接機(jī)。也就是說,每個(gè)控制框是一個(gè)2控的類中端存儲(chǔ),每個(gè)類中端存儲(chǔ)有自己的CPU、內(nèi)存和接口卡和硬盤框。12個(gè)類中端存儲(chǔ)通過四個(gè)交換機(jī)連接起來,就是富士通的新架構(gòu)——四星架構(gòu)(Quad Star Architecture)。
對(duì)比DX8700 S2的架構(gòu),我們發(fā)現(xiàn),最大的變化就是后端路由器BRT沒有了。
沒有了BRT,也就是沒有了后端的全連接。系統(tǒng)的可靠性下降。因?yàn)椴皇撬械目刂瓶蚨伎吹剿械目刂破髁耍绻粋€(gè)控制框里面的兩個(gè)控制器都失效,系統(tǒng)將不可用。
但是采用和VMAX一樣的松耦合架構(gòu)以后,擴(kuò)展性更好了,這也是為什么富士通直接可以做到24控的原因。
由于富士通采用PCIe的交換機(jī),西瓜哥記得Avago剛剛不久前才發(fā)布了25端口的PCIe交換芯片,這個(gè)芯片就可以用來制作24口PCIe交換機(jī)(其中有一個(gè)端口做管理用)。不知道富士通采用誰家的芯片?我們看到其到11月底才能交付8控以上的版本,不知道是否也是等24口的芯片量產(chǎn)?
而EMC VMAX采用Infiniband,市場(chǎng)上100口的交換機(jī)都有,應(yīng)該是EMC認(rèn)為目前高端存儲(chǔ)16控完全夠用了,因此沒有拉高這個(gè)參數(shù)。
而華為OceanStor 18000 V3也是采用PCIe交換機(jī),指標(biāo)也是緊跟EMC,保持在16控。但華為的控制框采用4控緊耦合的方式,可靠性上克服了原來雙控控制框出現(xiàn)一個(gè)控制器故障時(shí)引起的性能下降(因?yàn)橐P(guān)閉寫cache),減低故障期間再出現(xiàn)故障就會(huì)造成系統(tǒng)不可用的風(fēng)險(xiǎn)。因?yàn)橐话愦蟪鞘猩祥T時(shí)間都需要4小時(shí),如果偏遠(yuǎn)地方時(shí)間會(huì)更長。
而HDS VSP G1000,每個(gè)控制框是8個(gè)控制器緊耦合,可靠性又高了一些。但這種設(shè)計(jì),擴(kuò)展起來不太方便,目前支持2個(gè)控制框通過PCIe連接在一起,也是最大16控。
至于為什么富士通采用4個(gè)交換機(jī)而不是兩個(gè),西瓜哥認(rèn)為主要考慮帶寬的影響。因?yàn)镾3的架構(gòu)取消了后端的BRT,所有的數(shù)據(jù)交換都需要通過FRT進(jìn)行,而目前PCIe單端口的帶寬比Infiniband還是要小一些,因此富士通采用4個(gè)交換機(jī)主要是為了增加節(jié)點(diǎn)間的帶寬。原來EMC VMAX 40K也是采用4個(gè)Rapid IO交換機(jī),也是為了增加帶寬,現(xiàn)在換成Infiniband了后,單端口就56Gbps,因此其最高型號(hào)VMAX 400K也是兩個(gè)交換機(jī)就夠了。
具體到每一個(gè)控制模塊CM,我們看一下其內(nèi)部架構(gòu)和相關(guān)連接技術(shù)。我們看到,PCIe交換機(jī)的連接采用的是PCIe 3.0,后端磁盤框連接采用SAS 3.0。都是目前最新的版本了。
為什么S3的性能要比S2要好很多,除了CPU和內(nèi)存提升外,關(guān)鍵一點(diǎn)是CM多了一個(gè)PFM,也就是大容量flash cache,但奇怪的是接口居然采用PCIe 2.0,不知道為什么不采用3.0,可能是這個(gè)閃存卡不支持吧?這個(gè)PFM作為二級(jí)Cache使用,彌補(bǔ)DRAM的不足。富士通說采用PFM性能比不用提高了4倍。而DX8900 S3比DX8700 S2性能只提高了8倍,最大隨機(jī)IOPS是400萬??磥碛布?jí)和控制器數(shù)量的提升才提高2倍性能,關(guān)鍵還是大容量PFM(最大支持60多TB)提高4倍性能,可見這個(gè)大容量二級(jí)cache的威力。
而華為OceanStor 18000 V3雖然在DRAM上要大于富士通,而且也支持Smart Cache,但需要配置SSD盤,占用SSD槽位,效率上肯定不如PCIe閃存卡。
而EMC VAMX3,雖然DRAM和華為一樣是16TB,但目前EMC高端還沒有實(shí)現(xiàn)SSD cache的機(jī)制(中端支持),目前其SSD只能做分層使用。
富士通的CM都有兩個(gè)BUD(鏡像),也就是固態(tài)盤,用來保存OS的image文件,配置信息,而且也是作為掉電保護(hù)的臨時(shí)數(shù)據(jù)區(qū)。
由于富士通DX8900 S3支持24控,因此可以支持更多的I/O插卡,最大支持384個(gè)FC端口,和華為持平。
為了實(shí)現(xiàn)掉電保護(hù),每個(gè)控制框里面都有BBU電池。這個(gè)和富士通的低端產(chǎn)品不同。低端產(chǎn)品由于cache比較小,因此直接采用超級(jí)電容的方式。
但磁盤框富士通采用和中低端完全一樣的低密磁盤框。富士通宣稱,DX S3系列只需要更換控制器就可以實(shí)現(xiàn)升級(jí)。目前,其中低端采用的高密框高端里面并不支持。
為了工程方便,富士通把4個(gè)PCIe交換機(jī)都放在一個(gè)機(jī)框里,里面還有一個(gè)SVC管理模塊,統(tǒng)稱前端框FE。這個(gè)FE是整個(gè)系統(tǒng)架構(gòu)的中樞,控制和數(shù)據(jù)路徑的集中點(diǎn)。這種設(shè)計(jì)物理上集中在一個(gè)框內(nèi),容易讓人產(chǎn)生單點(diǎn)故障的錯(cuò)覺。不知道里面的電源設(shè)計(jì)是否各自獨(dú)立?
由于是高端存儲(chǔ),一般情況下都需要配置一個(gè)1U的網(wǎng)關(guān)服務(wù)器來實(shí)現(xiàn)call home功能。
至于軟件方面,DX8000 S3可以看到實(shí)時(shí)的電源消耗,這個(gè)西瓜哥感覺比較直觀。很多產(chǎn)品只看到溫度,但看不到實(shí)時(shí)功耗。
DX8000也支持自動(dòng)QoS。這個(gè)軟件功能也是一大特點(diǎn)。也就是可以根據(jù)用戶配置的SLA(支持時(shí)延和優(yōu)先級(jí))和自動(dòng)分層結(jié)合起來。
當(dāng)系統(tǒng)通過調(diào)整帶寬和CPU資源也實(shí)現(xiàn)不了用戶要求的時(shí)延的話,自動(dòng)分層將自動(dòng)提高性格卷的高性能容量層的比例,直到時(shí)延滿足要求。
這種機(jī)制和EMC的SLO的管理方法已經(jīng)非常類似了。只是EMC更加會(huì)營銷,并且采用出廠預(yù)配置的方式,易用性更高。但富士通這樣做保持了更高的靈活性。
在RAID方式上,富士通從S3開始就支持一種特別的RAID方式,叫RAID6-FR,F(xiàn)R表示fast recovery,即快速恢復(fù)。其原理和華為的RAID 2.0比較類似,只是華為是全局實(shí)現(xiàn),而富士通是局部實(shí)現(xiàn),因此,還是有一些不同。富士通宣傳1TB磁盤的重構(gòu)時(shí)間是90分鐘,比華為宣傳的30分鐘慢一些,但比傳統(tǒng)的RAID方式已經(jīng)快了10倍。具體的原理和局限,西瓜哥將在下一節(jié)單獨(dú)介紹。
總結(jié)一下,富士通DX8000 S3新高端存儲(chǔ)最大的變化就是采用了類似EMC VMAX一樣的松耦合架構(gòu),擴(kuò)展到了24控,400萬IOPS,另外利用大容量的flash cache,性能比老產(chǎn)品提高了8倍。自動(dòng)QoS和fast recovery也很有特點(diǎn)。但也有一些trade-off,比如拋棄了后端的全連接,4個(gè)PCIe交換機(jī)物理打包在一個(gè)前端框里,可能會(huì)引起部分對(duì)極致可靠追求用戶的擔(dān)憂。
估計(jì)幾乎沒有用戶能用到24控,但富士通引領(lǐng)這個(gè)高端存儲(chǔ)非常關(guān)鍵的指標(biāo),一改日系廠商低調(diào)保守的形象,估計(jì)比較受類似中國政府部門這些喜歡拼參數(shù)的市場(chǎng)的歡迎。好在富士通在中國主要聚焦運(yùn)營商市場(chǎng),其他行業(yè)碰到很少。但從新產(chǎn)品的規(guī)格和功能來看,其DX8000 S3是一個(gè)比較理想的OEM對(duì)象,據(jù)說已經(jīng)有中國廠商在洽談OEM事宜,高端存儲(chǔ)市場(chǎng)的混戰(zhàn)將不可避免。