增加對象存儲的性能多達(dá)100倍是否是有可能的?現(xiàn)在,可能是時候?qū)SD閃存和對象存儲同時部署在一起了,在本文中,我們將為廣大讀者諸君介紹關(guān)于同時使用這兩者在性能和可靠性方面所帶來的益處。此外,我們還將為您介紹關(guān)于提高數(shù)據(jù)存儲效率的七個技巧。
現(xiàn)在,可能是時候?qū)SD閃存用于對象存儲了
對象存儲已經(jīng)成為近線存儲(Nearline storage)、云存儲、Hadoop存儲,甚至NoSQL存儲的一個流行的首選。然而,用于對象存儲的主要介質(zhì)類型并不是SSD閃存存儲,反而一直并 將繼續(xù)是3.5英寸,7200轉(zhuǎn)速的HDD FAT硬盤。這背后的邏輯是,對象存儲主要是輔助存儲。其性能不是驅(qū)動因素。而以非常低的成本獲得可擴展性、可靠性和耐用性才是對象存儲銷售增長的主要因 素。
但是,如果對象存儲所能夠提供的性能較之其當(dāng)前所提供性能能夠增加高達(dá)100倍,并且是以相同或更低的成本提供相同或更好的耐久性和更密集的可擴展性占用空間呢?根據(jù)公開發(fā)布的SSD閃存存儲和FAT HDD硬盤讀取優(yōu)化藍(lán)圖顯示,這一愿景有望在2016年底實現(xiàn)。
而這一藍(lán)圖愿景的實現(xiàn)首先是從在對象存儲中所使用的媒介類型開始的。由于大多數(shù)被作為對象存儲的數(shù)據(jù)都不是需要被頻繁訪問的——畢竟,這都是屬于次 要的數(shù)據(jù)——而媒介最大的因素是成本和密度,而不是對象存儲的性能。這就是為什么今天的媒介是FAT驅(qū)動器且每個HDD硬盤的存儲原始容量范圍是從4 TB到10 TB,這使得其能夠以最小的占用空間每TB的成本最低。
讀取優(yōu)化的SSD閃存存儲被設(shè)計為用于同一類型的數(shù)據(jù),但僅僅只有更小的2.5英寸的足跡,這占到了3.5英寸HDD硬盤驅(qū)動器40%的容量和 10%的重量。讀取優(yōu)化的SSD是專為約10%的寫入和90%的讀取而設(shè)計的。新的多層3D或垂直三級單元(TLC)NAND是理想的讀取優(yōu)化的SSD。 目前市場上最高容量的2.5英寸,讀取優(yōu)化的SSD在2015年底的原始容量大約為4 TB。而這一切改變得相當(dāng)...快。
在2016年第一季度,三星公司的基于256GB的TLC NAND芯片的一款32層、16 TB、讀取優(yōu)化、2.5英寸(SAS或SATA)的閃存SSD產(chǎn)品開始出貨。到第三季度,幾家其它的供應(yīng)廠商的類似產(chǎn)品也紛紛出貨。而預(yù)計到2016年第 四季度,24 TB和32 TB的讀取優(yōu)化的2.5英寸固態(tài)硬盤閃存有望大規(guī)模上市。而預(yù)計到2017年,英特爾、Micron(美國鎂光)、 三星和東芝的48 TB和96 TB的讀取優(yōu)化的2.5英寸SSD閃存產(chǎn)品也將出貨。到2018年,上述供應(yīng)廠商都期望在128 TB和256 TB的2.5英寸的讀取優(yōu)化的閃存固態(tài)硬盤市場獲得加速增長。較之FAT 3.5英寸的近線硬盤驅(qū)動容量,今天,最大容量的HDD硬盤為10 TB。根據(jù)希捷和西部數(shù)據(jù)公司預(yù)計,到2020年,這一容量將增加到20 TB。而如果他們能夠加快研發(fā)的話,則有望能夠在2020年達(dá)到40 TB的容量——但這可能是一個低概率事件。無論如何,容量差距是如此巨大,而且還在進一步被快速拉開。
可靠性如何?
最近,由多倫多大學(xué)和谷歌公司聯(lián)合進行的一項關(guān)于閃存SSD固態(tài)硬盤生產(chǎn)領(lǐng)域的研究顯示:
原始比特誤碼率(raw bit error rate,RBER)在以一個非常慢的速度增長,其要比一般認(rèn)為的速率慢得多。而更重要的則是,它們對于不可校正錯誤或其他錯誤模式是不能預(yù)測的。相較于 傳統(tǒng)HDD硬盤,閃存SSD固態(tài)硬盤在該領(lǐng)域具有明顯更低的替代率;然而,它們具有較高的不可校正的錯誤率。
根據(jù)Gartner公司和其他業(yè)內(nèi)分析機構(gòu)預(yù)測,讀取優(yōu)化的閃存SSD和近線FAT HDD硬盤的成本交叉點——即每TB的計算購置成本,將在2016年出現(xiàn)。
這意味著這些大容量、讀取優(yōu)化的閃存的閃存SSD固態(tài)硬盤對于對象存儲是最為理想的。原因如下:因為閃存NAND的本質(zhì),SSD讀寫次數(shù) (program-erase,PE)塊更有可能出現(xiàn)運行失敗或產(chǎn)生不可恢復(fù)的寫操作錯誤。而讀取操作則很少產(chǎn)生不可恢復(fù)的錯誤,雖然可能出現(xiàn)讀取受干擾 的情況,但這是極為罕見的。對象存儲的糾刪碼基本上是在不同PE塊、驅(qū)動器和節(jié)點寫入對象作為多個子對象。當(dāng)一個子對象有一個不可恢復(fù)的錯誤時,對象存儲 會將其簡單的寫在別的地方,SSD將淘汰該PE塊。然后其在SSD中從過度配置的庫存中維持容量能力。這使得讀取優(yōu)化的SSD閃存存儲非常適用于對象存 儲。
這一切固然都不錯,但SSD閃存存儲——即使是讀取優(yōu)化的閃存SSD固態(tài)硬盤——也要比HDD貴出很多呢?其曾經(jīng)的確是的。但SSD和高性能的 HDD硬盤驅(qū)動器之間的交叉拐點發(fā)生在2015年。根據(jù)Gartner和業(yè)界的其他分析師們預(yù)測,讀取優(yōu)化的閃存SSD和近線FAT HDD硬盤的成本交叉點——每TB的計算購置成本將在2016年出現(xiàn)。請記住,讀取優(yōu)化的閃存SSD功耗和每TB的原始冷卻成本平均約為10%。加上在數(shù) 據(jù)中心占用空間的節(jié)省和不必使用強化地板,以處理高密度機架硬盤的重量的成本節(jié)省,使得該成本交叉點很有可能是在2016年底前出現(xiàn)。
使用讀取優(yōu)化的閃存SSD的系統(tǒng)將有更好的對象存儲性能——高達(dá)2至3倍的速度、占用更少的機架和占地面積,而且最終成本低于當(dāng)今的對象存儲。對于今天的對象存儲用戶的好消息是,對象存儲升級要比傳統(tǒng)存儲簡單,可以一次在一個節(jié)點上在線進行,而無需數(shù)據(jù)遷移。
改善數(shù)據(jù)存儲效率的七大技巧
存儲網(wǎng)絡(luò)、服務(wù)器端的閃存、網(wǎng)絡(luò)緩存、軟件定義的存儲和全閃存或混合陣列有助于存儲性能和效率的提升。
企業(yè)組織機構(gòu)IT專業(yè)人員們需要長期不斷地與存儲性能進行“拉鋸戰(zhàn)”,以便能夠確保其應(yīng)用程序能夠獲得運行所需要的資源,實現(xiàn)最佳性能。而回到當(dāng)硬 盤技術(shù)還是最先進的技術(shù)的時候,這意味著彼時的企業(yè)組織機構(gòu)所采用的是成本昂貴且效率低下的技術(shù)——比如即使不是跨數(shù)以百計的硬盤的話,至少也是跨幾十個 硬盤來標(biāo)記數(shù)據(jù),然后格式化這些硬盤驅(qū)動器,使得只有一半的容量能力能夠提供給應(yīng)用程序。
而企業(yè)組織機構(gòu)更為負(fù)擔(dān)得起的閃存的到來,有望在可預(yù)見的未來打破存儲在應(yīng)用程序性能方面的瓶頸。而為了能夠充分利用閃存,您的企業(yè)組織將需要通過 采用正確的方式來部署實現(xiàn),并同時還需要采用正確的互補技術(shù)。這樣,您企業(yè)組織才可以從固態(tài)存儲部署和存儲網(wǎng)絡(luò)中獲得性能最大化和更高的效率。
例如,對于常用活躍數(shù)據(jù)而言,閃存較之硬盤驅(qū)動器有較少的移動部件,故而能夠提供更好的性能。其結(jié)果是,在主數(shù)據(jù)使用案例的情況下,閃存較之硬盤驅(qū) 動器的部署成本往往更便宜,尤其是對于長距離持久存儲。固態(tài)存儲的問題是,在任何既定的時間點上,數(shù)據(jù)中心只有約5%至10%的數(shù)據(jù)是常用活躍的。所以您 企業(yè)組織還不如通過將剩余的90%或更多的數(shù)據(jù)存儲在容量更高、更便宜的HDD硬盤來節(jié)省一些現(xiàn)金成本,或者干脆和其他越來越多的企業(yè)都在做的那樣,將這 些剩余的數(shù)據(jù)存儲在云中。
正如上文的這一例子所示,閃存本身并不一定能夠提高數(shù)據(jù)存儲效率和性能。您企業(yè)組織將需要從打造一個堅實的基礎(chǔ)開始,而這也就引出了我們撰寫本文所想要為廣大讀者朋友們介紹的關(guān)于實現(xiàn)更快、更高效的存儲的七大技巧的第一點:改善存儲網(wǎng)絡(luò)
的確,基于硬盤的系統(tǒng)的延遲性并不會暴露一個網(wǎng)絡(luò)的弱點,但一個基于閃存的系統(tǒng)則會。因此,當(dāng)您所在的企業(yè)組織升級到閃存或為現(xiàn)有的系統(tǒng)添加額外的 固態(tài)硬盤之前,您應(yīng)該首先最大限度地提高您企業(yè)存儲網(wǎng)絡(luò)的能力。而您所需要考慮的關(guān)于企業(yè)網(wǎng)絡(luò)的三個組成部分則包括:在服務(wù)器和存儲系統(tǒng)中的主機總線適配 器(Host BusAdapter,HBA)或網(wǎng)絡(luò)接口卡(NIC)、網(wǎng)絡(luò)交換機和布線基礎(chǔ)設(shè)施。
人們很容易只關(guān)注帶寬能力的前兩個組成部分(NIC/HBA和交換機),其應(yīng)該達(dá)到10 GbE或16 Gbps光纖通道(FC)或更快。雖然帶寬是非常重要的,延遲和交付質(zhì)量更加如此。 大多數(shù)數(shù)據(jù)中心都無法產(chǎn)生足夠的連續(xù)交易來沖擊一個高速網(wǎng)絡(luò)。相反,它們會產(chǎn)生數(shù)百萬個非常小的交易。網(wǎng)絡(luò)將這些交易從服務(wù)器移動到存儲,然后再返回的效 率是至關(guān)重要的,以便能夠從一個閃存的投資中提取最大的性能。
布線也是至關(guān)重要的,而且其往往是在存儲網(wǎng)絡(luò)的性能和數(shù)據(jù)存儲效率中一個經(jīng)常被忽視的因素。您企業(yè)組織應(yīng)該在光纖基礎(chǔ)上建立布線基礎(chǔ)設(shè)施,以支持當(dāng) 前和下一代網(wǎng)絡(luò)的高帶寬和低延遲能力,并對其進行構(gòu)造,以便可以方便地確定端口分配。您企業(yè)還需要了解“鏈路損耗預(yù)算”,其是連接之間丟失的信號量。
一旦您已經(jīng)對您企業(yè)的存儲網(wǎng)絡(luò)進行了微調(diào),那么,是時候來考慮閃存的部署了。
實現(xiàn)服務(wù)器端的閃存
在服務(wù)器端的閃存設(shè)計中,網(wǎng)絡(luò)和連接到該網(wǎng)絡(luò)的存儲仍然是相同的,基本上安裝的是基于硬盤驅(qū)動器的存儲陣列,其存儲網(wǎng)絡(luò)的速度和質(zhì)量并沒有當(dāng)部署一個共享閃存陣列時那樣來得重要。但是,您利用服務(wù)器端的閃存的方式則是可以改變的。
當(dāng)您隔離服務(wù)器閃存時,該設(shè)計對于網(wǎng)絡(luò)的影響是最小的。在這里,您企業(yè)安裝一個固態(tài)硬盤或閃存PCIe卡僅僅只為該服務(wù)器的I/O負(fù)責(zé)。服務(wù)器本身成為一個單一故障點,所以這個用例只適用于存儲在共享存儲陣列上的數(shù)據(jù)的讀高速緩存。
相比之下,服務(wù)器端的閃存技術(shù),從多臺服務(wù)器聚集了內(nèi)部閃存,以創(chuàng)建一個虛擬的閃存池。這些服務(wù)器端的閃存聚合產(chǎn)品建立在冗余,適用于讀和寫緩存,甚至作為一個存儲層。然而,他們確實在性能方面引入了網(wǎng)絡(luò)因素,因為聚合需要一個網(wǎng)絡(luò)來創(chuàng)建虛擬存儲池。
部署一個網(wǎng)絡(luò)緩存
不同于存儲系統(tǒng)的升級,其僅僅只是增加了一個單一系統(tǒng)的性能,一個網(wǎng)絡(luò)緩存則能夠提升網(wǎng)絡(luò)上的每個存儲系統(tǒng)的性能。這些設(shè)備基本上是在存儲系統(tǒng)和服 務(wù)器之間內(nèi)聯(lián)的,緩存最常見活躍的數(shù)據(jù)。許多網(wǎng)絡(luò)緩存在高可用性的配置中是可用的,這使得它們適合緩存讀取和寫入I/O。您也可以規(guī)?;W(wǎng)絡(luò)緩存,讓閃存 存儲區(qū)大到足以存儲一家企業(yè)組織的整個常見活躍數(shù)據(jù)集,實際上把現(xiàn)有陣列納入到歸檔和數(shù)據(jù)保護存儲系統(tǒng)。
網(wǎng)絡(luò)緩存的一個重要的優(yōu)勢在于其能夠提高存儲性能,而不需要更換當(dāng)前的數(shù)據(jù)保護政策和程序。這些程序保持不變,因為現(xiàn)在的數(shù)據(jù)將同時位于高速緩存和原始存儲系統(tǒng)上。
需要注意的是,在快照或備份作業(yè)開始之前,尋找一個可以通過編程清空緩沖區(qū)數(shù)據(jù)的網(wǎng)絡(luò)緩存是很重要的。您也應(yīng)該在部署之前,考慮您企業(yè)網(wǎng)絡(luò)基礎(chǔ)設(shè)施及其組件的質(zhì)量。
考慮采用一款云支持的網(wǎng)絡(luò)緩存
網(wǎng)絡(luò)緩存選項的變體可以采用一種混合云的方式。一些供應(yīng)廠商——比如Avere、微軟Azure StorSimple、Nasuni和來自EMC的TwinStrata,提供全閃存網(wǎng)絡(luò)緩存,能夠?qū)⒎腔钴S的數(shù)據(jù)遷移到諸如亞馬遜、Azure或谷歌等 云存儲位置,而不是本地存儲。事實上,這可能是通往一個全閃存數(shù)據(jù)中心的最實用的途徑之一,因為現(xiàn)在的數(shù)據(jù)中心可以是真正全閃存的,而舊的數(shù)據(jù)已經(jīng)在云中 被存儲和保護。
借助小閃存陣列部署SDS
改善存儲性能和數(shù)據(jù)存儲效率的另一種選擇是使用軟件定義的存儲(SDS)。這些產(chǎn)品要么運行在一款設(shè)備上;要么在一個虛擬機系統(tǒng)管理程序內(nèi)運行,并 能夠跨各種硬件陣列提供一組通用的存儲軟件功能。一些SDS系統(tǒng)可以利用現(xiàn)有的存儲硬件,并在它們之間提供數(shù)據(jù)的自動遷移。如果您企業(yè)添加一個小的閃存陣 列到現(xiàn)有的基礎(chǔ)設(shè)施,您可以使用SDS自動遷移最活躍的數(shù)據(jù)集到陣列,以提高性能。而作為一個額外的獲益,其還簡化了管理,因為所有的存儲管理變得統(tǒng)一。
優(yōu)化應(yīng)用程序
在部署一款新的或增強現(xiàn)有存儲系統(tǒng)之前,務(wù)必請仔細(xì)檢查您企業(yè)打算運行的應(yīng)用程序。許多存儲專業(yè)人員發(fā)現(xiàn)這一點尤其艱巨,因為他們既不擁有這些應(yīng)用 程序,也不了解這些應(yīng)用程序的代碼。好消息是,可以使用某些程序來檢查應(yīng)用程序的代碼,這提供了一個公正的分析其質(zhì)量的方法,并能夠就需要在哪些地方進行 改變提出具體的建議。
雖然人們很容易跳過這一步,并只是在這個問題上投入更多的硬件,但請千萬不要這樣做。一個與代碼相關(guān)的性能問題可能被高性能的存儲所掩蓋,但其決不 允許閃存充分發(fā)揮其全部潛力——從而迫使管理員們?nèi)ふ移渌麧撛诘男阅芷茐恼?,如存儲網(wǎng)絡(luò)。在部署閃存之前搞定代碼問題甚至可能避開一開始對于閃存的需 求,或減少您企業(yè)所需要采購的閃存需求。
采購一個新的全閃存或混合陣列
這些對基于現(xiàn)有的硬盤系統(tǒng)仍然在使用壽命期限內(nèi)、且仍在原來的保修期內(nèi)的數(shù)據(jù)中心是理想的,這樣您就可以重新部署這些舊的硬盤系統(tǒng),并用一個新的閃 存陣列來擴充他們。但是,在某些時候,您將需要購買新的存儲系統(tǒng)。今天,這意味著在一個全閃存或混合陣列之間進行選擇。最初的決定是相對簡單的:如果企業(yè) 組織負(fù)擔(dān)得起全閃存陣列,其將滿足企業(yè)的容量要求(假設(shè)性能要求會得到滿足是可行的),然后再購買一個。
然而,許多企業(yè)組織都很難找到一款正好適合他們預(yù)算的閃存陣列。他們可以通過選擇一款混合陣列,來獲得一款全閃存陣列相同的益處,而又無需該水平的投資。其將閃存和HDD結(jié)合進同一系統(tǒng),然后,通過軟件在它們之間自動遷移數(shù)據(jù)。
對于混合陣列的主要關(guān)注:高速緩存缺失,已經(jīng)是過去的事情了。當(dāng)閃存容量的成本如此昂貴,以致于一個混合陣列的閃存層占總存儲容量的比例還不到5%時,其是一個需要關(guān)注的問題。但是現(xiàn)在,閃存層往往是容量的25%(如果沒有更多),顯著降低了高速緩存缺失的可能性。
總結(jié)
通往存儲性能提高的道路并不是從一個全閃存的投資開始的。其是從將您企業(yè)組織的存儲網(wǎng)絡(luò)作為一個整體,進行仔細(xì)的檢查開始的。一旦您企業(yè)這樣做了, 還有很多其他的提升存儲性能和數(shù)據(jù)存儲效率的選項可以考慮,其中許多都包括了某種類型的閃存存儲的部署。該款產(chǎn)品的效果會因具體數(shù)據(jù)中心的不同而有所差 異,而正如本文在對這些技巧進行介紹的那樣,某些企業(yè)組織的IT部門可能甚至不需要升級他們所有的存儲系統(tǒng)。
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。