咨詢師Glen Kemp分享了一位客戶在遇到平臺Bug之后重新評估網(wǎng)絡(luò)虛擬化好處的案例。
任何新技術(shù)或現(xiàn)有技術(shù)的迭代都會使事件變得更快、更便宜或減少運(yùn)營花費(fèi)。服務(wù)器虛擬化肯定能產(chǎn)生這些結(jié)果,而現(xiàn)在網(wǎng)絡(luò)虛擬化正在吸引越來越多的關(guān)注。然而,一些最新項(xiàng)目證明了虛擬化案例并不一定是這樣的。
按照我作為一名安全和IT咨詢師的經(jīng)驗(yàn),我曾經(jīng)看到過一些客戶跟隨潮流購買了安全虛擬化產(chǎn)品,將許多服務(wù)都整合到一個(gè)平臺上。這樣可以顯著節(jié)省電源和減少維護(hù)費(fèi)用。這一切都很好:合唱隊(duì)在看不見的地方高唱贊歌,告訴人們新技術(shù)是如何讓生活變得更好。
但是,它并不適用于一些情況——至少一開始是不適合的。
這就是我要說的。有這樣一個(gè)例子,一個(gè)客戶在使用虛擬化框架不久之后,就遇到了一個(gè)嚴(yán)重的平臺Bug。問題的細(xì)節(jié)并不重要,但是它的影響卻很大。在虛擬化 之前,這種問題的影響范圍很有限,但是共享平臺的層疊故障導(dǎo)致許多個(gè)業(yè)務(wù)單元發(fā)生中斷。這個(gè)問題很難修復(fù),它需要安裝幾個(gè)補(bǔ)丁才能讓平臺保持穩(wěn)定運(yùn)行。但 是,所造成的損失已經(jīng)成定局。對于管理層而言,他們對于網(wǎng)絡(luò)虛擬化的信任已經(jīng)完全消失。因此,他們提議對網(wǎng)絡(luò)進(jìn)行全面更新;這時(shí)我開始參與項(xiàng)目。這個(gè)計(jì)劃 是完全更換平臺,逐漸減小組織對于共享物理基礎(chǔ)架構(gòu)的依賴。
這不是我第一次見證同類項(xiàng)目的發(fā)生。我已經(jīng)看到過幾個(gè)案例了,客戶選擇從虛擬化網(wǎng)絡(luò)功能(VNF)退回到相對更為常規(guī)的網(wǎng)絡(luò)設(shè)計(jì)。表面上,在分布式集群上運(yùn)行VNF應(yīng)該可以實(shí)現(xiàn)令人期盼的成本節(jié)約。然而,我發(fā)現(xiàn)它也一樣會顯著增加系統(tǒng)的復(fù)雜性,特別是在監(jiān)控和管理方面。
不小心的話虛擬化系統(tǒng)就可能影響其他運(yùn)營
所有虛擬化的核心都藏著一種妥協(xié),用戶只能減輕它的影響卻無法完全消除它。虛擬化系統(tǒng)共享著物理資源,即使有資源保護(hù)、調(diào)度及其他“軟”控制,虛擬化系統(tǒng) 仍然會對各自產(chǎn)生負(fù)面影響。在很多時(shí)候,它們并不會互相干擾,只要有恰當(dāng)?shù)南到y(tǒng)管理,許多系統(tǒng)都可以共享相同的硬件。對于大多數(shù)最終用戶而言,共享資源可 以減少運(yùn)營成本。
服務(wù)器、網(wǎng)絡(luò)和安全虛擬化技術(shù)都共享一個(gè)致命要害:每一個(gè)節(jié)點(diǎn)(交換機(jī)或虛擬實(shí)例)都有的軟件系統(tǒng)。它可能是虛擬機(jī)管理程序、共享控制面板或集群協(xié)議。網(wǎng)絡(luò)/服務(wù)器/安全等組件的運(yùn)行依賴于這些服務(wù)。這本身沒有問題,因?yàn)榈竭_(dá)臨界點(diǎn)之前它們都是完全可靠的。
要記住IT運(yùn)營的兩個(gè)不變事實(shí):有Bug,也會有補(bǔ)丁(接下去就是人終究有死和必須交稅)。如果運(yùn)氣好,問題的根源和影響都會被修復(fù)。硬件和軟件供應(yīng)商會 在后續(xù)的升級和自動(dòng)恢復(fù)中改進(jìn)產(chǎn)品,但是有時(shí)候這些過程不可避免地會出現(xiàn)錯(cuò)誤。在上面的客戶案例中,問題跟蹤后發(fā)現(xiàn)是由于內(nèi)存泄漏引起的——任何供應(yīng)商都 可能(也確實(shí))會有這樣的問題。但是,一定上層作了決策,我們也不得不實(shí)施決議的計(jì)劃。
讓虛擬鏈路重新變成物理鏈路
遷移網(wǎng)絡(luò)的短期影響是可以預(yù)見的:需要使用大量的銅線和機(jī)架將虛擬鏈路重新變成物理鏈路。除了這些大件的工程問題,還有許多并行流程可用于零碎部件。在完 成更換之后,由于“技術(shù)水平發(fā)展”,基礎(chǔ)架構(gòu)的總?cè)萘繉?shí)際上會比以前增加了。然而,由于有更多的處理器和接口,因此跟蹤通過基礎(chǔ)架構(gòu)的流量會變得更加困 難。
在虛擬化環(huán)境中,一個(gè)集群通常等同于一個(gè)管理接口。在物理環(huán)境中,幾十個(gè)不同的管理接口部署在一起會形成一種巨大的管理難題。雖然可以使用一些元素管理工 具來創(chuàng)建跨越物理基礎(chǔ)架構(gòu)的策略,但是它們還無法完全解決所有的管理問題。例如,對于管理員基于角色的訪問控制作一點(diǎn)點(diǎn)小修改都會向80臺設(shè)備發(fā)送請求。 為了解決這些模板型問題,使用自動(dòng)化工具是理所當(dāng)然的方法。然而,由于組織的管理層已經(jīng)拋棄了像虛擬化這樣的“成熟”技術(shù),因此可以想像他們對于 NetOps風(fēng)格的系統(tǒng)管理的態(tài)度(不會太好)。
同時(shí),有一些小問題取代了用戶的大問題;客戶選擇對抗100只小馬,而不是一只小馬。毫無疑問,這個(gè)公司在放棄網(wǎng)絡(luò)虛擬化的好處之后是在逆流而上;但是在 這個(gè)案例中,可用性壓倒(幾乎)了所有其他的問題。人們其實(shí)沒有必要害怕到放棄虛擬化,但是也需要一定的執(zhí)著力。而且,人們必須要有一定的克制力,接受讓 許多硬件和軟件閑置的事實(shí),然后騎著小馬去迎接挑戰(zhàn)。
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。