大數(shù)據(jù)剛出現(xiàn)的時(shí)候,基本上只會(huì)用在高端科技類(lèi)或者硅谷網(wǎng)絡(luò)分析公司中;到了今天,如銀行、電信、保險(xiǎn)公司等更為傳統(tǒng)的行業(yè)也逐漸搭上了這輛列車(chē)。然而,在Teradata(數(shù)據(jù)倉(cāng)庫(kù)公司)技術(shù)總監(jiān)Stephen Brobst(寶立明)看來(lái),這還僅僅是個(gè)開(kāi)始。
2012年,許多IT業(yè)內(nèi)人士都發(fā)起了關(guān)于大數(shù)據(jù)的討論,寶立明就是其中之一。在今年TechTarget對(duì)他的采訪中,他兩次提到了他眼中的大數(shù)據(jù)熱潮。在以下的精選采訪中,你會(huì)讀到寶立明對(duì)云端數(shù)據(jù)倉(cāng)庫(kù)的憧憬、對(duì)內(nèi)存技術(shù)流行的看法以及對(duì)移動(dòng)消費(fèi)智能的期待。
問(wèn):對(duì)于大數(shù)據(jù)現(xiàn)象,你有什么看法?
寶立明:大數(shù)據(jù)熱潮主要關(guān)注的是大數(shù)據(jù)的容量,這卻恰恰是大數(shù)據(jù)中最不重要的一方面。拿Geoffrey Moore的crossing the chasm采用曲線圖(見(jiàn)下圖)來(lái)說(shuō),我們現(xiàn)在就處在裂口(chasm)的左邊,即發(fā)明者與早期采用者階段,所有的企業(yè)都是高端科技與網(wǎng)絡(luò)公司。不過(guò),今年有了一點(diǎn)改變,更多的主流公司開(kāi)始采用大數(shù)據(jù)分析;這些企業(yè)都不是技術(shù)公司,或者說(shuō)得準(zhǔn)確一點(diǎn),與網(wǎng)絡(luò)無(wú)關(guān),比如銀行、電信等等。
問(wèn):但是像Hadoop和MapReduce這樣的大數(shù)據(jù)技術(shù),它們不仍然是硅谷網(wǎng)絡(luò)公司一些核心軟件工程師的專長(zhǎng)領(lǐng)域嗎?
寶立明:在這個(gè)的過(guò)程中,Hadoop非常重要。但是,大數(shù)據(jù)不等于Hadoop;Hadoop目前只適合高端科技和非常專業(yè)的公司。其實(shí),Moore的理論對(duì)技術(shù)專業(yè)人士和實(shí)用主義者(只為應(yīng)用技術(shù)而對(duì)技術(shù)本身不感興趣的人)同樣適用。對(duì)于Teradata來(lái)講,我們的Aster Data在大數(shù)據(jù)普及過(guò)程中起到了橋梁的作用。去年,使用Aster Data的大客戶都是網(wǎng)絡(luò)公司,像LinkedIn、BarnesandNoble.com等。今年的業(yè)務(wù)明顯偏向主流企業(yè)——電信和銀行;它們大部分都在美國(guó),這點(diǎn)沒(méi)錯(cuò),但相信用不了多久就能夠推廣到其他地區(qū)。
問(wèn):現(xiàn)在很多人都在討論開(kāi)源與傳統(tǒng)商用關(guān)系數(shù)據(jù)庫(kù)的利弊。你是怎么看這兩者的關(guān)系的?
寶立明:我們現(xiàn)在和Hortonworks的合作關(guān)系就是一個(gè)典型的例子。他們有很多Hadoop原創(chuàng)開(kāi)發(fā)者,運(yùn)用的都是開(kāi)源技術(shù);有趣的是,開(kāi)發(fā)出來(lái)的元數(shù)據(jù)架構(gòu)不僅可對(duì)原始數(shù)據(jù)進(jìn)行處理,還能夠使數(shù)據(jù)獲取變得更加高效。
問(wèn):你對(duì)內(nèi)存分析的看法是什么?
寶立明:太火了??梢赃@么說(shuō),內(nèi)存價(jià)格每過(guò)18個(gè)月就會(huì)下降30%,但即便如此,存儲(chǔ)所有數(shù)據(jù)還是花費(fèi)不菲。當(dāng)然還有一點(diǎn),數(shù)據(jù)容量每18個(gè)月就會(huì)增長(zhǎng)40%,所以內(nèi)存依舊無(wú)法滿足數(shù)據(jù)量需求。SAP正在大肆宣揚(yáng)HANA可以解決所有問(wèn)題,這完全是因?yàn)槭艿搅思坠俏牡挠绊?。知道困獸之斗吧,是Oracle的產(chǎn)業(yè)鏈引發(fā)了SAP的不理智行為。SAP每年花在甲骨文身上的錢(qián)實(shí)在太多了,他們想要?jiǎng)冸xOracle數(shù)據(jù)庫(kù),因此而收購(gòu)了Sybase,甚至在收購(gòu)之前Sybase還沒(méi)有通過(guò)SAP應(yīng)用的認(rèn)證,他們要將Sybase作為SAP唯一的數(shù)據(jù)庫(kù)平臺(tái)。但要知道Sybase的規(guī)模還不足以支撐,對(duì)于理性的用戶來(lái)說(shuō)肯定不會(huì)想簡(jiǎn)單地聽(tīng)從廠商的擺布。相比較而言,IBM的DB2要更好一些。
問(wèn):但是企業(yè)數(shù)據(jù)倉(cāng)庫(kù)現(xiàn)在是不是有點(diǎn)過(guò)時(shí)了?Teradata的一些競(jìng)爭(zhēng)對(duì)手肯定會(huì)這么認(rèn)為。
寶立明:這是一個(gè)仁者見(jiàn)仁的問(wèn)題。現(xiàn)在已經(jīng)不可能把所有數(shù)據(jù)放到同一個(gè)地方了。想想看,如果你把所有的電子郵件和.wav文件全都放到一個(gè)數(shù)據(jù)倉(cāng)庫(kù)里行不行?很可能不行。但是,企業(yè)內(nèi)容管理與數(shù)據(jù)倉(cāng)庫(kù)還有區(qū)別。對(duì)于關(guān)系數(shù)據(jù)來(lái)說(shuō),集成化數(shù)據(jù)倉(cāng)庫(kù)與一系列小型數(shù)據(jù)集市比起來(lái)更省錢(qián),業(yè)務(wù)價(jià)值也更高。Sybase的模型就是小型數(shù)據(jù)集市;你最后只能不停地拷貝數(shù)據(jù),通過(guò)各種方法將它們聚集起來(lái),成本也自然上漲。
問(wèn):你認(rèn)為云計(jì)算對(duì)數(shù)據(jù)倉(cāng)庫(kù)有什么影響嗎?
寶立明:公有云架構(gòu)對(duì)數(shù)據(jù)倉(cāng)庫(kù)沒(méi)有影響,因?yàn)槠髽I(yè)的CIO不會(huì)無(wú)緣無(wú)故地把財(cái)務(wù)數(shù)據(jù)或客戶數(shù)據(jù)放到云上。那樣做很危險(xiǎn)。但私有云架構(gòu)確實(shí)有影響。第一,通過(guò)私有云,你可以鞏固數(shù)據(jù)集市,減少利用率不足的問(wèn)題。經(jīng)過(guò)幾次以后,架構(gòu)成本也就省下來(lái)了。第二,你可以通過(guò)靈敏的方式將數(shù)據(jù)集成,實(shí)現(xiàn)業(yè)務(wù)價(jià)值。在集中化解決方案中,業(yè)務(wù)方面的變化總是來(lái)得很慢。不過(guò),你可以在私有云中利用data lab的概念,對(duì)另一數(shù)據(jù)源(內(nèi)外部皆可)進(jìn)行集成。這個(gè)方法的關(guān)鍵在于,data lab與數(shù)據(jù)倉(cāng)庫(kù)為同一環(huán)境,所以你不需要復(fù)制集中化數(shù)據(jù),也沒(méi)有安全問(wèn)題,同時(shí)授權(quán)給了用戶一種非真實(shí)的網(wǎng)格計(jì)算方法,與云的概念類(lèi)似。
問(wèn):在企業(yè)IT中,云計(jì)算與移動(dòng)化常被同時(shí)提到,認(rèn)為會(huì)改變游戲規(guī)則。你是怎么看移動(dòng)技術(shù)對(duì)數(shù)據(jù)倉(cāng)庫(kù)與BI的影響?
寶立明:我們的主要概念是消費(fèi)者智能(consumer intelligence)。我們的團(tuán)隊(duì)主要關(guān)注于公司員工的決策制定。消費(fèi)者智能就是為那些是我們客戶的消費(fèi)群體提供智能服務(wù)。這樣一來(lái),移動(dòng)設(shè)備必不可少。我們?cè)谟?guó)的案例是萊斯銀行,美國(guó)的是富國(guó)銀行,提倡你就是自己家庭的CEO。還有一個(gè)案例是在公共事業(yè)領(lǐng)域。南加州愛(ài)迪生公司(美國(guó)第二大電力公司)實(shí)施了智能電表(smart metering)以后,在他們的網(wǎng)站Sce.com上,消費(fèi)者可以分析自己能源消費(fèi)的類(lèi)型。移動(dòng)消費(fèi)者智能可謂大勢(shì)所趨。
分享到微信 ×
打開(kāi)微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁(yè)分享至朋友圈。