ZDNet至頂網(wǎng)服務(wù)器頻道 05月20日 新聞消息: 日前,主題為數(shù)據(jù)蘊(yùn)藏價(jià)值 用芯發(fā)掘機(jī)遇的英特爾大數(shù)據(jù)技術(shù)及行業(yè)應(yīng)用論壇在北京舉行。英特爾介紹了其在大數(shù)據(jù)領(lǐng)域的最新進(jìn)展,并攜手獨(dú)立軟件開發(fā)商、系統(tǒng)集成商等合作伙伴展示了基于英特爾至強(qiáng)+Hadoop基礎(chǔ)上的行業(yè)大數(shù)據(jù)解決方案。其后,同樣的論壇還將在上海、廣州、南京、武漢、成都等地舉行。
談到英特爾這樣做的原因,英特爾數(shù)據(jù)中心軟件部中國區(qū)首席技術(shù)官苗凱翔博士表示,現(xiàn)在大數(shù)據(jù)軟件解決方案已經(jīng)成為了英特爾全球戰(zhàn)略。中國已于去年底早于全球發(fā)布了英特爾Hadoop發(fā)行版軟件。從英特爾戰(zhàn)略來講,硬件和軟件的結(jié)合非常重要,英特爾真心希望從性能上幫助業(yè)界往前跨一步。有鑒于大數(shù)據(jù)的迅猛增長和企業(yè)對大數(shù)據(jù)越來越重視,英特爾準(zhǔn)備和合作伙伴一起,共同建設(shè)大數(shù)據(jù)生態(tài)鏈,為電信、金融、醫(yī)療、智慧城市等行業(yè)提供更多契合需求的解決方案。
軟+硬全力深耕大數(shù)據(jù)市場
英特爾在大數(shù)據(jù)論壇上展示了醫(yī)療、電信、金融等行業(yè)的大數(shù)據(jù)解決方案及案例,而支撐起這些解決方案,并幫助它們成功通過實(shí)戰(zhàn)考驗(yàn)的主要力量,則是來自英特爾應(yīng)大數(shù)據(jù)核心應(yīng)用需求而開發(fā)的創(chuàng)新產(chǎn)品和技術(shù),其中主要包括:可為大數(shù)據(jù)的采集和邊緣處理提供支持英特爾凌動處理器及英特爾至強(qiáng)E3處理器平臺;能實(shí)現(xiàn)高效橫向擴(kuò)展以承載大數(shù)據(jù)分布式存儲、管理、處理和查詢重任的英特爾至強(qiáng)E5處理器平臺和針對它進(jìn)行了優(yōu)化、以具體實(shí)現(xiàn)這些應(yīng)用功能的英特爾Hadoop發(fā)行版軟件(Intel Distribution for Apache Hadoop);主要為大數(shù)據(jù)分析和商業(yè)智能提供支持,擁有高性能,支持高帶寬、高容量內(nèi)存子系統(tǒng),并具備可媲美小型機(jī)的可靠性、可用性和可維護(hù)性(RAS)特性的英特爾至強(qiáng)E7處理器平臺。圍繞這些核心處理器平臺所構(gòu)建的服務(wù)器設(shè)備,英特爾還提供了萬兆以太網(wǎng)和固態(tài)硬盤等創(chuàng)新,來突破大數(shù)據(jù)應(yīng)用在數(shù)據(jù)傳輸和存儲方面的性能瓶頸。
2009年開始我們已經(jīng)開始做Hadoop,當(dāng)時(shí)是作為一個創(chuàng)新主題,看看Hadoop的架構(gòu)、應(yīng)用場景是什么。由于當(dāng)時(shí)中國有具體的需求,大數(shù)據(jù)環(huán)境非常好,并且有電信行業(yè)典型的用戶需求。這都推動我們馬上把Hadoop變成了一個產(chǎn)品來滿足客戶的需求。苗凱翔博士回憶說。
英特爾中國行業(yè)合作解決方案服務(wù)部企業(yè)技術(shù)銷售與數(shù)據(jù)中心咨詢資深經(jīng)理張哲源表示,正是有了Hadoop的加入,英特爾才能實(shí)現(xiàn)軟硬的有機(jī)組合,構(gòu)成了英特爾針對大數(shù)據(jù)應(yīng)用提供的端到端支持,推動更多的合作伙伴在其上開發(fā)適合行業(yè)需求的大數(shù)據(jù)解決方案。
端到端支持用友醫(yī)療數(shù)據(jù)大挖掘
作為英特爾醫(yī)療行業(yè)大數(shù)據(jù)的重要合作伙伴,用友展示了其基于英特爾平臺的大數(shù)據(jù)解決方案。用友醫(yī)療衛(wèi)生信息系統(tǒng)有限公司副總裁、用友智慧健康研究院首席專家徐春華介紹, 醫(yī)療行業(yè)和大數(shù)據(jù)相關(guān)的主要有三大領(lǐng)域,也即電子健康檔案、城市級的電子病歷數(shù)據(jù)中心和衛(wèi)生醫(yī)療相關(guān)的統(tǒng)計(jì)數(shù)據(jù)。這三個領(lǐng)域的數(shù)據(jù)有著共性的特征:海量數(shù)據(jù)、結(jié)構(gòu)化半結(jié)構(gòu)化并存、版本隨著時(shí)間而改變。有鑒于此,用友將大數(shù)據(jù)技術(shù)主要用于三大數(shù)據(jù)庫的建設(shè)上。
這些領(lǐng)域必須采用大數(shù)據(jù)處理手段來處理,關(guān)鍵要素涉及到兩個:一是通過引入并行計(jì)算框架提高整個解決方案的運(yùn)行性能,到了PB級數(shù)據(jù)以后,運(yùn)行時(shí)間成為了關(guān)鍵參數(shù);二是基于列的數(shù)據(jù)庫架構(gòu),它和傳統(tǒng)的關(guān)系型數(shù)據(jù)庫有很大的差異。徐春華說。
在過去一年中,用友醫(yī)療和英特爾上海Hadoop團(tuán)隊(duì)開展了深入的合作,采用基于英特爾x86服務(wù)器集群+Hadoop綜合解決方案來嘗試處理大型電子健康檔案和區(qū)域性的醫(yī)療質(zhì)量分析。目前從運(yùn)轉(zhuǎn)情況來看效果非常理想。
在醫(yī)療行業(yè),用友采用的計(jì)算架構(gòu)有三類:x86服務(wù)器、小型機(jī)、大型主機(jī)。談到大數(shù)據(jù)領(lǐng)域用友為什么會選擇x86集群?徐春華表示,傳統(tǒng)做計(jì)算架構(gòu)或者存儲架構(gòu)的時(shí)候,經(jīng)常要考慮3年到5年的存儲量。但這樣往往存在著大量的浪費(fèi),因?yàn)閯傞_始往往用不到那么大的量。而英特爾提倡的橫向擴(kuò)展模式,可以根據(jù)業(yè)務(wù)的規(guī)模而隨時(shí)增加計(jì)算和存儲能力,這是用友和用友的客戶非常樂于接受的一種模式。
英特爾Hadoop發(fā)行版軟件雖然是新近加入英特爾陣營的產(chǎn)品,屬于軟實(shí)力,但實(shí)際上它在英特爾內(nèi)部已經(jīng)孕育有些年頭了。這期間一些用戶的需求,比如電信行業(yè)3G智能手機(jī)的用戶想查流量清單,智慧城市中的車載數(shù)據(jù)、視頻數(shù)據(jù)、監(jiān)控?cái)?shù)據(jù)的管理和分析。這些用戶實(shí)實(shí)在在的需求驅(qū)動英特爾把Hadoop變成一個真正的產(chǎn)品。
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。