從2008年至今,中國大數(shù)據(jù)技術(shù)大會(BDTC)已成功舉辦8屆。放眼海外,中國大數(shù)據(jù)技術(shù)大會曾傳遞Google、Microsoft、Intel、Yahoo!、Facebook、LinkedIn、Cloudera、Hortonworks、Databricks等大數(shù)據(jù)先鋒機(jī)構(gòu)的第一手探索;聚焦國內(nèi),中國大數(shù)據(jù)技術(shù)大會更分享了百度、阿里、騰訊、華為、新浪、網(wǎng)易、京東、攜程、360、小米、等知名機(jī)構(gòu)的最佳實(shí)踐。伴隨著中國大數(shù)據(jù)生態(tài)系統(tǒng)的建立、發(fā)展和演變,中國大數(shù)據(jù)技術(shù)大會從一個(gè)僅60人參加的技術(shù)沙龍已發(fā)展到當(dāng)下數(shù)千人的技術(shù)盛宴。
BDTC 歷屆嘉賓
2015中國大數(shù)據(jù)技術(shù)大會(Big Data Technology Conference 2015,BDTC 2015)
12月10-12日,由中國計(jì)算機(jī)學(xué)會(CCF)主辦,CCF大數(shù)據(jù)專家委員會承辦,中國科學(xué)院計(jì)算技術(shù)研究所、北京中科天璣科技有限公司與CSDN共同協(xié)辦的將在北京新云南皇冠假日酒店如約召開。本屆大會以“”為主題,聚焦大數(shù)據(jù)落地后各機(jī)構(gòu)所面臨的挑戰(zhàn)和需求,將從學(xué)術(shù)探索、技術(shù)實(shí)踐、產(chǎn)業(yè)應(yīng)用、變現(xiàn)實(shí)戰(zhàn)、數(shù)據(jù)交易、法律法規(guī)等多個(gè)方面對時(shí)下大數(shù)據(jù)生態(tài)圈進(jìn)行全面剖析,旨在為更多機(jī)構(gòu)的大數(shù)據(jù)實(shí)踐提供成功參考。大會前夕,我們從議題角度總結(jié)了今年BDTC不可錯(cuò)過的十大理由。
理由一:深度的產(chǎn)業(yè)現(xiàn)狀與趨勢解讀。
中國計(jì)算機(jī)學(xué)會將在BDTC 2015上正式發(fā)布《2016大數(shù)據(jù)十大發(fā)展趨勢預(yù)測》與《2015中國大數(shù)據(jù)技術(shù)與產(chǎn)業(yè)發(fā)展白皮書》。前兩屆大會——BDTC 2014和BDTC 2013上發(fā)布的兩份報(bào)告得到了學(xué)術(shù)界和產(chǎn)業(yè)界的高度關(guān)注。今年,在大數(shù)據(jù)的產(chǎn)學(xué)研用繼續(xù)深化更加務(wù)實(shí)之時(shí),由百余位技術(shù)專家參與的《2016大數(shù)據(jù)十大發(fā)展趨勢預(yù)測》以及中國大數(shù)據(jù)開放共享、中國工業(yè)大數(shù)據(jù)等多個(gè)篇章的《2015中國大數(shù)據(jù)技術(shù)與產(chǎn)業(yè)發(fā)展白皮書》,更加值得期待。除此之外,BDTC 2015基于技術(shù)和行業(yè)的發(fā)展設(shè)置了多場現(xiàn)狀和趨勢分析講解,詳情請查看具體日程(http://bdtc2015.hadooper.cn/dct/page/70042)。
理由二:內(nèi)存為王,前行中的開源大數(shù)據(jù)生態(tài)系統(tǒng)解析。
時(shí)下,為了應(yīng)對海量數(shù)據(jù)所帶來的挑戰(zhàn),分布式計(jì)算與存儲系統(tǒng)的摸索主要存在兩個(gè)方向:首先,讓計(jì)算更接近數(shù)據(jù)存儲端,從而解決網(wǎng)絡(luò)瓶頸所帶來的限制;其次則是隨著內(nèi)存價(jià)格下降,新一代內(nèi)存計(jì)算時(shí)代已經(jīng)來臨。在內(nèi)存計(jì)算探索上,業(yè)內(nèi)最受關(guān)注的開源大數(shù)據(jù)計(jì)算框架無疑當(dāng)屬Apache Spark,當(dāng)下已經(jīng)在生產(chǎn)環(huán)境中得到了廣泛的部署。然而作為一個(gè)高速成長中的開源項(xiàng)目,其未來發(fā)展方向無疑備受各個(gè)機(jī)構(gòu)關(guān)注。因此,本次會議特邀請了Databricks公司聯(lián)合創(chuàng)始人、Apache Spark首席架構(gòu)師、Apache Spark PMC辛湜為大家分享Spark在2016年最新的Roadmap,消除機(jī)構(gòu)前行中的障礙;同時(shí),IBM數(shù)據(jù)和分析事業(yè)部大中華區(qū)大數(shù)據(jù)產(chǎn)品總監(jiān)洪建勛還將分享“Spark數(shù)據(jù)和設(shè)計(jì)迎巨變”。在Spark之外,Hadoop仍然是生產(chǎn)環(huán)境部署最多的開源大數(shù)據(jù)處理框架,其生態(tài)系統(tǒng)中包含的數(shù)據(jù)倉庫技術(shù)更是得到了長足的發(fā)展。在這個(gè)背景下,本次BDTC特邀請了Hadoop、HBase和Thrift項(xiàng)目的PMC成員和Committer、Kudu的發(fā)明人Todd Lipcon,Hortonworks Ted Yu為大家分享大型數(shù)據(jù)倉庫Kudu和HBase的最新進(jìn)展。除此之外,本次BDTC上,百度大數(shù)據(jù)部高級研發(fā)工程師衣國壘,京東集團(tuán)云平臺數(shù)據(jù)首席架構(gòu)師杜宇甫,銀聯(lián)智慧CTO龍凱,中國計(jì)算機(jī)學(xué)會大數(shù)據(jù)專家委員會委員、南京大學(xué)教授黃宜華等專家還將分享基于開源技術(shù)的自主生態(tài)系統(tǒng)打造。
理由三:吞吐至上,剖析數(shù)據(jù)庫50年衍變。
在計(jì)算框架之外,業(yè)務(wù)更高的吞吐量需求同樣催生著新時(shí)代數(shù)據(jù)存儲系統(tǒng)的衍變。今年是數(shù)據(jù)庫誕生五十周年,前三十年的數(shù)據(jù)庫研究主要圍繞數(shù)據(jù)模型、事務(wù)機(jī)制、索引結(jié)構(gòu)、查詢處理等核心技術(shù)展開,在大數(shù)據(jù)時(shí)代,IT熱點(diǎn)從“計(jì)算”衍變?yōu)?ldquo;數(shù)據(jù)”,高吞吐量的需求更給傳統(tǒng)數(shù)據(jù)庫帶來了嚴(yán)峻的挑戰(zhàn)。在本次會議“數(shù)據(jù)庫分論壇”上,多場圍繞新時(shí)代的數(shù)據(jù)庫討論將被展開,其中包括:南大通用CTO武新的《GBase 8t 高端OLTP數(shù)據(jù)庫核心技術(shù)與客戶價(jià)值》,西北工業(yè)大學(xué)教授李戰(zhàn)懷的《新型存儲架構(gòu)下數(shù)據(jù)管理技術(shù)面臨的機(jī)遇與挑戰(zhàn)》,中國移動蘇州研發(fā)中心大數(shù)據(jù)產(chǎn)品開發(fā)部高級工程師薛港的《PosgreSQL-X2的開發(fā)和應(yīng)用》,華東師范大學(xué)教授錢衛(wèi)寧的《基于可擴(kuò)展事務(wù)處理系統(tǒng)的進(jìn)展與研究》,以及Pivotal研發(fā)總監(jiān)姚延棟的 《開源大數(shù)據(jù)引擎:分布式Greenplum數(shù)據(jù)庫內(nèi)核分析》。
理由四:深入挖掘,談如何打造一個(gè)更易用的平臺。
對于任何機(jī)構(gòu)來說,建立大數(shù)據(jù)平臺的唯一目的就是對數(shù)據(jù)進(jìn)行挖掘,從而更好地指導(dǎo)實(shí)踐。因此,如何構(gòu)建出一個(gè)更易用的大數(shù)據(jù)處理平臺顯然至關(guān)重要。本屆BDTC不僅邀請了SQL-on-Hadoop項(xiàng)目Apache Kylin PMC成員、eBay軟件工程師仲儉為大家分享Apache Kylin的大數(shù)據(jù)可視化實(shí)踐;
理由五:安全可靠,基礎(chǔ)設(shè)施架構(gòu)與設(shè)計(jì)。
軟件之外,硬件技術(shù)的提升對于大數(shù)據(jù)應(yīng)用實(shí)踐的重要性不言而喻。同時(shí),基于現(xiàn)有的商用服務(wù)器集群,如何更好地進(jìn)行資源調(diào)度與管理同樣至關(guān)重要。為此,本次會議特設(shè)置了“大數(shù)據(jù)基礎(chǔ)設(shè)施分論壇”,屆時(shí),工信部電信研究院政策與經(jīng)濟(jì)研究所法律部主任肖德芳,Hulu軟件技術(shù)開發(fā)資深研發(fā)主管梁宇明,Memblaze閃存系統(tǒng)負(fù)責(zé)人吳忠杰, 阿里云高級專家李超,企事錄創(chuàng)始人李明宇,中科院計(jì)算所研究員、中國科學(xué)院大學(xué)崗位教授、博士生導(dǎo)師詹劍鋒等專家將帶來《大數(shù)據(jù)服務(wù)器技術(shù)探索與實(shí)踐》、《Voidbox - Docker On YARN在Hulu的實(shí)踐》、《用閃存存儲技術(shù)應(yīng)對大數(shù)據(jù)挑戰(zhàn)》、《阿里云大數(shù)據(jù)平臺探秘》、《海量小文件與超大文件并存情況下的存儲系統(tǒng)評估與調(diào)優(yōu)》、《BigDataBench:開源的大數(shù)據(jù)基準(zhǔn)測試標(biāo)準(zhǔn) 》等專題報(bào)告。在資源調(diào)度和管理之外,數(shù)據(jù)安全同樣是各個(gè)機(jī)構(gòu)的重中之重,因此在本次大會的“大數(shù)據(jù)安全分論壇”,奇虎360高級技術(shù)經(jīng)理張卓,啟明星辰核心研究院資深研究員周濤,阿里巴巴集團(tuán)數(shù)據(jù)安全部阿里數(shù)據(jù)安全小組總監(jiān)鄭斌(天明),騰訊安全云部助理總經(jīng)理李旭陽 ,數(shù)美時(shí)代CTO梁堃等專家將聯(lián)手為大家演練大數(shù)據(jù)時(shí)代的攻防實(shí)戰(zhàn)。
理由六:人工智能,深度學(xué)習(xí)帶來的新機(jī)遇。
Deep Learning是機(jī)器學(xué)習(xí)中一個(gè)非常接近AI的領(lǐng)域,其動機(jī)在于建立、模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)。在過去一段時(shí)間,深度學(xué)習(xí)一直受限于主機(jī)的單機(jī)性能。而隨著各種分布式算法的實(shí)現(xiàn),各種優(yōu)秀大數(shù)據(jù)計(jì)算框架的開源,深度學(xué)習(xí)正迎來一個(gè)高速的發(fā)展期。在BDTC 2015上,我們特設(shè)立了“深度學(xué)習(xí)分論壇”,地平線機(jī)器人(Horizon Robotics)高級工程師余軼南,阿里巴巴iDST語音組高級專家鄢志杰,微軟亞洲研究院研究員洪春濤,華中科技大學(xué)教授白翔,廈門大學(xué)教授紀(jì)榮嶸等專家將結(jié)合學(xué)術(shù)與實(shí)踐應(yīng)用,為大家?guī)硪粓鲫P(guān)于深度學(xué)習(xí)的深入探索。
理由七:時(shí)代前沿,互聯(lián)網(wǎng)公司的最新成果。
毋庸置疑,基于業(yè)務(wù)的需求,在云計(jì)算、大數(shù)據(jù)等領(lǐng)域,互聯(lián)網(wǎng)公司一直走在時(shí)代的最前沿。因此BDTC 2015“互聯(lián)網(wǎng)大數(shù)據(jù)分論壇”將探討大量知名互聯(lián)網(wǎng)機(jī)構(gòu)的最新實(shí)踐,其中包括:滴滴機(jī)器學(xué)習(xí)研究院高級研發(fā)總監(jiān)劉威的《移動出行的大數(shù)據(jù)挑戰(zhàn)》,百度主任架構(gòu)師、機(jī)器翻譯技術(shù)負(fù)責(zé)人何中軍的《 互聯(lián)網(wǎng)機(jī)器翻譯》,京東商城大數(shù)據(jù)研發(fā)部負(fù)責(zé)人劉彥偉的《京東實(shí)時(shí)數(shù)據(jù)平臺的實(shí)現(xiàn)和應(yīng)用》, 中國人民大學(xué)副教授竇志成的《大數(shù)據(jù)時(shí)代的互聯(lián)網(wǎng)分析引擎》, 國雙技術(shù)副總裁黃勇堅(jiān)的《挖掘用戶行為大數(shù)據(jù)中的金礦》, 北京拓爾思信息技術(shù)股份有限公司副總裁劉瑞寶的《大數(shù)據(jù)——互聯(lián)網(wǎng)時(shí)代政府發(fā)展的引擎》,微眾稅銀聯(lián)合創(chuàng)始人兼COO曾源的《政務(wù)大數(shù)據(jù)在征信領(lǐng)域的應(yīng)用》等。
理由八:精華體現(xiàn),推薦系統(tǒng)實(shí)現(xiàn)的價(jià)值挖掘。
大數(shù)據(jù)技術(shù)核心是人群分析,而推薦系統(tǒng)包括人群分析和數(shù)據(jù)變現(xiàn)等是大數(shù)據(jù)技術(shù)精華的體現(xiàn)。在本次大會的“推薦系統(tǒng)分論壇”上,百度基礎(chǔ)架構(gòu)部高級架構(gòu)師沈國龍,F(xiàn)reeWheel技術(shù)副總裁李旸,新浪微博算法技術(shù)總監(jiān)姜貴彬,京東數(shù)字營銷大數(shù)據(jù)總經(jīng)理萬昊, 獵聘網(wǎng)首席數(shù)據(jù)官單藝等專家將為大家分享《BML百度大規(guī)模機(jī)器學(xué)習(xí)云平臺實(shí)踐》、《FreeWheel基于大數(shù)據(jù)的新興視頻廣告測量實(shí)踐》、《大數(shù)據(jù)驅(qū)動下的微博社會化推薦》、《大數(shù)據(jù)技術(shù)在京東在線廣告的應(yīng)用》《運(yùn)用增強(qiáng)學(xué)習(xí)算法提升推薦效果》等議題。
理由九:應(yīng)用為王,深入各行各業(yè)的數(shù)據(jù)挖掘。
歷經(jīng)數(shù)年發(fā)展,大數(shù)據(jù)產(chǎn)生的價(jià)值已毋庸置疑。因此,在BDTC 2015上,“醫(yī)療健康與生物大數(shù)據(jù)分論壇”、“交通與旅游大數(shù)據(jù)分論壇”、“教育大數(shù)據(jù)分論壇”、“金融大數(shù)據(jù)分論壇”、“網(wǎng)絡(luò)與通訊大數(shù)據(jù)分論壇”、“工業(yè)與制造業(yè)大數(shù)據(jù)分論壇”、“社會治理大數(shù)據(jù)分論壇”等分論壇被設(shè)置,數(shù)十位專家將為與會者分享各個(gè)垂直行業(yè)寶貴的應(yīng)用經(jīng)驗(yàn)。
理由十:開放共贏,取之有道,數(shù)據(jù)交易及法規(guī)探討。
大數(shù)據(jù)分析和價(jià)值發(fā)揮離不了數(shù)據(jù)的供給,除了政府、大型互聯(lián)網(wǎng)公司、電信運(yùn)營商等數(shù)據(jù)富礦外,其他一些企業(yè)急需利用數(shù)據(jù)提升效率、獲取新客戶、增加銷售額。但由于政策法規(guī)、市場機(jī)制等問題,數(shù)據(jù)流動一直效率不高,從而阻礙了大數(shù)據(jù)價(jià)值的充分發(fā)揮,“數(shù)據(jù)市場及交易”論壇將特邀中關(guān)村大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟副秘書長陳新河,亞信智慧數(shù)據(jù)公司DataHub產(chǎn)品總監(jiān)龔靜,數(shù)據(jù)堂科技股份有限公司創(chuàng)始合伙人、副總經(jīng)理肖永紅,北京安理律師事務(wù)所管理合伙人王新銳,貴陽大數(shù)據(jù)交易所執(zhí)行總裁助理王亞川等專家將集中討論如何解決上述問題。
除此之外,大會期間,組委會開設(shè)了各種方便互動和社交的交流環(huán)節(jié)和場所,每一場精彩講演之后都可以進(jìn)行深入地提問和討論。同時(shí),歷經(jīng)八屆,BDTC一如既往地履行著高規(guī)格的承諾, 對于已經(jīng)或正在考慮進(jìn)軍大數(shù)據(jù)的公司,這絕對是一場不容錯(cuò)過的技術(shù)盛會。