欧美两性人xxxx高清免费_国产婷婷综合在线视频中文_国产免费久久精品99reswag_在厨房乱子伦在线观看_一边写作业一边c她

開(kāi)篇:寫(xiě)給致力于大數(shù)據(jù)技術(shù)發(fā)展的志同道合者
來(lái)源:企業(yè)網(wǎng)  作者:佚名 2016-09-02 15:31:26
我們是星環(huán)科技的大數(shù)據(jù)研發(fā)部門,是國(guó)內(nèi)專注于大數(shù)據(jù)平臺(tái)技術(shù)研發(fā)的團(tuán)隊(duì),大數(shù)據(jù)領(lǐng)域平均工作經(jīng)驗(yàn)超過(guò)3年,一支有技術(shù)理想的團(tuán)隊(duì)。

寫(xiě)在開(kāi)頭,我們是誰(shuí)?

我們是星環(huán)科技的大數(shù)據(jù)研發(fā)部門,是國(guó)內(nèi)專注于大數(shù)據(jù)平臺(tái)技術(shù)研發(fā)的團(tuán)隊(duì),大數(shù)據(jù)領(lǐng)域平均工作經(jīng)驗(yàn)超過(guò)3年,一支有技術(shù)理想的團(tuán)隊(duì)。

為什么我們要?jiǎng)?chuàng)建大數(shù)據(jù)開(kāi)放實(shí)驗(yàn)室的公眾號(hào)?

1. 復(fù)雜的大數(shù)據(jù)技術(shù)棧

提到大數(shù)據(jù),很多人可能都聽(tīng)說(shuō)過(guò)4V - Big Volume, Big Velocity, Big Variety, Big Value,大數(shù)據(jù)從業(yè)人員的工作內(nèi)容也都和這4個(gè)V中的某些內(nèi)容密切相關(guān)。

相比較傳統(tǒng)的數(shù)據(jù)庫(kù)技術(shù),大數(shù)據(jù)的技術(shù)棧在過(guò)去幾年取得非常迅速的發(fā)展,尤其是Hadoop和Spark已經(jīng)構(gòu)建了一個(gè)龐大的技術(shù)生態(tài)圈。

文件系統(tǒng)方面,除了傳統(tǒng)的行式存儲(chǔ),還有新的列式存儲(chǔ)格式如ORC,Parquet,以及一些新型的用SSD或者內(nèi)存加速的存儲(chǔ),如Transwarp Holodesk以及Tachyon。此外,還有Ceph等新型文件系統(tǒng)。

在文件系統(tǒng)之上,各種存儲(chǔ)引擎也迅速發(fā)展,如NoSQL類的HBase,MongoDB,CouchDB,它們?cè)谝恍┐髷?shù)據(jù)場(chǎng)景下表現(xiàn)的非常出色(如高并發(fā),文檔存儲(chǔ)等),而放棄另外一些特性,如事務(wù)和SQL支持;不過(guò)近年也涌現(xiàn)出一些新的NoSQL存儲(chǔ)引擎,重新拾起來(lái)SQL和事務(wù),如VoltDB,CockroachDB,以及Transwarp Hyperbase。

計(jì)算引擎的發(fā)展更是日新月異,可以按照批處理/交互式/流式/迭代式做個(gè)大體的分類。批處理引擎在大數(shù)據(jù)領(lǐng)域發(fā)展的最快,MapReduce,Spark,Tez等已在大規(guī)模商用;交互式分析引擎的代表有Dremel,Presto,Impala等,目前還處于未能完全證明商用能力,但是在快速發(fā)展并且驗(yàn)證的階段;流式引擎這兩年發(fā)展很快,Spark Streaming/Flink/Storm/Samza是其中的代表;迭代式引擎有Graphx,Pregel,以及Transwarp Graphene等。

數(shù)據(jù)分析領(lǐng)域,各種工具更是層出紛紜,如Hive,Mahout,MLlib,R,Kylin等,除了開(kāi)源技術(shù),我們研發(fā)的Transwarp Inceptor是國(guó)內(nèi)經(jīng)過(guò)商業(yè)檢驗(yàn)的比較優(yōu)秀的大數(shù)據(jù)分析工具。

數(shù)據(jù)集成和調(diào)度工具也有很多的開(kāi)源項(xiàng)目涌現(xiàn)出來(lái),如Oozie,Azkaban,Crunch,Sqoop,F(xiàn)lume,Kafka等等。

因?yàn)檫@么復(fù)雜的技術(shù)棧,以及各種層出不窮的新技術(shù),開(kāi)發(fā)者會(huì)面臨著極大的學(xué)習(xí)成本,以及很困難的選型考量。如何選擇更合適的技術(shù)方案,如何做基于大數(shù)據(jù)的新的應(yīng)用的開(kāi)發(fā),如何去管理和運(yùn)維大數(shù)據(jù)產(chǎn)品,這是新技術(shù)時(shí)代的主要問(wèn)題。因此,我們希望通過(guò)大數(shù)據(jù)開(kāi)放實(shí)驗(yàn)室,將我們掌握的一些技術(shù)/原理等傳播給讀者,分享我們的經(jīng)驗(yàn)和教訓(xùn),共同促進(jìn)大家對(duì)大數(shù)據(jù)技術(shù)的掌握和理解。

2. 曲折反復(fù)的發(fā)展趨勢(shì)

為了處理大數(shù)據(jù)的4個(gè)V,大數(shù)據(jù)的技術(shù)棧變得非常繁雜,同時(shí)各個(gè)技術(shù)的發(fā)展趨勢(shì)在過(guò)去幾年也有一些有意思的變化。如MPP并行計(jì)算和分布式批處理計(jì)算的方向上分分合合,低延時(shí)計(jì)算架構(gòu)的演變,以及NoSQL數(shù)據(jù)庫(kù)的演進(jìn)路線。

傳統(tǒng)的并行數(shù)據(jù)庫(kù)(如MPP架構(gòu))和基于MapReduce/Spark的分布式批處理的計(jì)算模式,在2010年左右曾經(jīng)發(fā)生過(guò)比較激烈的技術(shù)方向辯論(http://database.cs.brown.edu/papers/stonebraker-cacm2010.pdf, http://www.cs.princeton.edu/courses/archive/spr11/cos448/web/docs/week10_reading2.pdf ),而后幾年,Cloudera的分析引擎Impala又將Share Nothing 的MPP(Massive Parallel Processing)處理風(fēng)格引入,分歧的雙方似乎又回到了起點(diǎn)。不過(guò)隨著Spark等類似的內(nèi)存計(jì)算引擎的興起以及完善,

MPP的技術(shù)又被拋棄,并且涌現(xiàn)出來(lái)性能和可擴(kuò)展性更好的數(shù)據(jù)分析引擎,如Transwarp Inceptor,Presto以及SparkSQL,分布式批處理又再次和MPP技術(shù)方向分道揚(yáng)鑣。

為了解決Big Velocity,滿足IoT等場(chǎng)景的需求,實(shí)時(shí)和低延時(shí)處理的計(jì)算架構(gòu)在快速的發(fā)展過(guò)程中,如何處理批處理和交互式分析之間的平衡,也不斷推進(jìn)這計(jì)算架構(gòu)的演進(jìn)。最經(jīng)典的莫過(guò)于Lambda架構(gòu),同時(shí)也是使用比較廣泛的架構(gòu);此外Twitter的SummingBird支持以批處理或者流處理模式,或者混合模式以統(tǒng)一的方式來(lái)執(zhí)行代碼,也是個(gè)比較新穎的架構(gòu)。

NoSQL數(shù)據(jù)庫(kù)發(fā)展也非常有意思,早期因?yàn)閭鹘y(tǒng)數(shù)據(jù)庫(kù)處理速度慢,事務(wù)過(guò)于復(fù)雜,SQL編譯過(guò)重等原因,不能滿足很多場(chǎng)景的需求,各種NoSQL數(shù)據(jù)庫(kù)快速發(fā)展起來(lái),如HBase,Cassandra,MongoDB等,API編程開(kāi)始流行。然而隨著時(shí)間推移,各個(gè)NoSQL數(shù)據(jù)庫(kù)發(fā)現(xiàn)了API編程的缺陷以及功能缺失導(dǎo)致的適用場(chǎng)景首先,又開(kāi)始走回SQL之路,如Cassandra和MongoDB;此外,不支持事務(wù)的架構(gòu)又不能保證2~3年后是否會(huì)因?yàn)椴粷M足業(yè)務(wù)需求而過(guò)時(shí),也是NoSQL數(shù)據(jù)庫(kù)的一個(gè)隱憂。因此,圖靈獎(jiǎng)得主大神Michael Stonebraker預(yù)測(cè)NoSQL數(shù)據(jù)庫(kù)最終將和SQL數(shù)據(jù)庫(kù)融合:SQL數(shù)據(jù)庫(kù)們通過(guò)增加對(duì)非結(jié)構(gòu)化數(shù)據(jù)的處理,如JSON的支持來(lái)提升業(yè)務(wù)場(chǎng)景的可適應(yīng)性;而NoSQL數(shù)據(jù)庫(kù)則開(kāi)始加入SQL的支持和分布式事務(wù)(參見(jiàn)Michael Stonebraker的演講 “What Does ‘Big Data’ Mean and Who Will Win?”)。 在這點(diǎn)上,Transwarp Hyperbase早已經(jīng)開(kāi)始了這個(gè)技術(shù)融合,基本完成了SQL支持/分布式事務(wù)以及非結(jié)構(gòu)化數(shù)據(jù)處理能力的打造。

技術(shù)的發(fā)展趨勢(shì)往往不是那么一往無(wú)前,而是一直不停的迭代,然后論證,然后互相影響,并可能出現(xiàn)一些方向上的變化。大數(shù)據(jù)技術(shù)也同樣如此,對(duì)于從業(yè)人員來(lái)說(shuō),在設(shè)計(jì)一個(gè)新系統(tǒng)的時(shí)候往往需要考慮到今后一定時(shí)間的發(fā)展趨勢(shì),并接合著業(yè)務(wù)來(lái)推進(jìn)系統(tǒng)的演進(jìn)。這也是我們創(chuàng)建開(kāi)發(fā)實(shí)驗(yàn)室的第二個(gè)原因:與廣大從業(yè)人員一起對(duì)大數(shù)據(jù)發(fā)展的歷史故事進(jìn)行梳理,分析對(duì)未來(lái)技術(shù)的趨勢(shì)的看法,然后在細(xì)分領(lǐng)域?qū)で笸黄?,以更好的適應(yīng)這個(gè)大數(shù)據(jù)時(shí)代。

3. 星環(huán)大數(shù)據(jù)技術(shù)的布道者

星環(huán)專注于大數(shù)據(jù)技術(shù)超過(guò)3年,目前Transwarp Data Hub包含4個(gè)組件來(lái)分別解決大數(shù)據(jù)的4-V技術(shù)問(wèn)題。Inceptor解決了Big Volume上的ETL和Analytics的問(wèn)題,Stream針對(duì)Big Velocity提供了基于SQL的解決方案,Hyperbase融合了對(duì)結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的處理能力,從而可以滿足Big Variety的需要,Discover幫助用戶來(lái)挖掘出big data里面的Big Value。

TDH走的是非開(kāi)源路線,因此在技術(shù)傳播上沒(méi)有開(kāi)源項(xiàng)目對(duì)大眾影響深遠(yuǎn)。我們認(rèn)為技術(shù)的共享不應(yīng)該有邊界,因此希望通過(guò)這個(gè)公眾平臺(tái),將我們研發(fā)的有意思的功能,模型,方案等新技術(shù),通過(guò)比較合理的方式與外界共享,并通過(guò)這個(gè)平臺(tái)構(gòu)建一個(gè)積極反饋的閉環(huán)。

我們的愿景

以技術(shù)之名,做一個(gè)有價(jià)值的大數(shù)據(jù)技術(shù)深度分享的平臺(tái);

以原創(chuàng)為主,做一個(gè)有深度的創(chuàng)新思維的技術(shù)社區(qū);

歡迎有技術(shù)理想的朋友們加入我們。

關(guān)于大數(shù)據(jù)開(kāi)放實(shí)驗(yàn)室

大數(shù)據(jù)開(kāi)放實(shí)驗(yàn)室是一個(gè)豐富的大數(shù)據(jù)學(xué)習(xí)和大數(shù)據(jù)資訊平臺(tái),由行業(yè)內(nèi)頂尖大數(shù)據(jù)公司星環(huán)科技運(yùn)營(yíng),每周都會(huì)放送一定數(shù)量的博文干貨,小到各種大數(shù)據(jù)技術(shù)掃盲貼,大到各種大數(shù)據(jù)前沿技術(shù)分析文,另外還有一些大數(shù)據(jù)熱門產(chǎn)品的內(nèi)部窺探,大數(shù)據(jù)未來(lái)的發(fā)展動(dòng)向等一系列非常具有市場(chǎng)參考價(jià)值的文章。除此之外,大數(shù)據(jù)開(kāi)放實(shí)驗(yàn)室也是一個(gè)大數(shù)據(jù)技術(shù)交流和分享的圈子,用戶可以在該公眾號(hào)留言,提出自己的想法或問(wèn)題,屆時(shí)會(huì)有管理員進(jìn)行回答,后期甚至?xí)性敿?xì)的針對(duì)該問(wèn)題或想法的博文放送,歡迎關(guān)注“大數(shù)據(jù)開(kāi)放實(shí)驗(yàn)室”。

關(guān)注公眾號(hào)“大數(shù)據(jù)開(kāi)放實(shí)驗(yàn)室”,獲取最新技術(shù)干貨。

編輯:楊麟
關(guān)鍵字: 大數(shù)據(jù)  技術(shù) 
分享按鈕 会泽县| 湘潭市| 金阳县| 醴陵市| 色达县| 平湖市| 志丹县| 莆田市| 桐梓县| 洪湖市| 永济市| 兴文县| 蒲城县| 平塘县| 南丰县| 黔西县| 黄石市| 哈密市| 金乡县| 陆良县| 青州市| 西吉县| 吴江市| 太和县| 无棣县| 大名县| 岳阳县| 锡林浩特市| 宁武县| 麦盖提县| 四子王旗| 南阳市| 河西区| 柳河县| 东乌珠穆沁旗| 曲松县| 习水县| 吉隆县| 太湖县| 宁国市| 五寨县|