?他實際干了一個什么事情?很簡單他預測機票價,對咱們來講,比如說我們要去旅游,我在半年前買的機票價格,和我1個月甚至頭一天買的價格是不是不一樣。并不是你買的越早,你機票價格越便宜,其實并不是這樣。有可能根據(jù)旅游的路線,如果他都不買,他為了保證滿員率,可能你后來買的價格還便宜。所以這是做了這個,他從旅游信息去抓這些信息,他抓到了很多,然后做一個分析。這是對我們個人來講非常有價值的東西,他不關(guān)心什么原因價格便宜了,他只關(guān)心什么時候降,什么時候便宜。
第三個是水利局,有很多的管道。管道會存在一個問題,就是年久失修的會老化,一旦老化他的水會冒出來,居民會受到很大影響。所以他在水管上裝傳感器,傳感器傳上來大量的信息,對過去出現(xiàn)問題的這些管道進行分析,然后去定位。哪些可能潛在的要出現(xiàn)風險估計,他得到的結(jié)果,比以往方法預測大于3倍另外有風險的比例減少了2.4%,這塊的話通過大數(shù)據(jù)進行分析決策。
總的來講他屬于特性,有這么幾點。第一你的亮點,你的數(shù)據(jù)幾千行、幾萬行這個沒有意義,我們傳統(tǒng)的方法就能解決,不需要你大數(shù)據(jù)這是第一點。第二點持續(xù)要更新,比如機票的價格。第三預測,需要你有預測的功能,非??炷軌蝾A測出來,我們關(guān)注的是什么?我關(guān)注結(jié)果,我不關(guān)注為什么,我只關(guān)注結(jié)果。
我們大家如果對大數(shù)據(jù)有一些了解的話,我們在網(wǎng)上也會看到大數(shù)據(jù)思維,包括什么呢?體積量大,第二多樣性,包括他數(shù)據(jù)結(jié)構(gòu),我們現(xiàn)在關(guān)于數(shù)據(jù)結(jié)構(gòu)已經(jīng)不是二維的。有一個網(wǎng)頁。網(wǎng)頁里面不是二維的,那是半結(jié)構(gòu)化,或者微結(jié)構(gòu)化。不僅僅是二維的結(jié)構(gòu),所以是數(shù)據(jù)的多樣性。而現(xiàn)在我們存在,關(guān)于數(shù)據(jù)庫里面的數(shù)據(jù),只占我們實際數(shù)據(jù)的5%—10%,也就是說剩下90%并不在我們庫里。所以對我們將來預測和分析,或者說我們現(xiàn)在已有的企業(yè)數(shù)據(jù)潛能,并不能完全發(fā)揮出來,就是沙子里拉金子。
以前我們做數(shù)據(jù)分析,我們是統(tǒng)計,而現(xiàn)在我們不是了。我們是從大量的浩大的信息里面,發(fā)現(xiàn)這樣的信息,還有速度,就是要求實時。速度要是非常快。大數(shù)據(jù)本質(zhì),就是剛才我們說的,從更大數(shù)據(jù)里邊,去挖掘出這樣的信息。實際這個里面,各個我們都在系統(tǒng)里面,包括我們自己內(nèi)部系統(tǒng)、IT系統(tǒng),包括營銷系統(tǒng)服務網(wǎng)絡,這些我們內(nèi)部系統(tǒng),還有外部系統(tǒng)。比如社交媒體的信息、今天的數(shù)據(jù),競爭對手的東西,這都是利于我們挖掘他。
這個圖的左邊就是我們的數(shù)據(jù)源,我們的交易數(shù)據(jù)、我們的應用數(shù)據(jù)、機器的數(shù)據(jù)。包括社交媒體還有多媒體的,對于社交媒體來說,可能更多是互聯(lián)網(wǎng)企業(yè)。那么對于我們傳統(tǒng)的,比如說我們按交易完善,現(xiàn)在銀行做一個,銀行在上大數(shù)據(jù),以前有一些已經(jīng)上了,以前是概念的,現(xiàn)在已經(jīng)上了。那么他解決一個什么問題?就是最簡單的,咱們要是查交易歷史,我去查我這張卡,我從辦這張卡到現(xiàn)在,我所有的消費信息,我要查出來。但現(xiàn)在我們的銀行里面只提供1年的,為什么提供1年。因為這個量太大了,我們現(xiàn)在承載不了那么大的數(shù)據(jù)。那要怎么做呢?我們做個大數(shù)據(jù),可以把過去所有消費都存那去。都存那庫里,客戶滿意度就慢慢提升了。所以這是基于銀行交易歷史,做的一個大數(shù)據(jù)。
那么還有機器數(shù)據(jù),機器數(shù)據(jù)是什么?從一些攝像頭、傳感器傳上來的數(shù)據(jù)。以前這些信息里頭我們直接把他不要了,或者說我們認為量太大了?,F(xiàn)在我們有一些機器數(shù)據(jù),是用做我們將來預測分析的。比如說簡單的拿交通行業(yè)舉例子來講,交通行業(yè)我們知道,我們開車是不是到路口的時候有攝像頭,到重要路口都有攝像頭。這些攝像頭信息,以前對我們來講他主要是抓違章,現(xiàn)在還有一個重要原因,交管局應該干什么?他用來抓捕,他這一信息,信息來了之后,交管局立刻要分析出來,這樣知道是不是可疑或者說是不是有暴恐的一些嫌疑,那么怎么看呢?這些信息立馬傳過去之后車牌號,什么時間到哪個路口,這些信息立馬分析出來,而且他的軌跡你馬上分析出來,所以這是非常有價值信息。
這些信息以前是不是就忘了,關(guān)于數(shù)據(jù)庫同一個路口。你比如每天有500萬輛車,同一時刻,同一路口,這數(shù)量非常龐大,怎么樣能快速把他抓住,利用大數(shù)據(jù)。那大數(shù)據(jù)涉及到的行業(yè),我們現(xiàn)在強調(diào)什么?制度的地球,制度的醫(yī)療等都是制度的,這些制度后面依賴的是什么?實際上是大數(shù)據(jù),有可能是大數(shù)據(jù)后面的運算,大數(shù)據(jù)的這些計算。這是大數(shù)據(jù)行業(yè)應用,這里面列為一個行業(yè)。我們現(xiàn)在可以看,這個里面有一些應用的可能性。比如說我們知道互聯(lián)網(wǎng)界,最適合做大數(shù)據(jù),互聯(lián)網(wǎng)數(shù)量大,云數(shù)據(jù)最重要的一個方向。另外他需求量高,還有你需要一些營銷,所以他最適合大數(shù)據(jù)。
另外電信,電信是傳統(tǒng)行業(yè)里最早上大數(shù)據(jù)的,為什么?因為他的量太大。包括我們以前,我做DB2的時候,我們現(xiàn)在移動里面的大部分客戶,在倉庫系統(tǒng)的建設。國內(nèi)目前最大的數(shù)據(jù)倉庫的量又創(chuàng)新高,他在幾年前就已經(jīng)達到800G了。那么他存在的最大問題是什么?既使是存在800G他也要把以前的這些數(shù)據(jù),記的非常清楚,否則他要權(quán)衡以后,他8個PG也裝不下,這是數(shù)據(jù)量構(gòu)成一個問題。另外還有一個是什么?就是我從交易系統(tǒng)抓的數(shù)據(jù),從5萬大家都做的非常多在處理的過程中,需要的時間是非常長的。第二天又要很快時間出來,所以這種需要在很快的時間內(nèi),把金額算出來。所以在這個行業(yè)里面,大數(shù)據(jù)非常需要,我們還有金融。
另外現(xiàn)在他說互聯(lián)網(wǎng)金融的數(shù)據(jù),一直在大數(shù)據(jù)里面也要做一些變革,另外剛才你提到的包括交通和能源,還有電力系統(tǒng)。電力系統(tǒng)怎么做呢?現(xiàn)在有一個什么呢?電力系統(tǒng)我們的電表,電表通過傳感器,用電的情況,用多少電,什么時候用,傳上去。以前可能一天傳一次,現(xiàn)在可能15分鐘、10分鐘甚至1分鐘傳一次,所以這個量極其的龐大。
第一部分是大數(shù)據(jù),在講的過程中,不僅僅針對他的特點,而且他應用的一些產(chǎn)品也有。接下來大數(shù)據(jù)平臺,大家做技術(shù),大數(shù)據(jù)平臺其實簡單來講就兩層,一個是存儲,一個計算,存儲就是我的數(shù)據(jù)怎么存呢?通過文件系統(tǒng)來存,還有什么呢?關(guān)于甲骨文的DB2不僅僅是這塊,這都不是新的技術(shù)。包括我們文件系統(tǒng),適用于大數(shù)據(jù)平臺的文件系統(tǒng)。上面計算層是什么呢?就是對你上面這個數(shù)據(jù)怎么算的快,有一些平臺和基礎,那么用來解決批量處理的問題,大量數(shù)據(jù)我怎么樣把他算出來。
另外有一些云處理,剛才我們說的攝像頭抓那個,實際上是流過來的數(shù)據(jù)立馬基于一定的規(guī)則,把他排列出來,傳統(tǒng)的我們做不到。流技術(shù)發(fā)展的特別火,從技術(shù)層面講,剛才我們說的是平臺的角度,那么具體實現(xiàn),有一些像哈度可(音)平臺。大家都知道,非?;?,實質(zhì)上的標準基本大家提大數(shù)據(jù)都要為什么?他想出來的一個平臺。誰能想出來,就是那幾個互聯(lián)網(wǎng)技術(shù),國外的互聯(lián)網(wǎng)技術(shù),像谷歌、亞馬遜等。
那么上面就是一些運行技術(shù)應用,剛才我們是從技術(shù)層面來講,基本上就是幾個案例分析。其實我們剛才已經(jīng)提到一些,怎么應用?剛才我們說的流計算,其實IBM在流計算這塊做的比較廣,一個商業(yè)這是一個平臺。他采用其實就是通信行業(yè)里面的信息系統(tǒng)分析,因為流量大,而且使用率高。
伊雪莉(音)這個是采用IBM分析解決的一個短期運營商,短期運營商一個案例。大家關(guān)心的幾個問題,我也從這個方面來講。第一個大數(shù)據(jù),我已經(jīng)有數(shù)據(jù)化庫,我還上大數(shù)據(jù)干什么?我們可以看,大數(shù)據(jù)定義我們要分析某一個產(chǎn)品,在某一個時間,在某一個地點,他統(tǒng)計的是銷量或者是金額。而大數(shù)據(jù),我要歸在某一處,歸在基本營銷。一個是統(tǒng)計,一個是針對客戶實體,針對于個人。
伍威:我先介紹一下我叫伍威(音)。首先非常感謝大家,到年底了,在比較繁忙的工作當中,還能抽出時間來參加這次交流會。我們也感謝媒體,給我們這樣一個交流的平臺,讓我們能夠大家坐在一起,面對面的交流。
接下來的時間我給大家介紹一下我們公司的一些大致情況。今天由于時間原因,我們一切從簡。公司從1993年發(fā)展至今,大概經(jīng)歷了20幾個年的歷程。
現(xiàn)在公司注冊資本是1050萬,有兩家分公司,覆蓋整個山東省的業(yè)務。2012年,我們實現(xiàn)銷售額突破1個億,2014年我們正式改名為山東海得朗潤信息技術(shù)有限公司。這是我們公司各個廠家一個合作平臺,其中我們是安陽的顧客代理,包括其他廠的,我們都有很好的一個代理資質(zhì)。這是公司的主營業(yè)務,我們銷售方面的業(yè)務主要是IT方面一些基礎的硬件設施,和軟件方面的云計算、大數(shù)據(jù)。系統(tǒng)形成方面,我們包括計算機網(wǎng)絡集成等。一星服務(音)是我們后面要重點介紹的。包含了外包服務、信息規(guī)
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。