記者:尊敬的各位ENI會員大家好,歡迎收看本期的零距離。今天做客ENI訪談的是明略數(shù)據(jù)的技術(shù)副總裁黃總,接下來有請他來給我們打個招呼。
黃代恒:大家好,我是黃代恒。很高興和大家一起聊大數(shù)據(jù)和人工智能的話題。
記者:打開明略的網(wǎng)站,有一句話令人印象深刻,“明略是國內(nèi)最專業(yè)的大數(shù)據(jù)的整體解決方案提供商。”您能解釋一下這句話背后所覆蓋的能力嗎?
黃代恒:這句話本身比較大,我們可以從人才、產(chǎn)品、所服務(wù)得行業(yè)三個方面來談一下明略的服務(wù)內(nèi)容。明略是14年中旬初創(chuàng)的創(chuàng)新公司,核心技術(shù)團隊來自于大數(shù)據(jù)分析互聯(lián)網(wǎng)廣告公司---秒針。而明略當初成立出來最大的情懷是把大數(shù)據(jù)的技術(shù)能力用于最關(guān)乎國計民生的領(lǐng)域,像公安、金融、高端工業(yè)制造等。所以,明略最寶貴的財富是技術(shù)人員,公司大概有30個左右的技術(shù)合伙人,并且都在大數(shù)據(jù)和核心技術(shù)架構(gòu)領(lǐng)域有非常深的研究,完全可以勝任其他公司技術(shù)總監(jiān)的職位。
除了人才,明略另一個積累是把知識落地成產(chǎn)品。目前主推三大產(chǎn)品線:MDP(安全、高效可用的數(shù)據(jù)資產(chǎn)管理平臺)、DataInsight(知識構(gòu)建與管理平臺)和SCOPA(大數(shù)據(jù)圖譜聯(lián)機分析產(chǎn)品)。基于這三個平臺之上,我們組合了非常多的解決方案來幫助很多的標桿客戶來進行落地。對于大數(shù)據(jù)技術(shù),之前大家往往是說得多,落地的少,真正能夠為企業(yè)級客戶提供大數(shù)據(jù)解決方案的公司并不多。明略的重點客戶包括銀聯(lián)商務(wù)等金融領(lǐng)域客戶,在公安領(lǐng)域明略去年共實施一個省七個地市一個縣,今年至少落地大概二十個地市來進行情報分析、數(shù)據(jù)加工,極大程度的提升了底層支撐工作的效率。我個人最近負責(zé)在工業(yè)方面的大數(shù)據(jù)技術(shù)和數(shù)據(jù)挖掘方面的工作。
記者:黃總,您剛提到的客戶,偏政府背景的客戶好像比較多。
黃代恒:政府及大中型企業(yè),明略做的工業(yè)和金融是服務(wù)于企業(yè),公安和公共安全本來就是政府的。
記者:政府背景的服務(wù),安全一定要考慮,而且政府對安全問題會更加敏感。為什么明略的客戶會更偏向于政府?
黃代恒:是這樣的,其實大家會注意到,金融對數(shù)據(jù)、安全是很敏感的,工業(yè)大家可能認為沒那么敏感。但實際來講,我們接觸的核心的建基和制造等部門,他們的所有數(shù)據(jù)都涉及到金融安全。明略項目的特征是基于客戶的數(shù)據(jù)來進行挖掘分析,項目結(jié)束后全部數(shù)據(jù)也都留在重要的行業(yè)客戶手中。不像有些互聯(lián)網(wǎng)的數(shù)據(jù),可以進行二次加工,把數(shù)據(jù)再次服務(wù)于其他客戶。明略服務(wù)的各企業(yè)、政府都把數(shù)據(jù)視作自己的核心,所以安全方面的工作是非常非常重要的。在數(shù)據(jù)的存儲和使用的權(quán)限控制領(lǐng)域,明略甚至還擁有該領(lǐng)域的專業(yè)產(chǎn)品,對數(shù)據(jù)的使用權(quán)限進行控制。未經(jīng)授權(quán)的客戶,即使是登錄狀態(tài),選擇數(shù)據(jù)的時候也拿不到不符合權(quán)限的內(nèi)容。
記者:黃總,在之前的大連軟交會上,您分享了一個關(guān)于人工智能的主題,明略從大數(shù)據(jù)的解決方案開始聚焦人工智能的方向,您能介紹一下明略戰(zhàn)略調(diào)整的初衷是什么,目前做了怎樣的規(guī)劃呢?
黃代恒:這并不是一個戰(zhàn)略的變化。明略從最開始做大數(shù)據(jù),使其成為自己的標簽,到現(xiàn)在偏向人工智能,這并不是轉(zhuǎn)型,而是順理成章的推進。
我們把大數(shù)據(jù)當做一個工具或手段,通過大數(shù)據(jù)我們會發(fā)現(xiàn),效率高了、以往分析不出來的現(xiàn)在可以了,這是大數(shù)據(jù)的價值。但實際上,從大數(shù)據(jù)本身來講,我們?yōu)槭裁丛敢飧冻龊艽蟮拇鷥r去琢磨它,就是希望通過大數(shù)據(jù)能夠發(fā)現(xiàn)事物本身的規(guī)律和特征。比如在金融行業(yè)發(fā)現(xiàn)正常還款人和非正常還款人以及行業(yè)交易中的危險行為,也包括金融詐騙等,這些其實都是基于大數(shù)據(jù)的分析,本質(zhì)并沒有變化,但現(xiàn)在我們將其稱之為行業(yè)的人工智能。明略希望在金融、工業(yè)、公安這三個垂直行業(yè),結(jié)合專家智慧,將以往人工化的操作替換為機器操作,將產(chǎn)生的數(shù)據(jù)不斷進行分析,后期慢慢脫離人的作用,形成基于大數(shù)據(jù)的行業(yè)智能,最終達到服務(wù)于人的目的。這個是明略一直在做的,所以不算是轉(zhuǎn)型而是必然。
記者:明略聚焦三個行業(yè),暫不提公安。就金融領(lǐng)域而言,由于它直接跟錢掛鉤,對數(shù)字、安全是特別敏感的。如果是基于大數(shù)據(jù)分析而開發(fā)出一系列行業(yè)人工智能解決方案,在這個過程當中是如何進行風(fēng)控的把握?在匹配各個行業(yè)不同的人工智能方案的時候,考慮到像金融行業(yè),它會有保險、銀行、網(wǎng)貸等細分的領(lǐng)域,這是不是牽扯到了人工智能的定制化?
黃代恒:是這樣的,前面也提到了明略有三個基礎(chǔ)的產(chǎn)品,但無論是人工智能還是大數(shù)據(jù),都是伴隨著客戶的成長,因為每個客戶的真實數(shù)據(jù)是不一樣的。所以明略的30位數(shù)據(jù)專家不是在研究室里,也不是在辦公室里面,而是都在一線,跟我們的客戶去學(xué)習(xí),做到真正的了解這個行業(yè)。在金融領(lǐng)域,明略的主要業(yè)務(wù)就是聚焦風(fēng)險,進行一些數(shù)據(jù)及用戶行為畫像的分析。我認為金融實際上就是做風(fēng)險的,主要分為三類:征信風(fēng)險、行為風(fēng)險和行業(yè)風(fēng)險。而明略現(xiàn)在主要做的就是行為風(fēng)險,已經(jīng)很成熟了。包括為國內(nèi)頂級銀行實施的實時監(jiān)控方案、銀行審計部門的金融鏈條分析,甚至當下的金融詐騙等都可以妥善應(yīng)對。以金融詐騙為例,這是一個很典型犯罪模式。犯罪分子如果騙了你的錢,他不會立刻取走,而是將其分散為數(shù)十個賬戶再進行轉(zhuǎn)移。在這個過程中,我們會發(fā)現(xiàn)在整個犯罪鏈條中,會出現(xiàn)某一特定時段的特定規(guī)律,發(fā)現(xiàn)這個規(guī)律后,我們就可以提前將錢款凍結(jié),避免相關(guān)部門在事后進行款項的追蹤。除此之外,還可以將防范手段升級,當系統(tǒng)檢測到某一賬戶存在問題的時候,讓嫌疑人主動提供相關(guān)信息,并且鎖定賬戶,更進一步的防止了詐騙行為的惡化。據(jù)明略客戶案例的實際數(shù)據(jù)表示,這個方案在銀行上線三個月后,成功攔截錢款300萬,按年化收益計算的話,一年大概可以為銀行攔截大概一千萬以上的問題錢款。而產(chǎn)生的這些效益,都是利用大數(shù)據(jù)分析技術(shù)為行業(yè)真真正正帶來的價值。
記者:黃總,您剛提到了一個數(shù)據(jù),三個月是三百萬左右,有一個問題,如果就是銀行上線了你這個項目,它一年的年化率可能達到了一千萬左右,對于銀行來說,它在這個項目上的投入和產(chǎn)出是怎樣的?
黃代恒:對于銀行來講,在這個項目上的投入是遠遠不及產(chǎn)出的,應(yīng)該不到半年就可以全部收回。所以對于銀行來講,風(fēng)控方面的內(nèi)需是比較強烈的,所以推進程度也高于其他細分行業(yè),而這也是明略進行金融細分領(lǐng)域選擇的重要依據(jù)。
記者:除了金融,明略還聚焦工業(yè)。而工業(yè)大數(shù)據(jù)這個提法跟智能制造是息息相關(guān)的。有人說工業(yè)大數(shù)據(jù)分析是智能制造的基礎(chǔ),也是未來我國實現(xiàn)智能化的一個重要的基石。您能介紹一下工業(yè)大數(shù)據(jù)分析在中國推進智能制造的過程當中起到了怎樣的作用?
黃代恒:大數(shù)據(jù)和人工智能是整個智能制造的基礎(chǔ),我認為稍微有點夸大,應(yīng)該是重要的一部分。明略為什么要發(fā)展工業(yè)大數(shù)據(jù)?因為工業(yè)本身就是一個巨大的市場。有個著名的百分之一理論:如果上萬億的市場,你可以做到百分之一,那最終你就能得到一百萬以上的市場。因為工業(yè)是一個十分廣泛的領(lǐng)域,包括高端裝備制造、航空、風(fēng)力、發(fā)電、石油等,而且每時每刻都在產(chǎn)生巨大的數(shù)據(jù)。大家或許認為公安和金融的數(shù)據(jù)量是很大的,但實際上數(shù)據(jù)量最大的是工業(yè)。在這個領(lǐng)域,不管是軌道交通還是風(fēng)力、發(fā)電,傳感器每時每刻都在采集溫度、濕度、轉(zhuǎn)速等各方面的數(shù)據(jù)。原來這些數(shù)據(jù)只是作為過程中的數(shù)據(jù)被使用,但現(xiàn)在這些數(shù)據(jù)信息已經(jīng)確確實實能夠為“智造”帶來一些非常實際的作用。
記者:黃總,之前在軟交會的時候,聽了您基于軌道交通的工業(yè)大數(shù)據(jù)分享,您能以這個軌道交通為例,跟我們詳細介紹一下,如果將工業(yè)大數(shù)據(jù)分析的功能運用到交通上面,我們會具體產(chǎn)生哪些顯性化的表現(xiàn)。
黃代恒:在軌交領(lǐng)域,實際上有很多的細分領(lǐng)域。但從大的層面來講,大致分為感知和洞察兩個方面。感知是可以靈敏的捕獲到已經(jīng)發(fā)生的事情,避免造成更大的問題;而洞察是可以發(fā)現(xiàn)隱藏在事件之后的東西。二者是不一樣的。
先說一下感知,大家現(xiàn)在都已經(jīng)是地鐵的用戶,早高峰的地鐵非常擠,如果某一天大家等了半個小時,卻被告知地鐵故障無法按時發(fā)出,相信很多人是無法容忍的,因為這已經(jīng)影響了我們的生活。但這個問題實際上是可以通過數(shù)據(jù)分析解決的,當一條地鐵線的制動出現(xiàn)問題,可能一兩站的時候影響不大,三四站的時候會有點影響,到了七八站的時候,他可能就跑不動了,這個時候影響就會很惡劣。而大數(shù)據(jù)在其中的作用是,雖然不能立刻把問題解決,但是可以在地鐵剛剛出現(xiàn)問題的時候進行預(yù)警。因為當車上人員滿載的時候,制動系統(tǒng)的壓力是非常大的,如果出現(xiàn)問題,系統(tǒng)會提前一兩站預(yù)警,讓乘客下去換成另一趟列車,在空載的情況下,列車可以直接開回終點。雖然也對乘客造成了影響,但最終避免了整條線擁堵一上午的情況。在北京上海等大城市,每年發(fā)生地鐵擁堵的情況都是有次數(shù)限制的,而這些情況都可以依靠感知來避免造成更壞的結(jié)果。
洞察就是發(fā)生了故障,但不清楚具體原因。傳統(tǒng)采所取的辦法是專家維修或者每天檢修,以北京為例,地鐵運維員工少則3000多則5000,但隨著地鐵線路的增加,以后可能會有上萬人來做這件事,這對于國家來講成本實在太大了。而大數(shù)據(jù)的洞察功能,可以對設(shè)備狀態(tài)進行預(yù)測,使檢修得以簡化,系統(tǒng)可以對設(shè)備的健康狀態(tài)進行打分,良好狀態(tài)下是70分,如果出現(xiàn)40分,那就要進行維修,如果狀態(tài)很好就不需要維修了。這樣漸漸地把原來的按照計劃去維修,變成按狀態(tài)去維修,減輕人工成本的支出。
記者:工業(yè)大數(shù)據(jù)其實是基于大數(shù)據(jù)創(chuàng)新技術(shù)的應(yīng)用,目前在制造業(yè)的應(yīng)用成果如何?
黃代恒:工業(yè)大數(shù)據(jù)實際上是一個先導(dǎo)性研究,像風(fēng)電、石油、軌交等行業(yè),大概是在5、6年前就已經(jīng)有很多獨立的案例了。而且不光是企業(yè)還有學(xué)校,比如清華大學(xué)、國外著名學(xué)校等都做出了很多獨立的案件。再如航空發(fā)展企業(yè)、最大的石油開采企業(yè)等頂級企業(yè),享受到了數(shù)據(jù)基礎(chǔ)帶來的好處。但現(xiàn)在隨著深度學(xué)習(xí)和開源等技術(shù)的不斷改進,很多人包括供應(yīng)商和企業(yè)都成為了受益者。未來,技術(shù)的更迭推進會越來越快,包括傳感器技術(shù)。
所以當下我們說物聯(lián)網(wǎng)的應(yīng)用有三層:傳感層、傳輸層、設(shè)計層,而這三層正在以永遠向前的加速度發(fā)展,未來可能很多的中等企業(yè),甚至一些小企業(yè),也能夠以一定的可負擔(dān)的代價去實現(xiàn)對人工智能的應(yīng)用。當然,類似AlphaGo可能會比較貴,訓(xùn)練一個可能就要上百萬。所以明略現(xiàn)在不做強人工智能,而是做行業(yè)人工智能,期望在未來的發(fā)展中,讓中型企業(yè)甚至年產(chǎn)值只有幾千萬的企業(yè),也能夠從快速實現(xiàn)數(shù)據(jù)對接和模型套用。而這個也是需要一個過程的,最初肯定是個別企業(yè)可以使用,然后是少量企業(yè),最后才會惠及所有企業(yè)。
記者:黃總,您剛說到了制造業(yè)的智能化過程,之前跟一位嘉賓聊天的時候,他說智能制造的過程是分為幾個階段,先是設(shè)備的智能化,生產(chǎn)線的智能化,然后是車間的智能化,最后得到智能化的企業(yè)。如果應(yīng)用人工智能化的方案的話,首先肯定是要進行設(shè)備的智能化,這其中的投入產(chǎn)出您怎么看?
黃代恒:你的觀點基本是對的,我剛才說的三層要配合,如果設(shè)備不具備感知也無法上傳,企業(yè)何談數(shù)據(jù)洞察!當然,在實際操作中,設(shè)備的修改更換需要一大筆費用。所以明略一般會選擇已經(jīng)具備一定條件的企業(yè),例如軌道交通。但如果汽車行業(yè),想快速實現(xiàn)數(shù)據(jù)的洞察,就不那么現(xiàn)實,由于汽車的數(shù)據(jù)是沒有回傳的,所以汽車做不好了。而電車卻可以,因為根據(jù)國家規(guī)定,電動車所有的數(shù)據(jù)是打包回傳的,因此,汽車在實現(xiàn)數(shù)據(jù)洞察上就不如電車。
而感知與洞察數(shù)據(jù)的過程是相互促進的,傳感器即便現(xiàn)階段還比較貴,但如果我們確實可以扎扎實實的分析出結(jié)果,做一些預(yù)警和深度分析,能夠幫到中小型企業(yè)的話,我想大部分企業(yè)也會同意的,不會說特別抗拒。所以這需要我們踏踏實實去將技術(shù)融入到行業(yè),,從而推動行業(yè)發(fā)展方向,三層配合會越來越好,最終形成Dizygotic twins。一邊是物理設(shè)備,一邊是數(shù)字化反饋,這樣一個數(shù)碼的孿生兄弟就會完整的建立起來。
記者:黃總,您剛才提到中國智能制造進程的三個環(huán)節(jié)要配合發(fā)展。您認為當下的制造業(yè)推進智能制造的過程,到了哪個階段?距離國家提出的中國制造2025戰(zhàn)略,還剩八年的時間,我們還能做什么?
黃代恒:對,八年時間還是挺長的。很久以前就有一些孤癥,國外的大公司也展開過一些先天性的研究。現(xiàn)在,我們國家也慢慢跟上來了,去發(fā)展市場,但是目前我們的起點并不高。估計目前市場上提供大型平臺解決方案的先導(dǎo)企業(yè)可能還不足十分之一,而且還都是在很先進的行業(yè),但整個過程一定是趨于穩(wěn)健發(fā)展的態(tài)勢。
有一句話是這樣說的:對技術(shù)的學(xué)習(xí)越來越快,對行業(yè)的學(xué)習(xí)還保持不變。以明略為例,最初我們可能花了兩三年的時間建立了一個堅實的國內(nèi)領(lǐng)先的大數(shù)據(jù)解決方案;后來開始做知識圖譜,這個我們可能用一年半、兩年的時間就可以掌握得很不錯了;隨著開源的上升,到研究知識學(xué)習(xí)、自然語言解析,這個時候我們可能只要半年的時間就夠了。所以我們發(fā)現(xiàn)知識、學(xué)習(xí)知識的速度在不斷加快,在這八年的發(fā)展期間,在知識領(lǐng)域,我們一定是向上發(fā)展變化的。
那么在這個過程中,什么是沒有變得?是對行業(yè)的學(xué)習(xí),我們?nèi)チ私膺@個行業(yè),需要具備一定的素養(yǎng),真的需要懂這個行業(yè)。我在接觸工業(yè)領(lǐng)域的兩年,依然感覺自己還是小學(xué)生?;旧隙@個行業(yè)的,都是一些老專家,為什么他們知識那么寶貴?他們只聽聲音就可以知道發(fā)動機是不是正常運作,而這種能力是在于對行業(yè)的理解。
所以我對工業(yè)企業(yè)的建議是,當下你可能認為做這個事情還不能立刻產(chǎn)生價值,但如果你提早開始,將來就能用更先進的手段、行業(yè)的技術(shù)去做更先進的事情。你不會直接吃第七個饅頭就飽了,前面肯定是有第一個第二個的。所以目前我們還不算先進,還處于追趕階段,比起歐美各國,不管是硬件還是軟件,我們都還在加速發(fā)展,而且是以疊加的速度在加速,不是一點一點加速的,尤其在數(shù)據(jù)基礎(chǔ)上,我們可能會實現(xiàn)彎道超車。
記者:明白了,黃總,那我們今天的訪談先到這里。尊敬的各位ENI會員,今天的零距離就到這里就結(jié)束了,我們下期再見。
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。