首先,自助取數(shù)平臺(tái)很難買到。
也就是,你很難找到符合你企業(yè)要求的通用產(chǎn)品,諸如BAT等企業(yè)內(nèi)部的自助取數(shù)工具,一般也是自研的,為什么?
一是自助取數(shù)是個(gè)極度重視數(shù)據(jù)處理的工具,
不僅需要一張可視化的皮,更需要依據(jù)企業(yè)現(xiàn)狀提供數(shù)據(jù)解決方案,也就是數(shù)據(jù)和功能緊耦合,很多功能需要根據(jù)數(shù)據(jù)的特點(diǎn)量身定做。
比如,我這個(gè)企業(yè)有個(gè)上百億記錄的HBASE指標(biāo)庫,自助取數(shù)產(chǎn)品需要基于這個(gè)引擎進(jìn)行,如何抉擇?
二是BI產(chǎn)品越往上走越垂直,
到達(dá)客戶操作一層,操控更加難以抽象,報(bào)表可視化可能業(yè)界已經(jīng)有些操作的規(guī)則,無非是選擇維度和指標(biāo),但取數(shù)到底怎么個(gè)取法并沒有固定的套路,它又寫又讀又查詢又分析的,一個(gè)字:復(fù)雜。
三是自助取數(shù)受企業(yè)的業(yè)務(wù)特點(diǎn)影響太大了,
有些企業(yè),以清單級(jí)的關(guān)聯(lián)取數(shù)為主,有些企業(yè),以復(fù)雜的匯總分析取數(shù)為主,有些企業(yè),取數(shù)邏輯簡單,但查詢的速度要求卻很高,不同的業(yè)務(wù)需求對(duì)于自助取數(shù)引擎要求可能很大不同,只有基于企業(yè)的特點(diǎn)才能得到一個(gè)妥協(xié)的方案。
四是自助取數(shù)迭代要求偏高,
企業(yè)的數(shù)據(jù)和分析變換萬千,取數(shù)要素也必然隨之要不停更新,這個(gè)工具顯然要持續(xù)運(yùn)營的,而產(chǎn)品化的東西,感覺很難跟上。
話說,淘寶魔方本質(zhì)上也是個(gè)自助取數(shù)平臺(tái),但這個(gè)能買得到嗎?它其實(shí)也很難抽象成通用的產(chǎn)品,只適合電商,甚至只適合淘寶。
其實(shí)可以類比,為什么這么多行業(yè)分別需要建立自己的C R M系統(tǒng),市面上不是有很多C R M產(chǎn)品嗎,自助取數(shù)道理跟它一樣,沒有包打天下的C R M,也就沒有包打天下的取數(shù)工具,況且,數(shù)據(jù)的維度組合無限,而CRM好歹功能算是有限。
BI自助取數(shù)要么自研,要么定制開發(fā),很難奢望能有一個(gè)通用產(chǎn)品能真正符合要求,這由其特點(diǎn)決定。
其次,務(wù)必做好自助取數(shù)的可行性判斷。
自助取數(shù)很能完全替代人,想想也不可能,比如市場(chǎng)綜合分析人員冒出的那種海闊天空的分析取數(shù)要求,在取數(shù)的時(shí)候涉及復(fù)雜的關(guān)聯(lián)、跟蹤等操作,自助取數(shù)很難支撐,即使勉強(qiáng)支撐,也會(huì)導(dǎo)致功能的極其復(fù)雜,帶來體驗(yàn)的極度下降。
取數(shù)有個(gè)特點(diǎn),越偏向管理,越難取,規(guī)則越無法抽象,比如一般取數(shù)的難度排名如下:老大-領(lǐng)導(dǎo)-主管-分析-營銷-執(zhí)行,原因很簡單,層級(jí)越高,人的自主性越大,越不可捉摸,如果老大怎么想的規(guī)律被你抓到了,就不要玩了。
因此,自助取數(shù)實(shí)際只能解決部分問題,到底有沒有價(jià)值,值不值得做,這就需要事先進(jìn)行客觀的評(píng)估。
幸好,一個(gè)企業(yè)的取數(shù),往往簡單通用類的取數(shù)還是占據(jù)了大部,這為特定企業(yè)自助取數(shù)工具的成功奠定了基礎(chǔ),比如某些運(yùn)營商,一線簡單的營銷清單類取數(shù),規(guī)則比較簡單,且占到總?cè)?shù)量的60%到80%,而大多時(shí)候,這些取數(shù)還是在靠IT支撐人員寫一個(gè)個(gè)腳本在取,效率可想而知,這讓自助取數(shù)工具有了用武之地。
因此,自助取數(shù)也是有點(diǎn)時(shí)勢(shì)造英雄的感覺,不在那個(gè)行業(yè),沒有那個(gè)條件,就不要輕易上馬一個(gè)自助取數(shù)項(xiàng)目。
第三,做好自助取數(shù)需求的分析,這決定了工具的成敗。
自助取數(shù)的需求分析是很艱難的工作,有兩項(xiàng)最為重要的工作,一是數(shù)據(jù)需求分析,二是功能分析。
針對(duì)數(shù)據(jù)進(jìn)行分析,需要對(duì)歷史的取數(shù)工單進(jìn)行系統(tǒng)分析,至少能得出以下結(jié)論,字段屬性的排名并作取舍,模型的分析并作取舍,要做到這個(gè),需要對(duì)于企業(yè)的業(yè)務(wù)和數(shù)據(jù)有全局而深入的理解。
本質(zhì)上,自助取數(shù)是面向業(yè)務(wù)的,不是一個(gè)純技術(shù)活,這也是自助取數(shù)很難產(chǎn)品化的原因。
有一點(diǎn)特別要提,理論上做一張大寬表是體驗(yàn)最好的,但由于維度的限制,這是不可能的,因此,數(shù)據(jù)建模師就很重要了,設(shè)計(jì)需要達(dá)到很高的性價(jià)比,為了符合取數(shù)的特點(diǎn),甚至需要全新打造一套新的取數(shù)數(shù)據(jù)模型。
功能則需要調(diào)研,類似于設(shè)計(jì)產(chǎn)品,必須到一線中去了解需要哪些功能,怎么設(shè)計(jì)最好的配置方式,如何方便的找到相關(guān)模型、如何做好業(yè)務(wù)和數(shù)據(jù)的映射、如何方便的進(jìn)行關(guān)聯(lián)、如何方便的選擇屬性、如何方便的進(jìn)行在線分析、如何方便的調(diào)度和監(jiān)控、如何方便的導(dǎo)入導(dǎo)出數(shù)據(jù)、如何與現(xiàn)有的取數(shù)流程進(jìn)行自動(dòng)銜接、如何進(jìn)行SQL解析、是否需要打造一個(gè)取數(shù)社區(qū)等等。
下圖是一張系統(tǒng)架構(gòu)的示例,供參考。
最后就是要做出高保真設(shè)計(jì),讓業(yè)務(wù)人員試用,一定要簡單簡單再簡單。最好不要培訓(xùn)也會(huì)配,你可以設(shè)計(jì)成4步法或者5步法,步數(shù)越多,則會(huì)大幅增加工具的使用門檻,比如:
第一步,基本信息填寫:
填寫取數(shù)的基本信息,包括業(yè)務(wù)目的、業(yè)務(wù)口徑等信息。
第二步,選取合適的取數(shù)模型:
可以通過標(biāo)簽及搜索的方式從取數(shù)模型庫中選取合適的模型。
第三步,取數(shù)模型配置:
對(duì)取數(shù)模型的配置主要包括三個(gè)方面,一是對(duì)模型輸出結(jié)果的勾選,二是業(yè)務(wù)篩選條件的配置,三是外部數(shù)據(jù)的配置,允許導(dǎo)入外部數(shù)據(jù),以及對(duì)取數(shù)結(jié)果進(jìn)行特殊剔除等。
第四步,模型間組合(可選):
選擇兩個(gè)以上的模型,可以通過拖拽的方式對(duì)模型進(jìn)行自由組合。
第五步,取數(shù)任務(wù)執(zhí)行:
配置完數(shù)據(jù)的地域和時(shí)間范圍之后即可提交取數(shù)。
第四,運(yùn)營是臨門一腳,業(yè)務(wù)人員不是一張白紙。
取數(shù)作為企業(yè)的一項(xiàng)基礎(chǔ)工作,傳統(tǒng)取數(shù)的方式和流程已經(jīng)成為套路,自助取數(shù)工具作為一種新的支撐手段,是對(duì)傳統(tǒng)方式的挑戰(zhàn),即使產(chǎn)品再好,也需要做好內(nèi)部的運(yùn)營推廣。
曾經(jīng)將研發(fā)的自助取數(shù)叫作取數(shù)機(jī)器人,強(qiáng)調(diào)了其自動(dòng)化的特性,宣傳口號(hào)是“完全自助,永遠(yuǎn)在線,極簡操控,知識(shí)共享”。
事實(shí)上,很多企業(yè)業(yè)務(wù)人員提出取數(shù)需求的代價(jià)并不高,取數(shù)也是企業(yè)的一項(xiàng)剛性成本投入,要改變流程和習(xí)慣并不容易,這就更考驗(yàn)產(chǎn)品的能力。
況且自助取數(shù)與一般的企業(yè)內(nèi)生產(chǎn)系統(tǒng)不同,其并不是必需的,人工取數(shù)是它最大的競爭對(duì)手,需要接受業(yè)務(wù)人員的最挑剔眼光。
即使做過很多企業(yè)內(nèi)部推廣,還是有不少一線單位沒有使用,究其原因,一是工具還沒好到一定程度,二是缺乏持續(xù)的運(yùn)營推廣,三是企業(yè)人工取數(shù)成本太低,如果搞個(gè)虛擬結(jié)算估計(jì)會(huì)好很多,呵呵。
第五,不同企業(yè)效果可能不同,但成功還是可期。
當(dāng)然,運(yùn)營的效果還是要數(shù)據(jù)說話,說啥都是虛的,可以看到,后續(xù)自助的比例穩(wěn)定在50%左右。不少企業(yè)能做到80%以上,也是令人非常羨慕的。
同時(shí)發(fā)現(xiàn),一旦自助取數(shù)被投入實(shí)用,往往會(huì)大幅激發(fā)潛在取數(shù)需求,這對(duì)于公司是好事,說明原有的靠人工取數(shù)的方式已經(jīng)抑制了大量的數(shù)據(jù)需求,信息技術(shù)的確是生產(chǎn)力,它讓我們分析的成本、迭代的成本間接降低了。
自助取數(shù)的速度依賴于使用的技術(shù)引擎和取數(shù)復(fù)雜度,一般可以達(dá)到小時(shí)或半小時(shí),這個(gè)已經(jīng)遠(yuǎn)遠(yuǎn)低于傳統(tǒng)的按天的人工取數(shù)周期了。
同時(shí),自助取數(shù)的永遠(yuǎn)在線、口徑的標(biāo)準(zhǔn)化、知識(shí)傳承及很少出錯(cuò)也是其天然的優(yōu)勢(shì)。
第六,給用戶足夠的自主權(quán)。
自助取數(shù)最大的變數(shù)是業(yè)務(wù),業(yè)務(wù)會(huì)帶來數(shù)據(jù)模型的快速變化,因此需要最大可能的提供一線用戶的模型自主權(quán),因此,即使項(xiàng)目前期做了大量的數(shù)據(jù)調(diào)研,也務(wù)必能夠讓一線人員能夠自行定制模型表,這也是一種開放化的思維。
實(shí)際上,自助取數(shù)演變到現(xiàn)在,一線專業(yè)人員自行開發(fā)配置的模型已經(jīng)占到了60%以上。因此,我們需要做這個(gè)發(fā)動(dòng)機(jī),一旦自助取數(shù)工具能夠啟動(dòng),也許,星星之火,就能燎原了。
當(dāng)然,自助取數(shù)工具還有大量的問題,需要去持續(xù)解決。
自助取數(shù)強(qiáng)調(diào)關(guān)聯(lián)查詢的實(shí)時(shí)分析能力,原來的自助取數(shù)工具,是基于IOE的,這個(gè)性能的瓶頸顯然是很難解決的,包括在線、實(shí)時(shí)等計(jì)算分析能力,這給用戶的體驗(yàn)造成了極大的困惑,對(duì)于自助取數(shù),平均半個(gè)小時(shí)顯然也太長了。
因此很羨慕BAT,其較傳統(tǒng)企業(yè),通過技術(shù)自主創(chuàng)新,還是能領(lǐng)先一步,諸如淘寶魔方這種所見即所得的取數(shù)方式,正是我們孜孜以求的,而這個(gè)靠購買產(chǎn)品的方式,顯然很難。
當(dāng)然,如果有廠家能解決前面我提到的問題,也許真的能打造出通用的PaaS取數(shù)平臺(tái)也不一定,但相信肯定是一體化解決方案,而不是輕量級(jí)的一個(gè)工具。
由此想到了大數(shù)據(jù),最近也在考慮MPP等數(shù)據(jù)庫替代方案,比如GBASE、EXDATA啥的應(yīng)該更好一點(diǎn),但顯然無法達(dá)到實(shí)時(shí)水平,也許IMPALA/SPARK等也可以嘗試一下,無論如何,如果自助取數(shù)能移植到大數(shù)據(jù)平臺(tái)上,還是能推動(dòng)企業(yè)數(shù)據(jù)生產(chǎn)力的大幅提升。
要承認(rèn),當(dāng)前自助取數(shù)工具對(duì)于清單級(jí)的取數(shù)也許支撐的還可以,但對(duì)于匯總分析類的取數(shù)支撐難度就上了一個(gè)量級(jí),因?yàn)橐坏┓治霰砀裉珡?fù)雜,自助配置復(fù)雜度也將達(dá)到一個(gè)量級(jí),這就失去了自助的意義。
也許,并不存在完美的自助取數(shù),直接開放最終數(shù)據(jù)給業(yè)務(wù)人員,可能才是終極解決之道,再牛逼的工具或產(chǎn)品,在無邊的數(shù)據(jù)形式面前,也需要妥協(xié)。
大數(shù)據(jù)時(shí)代,機(jī)會(huì)無處不在,自助取數(shù)還是要繼續(xù)加油!
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。