金融不是說量做的大,最后就一定能跑贏,但互聯(lián)網(wǎng)不是,互聯(lián)網(wǎng)是玩杠桿的,錢是投資人的錢或者說是資金方的錢,把錢燒了,把用戶數(shù)做上來就可以。美國不敢這么玩,為什么?他們真正經(jīng)歷過金融危機。
我從美國回到中國,最大一個感受是,中國的互聯(lián)網(wǎng)真是比美國激進太多,燒錢跑規(guī)模成了行業(yè)慣例,不管收入不管盈利,燒錢把用戶量做上去就算贏了。就是互聯(lián)網(wǎng)金融這個行業(yè),也經(jīng)常能看到在用戶量和交易量上驚人的現(xiàn)象。
但是我雖然在一個互聯(lián)網(wǎng)金融公司,但我的看法可能不那么“互聯(lián)網(wǎng)”。在我看來,金融的邏輯和互聯(lián)網(wǎng)不一樣。
第一,是行業(yè)邏輯不一樣。
金融并不是贏家通吃的行業(yè)?;ヂ?lián)網(wǎng)都是寡頭統(tǒng)治,阿里統(tǒng)治電商,騰訊統(tǒng)治社交。但是金融不是這個邏輯。金融是一個經(jīng)營風(fēng)險的業(yè)務(wù),當(dāng)所有的規(guī)模都集中在一起時,風(fēng)險也就集中在了一起。
且不說你自己能不能玩的下去,政府就不會袖手旁觀。大而不倒,早晚政府會接手,這在美國都有先例,他們可是見識過真正金融危機的,何況中國。
現(xiàn)代金融歷史幾百年,也沒有哪個國家出現(xiàn)金融的絕對集中。有人說中國以前有這種現(xiàn)象,改革開放前只有一個中國人民銀行包攬一切,但那是國家的業(yè)務(wù),跟市場沒關(guān)系。
我們?nèi)サ疥懠易烊タ匆幌?,招商銀行旁邊是匯豐,匯豐旁邊是渣打,渣打旁邊是花旗,不存在一個寡頭統(tǒng)治。金融是十幾萬億甚至上百萬億級的市場,所以永遠不要去追逐在這個市場里邊占50%以上的份額,我認為不可能的,這個市場大到足夠容得下眾多玩家。
第二,是業(yè)務(wù)邏輯不一樣。
金融它是很強調(diào)邊際效應(yīng)的業(yè)務(wù),金融的“邊際化”對應(yīng)就是“規(guī)?;?rdquo;,然而規(guī)?;褪怯脕硇稳莼ヂ?lián)網(wǎng)這個行業(yè)。從這也能看出互聯(lián)網(wǎng)金融還是偏重金融一些,不靠做量。
因為金融不是說量做的大,最后就一定能跑贏,金融本來就不是做量的,更別說為了做量而放寬風(fēng)險的控制。
拿我們信貸行業(yè)來說,控制逾期的方式其實就兩種,一個是做分子,一個是做分母。所謂的做分子就是把你真正壞賬的部分壓下去。
而做分母就是說壞賬不斷的增長同時,加大貸款的數(shù)量,體量大了讓優(yōu)質(zhì)貸款為劣質(zhì)貸款買單,短期也是可以把壞賬率往下降的。
但我們更愿意選擇前者,因為一旦采用做分母模式的話,就進入了一個被動的周期,被動的追求數(shù)量就會被動放棄質(zhì)量。
為了做大分母讓更多人獲得貸款,就要被動的放寬風(fēng)控審核條件,邊際被動放寬,風(fēng)險也會越來越控不住的。
所以我們更愿意做的是,在可控的范圍之內(nèi),獲取最大用戶量。
中國的征信體系才剛剛建立,有效的信用數(shù)據(jù)還不全面,不像美國以及擁有了很成熟的信用體系和征信體系。
在這種情況下,面對有信貸需求的用戶,我們不會像傳統(tǒng)金融機構(gòu)一樣,只做簡單的風(fēng)險控制,把大量的潛在用戶拒之門外,而是通過我們的算法對計算出用戶的風(fēng)險偏好,提供動態(tài)的授信決策。
風(fēng)險偏好決定了風(fēng)險的可控范圍,只要風(fēng)險在可控的范圍之內(nèi),我們就可以最大化的獲取用戶,產(chǎn)生最大化的價值。即使對待一個風(fēng)險偏高的用戶,我們也會有自己的界定,不會一刀切似的拒絕。
比如我們會用風(fēng)險定價的方式給他一個比較高的貸款利率或者是比較低的借貸額度。如果他的幾次信貸記錄都非常良好,那在之后的運營過程中,我們會動態(tài)調(diào)整他的授信額度或者貸款利息,從而增加用戶粘性。反過來,如果用戶在還款過程中表現(xiàn)出了風(fēng)險比較高,經(jīng)常不還款,我們也會凍結(jié)他的額度。
中國的數(shù)據(jù)太分散了,沒有像美國三大征信局這樣的信用庫,于是我們引入跟金融不是強相關(guān)的弱變量。
我回來中國工作第二個感受是,我們國家消費金融行業(yè)從來不缺少思維活躍的人,這是好事也是壞事,思維越活躍,騙局就越多,對我們做數(shù)據(jù)的人來說,每一天都有新挑戰(zhàn)。
中國的央行征信體系雖然已經(jīng)覆蓋近8億人,但基本上只對金融機構(gòu)開放,比如銀行、小金公司和小貸公司。雖然極大程度的保護了用戶信息,但是對于我們做數(shù)據(jù)決策,沒有數(shù)據(jù)支撐還是太難了。在美國的話,拿我以前在Capital One的經(jīng)驗舉例。Capital One做的是主流消費信貸,主要接入的是三大信用局數(shù)據(jù)來做零售信貸業(yè)務(wù)。三大信用局對美國的主流人群基本上就可以覆蓋了。
在中國也有一些機構(gòu)自稱是在提供一個行業(yè)的解決方案。聲稱是搜集到了各個行業(yè)主動給予的黑名單,然后這個機構(gòu)進行整合并且建立一個“聯(lián)防聯(lián)控”的解決方案,有點兒像美國征信據(jù)局干的事。
比如以前我們在Capital One給一個用戶發(fā)了信用卡,但是他屢次逾期最終賬戶被注銷,那我們就會把這個的信用情況交給美國征信局,那他在其他機構(gòu)再申請貸款的時候,機構(gòu)就可以從征信局查到他的這些不良記錄,可能就會不再房貸給他。
但是在中國,這些信息的整合還不是政府行為,很多時候很多一些比較小的機構(gòu),沒有監(jiān)管,就很有可能讓沒有職業(yè)操守的機構(gòu)鉆了空子。比如這些小機構(gòu)會自行上傳一些黑名單上去批的也沒辦法驗真。
如果這些在假的黑名單中的用戶在別家想要申請貸款自然申請不到,就只能去找這個這個黑機構(gòu)了。
沒有征信局,沒有靠譜的民間聯(lián)盟怎么辦?這也是中國一個非常大的特點,除了傳統(tǒng)的征信數(shù)據(jù)以外,我們運用一些所謂的弱變量,弱變量就是說它不是跟你收入多少、或者你的銀行信用卡額度多少這些金融數(shù)據(jù)強相關(guān)的。而是非常散的一些數(shù)據(jù),包括征信數(shù)據(jù),消費記錄、通信數(shù)據(jù)或者社交數(shù)據(jù)等等。
在中國在用戶授權(quán)的前提下,我們會接入銀聯(lián)的消費,通信數(shù)據(jù),社交數(shù)據(jù)以及電商的消費記錄數(shù)據(jù)等等。比如說和場景類的平臺合作,比如像攜程、去哪兒,他們會有一些用戶在他們平臺上消費的記錄,這些消費記錄其實是對做風(fēng)險是非常有用的
它可以解讀出很多信息,比如從時間和交易次數(shù)這緯度來判斷這是不是個忠實客戶;其次,是這個客戶的消費能力,比如是不是經(jīng)常出行,是商業(yè)出行還是個人出行呢?出行時候坐的是經(jīng)濟艙還是商務(wù)倉呢?這些數(shù)據(jù)間的關(guān)聯(lián)就可以判斷出一個人的收入情況和消費能力。
跟螞蟻金服的芝麻信用合作,實際上是獲取了支付寶的數(shù)據(jù)。這對B端小企業(yè)主,它可以看到電商的流水和負債;對C端消費者,可以判斷C端用戶的消費行為能力。這種數(shù)據(jù)在美國就不太可能會有,除非Amazon自己做,但它好像也沒在做。
社交數(shù)據(jù),對這個領(lǐng)域獲取的數(shù)據(jù)就目前來看還是以有趣的探索為主,現(xiàn)在社交網(wǎng)絡(luò)都是實名登記,從手機號就可以看到用戶是不是微博用戶或者是不是知乎用戶,他們有多少粉絲,原創(chuàng)與轉(zhuǎn)發(fā)有多少號召力。
像美國有很多基于Twitter來做數(shù)據(jù)的,甚至有人是通過關(guān)注Twitter內(nèi)容炒股的,但社交數(shù)據(jù)目前至少在中國,這些也還只是一個有趣的方向,有效數(shù)據(jù)比重很少,效果不明顯,花大力氣研究事倍功半,前文也說了,金融還是一個講賺錢的業(yè)務(wù),燒錢燒腦只能選一個。
在大數(shù)據(jù)的時代下,尤其中國的信用體系才剛剛建立,數(shù)據(jù)一定是比較稀疏分散的,我們有上千緯度的數(shù)據(jù)和上萬個緯度可以用戶的評定,對每一個真實用戶做有效信息判定,就好像受孕一樣難。
每一個用戶帶著上萬條的信用數(shù)據(jù)進來,有效數(shù)據(jù)并且受用的可能就是受孕的那極少部分,大部分還是缺失的,或者查不到。想想懷孕多難就知道了,所以在數(shù)據(jù)總量大,有效多的情況下,我們要對這種比較稀疏的數(shù)據(jù)有一個處理能力。
實際上我們整天的工作就是在跟各種各樣的數(shù)據(jù)打交道,但這個過程中要像一個狐貍一樣有著敏銳的感官,很多時候去建立一些新鮮的事情,新鮮的緯度,可能我們選出來的維度有90%或者80%都是最后沒有太大的決定性的作用。
但是我們其實都會花很多時間把特征放到模型里面評估,最終就是看它跟風(fēng)險有沒有關(guān)聯(lián)度,或者跟我們所要的這個指標有沒有關(guān)聯(lián)度,如果一旦有關(guān)聯(lián)度,我們就認為它是個很好的變量,如果沒有關(guān)聯(lián)度的話,那就重頭再來,這個過程很好聽,叫迭代。
我們的用戶的90%以上都來自于移動端,這在美國是不敢想象的,防止移動端騙貸是新的挑戰(zhàn)。
我們的用戶的90%以上都來自于移動端,這在美國是不敢想象的。因為他們申請貸款的方式基本上還是通過PC機,甚至是填寫紙質(zhì)的申請資料。從這個角度來說,在中國,在用戶授權(quán)的前提下,我們可以抓取更多用戶的行為信息。
比如說你的手機開著定位系統(tǒng),就可以獲取你的位置信息,最主要還是能獲取你的手機的獨特“指紋”。這個“指紋”不是iPhone解鎖的那個指紋,而是指手機獨一無二的特征,比如說它的設(shè)備唯一識別號、MAC地址、IP地址等等,用來判斷信貸請求是不是通過代理,也就是VPN申請的,他有沒有偽裝過他的IP地址等等。
抓取行為信息有什么作用呢?通過抓取用戶手機的“指紋”信息可以判斷用戶是不是換過手機了,當(dāng)然用戶換手機不一定代表是個壞事,有可能是手機壞了丟了或者型號更新?lián)Q了一個新的。
但是會把“指紋”變更作為我們風(fēng)險識別的一個指標,進入到風(fēng)險測評的模型。如果頻繁的換手機我們會認為是個太正常的情況。還有一種風(fēng)險測評的模型,我們會判斷同一個手機是不是申請了多次貸款,像個中介一樣,實為在替別人在貸款。
比如說一臺手機,這個手機他一下申請了100筆貸款,不同的人,不同的姓名身份證號。這就屬于騙貸了。
中國現(xiàn)在有很多這種黑色產(chǎn)業(yè)鏈,他們每天工作就是騙貸。一個人同時兼顧幾百臺手機在不同的平臺上貸款。
我們發(fā)現(xiàn)設(shè)備“指紋”對付欺詐是非常有用的。同一個設(shè)備同一天是否申請了多筆借款;或者同一臺設(shè)備為不同的人申請借款,這些都是以往審批通過在PC申請和紙質(zhì)的申請表申請貸款所遇不到的問題。
對申請者手機地理位置異樣的抓取,比如說你一下子在北京,一下子又到了紐約,這就很有可能判斷你開了VPN。通過我們算法就可以對一些高危的行為進行管控,也會對用戶進行預(yù)警與告警,從反欺詐的角度來說是一個非常好的防范。
既然AI先生來了,就讓咱們家那些個騾子啊馬啊,那些個大牲口都歇了吧。
我從美國回來,還有第三個感受就是,中國市場太喜歡“蹭熱度”了。
一個阿法狗的亮相,AI神話了,仿佛可以把所有積攢的數(shù)據(jù)往里一扔,然后就能幻化出一個神奇的結(jié)果,而且這個結(jié)果都是美好的,也是我們正想要的。其實做過數(shù)據(jù)的人就知道,輸出質(zhì)量是由輸入質(zhì)量決定的,并沒有一個超強大腦,把所有東西放進去,出來就是好東西。
Garbage in,garbage out,是計算機科學(xué)和數(shù)學(xué)中很常見的概念,輸出質(zhì)量是由輸入質(zhì)量決定的。舉例來說,如果一個數(shù)學(xué)方程表達不當(dāng),答案就不太可能正確。同樣地,如果不正確的數(shù)據(jù)輸入到一個程序,輸出的就可能是無用信息。
就像阿法狗一樣,阿法狗大家只看到了它跟李世石打仗的那一面,阿法狗下棋本身其實是Google Real-Time上百工程師在隨時調(diào)整阿法狗的算法,所以阿法狗并不是一個電腦坐在你對面,是算法還有調(diào)整算法的工程師。
在中國,信用體系才剛剛建立,央行的征信體系雖然覆蓋了近8億,但是面對14億人民,從百分比來看就是還有近40%沒有覆蓋。而且數(shù)據(jù)來源分散,每一個來源的數(shù)據(jù)又單一。
這些很分散、有獨特的中國市場特征的數(shù)據(jù),我們需要通過一個有邏輯的方式接入進去。就像Real-Time,F(xiàn)ast data秒級對所有的數(shù)據(jù)進行響應(yīng),這是科技。回到對數(shù)據(jù)的運用這個問題上,我們需要去強調(diào)一種關(guān)注問題本身,解決問題,而不是打造酷炫的大腦外殼。真正去靜下心做數(shù)據(jù)特征挖掘,整理數(shù)據(jù),然后做一個比較好的模型,比什么都強。
但有時候,不是說科技打敗了很多人類的東西,而是自動化打敗了很多人類的東西,自動化不是做了一個人類做不了的東西,而是他把人類能做的事情用非常非??斓姆椒ㄗ隽恕?/strong>
比如我們現(xiàn)在做的智能信貸系統(tǒng),可以做到十秒鐘授信,沒有任何人工的干預(yù),全部實現(xiàn)自動化,我們可以接很多單,幾百萬、幾千萬單都沒問題。
這是在傳統(tǒng)的銀行是不可想象的,因為銀行是有人工成本的。審批員他就是成本,而且他得正常休息,雙休日不上班的,節(jié)假日也不上班。
就像春節(jié)就是個很好的例子,其實春節(jié)之前人們對現(xiàn)金或者說資金的需求是很大的,但是恰巧那個時候銀行很多人,尤其工作和老家不在一個地方的都會提前休假了。這個時候就會呈現(xiàn)出一種需求與資源不對等的現(xiàn)象:我急著用錢,你卻休息了。
而我們所做的就是通過大數(shù)據(jù)和科學(xué)決策的方法將這個過程自動化了,自動化直接的效果就是將邊際成本是慢慢降下來了。就像我們的一些分期產(chǎn)品,即使是幾十塊一單的商品我們都可以不考慮人工成本的去進行審批。
就算突然有一天我們的接單量一下子增加三倍,那也只需要去擴容我的機器或者說滿足系統(tǒng)能支持這么大的一個峰值就可以了,不需要增加三倍的人。
我舉這個例子,不是要黑高科技,我一直都對“科技改變世界”飽有敬畏心的,前沿的科技會打開我們很多思路與壁壘,但與其強行“熱度”,不如在自己從事的行業(yè)或者工作內(nèi)容上精耕深挖。
比如以前我們在Capital One工作的時候,數(shù)據(jù)在已有的系統(tǒng)里已經(jīng)被挖掘很深了,卻依然在做精細化挖掘。我們在用信用局的數(shù)據(jù)的同時也跟FICO(美國有一個評分機構(gòu))合作,它的分數(shù)我們也進行比較,我們可能就是比FICO做了一個小小的算法優(yōu)化,可能只提高5%,但也是在已有的數(shù)據(jù)基礎(chǔ)上挖的很深了。
而現(xiàn)在中國市場還沒做到挖的很深,就玩起了花板子。中國是市場驅(qū)動,中國現(xiàn)在市場非常大,跟美國相比,美國是商業(yè)驅(qū)動,他們可能會覺得有些數(shù)據(jù),比如社交數(shù)據(jù),有意思,但不會真的用,為什么,因為商業(yè)需求不強。
美國的數(shù)據(jù)很多都是在征信體系內(nèi)已經(jīng)覆蓋了,而且它信用卡的覆蓋人群已經(jīng)到了70%,基本上大部分人擁有完善的信用歷史,你用一些社交數(shù)據(jù)玩一些花,沒什么決定性的意義。不會因為你在Twitter上有很多贊就給你很多貸款。
我們正在經(jīng)歷一個新體系的建立過程,那一定是一個井噴的階段,這是我們的優(yōu)勢。我們現(xiàn)在有很多數(shù)據(jù),以前沒有用過的數(shù)據(jù),量大的驚人,比如像電商、社交的場景數(shù)據(jù),銀聯(lián)的消費、電話的通信記錄,以及移動終端的“指紋”數(shù)據(jù)。
但是有效數(shù)據(jù)挖掘、精細的處理肯定是弱項,但會是未來的方向。未來,在中國肯定會做的越來越精細,就是把我們有效數(shù)據(jù)挖掘做的更深,就像我們現(xiàn)在做的事情一樣。
科技改變金融,數(shù)據(jù)開拓眼界,這點我從沒懷疑過。
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。