如果將單個或局部領(lǐng)域的數(shù)據(jù)及其挖掘處理視為小數(shù)據(jù),那么關(guān)于某一主體的大數(shù)據(jù)就是由成千上萬、相互關(guān)聯(lián)、相互交織的小數(shù)據(jù)匯聚而成的。小數(shù)據(jù)的充分融合,就是大數(shù)據(jù)形成的根基。
大數(shù)據(jù)活在“云端”!唯有云計算能讓大數(shù)據(jù)找到自己的軌跡和存在的真正價值;但大數(shù)據(jù)不是無根的浮云,它有自己的根,源源不斷輸送數(shù)據(jù)的根。
那么,大數(shù)據(jù)的“根”在哪里?日前國務(wù)院出臺的《促進大數(shù)據(jù)發(fā)展行動綱要》(以下簡稱《行動綱要》)或許可以讓我們找到答案。
《行動綱要》明確提出了促進大數(shù)據(jù)發(fā)展的三大重點任務(wù)和十項工程。三大重點任務(wù)之首即加快政府數(shù)據(jù)開放共享,推動資源整合;十項工程前四大工程涉及政府信息,即:政府數(shù)據(jù)資源共享開放工程、國家大數(shù)據(jù)資源統(tǒng)籌發(fā)展工程、政府治理大數(shù)據(jù)工程、公共服務(wù)大數(shù)據(jù)工程。不難發(fā)現(xiàn),三大重點任務(wù)、十項工程的關(guān)鍵詞就是共享,而政府數(shù)據(jù)的開放共享是核心。
共享是大數(shù)據(jù)的“根”
大數(shù)據(jù)與云計算,或許就像一枚神奇的金幣之正反面,讓許多人感覺“云里霧里”、亦真亦幻,卻又能真切地感受到金幣的光芒。
什么是大數(shù)據(jù)?按照維基百科的定義,大數(shù)據(jù)是指無法在可承受時間范圍內(nèi)用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合。大數(shù)據(jù)的基本特點可以概括為“4V”:大量化(Volume)多樣化(Variety)、快速化(Velocity)、價值化(Value),即海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流動和動態(tài)的數(shù)據(jù)體系、多樣的數(shù)據(jù)類型、巨大的數(shù)據(jù)價值。
而《大數(shù)據(jù)時代》的作者維克托·邁爾·舍恩伯格給出的解釋或許更易于理解,他認為,“大數(shù)據(jù)”并不是很大或者很多數(shù)據(jù),并不是一部分數(shù)據(jù)樣本,而是關(guān)于某個現(xiàn)象的所有數(shù)據(jù)。比如說關(guān)于一家企業(yè)的數(shù)據(jù)信息,除了企業(yè)名稱、法定代表人、注冊資本、經(jīng)營范圍等基本信息外,還包括財務(wù)信息、經(jīng)營信息、外部關(guān)聯(lián)關(guān)系、誠信狀況等信息。大量、多維、立體、交織信息的匯集,就可以為不同主體、基于不同需求分析企業(yè)提供數(shù)據(jù)基礎(chǔ)。
如果將單個或局部領(lǐng)域的數(shù)據(jù)及其挖掘處理視為小數(shù)據(jù),那么關(guān)于某一主體的大數(shù)據(jù)就是由成千上萬、相互關(guān)聯(lián)、相互交織的小數(shù)據(jù)匯聚而成的。小數(shù)據(jù)的充分融合,就是大數(shù)據(jù)形成的根基。譬如一滴水,唯有與別的水滴融合在一起,才能形成水流,才能匯成江河、海洋,才能發(fā)揮水的價值。這種融合就是共享。沒有小數(shù)據(jù)的共享,就沒有大數(shù)據(jù)生長的“根”。
要從海量的數(shù)據(jù)中快速地分析、挖掘出有用的信息,單臺計算機已難以勝任,必須采用分布式架構(gòu),依托云計算的分布式處理、分布式數(shù)據(jù)和云存儲、虛擬化技術(shù),即透過網(wǎng)絡(luò)將龐大的計算處理程序自動分拆成無數(shù)個較小的子程序,再交由多部服務(wù)器所組成的龐大系統(tǒng)經(jīng)搜尋、計算、分析之后將處理結(jié)果回傳給用戶。這就是與大數(shù)據(jù)相依相存的云計算。顯然,如果沒有數(shù)據(jù)的共享,云計算也是“無米之炊”。
當然,數(shù)據(jù)能否共享,涉及到數(shù)據(jù)的開放性、法律邊界、數(shù)據(jù)價值實現(xiàn)等問題,還面臨諸多現(xiàn)實障礙。
誰阻礙了數(shù)據(jù)共享?
當我們沉醉于大數(shù)據(jù)的奇妙與魔法無邊的時候,現(xiàn)實世界卻給了我們一記響亮的耳光!我們會沮喪地發(fā)現(xiàn),許多政府公共信息仍處于零散、分割、封閉狀態(tài)!
各級政府部門在履職過程中掌握了大量的數(shù)據(jù)信息,其中涉及企業(yè)(個人)的數(shù)據(jù)最為豐富。目前普遍認為比較有用的企業(yè)信息大致包括四個方面。
一是反映企業(yè)基本情況的信息。
包括:工商部門提供的企業(yè)注冊登記信息,注冊資本、股東及高管變更情況等;環(huán)保部門提供的企業(yè)環(huán)境違法處罰信息、環(huán)評審批、排污許可證和排污權(quán)抵押登記情況等;質(zhì)監(jiān)、安監(jiān)、食品藥監(jiān)、衛(wèi)生等部門提供的各項資質(zhì)信息。
二是反映企業(yè)真實經(jīng)營狀況的信息。
包括:稅務(wù)部門提供的企業(yè)應(yīng)稅銷售額,納稅、退稅情況等;人力社保部門提供的企業(yè)社保繳納、勞動爭議情況、勞動保障書面審查信息等;海關(guān)部門提供的進出口信息、企業(yè)報關(guān)情況等;水、電、氣部門提供的繳費及欠費情況等。
三是反映企業(yè)及企業(yè)主資信狀況及守法情況的信息。
包括:公安、法院等部門提供的企業(yè)或企業(yè)主的司法訴訟、執(zhí)行、查封信息等;工商、環(huán)保、人社、稅務(wù)、質(zhì)監(jiān)、安監(jiān)、食品藥監(jiān)、衛(wèi)生、海關(guān)等部門提供的處罰信息。
四是反映企業(yè)融資、財產(chǎn)抵質(zhì)押、對外擔保等情況的信息。
包括:人民銀行征信系統(tǒng)提供的貸款、質(zhì)押信息,工商部門提供的股權(quán)轉(zhuǎn)讓、抵押、查封信息等;房產(chǎn)部門提供的房地產(chǎn)權(quán)屬、抵押、查封、租賃信息等。
這些涉及企業(yè)的各種信息資源散落在不同的政府管理部門,總體處于彼此分割、孤立、封閉狀態(tài),沒有實現(xiàn)數(shù)據(jù)之間的共享、連接和融合,更談不上大數(shù)據(jù)價值的體現(xiàn)。
盡管近年來,各級政府都在積極搭建公共信用信息平臺,推動社會征信體系建設(shè),特別是《國務(wù)院關(guān)于印發(fā)社會信用體系建設(shè)規(guī)劃綱要(2014—2020年)的通知》出臺后,步伐進一步加快,各部門也大多建立了自身的信息管理系統(tǒng),但部門之間信息不共享或共享不充分仍是常態(tài)。即使有一些全國性、地區(qū)性的統(tǒng)一信息平臺,如“全國企業(yè)信用信息公示系統(tǒng)”“信用浙江”等,所含企業(yè)信息也非常有限,且不完整、不及時。
這種信息割裂的狀態(tài),不僅不利于大數(shù)據(jù)的發(fā)展,從眼前看,則對具體運用大數(shù)據(jù)的相關(guān)主體的發(fā)展形成阻礙。比如,銀行業(yè)在服務(wù)實體經(jīng)濟特別是小微企業(yè)過程中,面臨的突出瓶頸之一,就是信息瓶頸。銀行業(yè)開展小微企業(yè)信貸業(yè)務(wù)面臨的最大困惑是信息不對稱。信息的不對稱使銀行在發(fā)放小微企業(yè)貸款時難免“如履薄冰”,顧忌甚多。因此,能否切實掌握和了解反映企業(yè)真實經(jīng)營狀況、企業(yè)及企業(yè)主資信狀況等相關(guān)信息,在很大程度上決定了銀行對小微企業(yè)放貸的意愿以及介入小微企業(yè)信貸領(lǐng)域的深度。
目前客觀存在的企業(yè)信息難共享之格局,根源在于部門利益。相關(guān)政府部門在參與公共信用信息平臺建設(shè)時,出于種種原因,往往叫得響、做得少。一些部門出于自身商業(yè)利益,將自身所擁有的大量公共信息視為“私有財產(chǎn)”,以有償作為提供信息的條件;或以維護商業(yè)秘密、涉及部門機密為由,不愿將擁有的、本屬于公共資源的企業(yè)信息與其他部門共享,或者象征性地扔幾根“骨頭”,人為造成了企業(yè)信息的分割、殘缺,也造就了許多“僵尸”信息平臺;有些信息的共享按說不應(yīng)存在障礙,只因為一些數(shù)據(jù)擁有的部門感覺“吃力不討好”,缺乏主動提供數(shù)據(jù)的動力。
當然,也不排除個別地方政府從局部利益出發(fā),對可能影響當?shù)仄髽I(yè)發(fā)展的行政處罰類負面、失信信息的公開加以阻擾,影響信息數(shù)據(jù)的共享。深層的原因,則是社會信用體系建設(shè)法制化步伐緩慢,公共信息征集機制不健全,對相關(guān)部門提供、公開相關(guān)政務(wù)信息缺乏有效的約束,以及信用信息使用在公開與保密之間的法律邊界不清晰。
怎樣走向數(shù)據(jù)共享?
《行動綱要》把加快政府數(shù)據(jù)開放共享、推動資源整合列為首要任務(wù),把推動政府數(shù)據(jù)資源共享開放工程、國家大數(shù)據(jù)資源統(tǒng)籌發(fā)展工程、政府治理大數(shù)據(jù)工程、公共服務(wù)大數(shù)據(jù)工程等工程建設(shè)作為促進大數(shù)據(jù)發(fā)展的基礎(chǔ)設(shè)施工程。說明政府高層對信息共享問題的高度關(guān)注。
顯然,推動數(shù)據(jù)共享的起點是政府部門間的信息共享,而這恰恰是難點所在。這是一個系統(tǒng)性艱巨工程,也是一個漸進的過程,既需要加快社會征信體系的法制化進程,更需要政府及相關(guān)部門創(chuàng)新思維。
搭建統(tǒng)一、公開、透明的社會信用信息共享平臺,有效整合政府各部門信息。對于擁有各種管理資源的政府而言,搭建一個比較完備的信息平臺框架似乎并不難,難就難在能否實現(xiàn)信息的充分共享。如何讓信息平臺所涉及的政府部門主動、及時、充分地將自身所擁有、可公開的數(shù)據(jù)信息共享到統(tǒng)一的信息平臺,關(guān)鍵是要強化信息征集的行政約束力,建立公共信息共享平臺的保障機制。
在現(xiàn)行體制下,筆者以為政績考核“指揮棒”或是推動信息共享之“神器”。應(yīng)以推動《社會信用體系建設(shè)規(guī)劃綱要(2014—2020年)》實施、落實政務(wù)公開制度為抓手,將公共信用信息共享系統(tǒng)數(shù)據(jù)信息的報送納入政府對相關(guān)部門的考核,前提是要充分研究和界定各類信息公開的法律邊界,特別是在對各類違法違規(guī)信息、不誠信行為信息的公開方面,應(yīng)明確可以采取的共享方式和程度,以打消信息發(fā)布各方的顧慮。在此基礎(chǔ)上,制定清晰的公共信息共享清單,明確相應(yīng)的責任與義務(wù)。
小數(shù)據(jù)不能共享,大數(shù)據(jù)必是空談。所以,看大勢、顧大局、破本位,推進小數(shù)據(jù)共享,是政府部門在大數(shù)據(jù)時代應(yīng)有的思維。
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。