大數(shù)據(jù)概念的形成和發(fā)酵,在當今社會引發(fā)了人們無限的遐想和期待,也受到普遍的歡迎和推崇,甚至有人不斷編造出關于大數(shù)據(jù)無所不能的種種現(xiàn)代神話。這種令不少人癲狂、著迷的東西是否真的“法力無邊”,我們不妨試發(fā)三問。
一問:大數(shù)據(jù)的特點在“大”,是否越大越好?
回答是不一定。
人類對世界的認識,首先是感知信息。但問題在于,人類許多方面的感知能力卻不如普通動物,比如人的嗅覺不如狗,聽覺不如貓,視覺不如鷹等等。
難道高級動物竟然比不上低等動物?顯然不是。奧秘在于人類相對普通動物而言,長處在思維。思維之花乃是生物進化的杰作,人類憑借思維之利器,便可以通過科學技術手段,根據(jù)需要延長自身的器官,最后實現(xiàn)各方面能力都遠在一般動物之上。在此過程中,關鍵是計算機技術的發(fā)展,得以替代人的部分邏輯思維,能夠進行大規(guī)模數(shù)據(jù)的快速處理,從而使得我們在面對大數(shù)據(jù)時,不至于心懷畏懼。
20世紀以來科技領域看起來碩果累累,但真正具有顛覆性意義的發(fā)現(xiàn)卻如鳳毛麟角,甚至不及19世紀。問題何在?數(shù)字化的數(shù)據(jù)固然有利于從中發(fā)現(xiàn)規(guī)律,但這類數(shù)據(jù)在整個大數(shù)據(jù)庫中所占份額極小,何況還有一個魚龍混雜問題。至于那些尚未數(shù)字化的數(shù)據(jù),尤其是那些似是而非、眾說紛紜的數(shù)據(jù),顯然并非越多越好。
事實上,就人類認識而言,也有減材加工與增材加工兩種方式。毛澤東在《實踐論》中所說的去粗取精、去偽存真、由此及彼、由表及里的認識過程,其實就是講的真理性認識有增有減的過程。當年第谷觀察天象,所做工作就是增加數(shù)據(jù);而開普勒總結天體運行規(guī)律,所做工作則屬刪繁就簡。如果說數(shù)據(jù)的增加意味著真理性認識的增加,那么數(shù)據(jù)的減少則意味著真理性認識的深化和升華,何嘗不值得我們同樣為之喝彩?
二問:大數(shù)據(jù)的亮點在“數(shù)”,是否萬物皆數(shù)?
回答是不可能。
數(shù)字的發(fā)明,是人類抽象思維能力發(fā)展的產(chǎn)物。而發(fā)現(xiàn)數(shù)字之間的某些關聯(lián),曾經(jīng)更使人類欣喜若狂,畢達哥拉斯甚至據(jù)此作出了“萬物皆數(shù)”的斷言。大數(shù)據(jù)之所以吸引人們眼球,噱頭就在“數(shù)”上,似乎一切化歸于數(shù),就可萬事大吉,適合數(shù)字化生存的時代要求了。
應該看到,世界在演化的進程中,特別是生命體和人類社會誕生后,正負二分的表征法就變得越來越不適用了,無論是模擬仿真技術的興起,還是復雜化方法的運用,都說明這種建立在非此即彼的認識論基礎上的進位法,其實是形而上學思維方式在信息時代的反映。
由此可見,所謂的數(shù)據(jù)其實有兩類,一類是可以實現(xiàn)數(shù)字化的數(shù)據(jù),人類可以輕而易舉地將它的處理任務付之電腦,進而從中發(fā)現(xiàn)規(guī)律、把握規(guī)律。而另一類不可數(shù)字化或者說很難實現(xiàn)數(shù)字化的數(shù)據(jù),則還是必須依靠人腦的判斷與解讀。1948年美國的“驢象”之爭中,蓋洛普的配額抽樣方法以及其他民意調查機構之所以遭遇“滑鐵盧慘敗”,就是因為過于迷信數(shù)據(jù),而這種建立在數(shù)字基礎上的所謂“科學”方法,其實經(jīng)實踐檢驗后被發(fā)現(xiàn)并不科學。過去這些年來,定量評估在世界各地盛行,人們動輒以各式各類指標體系肢解復雜事物和系統(tǒng),最后鬧出許多笑話,正說明現(xiàn)代的數(shù)字崇拜照樣是此路不通。
三問:大數(shù)據(jù)的基點在“據(jù)”,是否據(jù)實逼真?
回答是不見得。
信息技術的推廣應用同樣是一把雙刃劍,它在為人們提供無限便利的同時,也為數(shù)據(jù)造假及其傳播洞開了方便之門。據(jù)《環(huán)球科學》2014年12月載文,生物科技風投資本家有一個經(jīng)驗法則:一半公開發(fā)表的科研成果都無法復制,這還是最樂觀的估計。2012年,生物科技公司安進發(fā)現(xiàn),在關于癌癥研究的53項重大成果中,只有6項可被復制。稍早前,拜耳制藥公司的一個團隊重新開展了67篇有重要影響的論文所做過的實驗,最終成功的卻只有四分之一。本世紀最初10年,應用于臨床的研究專利大約有8萬份被撤銷,因為它們都是錯誤的。
面對如此龐大的虛假數(shù)據(jù),你還會相信大數(shù)據(jù)即未來石油的神話嗎?美國科學計量學家普賴斯曾在上世紀50年代就得出科學知識呈指數(shù)增長的結論,其依據(jù)是各國期刊文獻的數(shù)量增長。此后,有關知識爆炸的說法甚囂塵上?,F(xiàn)在回頭看,普賴斯的判斷未免草率,因為期刊文獻數(shù)量與人類知識量顯然是不能畫等號的,否則就會得出撤銷某些期刊就是限制知識增長的荒唐結論。
總之,科學的發(fā)展在深刻改變人類生產(chǎn)生活方式的同時,也制造了許多令人目不暇接的神話。當泥沙俱下且呈雪崩式的大數(shù)據(jù)襲來時,我們更應保持一個清醒的頭腦,用中國的古訓來說,就是要防止以目廢心。
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。