上世紀(jì)80年代末,還在加拿大攻讀碩的尤舒亞·本吉奧(Yoshua Bengio)被一個當(dāng)時并不怎么流行的想法迷住了。那時,有少數(shù)從事人工智能研究的計算機科學(xué)家試圖研發(fā)這樣一種軟件,這種軟件可以大致模仿神經(jīng)元網(wǎng)絡(luò)在大腦中處理數(shù)據(jù)的方式,雖然當(dāng)時并沒有證據(jù)表明這是一種行得通的想法。
神經(jīng)元模擬20多年后,科技行業(yè)也后知后覺地愛上了這個想法。近年來,人工智能領(lǐng)域的長足進步使得自動駕駛汽車等項目能達到幾乎與人類相差無幾的智能程度,而神經(jīng)網(wǎng)絡(luò)就是人工智能蓬勃發(fā)展的幕后推手。
現(xiàn)在,55歲的本吉奧已成為了蒙特利爾大學(xué)的一名教授,就在今天,他與71歲的杰弗里·欣頓(Geoffrey Hinton)和58歲的楊立昆(Yann LeCun),共同獲得了計算機科學(xué)的最高獎項——ACM圖靈獎(該獎項自1966年起每年頒發(fā)一次,以計算機之父艾倫·圖靈的名字命名)。
從左至右:楊立昆、杰弗里·欣頓、尤舒亞·本吉奧。圖片:Facebook/Google/Bolter AI他們?nèi)说奶剿髦梅路鹗且粍t關(guān)于勇氣的寓言。在遠離追捧與聚光燈的地方,他們潛心研究了幾十年,把一個不被看好的、被邊緣化的想法,變成了計算機科學(xué)中最熱門的想法。現(xiàn)如今,他們所倡導(dǎo)的技術(shù)已經(jīng)成為了每家大型科技公司的未來戰(zhàn)略的核心。谷歌測試中的軟件得以讀取醫(yī)學(xué)掃描,特斯拉的自動駕駛儀得以讀取道路標(biāo)志,臉書得以自動刪除一些惡毒言論,都是得益于他們?nèi)怂鶆?chuàng)造的技術(shù)。
此次將圖靈獎授予這三位深度學(xué)習(xí)的教父,不僅是對他們工作的肯定,更表明了機器學(xué)習(xí)已經(jīng)成為了計算機科學(xué)中的一個核心領(lǐng)域。這個學(xué)科有一個悠久的傳統(tǒng),那就是重視問題的解決方案的數(shù)學(xué)證明。但機器學(xué)習(xí)算法會以一種更為混亂的方式完成任務(wù),它會跟蹤數(shù)據(jù)的統(tǒng)計軌跡,來找到在實際中行之有效的方法,即使我們并不清楚具體是如何做到的。
神經(jīng)網(wǎng)絡(luò)是人工智能最古老的方法之一,當(dāng)這個領(lǐng)域在20世紀(jì)50年代末剛起步時就已經(jīng)建立起來了。研究人員將神經(jīng)科學(xué)家創(chuàng)造的神經(jīng)元的簡單模型改造成數(shù)學(xué)網(wǎng)絡(luò),這種數(shù)學(xué)網(wǎng)絡(luò)可以通過讓一系列人工的“神經(jīng)元”對數(shù)據(jù)進行過濾,來學(xué)習(xí)如何對數(shù)據(jù)進行分類。早期成功的例子包括占據(jù)整個房間的感知機馬克1號,它能學(xué)習(xí)如何分辨屏幕上的形狀。但當(dāng)時還不清楚要如何訓(xùn)練具有多層神經(jīng)元的大型網(wǎng)絡(luò),讓這項技術(shù)超越模擬的小型任務(wù)。
欣頓提出的解決方案是訓(xùn)練深度網(wǎng)絡(luò)。1986年,他與他人共同發(fā)表了一篇題為“Learning Internal Representations by Error Propagation”的開創(chuàng)性論文,提出了全新的反向傳播算法。欣頓證明了反向傳播算法可以讓神經(jīng)網(wǎng)絡(luò)去發(fā)現(xiàn)其自身對數(shù)據(jù)的內(nèi)部表達,從而讓利用神經(jīng)網(wǎng)絡(luò)來解決之前無法解決的問題成為可能。如今,反向傳播算法處于深度學(xué)習(xí)的核心,但當(dāng)時這項技術(shù)還不夠成熟。
楊立昆說:“從90年代中期到21世紀(jì)的最初幾年,除了少數(shù)像我們這樣瘋狂的人,基本上沒有人研究神經(jīng)網(wǎng)絡(luò)。”楊立昆的貢獻包括發(fā)展了卷積神經(jīng)網(wǎng)絡(luò),上世紀(jì)80年代末,他是第一個用手寫數(shù)字圖像訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)系統(tǒng)的人。如今,卷積神經(jīng)網(wǎng)絡(luò)已成為計算機視覺、語音識別、語音合成、圖像合成和自然語言處理等領(lǐng)域的一個行業(yè)標(biāo)準(zhǔn)。它們在諸多領(lǐng)域均具有廣泛應(yīng)用,例如自動駕駛、醫(yī)學(xué)圖像分析、聲控助手和信息過濾等等。
本吉奧開創(chuàng)了將深度學(xué)習(xí)應(yīng)用于序列(比如語音和理解文本)的方法。但直到本世紀(jì)初,在研究人員發(fā)現(xiàn)如何利用圖形處理器的能力之后,深度學(xué)習(xí)才觸及到更廣泛的世界。
一個關(guān)鍵的時刻出現(xiàn)在了2012年,當(dāng)時,欣頓與他的兩名學(xué)生一起利用兩種算法對卷積神經(jīng)網(wǎng)絡(luò)進行了改進。在著名的 ImageNet 比賽中,欣頓和他的學(xué)生出人意料地獲得了冠軍。他們以5次的猜測機會,將10萬多張照片正確地分成1000個類別,準(zhǔn)確率高達85%,比第二名高出十多個百分點。這一勝利使得原本在該領(lǐng)域備受青睞的方法被拋諸腦后。
2013年初,谷歌收購了由他們?nèi)藙?chuàng)立的一家初創(chuàng)公司,自那之后,欣頓便一直留在了那里工作。同年,臉書也聘請了楊立昆。欣頓說,他和他的合作者能夠長期堅持這些不受青睞的想法,是因為在內(nèi)心深處,他們都是特立獨行的人。現(xiàn)在,無論在學(xué)術(shù)圈還是技術(shù)行業(yè),三位獲獎?wù)叨际侵髁鞯囊徊糠帧?/p>
盡管深度學(xué)習(xí)已經(jīng)在實踐中取得了諸多成功,但它仍然有許多無法做到的事。神經(jīng)網(wǎng)絡(luò)的概念受到的是人類大腦的啟發(fā),但它與大腦并沒有太多的相似之處。深度學(xué)習(xí)賦予計算機的智能讓它可以在一些簡單的任務(wù)上表現(xiàn)出眾,例如玩某個特定的游戲,識別某些特定的聲音等,但它不像人類智能那樣具有適應(yīng)性和通用性。
欣頓和楊立昆說,他們希望能結(jié)束現(xiàn)有系統(tǒng)中對人來進行的明確而又廣泛的訓(xùn)練的依賴。深度學(xué)習(xí)項目依賴于大量標(biāo)注的數(shù)據(jù)來解釋眼前的任務(wù),這是醫(yī)學(xué)等領(lǐng)域所面臨的一個主要限制。本吉奧強調(diào),盡管在一些領(lǐng)域我們?nèi)〉昧顺晒?,比如擁有了更好的翻譯工具,但這一技術(shù)還遠遠不能正確地理解語言。
三位獲獎?wù)叻Q,他們不知道要如何解決余下的這些挑戰(zhàn)。他們建議,任何希望在人工智能領(lǐng)域取得下一個突進突破的人,都應(yīng)效仿他們過去的做法——無視主流想法的意愿。本吉奧說:“他們不應(yīng)該隨波逐流,現(xiàn)在深度學(xué)習(xí)就是這股洪流。”
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。