2012 年,IBM 的人工智能軟件 Watson 正處在名聲最顯赫的時期。正是在前一年,Watson 一舉擊敗兩位人類選手,獲得智力挑戰(zhàn)賽 Jeopardy 的冠軍,比賽中,Watson 展示超強的自然語言處理能力,令人驚嘆。借助這個節(jié)目的流行,Watson 儼然成為當時人工智能的代言人。
2012 年 11 月,IBM 為Watson 找來一個小伙伴,成立于上世紀 20年代 的克利夫蘭診所將幫助 Watson 接受醫(yī)療方面的「訓練」。通過大量醫(yī)療數(shù)據的訓練,Watson 可以做出大量「醫(yī)療假設」,IBM和醫(yī)療診所希望 Watson 幫助臨床醫(yī)生和醫(yī)學院的學生更精確地診斷,并且提供更好的醫(yī)療方案。彼時,科技媒體 Singularity 以「話務員醫(yī)生 Watson」形容 Watson 的新 Title 。
從底層技術上來說,Watson 從一開始到現(xiàn)在都是由 DeepQA 驅動。簡而言之,DeepQA 是一套集分析、推理與提供答案的復雜軟件架構,這套架構能夠讀取數(shù)百萬文本數(shù)據,再通過自然語言處理技術產生答案,最后根據問題的情景作出回答。正是這套架構支撐了 Watson的發(fā)展。2012年的時候,Watson 可以在每秒鐘完成 80億次計算。
當時,根據彭博社的報道稱,IBM 曾計劃將 Watson 變成商業(yè)領域的「超級 Siri」,而最終的呈現(xiàn)形式則是搭配 IBM 的硬件產品,換句話說,IBM 當時還在希望以 Watson 促進自己的硬件生意。不過,故事發(fā)展到現(xiàn)在,IBM 最終放棄了這個計劃,并把 Watson 改造成認知商業(yè)計算平臺。
盡管 IBM 并未借助 Watson 賣出更多硬件,但 Watson 的形狀還是發(fā)生了很大的變化:從一個有 10 臺冰箱那么大的「大塊頭」,變成四個披薩盒子大小的「小不點」。而且,用戶也可以通過平板電腦、智能手機與 Watson 連接。相比于初代產品, 2012 年的 Watson 在性能上有 240% 的確提升,并且能夠處理 28 種不同類型的數(shù)據,遠遠超過上代的 5 種。
2013 年,Watson 的 API 開源,現(xiàn)在則集成到了 IBM 的 Bluemix里,開發(fā)者可以通過這個平臺,借助 Watson 的「技能」構建一系列人工智能的應用。
而對于 Watson 最重要的一步則是 2014 年,當時, IBM 投資 10 億美金成立了 IBM Watson 業(yè)務集團,這家公司擁有超過 2000 名員工,將全面運作 Watson 的研究和商業(yè)化事宜。這也成為 Watson 快速成長的開始,并且?guī)椭?IBM 將認知計算帶入主流科技媒體的口頭禪里。
時間很快到了 2016 年,Watson 在諸多領域有了自己的根據地,比如財務顧問、自動客服代表等等,然而我們還是有必要再去看看四年前 Watson 第一份職業(yè)——醫(yī)生助理——到底干的如何?
現(xiàn) 在,Watson 已經將醫(yī)療方面的工作交給了 Watson 健康部門。這從另一個側面也展示出 Watson 自 2012 年以來在醫(yī)療領域的良好態(tài)勢。2012 年以來,Watson 與克利夫蘭診所合作的進展并不多。直到 2014 年,克利夫蘭診所醫(yī)療創(chuàng)新峰會上,IBM 宣布腫瘤專家已經開始使用 Watson 去分析基因數(shù)據和醫(yī)療數(shù)據之間的關系,以更好的形成個性化的治療方案。
去年五月,根據 BI 的一篇報道,Watson 很可能已經能夠讓腫瘤專家「上傳腫瘤病人的 DNA 指紋圖到系統(tǒng)里,Watson 根據這個數(shù)據,快速甄別出哪一個基因可能引發(fā)突變,從而確定針對這些可能突變的藥物?!?/p>
另一個案例,東京大學的研究者利用 Watson 成功治愈了一個 60 歲的白血病患者, 其做法就是將該病人的基因數(shù)據與數(shù)以萬計的醫(yī)療文獻做對比,形成針對該患者的定制醫(yī)療方案。另據 36kr 的報道,21家本土醫(yī)院計劃使用經由紀念斯隆-凱特琳癌癥中心(Memorial Sloan Kettering Cancer Center)訓練的IBM Watson腫瘤解決方案(IBM Watson for Oncology),幫助醫(yī)生為病人提供更好的個性化腫瘤治療方案。
盡管上述進展喜人,但在整個醫(yī)療行業(yè),類 似這樣的做法還非常少。去年,iEEE 記者 Brandon Keim 在一篇文章里分析了幾個原因,比如 Watson 需要適應醫(yī)院特殊的工作環(huán)境,這要花費不少的時間去真對醫(yī)療環(huán)境下的特定任務和工作場景訓練 Watson。
但這個訓練過程非常漫長和艱苦。首先,要有一大批計算機科學家和醫(yī)生、藥劑師收集一個參考數(shù)據庫,并加入病例學習,然后詢問上千個問題。事實上,Watson 并不會自我學習,他給出的錯誤答案會被研究者們評估,再手動調整 Watson 的算法,保證最后輸出的答案是有價值的。
醫(yī)療領域的信息更新速度非???,同時不同信息之間可能存在沖突,這也讓 Watson 在快速回答問題之前必須更快地評估各類信息的價值,區(qū)分不同情況,作出更精確的判斷。
Watson 在醫(yī)療行業(yè)的緩慢成長無法滿足人們對于人工智能給人類健康帶來巨大提升的期望。事實上,醫(yī)療領域的人工智能幾乎與個人計算機一起出現(xiàn)在上世紀的 70 年代,但現(xiàn)在來看,所謂人工智能驅動的個性化治療,還有很長一段路要走。
對 目前的 Watson 來說,他必須緊跟當下人工智能發(fā)展的步伐。2012 以來,深度學習成為人工智能領域最熱門的算法,尤其是深度學習可以實現(xiàn)「自我學習」——非監(jiān)督學習。比如,Google的 AlphaGo 對于圍棋的學習就是深度學習成果的展現(xiàn),通過自我學習,AlphaGo 成長速度驚人,如今已是世界頂尖的圍棋「選手」。
2015 年 6 月,《麻省理工科技評論》報道稱,IBM 計劃為 Watson 加入深度學習的技術,比如翻譯、語音文本的互轉等等。如今的 Watson 依然是個「大雜燴」,早期是自然語言處理與大規(guī)模數(shù)據集的分析,又加入了深度學習。
另 一方面,IBM 在人工智能基礎研究的突破也將對Watson 的未來產生積極影響。2016 年 8 月初,IBM 蘇黎世研究中心制成了世界上第一個人造納米尺度隨機相變神經元。這個由 500個該神經元組成的陣列,能夠以模擬人類大腦的工作方式進行信號處理。這是IBM 在「人造大腦」研究方面的巨大進展。IBM 表示,他們的人工神經元技術和目前發(fā)展中的另外一種人工神經元器件——憶阻器互為補充。
如今,整個科技產業(yè)都 在轉型人工智能,今年以來,由于聊天機器人和虛擬助理最火,無論是 Google、FB,還是微軟、蘋果以及阿里,都紛紛在資金和戰(zhàn)略層面加快布局,Watson 作為 IBM 搶占未來的重要據點,以及向認知計算轉型的核心產品,未來還將繼續(xù)扮演著重要角色。