人工智能正在改變各行各業(yè),而芯片是實現(xiàn)人工智能的載體。
2018年,資本對半導體芯片的熱情被AI技術徹底點燃,不管是巨頭公司還是創(chuàng)業(yè)公司、傳統(tǒng)制造公司還是互聯(lián)網(wǎng)公司,都對芯片熱情高漲。5月到7月,云知聲、出門問問、Rokid、百度紛紛發(fā)布AI芯片或芯片模組,思必馳確認正在打造AI語音芯片,深鑒科技對外宣布其AI芯片將于今年下半年面市,云知聲創(chuàng)始人兼CEO黃偉甚至用“不做芯片,必死”來表達自己做AI芯片的決心。
然而,“到現(xiàn)在為止,全球還沒有出現(xiàn)一款真正的AI芯片,因為真正的人工智能還遠未能實現(xiàn)。”異構智能中國區(qū)總經(jīng)理周斌的這番話代表了部分業(yè)內(nèi)人士的觀點。
《IT時報》記者采訪大量AI界人士后發(fā)現(xiàn),對于AI芯片的概念,目前全球并沒有形成統(tǒng)一共識,甚至有投資人認為,AI芯片領域存在泡沫,大部分創(chuàng)業(yè)公司將會消失。
但無論如何,身在草莽年代的AI芯片群雄們,總會有人為中國核心技術國產(chǎn)化“殺出一條血路”。
AI 芯片的不同定義
“初創(chuàng)企業(yè)做AI芯片很可能得不償失。”芯片企業(yè)蘇州邁瑞微公司的創(chuàng)始人李揚淵在行業(yè)里浸淫十幾年,他告訴《IT時報》記者,一款芯片從0到1需要10年以上的周期,他自家的芯片產(chǎn)品也是流片5次后才正式商用,流片20次才能處于業(yè)內(nèi)頂尖的位置,“如果是企業(yè)自行研發(fā)AI芯片,采用40nm(納米)工藝,那么成本可能會上漲而不是降低。芯片必須靠規(guī)模分攤研發(fā)成本,40nm工藝僅流片費高達1000萬元,分攤給100萬PCS(某一產(chǎn)品單位數(shù)量),平均每片成本高達10元,這還不包括更加高額的研發(fā)費用。”
但Rokid平臺研發(fā)負責人朱斌的觀點恰恰與李揚淵相反,“智能設備采用通用芯片是殺雞用牛刀,特殊需求需要特殊芯片來解決痛點,定制AI芯片恰恰是在降低成本,人工智能硬件對算力有需求,低端的通用芯片算力不夠,高端的通用芯片又有許多冗余設計,造成高功耗。”
AI芯片也被稱為AI加速器或計算卡,通常概念中,AI芯片是指專門用于處理人工智能應用中的大量計算任務的模塊(其他非計算任務仍由CPU負責),當前主要分為GPU、FPGA、ASIC等類型,與高通驍龍等通用芯片不同,AI芯片主要用于處理專用任務,比如安防中高清視頻的識別、自動駕駛時的數(shù)據(jù)計算等等。
6月26日,Rokid發(fā)布了一款KAMINO18 自研AI語音專用芯片,可支持智能音箱和兒童故事機,不同于英特爾、高通等傳統(tǒng)通用芯片,這是一塊AI語音專用的SoC(系統(tǒng)級芯片)芯片,其內(nèi)部繼承了ARM、NPU、DSP、DDR、DAC等多個核心元件,大小與一枚一元硬幣差不多。朱斌曾經(jīng)專門對語音喚醒做硬件上的架構設計,發(fā)現(xiàn)通用芯片中許多功能用不到,但附件成本依然存在,于是,Rokid在去年9月開始定制自己的芯片,采用DSA(Domain specific architecture)架構,從本身的產(chǎn)品和算法要求出發(fā),用異構計算的方式整合到芯片中,在整機工作狀態(tài)下,產(chǎn)品功耗能降低30%到50%。
李揚淵和朱斌的不同觀點,恰好代表了傳統(tǒng)半導體行業(yè)與互聯(lián)網(wǎng)創(chuàng)業(yè)公司對AI芯片的兩種不同認知,半導體圈出身的人更看重芯片從0到1的突破,而“由軟變硬”的互聯(lián)網(wǎng)創(chuàng)業(yè)者卻更希望在1、2、3、4的基礎上,通過算法和軟件設計,直接變成10。從目前已發(fā)布的AI芯片來看,它們主要目的體現(xiàn)在以合適的形態(tài)和功耗來加速某種機器學習算法上。比如,用在邊緣側和終端側設備時,要求極低的功耗和極高的矩陣/浮點運算能力,這些是通用型芯片很難做到的。
可佐證的是另一家龍頭芯片廠商的工程師對此的解釋,在他看來,目前市場上大多數(shù)AI語音芯片,屬于一種服務于“專有”功能的芯片(可類比DSP數(shù)據(jù)信號處理),由于專注于一項或幾項功能,限定于特定場景使用,所以設計和生產(chǎn)的復雜度要比通用芯片低,加上這類芯片很少牽扯技術授權的原因,做起來會更加容易。這些AI芯片并不是從底層開始做起,而是直接從SoC或者通用處理器外掛某種“協(xié)處理器”之類架構優(yōu)化,通過各種IP的組合來加速上層應用的場景,譬如語言,圖像。
異構的殊途同歸
目前,AI芯片并無清晰的定義,所以如何算“真正”并不好衡量。不久前的2018動點國際峰會(杭州)上,硅谷創(chuàng)業(yè)公司異構智能中國區(qū)總經(jīng)理周斌試著給AI芯片下了個定義,“能夠高效率、高性能地完成目前人工智能最核心的算法,由于現(xiàn)在主流算法是深度學習,意味著AI芯片必須對深度學習有非常好的支持。”從數(shù)據(jù)來看,周斌認為,AI芯片的計算能力必須要超過每秒5萬億次,因為只有達到這樣的性能指標,很多特定應用計算結果才可能與人的能力相媲美。
周斌公司的名字——“異構”,實質(zhì)上正是對AI芯片創(chuàng)業(yè)者們互聯(lián)網(wǎng)背景最直接的闡釋。異構,顧名思義是指由不同來源共同構成,互聯(lián)網(wǎng)就是一個典型的異構網(wǎng)絡。后來演化出的異構計算,是一種特殊形式的并行和分布式計算,常被用于協(xié)調(diào)不同硬件以滿足不同的計算需求,并使代碼(或代碼段)能以獲取最大總體性能方式來執(zhí)行。
目前AI芯片基本都通過多種芯片進行異構計算。過去傳統(tǒng)芯片公司只專注于少數(shù)幾種芯片,但現(xiàn)在的芯片公司開始注重橫向發(fā)展,整合不同類型的芯片,比如,手機SoC在傳統(tǒng)的CPU(中央處理器)、GPU(圖形處理器)、ISP(在線編程)之外,還會加入另外用來加速AI的NPU(嵌入式神經(jīng)網(wǎng)絡處理器)等處理核心。“異構芯片中有一部分是通用功能。”云知聲聯(lián)合創(chuàng)始人康恒告訴《IT時報》記者。
成本決定的道路
一個有趣的現(xiàn)象是,互聯(lián)網(wǎng)出身的AI創(chuàng)業(yè)者都在跑步進入AI芯片硬件領域,而傳統(tǒng)芯片廠商卻在用算法等“軟”的方法實現(xiàn)AI。
AI技術有三大要素,算法、算力和數(shù)據(jù)。從國際AI技術前沿來看,深度學習等算法模型的研發(fā)并未成熟,遷移學習、膠囊網(wǎng)絡等新的算法模型都在同步快速發(fā)展,AI芯片該使用什么方法和原理實現(xiàn)仍在探索階段。事實上,目前主流芯片廠商并沒有推出AI芯片,很多AI功能都通過通用芯片加特殊的算法、軟件完成。
高通今年年初推出的人工智能引擎(AI Engine)包括軟硬件兩部分,在高通驍龍核心硬件架構(CPU、GPU、VPS向量處理器)上搭載了神經(jīng)處理引擎(Neural Processing Engine, NPE)、Android NN API、Hexagon神經(jīng)網(wǎng)絡庫等軟件,讓人工智能在終端側(如智能手機)上的應用更快速、高效。高通旗下芯片產(chǎn)品驍龍845、驍龍835、驍龍820、驍龍660都支持AI Engine,而國內(nèi)不少打著AI旗號的手機也基本采用高通方案,通過該AI Engine更好實現(xiàn)人臉識別功能。
但對于目前AI芯片的創(chuàng)業(yè)者和智能家居廠商而言,通用芯片“太貴”了。
康恒告訴《IT時報》記者,電視、空調(diào)等大家電產(chǎn)品的利潤足以覆蓋語音模組的高成本,但風扇、電燈等小家電成本限制較大,模組的優(yōu)勢便削弱了,“客戶想做更多的智能品類,下沉到低端產(chǎn)品,但市場上根本找不到合適的芯片,一款百元以內(nèi)的產(chǎn)品,通用芯片并不劃算。”打造自己的AI芯片后,云知聲可以把語音AI技術的芯片方案開放給客戶,在成本及供應周期上有了更大的主動權。
但是李揚淵認為人工智能的關鍵技術,在不同階段的重要程度不同。“處理器不是人工智能關鍵技術,專用處理器只在部分工作段起提升競爭力的作用。”他認為感知段以傳感器為中心,處理器存在價值并不高;認知段、學習段和決策段,太強調(diào)處理器反而影響成本,包括一次性成本和功耗成本。
“沒有哪一段以專用的人工智能芯片為前提,應該把研發(fā)人工智能芯片當作一件獨立的事,而不是軟件研究的自然延伸。”李揚淵以人做比喻,傳感器是人的軀殼,大腦靠算法取勝。
半導體分析師李壽鵬也認為,人工智能依靠的是算法,芯片只是載體。如果想用ASIC(全定制芯片)去做更好的語音識別處理,硬件差異性并不大。對語音識別來說,識別語句與軟件、網(wǎng)絡、訓練更有關系,而之前存在的云和端數(shù)據(jù)交換延遲問題,也會隨著5G到來,迎刃而解。
落地第一站:智能音響
研發(fā)AI芯片比高端通用芯片更簡單,是AI圈普遍的認知。
云知聲聯(lián)合創(chuàng)始人、IoT事業(yè)部副總裁李霄寒認為,經(jīng)過幾十年的發(fā)展,芯片業(yè)沉淀了很多模塊化的東西,比如高通和聯(lián)發(fā)科都是基于ARM的架構設計芯片,因此,并不是每一款AI芯片都要從零開始,可以用業(yè)界成熟的模塊和產(chǎn)品,但AI芯片的核心加速模塊需要從最底層開始設計。從 2014 年提出云、端、芯戰(zhàn)略,到 2015 年正式建立研發(fā)團隊,再到 2018 年推出AI 芯片“雨燕”,云知聲花了整整 4 年時間,漸漸意識到AI不能只在云端,要落地。
2018年被稱為AI芯片落地年,所謂落地,是指AI芯片要搭載到終端上商用。2017年,中國在芯片領域的投資超過1500億元人民幣,2018年開始,這些投資的產(chǎn)業(yè)將陸續(xù)密集落地。信中利資本集團創(chuàng)始人、董事長汪潮涌不久前在尋找中國創(chuàng)客第四季夏季峰會上指出,中國每年花費3000多億美元進口各類芯片,消耗全球1/3的芯片,自給率不到10%,因此,AI芯片的投資是重中之重,但由于安防AI芯片的流片成本和研發(fā)費用高昂,目前尚未形成規(guī)模化的出貨量來抵扣成本;自動駕駛汽車未量產(chǎn),自動駕駛AI芯片安全性未達要求;其他特定領域AI芯片總體下游需求不足,供大于求,“目前AI領域存在較大泡沫。”
根據(jù)摩爾定律,芯片每隔18個月性能就會提升一倍,成本會下降一半,但半導體行業(yè)賺錢的根本秘訣還是規(guī)?;?,能否有足夠大的出貨量和商用市場,是AI芯片順利從紙面上“著陸”的關鍵。此前有媒體報道,即便是安防領域的“大佬”??低暎磕陮τ谟ミ_的需求也只有20萬片。
從這個角度來看,智能音響可能是AI芯片最早實現(xiàn)落地的市場。調(diào)研公司Canalys Research(以下簡稱Canalys)發(fā)布報告稱,到今年年底,智能音響的保有量將達到1億部,幾乎是去年的2.5倍。去年,智能音響的保有量不足5000萬部。未來幾年,智能音響的保有量將繼續(xù)增長,到2020年其保有量將增加一倍以上,達到2.25億部。
云知聲今年5月發(fā)布了面向物聯(lián)網(wǎng)的AI芯片UniOne,用于在終端本地做邊緣計算,可以為智能音響、智能家居、智能家電等提供服務方案。出門問問發(fā)布的AI語音芯片模組“問芯”已經(jīng)量產(chǎn),客戶可以下單購買。
出門問問的CEO李志飛認為,芯片是一個長周期產(chǎn)業(yè),從概念開始,要經(jīng)過系統(tǒng)設計、模塊設計、仿真驗證、線路綜合、布局布線、流片生產(chǎn)、封裝測試、驅(qū)動開發(fā)、解決方案適配等非常長的流程,芯片一旦做成很難像軟件一樣再做修改,必須重新設計流片,迭代周期長、成本高,而芯片本身屬性是一種計算的硬件載體,不同的芯片適配不同的算法和應用場景,AI芯片一方面要有足夠的算力去運行各種語音AI算法,另一方面還要針對各種場景做大量接口的適配,同時讓成本和功耗滿足大規(guī)模量產(chǎn)的商業(yè)要求。
“能產(chǎn)業(yè)化且能在市場上對國外的同類產(chǎn)品構成競爭威脅才是一塊芯片成功的標準。”一位業(yè)內(nèi)人士如是說道。從這一點來看,中國的AI芯片才剛剛起步,江湖草莽,泡沫待破。
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。