11月23日,“百度語音開放平臺(tái)3周年慶”活動(dòng)在京舉行。百度宣布將在其語音開放平臺(tái)上線三周年之際,開放四項(xiàng)全新語音技術(shù)的接口,用戶在使用語音與機(jī)器進(jìn)行交流時(shí),能夠享受到更奇妙的交互體驗(yàn)。
百度公司首席科學(xué)家吳恩達(dá)在演講中介紹,這四項(xiàng)語音技術(shù),包括情感合成、遠(yuǎn)場(chǎng)方案、喚醒二期技術(shù)和長(zhǎng)語音方案。吳恩達(dá)現(xiàn)場(chǎng)宣布即日起百度將會(huì)把這幾項(xiàng)技術(shù)免費(fèi)開放給用戶和開發(fā)者共享。
“最新的語音技術(shù)有很大的潛力,能夠徹底改變?nèi)藱C(jī)交互的效率和辦法。未來語音技術(shù)在很多應(yīng)用場(chǎng)景有很好的機(jī)會(huì),將為人機(jī)交互帶來巨大的改變。”吳恩達(dá)表示,最新的語音技術(shù)旨在解決用戶在使用語音交互時(shí)遇到的一些關(guān)鍵問題。例如,百度情感合成技術(shù)主要聚焦在為合成語音“加入情感”,目前可達(dá)到接近真人發(fā)聲效果。
“極智開放·共語未來——百度語音開放平臺(tái)3周年慶”現(xiàn)場(chǎng)
活動(dòng)現(xiàn)場(chǎng),來自斯坦福大學(xué)的人工智能專家James Landay,也分享了一項(xiàng)與百度合作的最新研究成果,該研究發(fā)現(xiàn)智能手機(jī)在運(yùn)用語音方式進(jìn)行輸入時(shí),輸入速度比鍵盤輸入快了3倍。他表示,近兩年,受益于大數(shù)據(jù)和深度學(xué)習(xí)技術(shù)的不斷發(fā)展,語音識(shí)別技術(shù)突飛猛進(jìn),速度及準(zhǔn)確性都有了長(zhǎng)足進(jìn)步。
目前,百度語音開放平臺(tái)的合作伙伴已涵蓋多個(gè)領(lǐng)域和場(chǎng)景,包括智能手機(jī)領(lǐng)域的聯(lián)想、中興;智能家居領(lǐng)域的長(zhǎng)虹智能電視、康佳智能電視、SONY智能電視;汽車行業(yè)的特斯拉、途勝;智能設(shè)備領(lǐng)域的惠普、艾米通訊;智能服務(wù)領(lǐng)域的攜程、手機(jī)QQ閱讀等。
“語音是人類交流最自然的方式,通過開放語音技術(shù),百度希望可以引領(lǐng)語音功能產(chǎn)品的繁榮發(fā)展。”吳恩達(dá)表示。
作為國內(nèi)最為開放的領(lǐng)先語音技術(shù)開放平臺(tái),百度語音開放平臺(tái)自2013年10月上線以來,每日在線語音識(shí)別要求從2013年的500萬上升到今天的1億4千萬,在線語音合成每日請(qǐng)求達(dá)2億,開發(fā)者數(shù)量超過14萬。
據(jù)百度提供的數(shù)據(jù),在技術(shù)指標(biāo)方面,百度語音識(shí)別準(zhǔn)確率目前已達(dá)97%,居于全球領(lǐng)先。今年2月,百度深度語音識(shí)別系統(tǒng)Deep Speech 2入選MIT 2016十大突破技術(shù)。包括語音技術(shù)在內(nèi)的百度大腦,入選2016第三屆烏鎮(zhèn)世界互聯(lián)網(wǎng)大會(huì)15大領(lǐng)先科技成果,成為國內(nèi)唯一入選的綜合型人工智能技術(shù)。
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。