根據(jù)英國《自然》雜志3日發(fā)表的一項計算機(jī)科學(xué)最新突破,加拿大科學(xué)家團(tuán)隊報告:完全由人工智能控制的氣球,成功實現(xiàn)自主導(dǎo)航,在平流層一連數(shù)周待在原地。這一成果標(biāo)志著深度強(qiáng)化學(xué)習(xí)向現(xiàn)實應(yīng)用邁出了重要且非常難得的一步,同時提高了人類全自動環(huán)境監(jiān)測的可能性。
人工智能在氣象領(lǐng)域的應(yīng)用,正在爆發(fā)式增長,并且呈現(xiàn)出由傳統(tǒng)的機(jī)器學(xué)習(xí)向深度學(xué)習(xí)發(fā)展的趨勢。通常,填充氦氣的超壓氣球常被用于高層大氣實驗,如氣象監(jiān)測,但如果被風(fēng)吹偏了航道,它們必須要返回原駐點,而深度強(qiáng)化學(xué)習(xí)可以訓(xùn)練人工智能系統(tǒng)進(jìn)行決策——對于超壓氣球來說,這些主動決策就包括采取哪些行動來保持它們的位置不變。
此次,加拿大谷歌研究院科學(xué)家馬克·貝爾麥爾及其同事,訓(xùn)練了一種人工智能控制器,能根據(jù)風(fēng)的歷史記錄、預(yù)報、局地風(fēng)觀測和其他因素(如氦氣損失和電池疲勞),決定是否要移動氣球。
研究團(tuán)隊利用一種數(shù)據(jù)增強(qiáng)算法來解釋數(shù)據(jù)中的空白。他們將這一新成果——名為“StationSeeker”的技術(shù)應(yīng)用到分布在全球各地的“Loon氣球”上,包括一項在太平洋上空進(jìn)行的為期39天的受控實驗。“Loon氣球”原本是一個互聯(lián)網(wǎng)項目,團(tuán)隊將高空超壓氣球發(fā)放至平流層,組成空中的無線網(wǎng)絡(luò)。而貝爾麥爾的實驗證明,受到“StationSeeker”控制的氣球能成功實現(xiàn)自主導(dǎo)航,一旦被吹偏航道,它們能比傳統(tǒng)控制器控制的氣球更快地回到原駐點。
深度強(qiáng)化學(xué)習(xí)的應(yīng)用此前已在受控環(huán)境——如電腦游戲中得到了演示,但在受控環(huán)境中,擁有完整的數(shù)據(jù)集和明確定義的參數(shù)。而在現(xiàn)實世界中,可預(yù)測性變得更差,比如關(guān)于環(huán)境中風(fēng)的數(shù)據(jù)就不完整,因此很難采取最優(yōu)調(diào)整而讓氣球保持在原位。
在一篇同時發(fā)表的“新聞與觀點”文章中,英國牛津大學(xué)科學(xué)家斯科特·奧斯佩爾表示,正是由于這一理由,此次最新成果可以說代表了增強(qiáng)學(xué)習(xí)在現(xiàn)實世界應(yīng)用的一次巨大進(jìn)步。
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。