最近,加州大學(xué)圣迭戈分校的研究人員進(jìn)行了一項(xiàng)名為圖靈測(cè)試的研究,旨在評(píng)估機(jī)器展現(xiàn)出人類(lèi)智能的程度。他們的研究結(jié)果發(fā)現(xiàn),人們?cè)谂c GPT-4模型和人類(lèi)代理進(jìn)行兩人對(duì)話(huà)時(shí),很難區(qū)分兩者。
研究論文提前發(fā)布在 arXiv 服務(wù)器上,其結(jié)果顯示 GPT-4在大約50% 的互動(dòng)中能夠被誤認(rèn)為是人類(lèi)。盡管初步實(shí)驗(yàn)并未充分控制影響結(jié)果的一些變量,但他們決定進(jìn)行第二項(xiàng)實(shí)驗(yàn),以得出更詳實(shí)的結(jié)果。
在他們的研究中,人們難以確定 GPT-4是否為人類(lèi)。與 GPT-3.5和 ELIZA 模型相比,人們往往能夠判斷出后者是機(jī)器,但在判斷 GPT-4是人類(lèi)還是機(jī)器上,他們的能力并不比隨機(jī)猜測(cè)更高。
研究團(tuán)隊(duì)設(shè)計(jì)了一個(gè)名為 "人還是不是人" 的二人在線游戲,讓參與者與另一個(gè)人或一個(gè) AI 模型進(jìn)行互動(dòng)。每次游戲中,一個(gè)人類(lèi)詢(xún)問(wèn)者與一個(gè) “證人” 進(jìn)行交談,以試圖確定對(duì)方是否為人類(lèi)。
雖然真正的人類(lèi)其實(shí)更成功,有約三分之二的時(shí)間說(shuō)服詢(xún)問(wèn)者他們是人類(lèi),但研究結(jié)果表明,在現(xiàn)實(shí)世界中,人們可能無(wú)法可靠地判斷他們是否在與人類(lèi)還是 AI 系統(tǒng)交談。
分享到微信 ×
打開(kāi)微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁(yè)分享至朋友圈。