將鼠標放在迷宮中可以告訴您很多有關小大腦如何學習的信息。但是,如果您可以隨意改變其大腦的大小和結構,以研究使不同行為成為可能的怎么辦?這就是Elan Barenholtz和William Hahn的提議。Boca Raton的佛羅里達大西洋大學的認知心理學家和計算機科學家都在裝有人工智能的機器人上運行經典心理學實驗版本。他們的筆記本電腦大小的機器人漫游車可以通過攝像頭移動并感知環(huán)境。而且它們是由運行神經網絡的計算機指導的,這些神經網絡的模型與人的大腦有些相似。
巴倫霍茲(Barenholtz)上周在美國心理學會的技術思想與社會會議上介紹了這種“機器人心理學”方法。他和哈恩(Hahn)告訴《科學》雜志,他們如何使用他們不尋常的新測試科目。訪談已經過編輯,以使內容更加清晰明了。
埃倫·巴倫霍茲(Elan Barenholtz):有許多小組試圖建立模型來模擬大腦的某些功能。但是他們并沒有讓機器人四處走走并識別事物并執(zhí)行復雜的認知功能。
威廉·哈恩(William Hahn):我們想要的是有機體本身來指導自己的行為并獲得回報??紤]它的一種方法是嘗試構建最簡單的模型。您需要放入這些代理之一中以使其像松鼠或貓一樣地工作的最低復雜度是多少?
問:這些機器可以進行哪種實驗?
EB:實際上,我們的小型漫游車有了一個初步的結果,我們開玩笑地稱它為Skinner盒子。[在BF斯金納(BF Skinner)關于動物學習的經典實驗中],一只鴿子在籠子里徘徊,然后也許走到了某個位置,這也許使它興奮了。這很震驚,因此它很快學會了不去那里。或者,也許鴿子在一個小按鈕上啄食,它就會獲得食物獎勵。
我們將[流動站]放到墻壁各面帶有顏色的盒子中,并且僅僅因為面向正確的方向而得到獎勵。我們在問我們是否可以讓這種機器人僅僅基于強化來從事某種行為。我們從來沒有告訴過它:“這是正確的做法。”相反,我們只是允許它去探索,因為“這是我的相機輸入,這是我的行為,有結果嗎?我會得到回報嗎? ”
問:只是被告知其“獎勵”是正確的?
EB:[是,]現在,這就是它要優(yōu)化的內容。這就提出了一個非常有趣的問題—一個心理問題:獎勵的本質是什么,它能最好地模擬其在生物體中的工作方式?我們的頭腦中沒有分數。有內啡肽和5-羥色胺,發(fā)生的所有這些事情我們稱之為獎勵。