查爾斯大學(xué),Švanda劇院和布拉格表演藝術(shù)學(xué)院的研究人員目前正在研究一個(gè)有趣的研究項(xiàng)目,該項(xiàng)目將人工智能和機(jī)器人技術(shù)與劇院融合在一起。他們的項(xiàng)目的主要目標(biāo)是利用人工智能創(chuàng)造創(chuàng)新的戲劇表演,預(yù)計(jì)將于2021年1月首播。
進(jìn)行這項(xiàng)研究的研究人員之一魯?shù)婪?middot;羅莎(Rudolf Rosa)告訴TechXplore:“我們研究的主要思想來自創(chuàng)新者湯瑪斯·斯圖登尼克(TomášStudeník),他注意到戲劇RUR即將到來100周年。” “這是機(jī)器人技術(shù)的關(guān)鍵時(shí)刻,因?yàn)镵arel?apek和他的兄弟約瑟夫(Josef)發(fā)明了機(jī)器人的概念,其中包括“機(jī)器人”一詞,他寫了這部戲。湯瑪斯認(rèn)為應(yīng)該適當(dāng)?shù)貞c祝并提出這一觀點(diǎn)。他的想法是扭轉(zhuǎn)局勢:100年前,一個(gè)人寫了一部關(guān)于機(jī)器人的戲劇;如果今天,機(jī)器人寫了一部關(guān)于人類的戲劇,那又會(huì)怎樣呢?”
在開始項(xiàng)目之前,研究人員回顧了以前的文獻(xiàn),探討了人工智能技術(shù)在詩歌,音樂,繪畫或其他形式藝術(shù)創(chuàng)作中的潛力。雖然現(xiàn)在有大量論文涉及機(jī)器生產(chǎn)的藝術(shù),包括一些使用計(jì)算技術(shù)來產(chǎn)生戲劇對(duì)話或故事創(chuàng)意的論文,但自動(dòng)生成整個(gè)戲劇表演是一項(xiàng)非常復(fù)雜的任務(wù),很少有人進(jìn)行嘗試過。
羅莎(Rosa)和他的同事們決定將其劇本的制作分成幾個(gè)子部分。他們的計(jì)劃是使用一種稱為“分層生成”的方法,該方法需要將大量文本的生成分成較小的可管理部分。過去,其他研究團(tuán)隊(duì)使用這種方法生成對(duì)話,腳本或其他文本時(shí),很少有人嘗試使用它來制作整部劇本。
羅莎解釋說:“由于即將到來的周年紀(jì)念日,我們的主要目標(biāo)是明確和固定的:到2021年1月,我們需要為首映做好準(zhǔn)備。” “由于將由專業(yè)的戲劇團(tuán)體來執(zhí)行,因此我們需要在9月準(zhǔn)備好劇本,以便有足夠的時(shí)間進(jìn)行戲劇化,排練等。因此,即使我們正在開發(fā)用于生成劇本的通用工具,目前,我們只需要生成一個(gè)腳本即可。”
到目前為止,研究人員開始嘗試一種稱為GPT-2的預(yù)訓(xùn)練語言模型。這是由OpenAI聯(lián)盟開發(fā)的開源模型,并接受了大量在線英語文本的培訓(xùn)。他們的測試的第一個(gè)結(jié)果在arXiv上預(yù)先發(fā)表的論文中概述。
GPT-2是一種生成語言模型,這意味著經(jīng)過適當(dāng)培訓(xùn)后,它可以使用相似的語言并涵蓋相關(guān)主題來完成未完成的文本。例如,如果為新聞的第一段提供內(nèi)容,則該模型將嘗試使用相同的文本作為靈感來源并針對(duì)新概念生成句子,從而針對(duì)同一主題生成一些其他段落。
“當(dāng)我們向GPT-2提供場景設(shè)置和戲劇腳本的幾行內(nèi)容時(shí),它會(huì)以相同的樣式生成更多行內(nèi)容,并專注于輸入腳本塊的主題,” Rosa解釋說。“通過這種方式,我們還沒有訓(xùn)練任何東西,因?yàn)槲覀兿拗屏税l(fā)電機(jī)以完成任務(wù)并且不會(huì)在其他地方發(fā)散。因此,我們可以利用訓(xùn)練有素的大型GPT-2模型長時(shí)間閱讀非常大的文字,我們無法負(fù)擔(dān)對(duì)我們的硬件進(jìn)行培訓(xùn)的能力,因?yàn)槿缃裰挥凶畲蟮目萍脊静拍芘嘤?xùn)此類模型。”
盡管研究人員使用預(yù)訓(xùn)練的GPT-2模型進(jìn)行的實(shí)驗(yàn)產(chǎn)生了可喜的結(jié)果,但他們沒有適應(yīng)模型或未在劇院劇本上對(duì)其進(jìn)行專門訓(xùn)練的事實(shí)使控制其操作和性能變得更加困難。他們現(xiàn)在計(jì)劃通過在現(xiàn)有劇院劇本上對(duì)其進(jìn)行訓(xùn)練來對(duì)GPT-2進(jìn)行微調(diào),因?yàn)閷?duì)他們而言,這比開發(fā)新的語言生成模型更加可行,并且應(yīng)該為他們的游戲制作出質(zhì)量更高的劇本。
羅莎說:“我們還明確地與人在循環(huán)中的概念進(jìn)行合作。” “基本上,所有計(jì)算機(jī)生成的'藝術(shù)'(如果我們想這樣稱呼)都是由人類以某種方式觸及和修飾的,但通常這不是很透明。在我們的工作中,我們正在努力明確地說明什么機(jī)器的工作能力和人類的工作能力,使他們的合作成為系統(tǒng)設(shè)計(jì)不可或缺的一部分,而不是事后修正。”
目前,羅莎和他的同事們通過回顧以前的作品并試圖確定制作戲劇劇本的最有效方法來啟動(dòng)他們的項(xiàng)目。當(dāng)他們決定要使用哪種方法時(shí),他們才剛剛開始將其應(yīng)用于戲劇創(chuàng)作。
羅莎說:“我們的項(xiàng)目仍處于起步階段,但是我們對(duì)采用預(yù)訓(xùn)練的GPT-2模型的基本方法的效果感到驚訝。” “我們僅從腳本中獲取了幾行內(nèi)容,然后就使用了該信息來生成或多或少的合理行,從而獲得了其體裁,結(jié)構(gòu),主題和角色名稱。這是在沒有任何改編或微調(diào)的情況下實(shí)現(xiàn)的:我們只是使用了該模型可以在線下載,這表明GPT-2模型確實(shí)非常強(qiáng)大。”
目前,Rosa和他的同事們?nèi)栽趪L試所謂的“純文本生成”,即機(jī)器學(xué)習(xí)模型一次為腳本單獨(dú)生成一行。但是,他們很快希望開始使用層次生成方法來創(chuàng)建其劇本的簡要摘要,將其擴(kuò)展為詳細(xì)的提要,最后將其翻譯為對(duì)話。理想情況下,他們計(jì)劃使用的模型將生成一個(gè)連貫且有效的腳本,遵循一個(gè)共同的思路,同時(shí)還要在其背后創(chuàng)建具有清晰含義的文本。
“我們還仍然需要確保生成的腳本是連貫的,不會(huì)重復(fù)或自相矛盾,不會(huì)過于頻繁地引入新的隨機(jī)角色,以及次要但有趣的事情,例如防止角色離開場景但繼續(xù)說話,”羅莎說。“我們的第一部戲應(yīng)該在2021年1月首映。我們將看看進(jìn)展如何,接待情況如何,然后希望我們的觀察將推動(dòng)我們的進(jìn)一步研究和開發(fā)。”
在研究的這一階段,羅莎和他的同事們?nèi)匀徽J(rèn)為,參與游戲的機(jī)器人將需要大量的人工監(jiān)督。但是,在將來,他們希望制作一種可以完全由機(jī)器人表演的劇本,而無需任何人工表演或人工指導(dǎo)。