經(jīng)過將近一年的懸念和爭(zhēng)議,現(xiàn)在,OpenAI的人工智能(AI)研究人員團(tuán)隊(duì)將有一天發(fā)布GPT-2的完整和最終版本,該語言模型可以“生成連貫的段落并進(jìn)行基本的閱讀理解,機(jī)器翻譯,問題解答和摘要-所有這些都無需特定任務(wù)的培訓(xùn)。”當(dāng)OpenAI在2月份首次發(fā)布該程序時(shí),它具有令人贊嘆的壯舉:例如,關(guān)于安第斯山脈獨(dú)角獸的兩句提示,該程序制作了一條連貫的九段新聞文章。當(dāng)時(shí),技術(shù)成就是有新聞價(jià)值,但它是如何OpenAI選擇了釋放,真正引起了軒然大波新技術(shù)。
機(jī)器學(xué)習(xí)研究社區(qū)中存在一種普遍的開放性規(guī)范,該領(lǐng)域的開放者是該領(lǐng)域的早期巨頭有意識(shí)地創(chuàng)建的:期望可以共享進(jìn)步,以便可以對(duì)其進(jìn)行評(píng)估,從而使整個(gè)領(lǐng)域都在進(jìn)步。但是,在2月份,由于擔(dān)心該程序可能被用來產(chǎn)生誤導(dǎo)性的新聞報(bào)道,OpenAI選擇了更有限的發(fā)布;在網(wǎng)上模擬人;或自動(dòng)制作可惡,偽造或垃圾內(nèi)容。因此,該公司共享了一個(gè)小的117M版本以及采樣代碼,但宣布將不共享數(shù)據(jù)集的關(guān)鍵元素,培訓(xùn)代碼或模型權(quán)重。
盡管一些觀察者贊賞OpenAI的謹(jǐn)慎,但許多人感到失望。一組評(píng)論員指責(zé)該組織散布恐懼,并夸大了該技術(shù)引起人們注意的危險(xiǎn);其他人則建議該公司背叛其核心使命,應(yīng)將自己重命名為“ClosedAI”。5月份,OpenAI發(fā)布了該模型的較大版本3.45億,并宣布將與也正在努力的有限合作伙伴共享762M和1.5B版本。制定針對(duì)惡意使用的對(duì)策。再次有人鼓掌。其他人則不為所動(dòng)。
不管GPT-2是否足夠危險(xiǎn)以至于無法保留,OpenAI的出版策略都引發(fā)了關(guān)于確定原則和策略的跨學(xué)科對(duì)話,以決定何時(shí)適當(dāng)限制對(duì)AI研究的訪問。在過去的八個(gè)月中,OpenAI作為規(guī)范企業(yè)家的努力已經(jīng)影響了其他人:AI合作伙伴關(guān)系組織了一次活動(dòng),討論開放研究與預(yù)防性關(guān)注之間的緊張關(guān)系。Hugging Face公司限量發(fā)行社交聊天機(jī)器人的文章,描述了如何濫用該系統(tǒng),并提出了識(shí)別他人誤導(dǎo)性聊天機(jī)器人的方法。華盛頓大學(xué)和艾倫人工智能研究所的研究人員揭示了GROVER(一種GPT-2風(fēng)格的語言模型)時(shí),他們決定不發(fā)布該模型的大型版本-這一決定部分基于OpenAI的論點(diǎn)。同樣,人工智能初創(chuàng)公司AI21 Labs發(fā)布了其神經(jīng)文本生成器的345M版本,理由是“它的大小相當(dāng)于Grover和GPT-2的公開發(fā)布版本。”“好奇的黑客” Connor Leahy獨(dú)立復(fù)制了OpenAI的未發(fā)布1.5 B GPT-2,并計(jì)劃公開發(fā)布它-但隨后決定不這樣做,幫助制定負(fù)責(zé)任的發(fā)布規(guī)范。
GPT-2案引發(fā)了AI界內(nèi)部關(guān)于OpenAI是否做出正確選擇的激烈辯論。現(xiàn)在,任務(wù)是從GPT-2案例研究中推斷出來,并就負(fù)責(zé)任的AI發(fā)布規(guī)范達(dá)成共識(shí)。