芝加哥大學(xué)東方學(xué)院和計(jì)算機(jī)科學(xué)系的研究人員合作設(shè)計(jì)了一種AI,該AI可以幫助解碼來(lái)自古代文明的平板電腦。根據(jù)Phys.org的說(shuō)法,該AI被稱(chēng)為DeepScribe,并且接受了從Persepolis Fortification存檔中提取的6,000多張帶注釋的圖像的訓(xùn)練,當(dāng)AI模型完成后,它將能夠解釋未經(jīng)分析的圖形輸入板,從而使研究古代文獻(xiàn)變得更加容易。
計(jì)算機(jī)視覺(jué)算法和深度學(xué)習(xí)體系結(jié)構(gòu)為該領(lǐng)域帶來(lái)了新的可能性。OI計(jì)算機(jī)科學(xué)系的Sanjay Krishnan與Assyriology的副教授Susanne Paulus合作啟動(dòng)了DeepScribe程序。研究人員監(jiān)督了一個(gè)名為OCHRE的數(shù)據(jù)庫(kù)管理平臺(tái),該平臺(tái)整理了考古發(fā)掘的數(shù)據(jù)。目標(biāo)是創(chuàng)建一個(gè)既廣泛又靈活的AI工具,能夠解釋來(lái)自不同地理區(qū)域和時(shí)間段的腳本。
正如Phys.org報(bào)道的那樣,克里希南(Krishnan)解釋說(shuō),考古研究人員面臨的識(shí)別腳本的挑戰(zhàn)與計(jì)算機(jī)視覺(jué)研究人員面臨的挑戰(zhàn)基本相同:
“從計(jì)算機(jī)視覺(jué)的角度來(lái)看,這確實(shí)很有趣,因?yàn)檫@些是我們面臨的相同挑戰(zhàn)。在過(guò)去的五年中,計(jì)算機(jī)視覺(jué)有了顯著改善;十年前,這本來(lái)應(yīng)該是波浪形的,我們走得太遠(yuǎn)了。這是一個(gè)很好的機(jī)器學(xué)習(xí)問(wèn)題,因?yàn)檫@里的準(zhǔn)確性是客觀的,我們有一個(gè)標(biāo)簽化的訓(xùn)練集,而且我們對(duì)腳本的理解非常好,對(duì)我們有幫助。這不是一個(gè)完全未知的問(wèn)題。”
所涉及的培訓(xùn)是從OI和U Chicago進(jìn)行的大約80年的考古研究中獲取平板電腦和翻譯的結(jié)果,并從中獲得高分辨率的帶注釋的圖像。當(dāng)前,訓(xùn)練數(shù)據(jù)的大小約為60 TB。研究人員能夠使用數(shù)據(jù)集,并創(chuàng)建一個(gè)字典,其中包含超過(guò)100,000個(gè)可以從模型中學(xué)習(xí)的獨(dú)立識(shí)別標(biāo)志。當(dāng)訓(xùn)練的模型在看不見(jiàn)的圖像集上進(jìn)行測(cè)試時(shí),該模型達(dá)到了約80%的準(zhǔn)確性。
當(dāng)研究人員團(tuán)隊(duì)嘗試提高模型的準(zhǔn)確性時(shí),即使80%的準(zhǔn)確性也可以協(xié)助轉(zhuǎn)錄過(guò)程。Paulus認(rèn)為,該模型可用于識(shí)別或翻譯文檔中高度重復(fù)的部分,從而使專(zhuān)家可以花時(shí)間來(lái)解釋文檔中較難處理的部分。即使模型無(wú)法確定說(shuō)出一個(gè)符號(hào)所代表的含義,它也可以為研究人員提供概率,這已經(jīng)使他們領(lǐng)先。
該團(tuán)隊(duì)還致力于使DeepScribe成為其他考古學(xué)家可以在其項(xiàng)目中使用的工具。例如,可以在其他楔形文字上對(duì)該模型進(jìn)行重新訓(xùn)練,或者該模型可以對(duì)損壞或不完整的平板電腦上的文本進(jìn)行明智的估計(jì)。一個(gè)足夠健壯的模型甚至可以估計(jì)片劑或其他人工制品的年齡和起源,這通常是通過(guò)化學(xué)測(cè)試完成的。
DeepScribe項(xiàng)目由高級(jí)計(jì)算開(kāi)發(fā)中心(CDAC)資助。計(jì)算機(jī)視覺(jué)也已在CDAC資助的其他項(xiàng)目中使用,例如旨在識(shí)別藝術(shù)品風(fēng)格的項(xiàng)目以及旨在量化海洋雙殼類(lèi)生物多樣性的項(xiàng)目。研究人員團(tuán)隊(duì)也希望他們的合作能夠?qū)е轮ゼ痈绱髮W(xué)計(jì)算機(jī)科學(xué)系和OI之間的未來(lái)合作。