通過學習以與人類相同的方式偏離已知信息,人工智能(AI)的“成像”算法能夠從書面說明中識別以前看不見的物體。
該算法由KAUST研究人員Mohamed Elhoseiny與中央佛羅里達大學的Mohamed Elfeki合作開發(fā),為人工想象和對新動植物物種進行自動分類鋪平了道路。
Elhoseiny解釋說:“想象力是人類智力的關鍵特性之一,它使我們不僅能夠產生藝術和音樂等創(chuàng)意產品,而且能夠理解視覺世界。”
人工智能依靠訓練數據來發(fā)展其識別物體并響應其環(huán)境的能力。人類也可以通過積累的經驗來發(fā)展這種能力,但是人類可以做AI無法做到的事情。他們可以通過想象從書面描述中得出的東西看起來是什么樣子,或者通過類似的推論來直觀地推斷出以前遇到的對象的可能分類。在AI中,隨著技術被推廣到復雜的實際應用中(其中新對象的錯誤分類或錯誤識別可能會造成災難性的后果),這種想象未知的能力變得越來越重要。
同樣重要的是可靠地為現實世界訓練AI所需的大量數據。用AI甚至對全世界所有已知動植物物種的很小一部分的圖像進行訓練來進行AI訓練是不可行的,更不用說無數未發(fā)現或未分類的物種了。
Elhoseiny和Elfeki的研究旨在開發(fā)所謂的零擊學習(ZSL)算法,以基于沒有培訓示例的班級描述來幫助識別以前看不見的類別。
Elhoseiny表示:“我們通過將ZSL與人類創(chuàng)造力聯系起來,為'看不見的'類別建立了視覺學習過程的模型,觀察到ZSL是要識別看不見的事物,而創(chuàng)造力是要創(chuàng)造'可愛的看不見的事物,” Elhoseiny說。
在創(chuàng)造力方面,新穎但令人愉悅或“討人喜歡”的事物必須與現有技術有所不同,但又應如此以至于無法辨認。以同樣的方式,Elhoseiny和Elfeki仔細地建模了一個學習信號,該信號以歸納方式鼓勵了與已見班級的背離,但并沒有推得太遠,以至于想象中的班級變得不切實際,并失去了已見班級的知識轉移。所得算法顯示出對ZSL最新基準的持續(xù)改進。
Elhoseiny說:“我們方法的可能應用之一是識別未知物種。”“采用這種技術的AI可以幫助報告物種的目擊情況,而無需圖片,只需帶有語言描述即可。”