如今,自動圖像識別已被廣泛使用:有些計算機程序可以可靠地診斷皮膚癌,駕駛自動駕駛汽車或控制機器人。到目前為止,所有這些都是基于對普通攝像機提供的圖像數(shù)據(jù)進行評估的,而且這很耗時。尤其是每秒記錄的圖像數(shù)量很多時,會生成大量難以處理的數(shù)據(jù)。
因此,維也納工業(yè)大學的科學家采用了另一種方法:使用特殊的2D材料,開發(fā)了一種圖像傳感器,可以對其進行訓練以識別某些物體。該芯片代表了能夠?qū)W習的人工神經(jīng)網(wǎng)絡(luò)。數(shù)據(jù)不必由計算機讀取和處理,但是芯片本身可以提供有關(guān)當前所見內(nèi)容的信息-僅需數(shù)納秒。這項工作現(xiàn)在已經(jīng)在科學雜志《自然》上發(fā)表。
學習硬件
神經(jīng)網(wǎng)絡(luò)是類似于我們的大腦的人工系統(tǒng):神經(jīng)細胞與許多其他神經(jīng)細胞相連。當一個細胞處于活動狀態(tài)時,這會影響鄰近神經(jīng)細胞的活動。在計算機上進行人工學習的原理完全相同:對神經(jīng)元網(wǎng)絡(luò)進行數(shù)字化仿真,并改變該網(wǎng)絡(luò)的一個節(jié)點影響另一個節(jié)點的強度,直到該網(wǎng)絡(luò)顯示出所需的行為為止。
“通常,圖像數(shù)據(jù)首先逐個像素地讀取,然后在計算機上進行處理,” Thomas Mueller說。“另一方面,我們將神經(jīng)網(wǎng)絡(luò)及其人工智能直接集成到圖像傳感器的硬件中。這使對象識別的速度提高了多個數(shù)量級。”
該芯片是在維也納工業(yè)大學開發(fā)和制造的。它基于由二硒化鎢制成的光電探測器-一種僅由三個原子層組成的超薄材料。單獨的光電探測器,即相機系統(tǒng)的“像素”,都連接到提供目標識別結(jié)果的少量輸出元件。
通過可變的敏感性學習
該出版物的第一作者Lukas Mennel表示:“在我們的芯片中,我們可以專門調(diào)節(jié)每個檢測器元件的靈敏度-換句話說,我們可以控制特定檢測器拾取的信號影響輸出信號的方式。 。“我們要做的就是直接在光電探測器上調(diào)節(jié)局部電場。”這種調(diào)整是在計算機程序的幫助下從外部完成的。例如,可以使用傳感器記錄不同的字母并逐步更改各個像素的靈敏度,直到某個字母始終精確地導致相應的輸出信號為止。這就是芯片中神經(jīng)網(wǎng)絡(luò)的配置方式-使網(wǎng)絡(luò)中的某些連接更牢固而其他連接更弱。
一旦學習過程完成,就不再需要計算機。神經(jīng)網(wǎng)絡(luò)現(xiàn)在可以單獨工作。如果將某個字母顯示給傳感器,它將在50納秒內(nèi)生成經(jīng)過訓練的輸出信號-例如,代表芯片剛剛識別出的字母的數(shù)字代碼。
事物必須快速進行時的對象檢測
“目前,我們的測試芯片還很小,但是您可以根據(jù)要解決的任務輕松擴展該技術(shù),” Thomas Mueller說。“從原理上講,該芯片還可以進行訓練,以區(qū)分蘋果和香蕉,但是我們看到它在科學實驗或其他專門應用中的使用更多。”
這項技術(shù)可以在需要極高速度的地方有用地應用:“從斷裂力學到粒子檢測-在許多研究領(lǐng)域中,都對短時間事件進行了研究,” Thomas Mueller說。“通常不必保留有關(guān)此事件的所有數(shù)據(jù),而是要回答一個非常具體的問題:裂紋是否從左向右傳播?幾個可能的粒子剛剛通過了?這正是我們的技術(shù)有好處。”