在當今世界,沒有人工智能的日常生活幾乎是不可想象的。自動駕駛,外語翻譯或醫(yī)學診斷等領域的無數(shù)應用已進入我們的生活。在化學研究中,也正在努力有效地應用人工智能(AI),也稱為機器學習。這些技術已經用于預測單個分子的特性,從而使研究人員更容易選擇要生產的化合物。
這種生產稱為合成,通常涉及相當大的努力,因為存在許多可能的合成途徑來生產靶分子。由于每個反應的成功取決于許多參數(shù),因此即使對于有經驗的化學家來說,也不總是能夠預測反應是否會發(fā)生,甚至無法預測反應的進行情況。為了解決這種情況,來自明斯特大學(德國)的化學家和計算機科學家團隊共同努力,開發(fā)了一種AI工具,該工具現(xiàn)已發(fā)表在《化學》雜志上。
背景與方法:
“化學反應是一個高度復雜的系統(tǒng),”有機化學研究所的博士生,該出版物的主要作者之一弗雷德里克·桑福德解釋說。他補充說:“與預測單個化合物性質相反,反應是許多分子的相互作用,因此是一個多維問題。”而且,沒有明確定義的“游戲規(guī)則”,就像現(xiàn)代國際象棋計算機一樣,它可以簡化AI模型的開發(fā)。因此,以前準確預測反應結果(例如產率或產物)的方法主要基于對分子特性的先前了解。“開發(fā)這種模型需要大量的努力。此外,
因此,提出的工作重點是該程序的普遍適用性,以便其他化學家可以輕松地將其用于自己的工作。為了確保這一點,該模型直接基于分子結構。“每個有機化合物都可以用圖形表示,原則上可以用圖像表示,”計算機科學領域的另一位作者MariusKühnemund解釋說。“在這樣的圖形上,可以進行簡單的結構查詢(與照片中的顏色或形狀問題類似),以便盡可能準確地捕獲所謂的化學環(huán)境。”
許多這樣的連續(xù)查詢的組合產生了所謂的分子指紋。這些簡單的數(shù)字序列長期以來一直用于化學信息學中,以發(fā)現(xiàn)結構相似之處,非常適合計算機輔助應用。在他們的方法中,作者使用了大量的此類指紋來盡可能準確地表示每個分子的化學結構。MariusKühnemund補充說:“通過這種方式,我們已經能夠開發(fā)出可用于預測完全不同的反應結果的強大系統(tǒng),同一模型可用于預測產量和立體選擇性,這是獨一無二的。”
作者證明,他們的程序可以很容易地應用,并且可以通過使用最初不是為機器學習創(chuàng)建的數(shù)據(jù)集來進行準確的預測,尤其是與現(xiàn)代機器人技術結合使用時。Frederik Sandfort解釋說:“該數(shù)據(jù)集僅包含原材料的相對銷售量,而沒有確切的產量。”“要獲得準確的產量,就必須創(chuàng)建校準。但是,由于涉及的工作量很大,實際上很少這樣做。”
該團隊將繼續(xù)開發(fā)其程序,并在將來為其配備新功能。Frank Glorius教授充滿信心:“在評估大量復雜數(shù)據(jù)時,計算機在根本上優(yōu)于我們。但是,我們的目標不是用機器代替合成化學家,而是盡可能有效地支持它們。基于模型人工智能可以極大地改變我們進行化學合成的方式。但我們仍處于起步階段。”