化學(xué)是一門(mén)研究物質(zhì)組成、結(jié)構(gòu)、性質(zhì)與變化規(guī)律的學(xué)科,其發(fā)展史是人類突破自然表象、揭示物質(zhì)本質(zhì)的歷史。從古代煉金術(shù)士對(duì)“點(diǎn)石成金”的癡迷,到現(xiàn)代科學(xué)家操控原子合成新物質(zhì),在好奇心的驅(qū)動(dòng)下,人類正不斷向著未知前進(jìn)。
近年來(lái),人工智能(AI)技術(shù)迅猛發(fā)展,進(jìn)入千行百業(yè)。當(dāng)AI遇上化學(xué),將催生怎樣的“化學(xué)反應(yīng)”?在化學(xué)領(lǐng)域,AI能處理海量數(shù)據(jù),發(fā)現(xiàn)人類難以察覺(jué)的復(fù)雜結(jié)構(gòu),加速科學(xué)研究進(jìn)程,幫助解決復(fù)雜科學(xué)問(wèn)題。從數(shù)據(jù)獲取到規(guī)律發(fā)現(xiàn),再到技術(shù)應(yīng)用,AI技術(shù)正從根本上重塑化學(xué)研究,為人類開(kāi)拓未知帶來(lái)無(wú)限可能。

在由人工智能驅(qū)動(dòng)的新型化學(xué)實(shí)驗(yàn)室——智化科技實(shí)驗(yàn)室內(nèi),技術(shù)人員正檢查、調(diào)整機(jī)器人參數(shù)。 魏錸/湖北日?qǐng)?bào)
按下研究“快進(jìn)鍵”
“近年來(lái),面對(duì)復(fù)雜的化學(xué)分子結(jié)構(gòu)和海量實(shí)驗(yàn)數(shù)據(jù),傳統(tǒng)的化學(xué)與化工研究方法已經(jīng)開(kāi)始顯得力不從心?!北本┗ご髮W(xué)教授王丹向科技日?qǐng)?bào)記者介紹,AI可模擬人類的學(xué)習(xí)過(guò)程,從大量數(shù)據(jù)中提取有用信息,優(yōu)化決策過(guò)程,已在化學(xué)研究領(lǐng)域展現(xiàn)出巨大潛力。
例如,上海交通大學(xué)借助白玉蘭科學(xué)大模型,首次實(shí)現(xiàn)化學(xué)大語(yǔ)言模型加速有機(jī)合成全流程。該大模型在單步/多步逆合成、產(chǎn)率預(yù)測(cè)、選擇性預(yù)測(cè)、反應(yīng)優(yōu)化等多個(gè)基準(zhǔn)任務(wù)上展現(xiàn)出卓越能力,在加速真實(shí)化學(xué)發(fā)現(xiàn)中潛力巨大,有望解決實(shí)驗(yàn)科學(xué)中反復(fù)試錯(cuò)的難題,為大型語(yǔ)言模型加速有機(jī)化學(xué)合成提供了新的研究范式和方法。
在化學(xué)與其他學(xué)科的交叉領(lǐng)域,AI同樣大有可為?!拔覀冎饕獜氖鲁亓η把乜茖W(xué)與納米材料產(chǎn)品工程研究。目前,我們課題組正在與計(jì)算機(jī)領(lǐng)域的專家合作,共同研發(fā)針對(duì)特定有機(jī)無(wú)機(jī)納米復(fù)合材料體系的AI智能體原型系統(tǒng)?!蓖醯ふf(shuō),課題組目前正借助深度學(xué)習(xí)算法進(jìn)行配方模型構(gòu)建。實(shí)驗(yàn)結(jié)果顯示,在給定性能指標(biāo)、成本和環(huán)境影響的約束條件下,AI系統(tǒng)能快速生成滿足需求的材料配方。
“我認(rèn)為AI帶來(lái)的最顯著提升主要體現(xiàn)在縮短研發(fā)周期、降低研發(fā)成本、提升發(fā)現(xiàn)概率方面?!贝筮B理工大學(xué)材料科學(xué)與工程學(xué)院副院長(zhǎng)董旭峰說(shuō),AI已能輔助科學(xué)家進(jìn)行新材料設(shè)計(jì)、性能預(yù)測(cè)及工藝優(yōu)化等多個(gè)研究步驟。例如對(duì)于生物醫(yī)用材料,AI可以輔助設(shè)計(jì)多孔支架的結(jié)構(gòu),預(yù)測(cè)其力學(xué)性能以及生物相容性。AI還可以分析海量的工藝參數(shù)與最終產(chǎn)品性能的數(shù)據(jù),找出最優(yōu)的制備工藝窗口,實(shí)現(xiàn)工藝的精準(zhǔn)調(diào)控。
普遍面臨“數(shù)據(jù)之渴”
化學(xué)實(shí)驗(yàn)數(shù)據(jù)質(zhì)量的高低直接影響著AI的預(yù)測(cè)和決策能力。然而,當(dāng)前,化學(xué)AI普遍面臨著“數(shù)據(jù)之渴”。
王丹舉例說(shuō),化工新材料的研發(fā)涉及實(shí)驗(yàn)、模擬和文獻(xiàn)等多源異構(gòu)數(shù)據(jù),但該領(lǐng)域長(zhǎng)期存在數(shù)據(jù)碎片化、語(yǔ)義鴻溝及跨尺度關(guān)聯(lián)不足的問(wèn)題。高質(zhì)量的數(shù)據(jù)是訓(xùn)練有效AI模型的基礎(chǔ),但化學(xué)數(shù)據(jù)的獲取、整理和標(biāo)準(zhǔn)化仍是一大難題。他建議,構(gòu)建統(tǒng)一的高質(zhì)量數(shù)據(jù)與知識(shí)體系,實(shí)現(xiàn)材料特征與性能信息的結(jié)構(gòu)化整合與動(dòng)態(tài)更新。
董旭峰同樣認(rèn)為,數(shù)據(jù)匱乏與數(shù)據(jù)質(zhì)量低是制約AI技術(shù)深入應(yīng)用的重要阻礙?!坝绕涫巧镝t(yī)用材料領(lǐng)域,涉及活體實(shí)驗(yàn)和臨床研究的相關(guān)數(shù)據(jù)不僅數(shù)量少,而且獲取成本極高、噪聲大、標(biāo)準(zhǔn)不統(tǒng)一?!彼ㄗh,應(yīng)推動(dòng)數(shù)據(jù)標(biāo)準(zhǔn)化與共享,建立材料數(shù)據(jù)的標(biāo)準(zhǔn)格式和共享平臺(tái);發(fā)展小樣本學(xué)習(xí)、零樣本學(xué)習(xí)技術(shù),讓AI學(xué)會(huì)“舉一反三”;融合多源數(shù)據(jù),將模擬數(shù)據(jù)、文獻(xiàn)數(shù)據(jù)、實(shí)驗(yàn)數(shù)據(jù)甚至失敗的實(shí)驗(yàn)數(shù)據(jù)整合起來(lái)。
此外,業(yè)內(nèi)專家普遍認(rèn)為,數(shù)據(jù)驅(qū)動(dòng)的AI還面臨模型代表性不足、可解釋性不確定等問(wèn)題,要真正形成實(shí)用性強(qiáng)的技術(shù)方法,還需要系統(tǒng)深入研究探索。“作為科學(xué)家,我們不僅需要知道‘是什么’,更需要知道‘為什么’?!倍穹逭f(shuō)。
人機(jī)協(xié)同是方向
王丹認(rèn)為,推動(dòng)AI與化學(xué)研究深度融合,除了要在技術(shù)層面上不斷優(yōu)化,更要在思維層面融合貫通。他分析,當(dāng)前主流AI模型多采用通用算法,缺乏化學(xué)專業(yè)適配性,AI與化學(xué)之間存在“語(yǔ)言不通”的問(wèn)題?!安浑y想象,一名化學(xué)專業(yè)的博士和一名計(jì)算機(jī)專業(yè)博士在接受教育和科研訓(xùn)練過(guò)程中,都潛移默化地形成了基于各自學(xué)科特點(diǎn)的思維模式。而思維模式是人類認(rèn)知和決策的核心框架,不同思維模式?jīng)Q定了人們理解世界、解決問(wèn)題和創(chuàng)造價(jià)值的不同方式。”王丹認(rèn)為,要推動(dòng)“AI+化學(xué)”的跨學(xué)科研究工作,需要匯聚這兩個(gè)或更多領(lǐng)域的專家。因此,培養(yǎng)選拔真正具備復(fù)合型知識(shí)體系和跨學(xué)科整合能力的創(chuàng)新人才至關(guān)重要。
隨著AI技術(shù)逐漸成熟,其與人類科學(xué)家分工的邊界在哪里?在董旭峰看來(lái),即使未來(lái)AI發(fā)展到極高水平,至少在材料研究中,AI仍將面臨不可逾越的邊界,科學(xué)家的核心地位不會(huì)改變。
“AI擅長(zhǎng)在給定的目標(biāo)和框架下進(jìn)行優(yōu)化和探索,但它無(wú)法自發(fā)地提出一個(gè)全新的、顛覆性的科學(xué)問(wèn)題。AI是工具,它沒(méi)有價(jià)值觀。研究什么、為何而研究,涉及社會(huì)需求、倫理等諸多方面?!倍穹逭f(shuō),真正的科學(xué)突破往往來(lái)自將兩個(gè)看似不相關(guān)的領(lǐng)域連接起來(lái)。這種“遠(yuǎn)距離聯(lián)想”的能力和基于深厚學(xué)識(shí)的直覺(jué)和審美,目前還是人類的“特權(quán)”。
“AI未來(lái)或許會(huì)成為一位無(wú)比強(qiáng)大的研究助理,它能處理所有煩瑣、復(fù)雜、耗時(shí)的計(jì)算和數(shù)據(jù)分析工作,將科學(xué)家從重復(fù)性勞動(dòng)中解放出來(lái)。但研究的‘大腦’和‘靈魂’,即提出問(wèn)題的智慧、定義方向的責(zé)任、進(jìn)行創(chuàng)造性整合的靈感以及承擔(dān)倫理后果的擔(dān)當(dāng),將始終屬于人類科學(xué)家?!倍穹逭J(rèn)為,“AI+化學(xué)”的未來(lái)發(fā)展方向應(yīng)是人機(jī)協(xié)同、各展所長(zhǎng)的“科學(xué)家—AI”共生體,而并非互相替代。
聲明:化學(xué)加刊發(fā)或者轉(zhuǎn)載此文只是出于傳遞、分享更多信息之目的,并不意味認(rèn)同其觀點(diǎn)或證實(shí)其描述。若有來(lái)源標(biāo)注錯(cuò)誤或侵犯了您的合法權(quán)益,請(qǐng)作者持權(quán)屬證明與本網(wǎng)聯(lián)系,我們將及時(shí)更正、刪除,謝謝。 電話:18676881059,郵箱:gongjian@huaxuejia.cn