日前, 美國科研人員在英國《自然通訊》發表題為《從資料中學習來設計功能材料沒有反演對稱性》的論文, 闡述了一種依託更少的資料篩選並設計材料的方法。 該論文第一作者是新墨西哥州洛斯阿拉莫斯國家實驗室的普拉桑納·巴拉幹德蘭(Prasanna Balachandran), 接著是西北大學的研究生約書亞·楊(Joshua Young), 洛斯阿拉莫斯實驗室的資深研究員圖拉伯·魯克曼(Turab Lookman)等也參與了論文撰寫。
論文主題受美國國家自然科學基金和洛斯阿拉莫斯實驗室指導研發計畫的資助。 西北大學麥考米克工程學院材料科學與工程領域的助理教授詹姆斯·蘭丁內利(James M. Rondinelli)的團隊專注於一類二維複合氧化物的研究。 這些材料展現出了很多使得某些技術實現的特性, 如鐵電性和壓電性,
蘭丁內利表示:“在這個材料族中, 資料量是很小的。 目前來看, 大約只有10~15種材料被認為擁有人們迫切想要的性能……這裡並沒有很多資料可以拿來使用。 傳統的資料科學通常應用在解決大資料問題上, 對領域知識的需求較少。 ”
研發一種新型功能材料本來就很難, 從相對小範圍的已知材料族中搜索非常特定的性質就更加困難。 為此, 來自西北大學工程學院和洛斯阿拉莫斯實驗室的團隊成立了一個工作室,
因此, 該團隊開始建立已知材料的資料庫, 並且開始應用機器自主學習的方法(電腦科學的一個子領域), 從資料中學習並建立演算法, 並運用演算法做出更準確的預測。 “結合機器學習的方法, 我們可以將人們想研發新材料的化學成分識別出來, 作為候選組分”。 經過了對超過3000種潛在的材料的核查, 這種資料科學方法找到了超過200種有前途的候選材料。 隨後, 該團隊還應用了幾種嚴密的量子力學計算方法, 評估了潛在材料的原子結構並檢驗了其穩定性。 這項工作將潛在候選材料的範圍縮小到了19種, 並建議立刻採用這19種材料進行試驗合成。
通常在開發新材料時, 具有潛在可能性的材料數量太多, 以至於不能探索和發展每一種材料,因為篩選潛在材料的過程非常昂貴,科學家們必須有選擇的進行重點科研投資。“我們的工作有潛力幫助節約大量的時間和資源,”巴拉幹德蘭說,“通過機器的判斷後,只有那些最有潛力成為我們需要的新材料才會被建議做科研上的投資,而不是所有有可能性的材料”。
以至於不能探索和發展每一種材料,因為篩選潛在材料的過程非常昂貴,科學家們必須有選擇的進行重點科研投資。“我們的工作有潛力幫助節約大量的時間和資源,”巴拉幹德蘭說,“通過機器的判斷後,只有那些最有潛力成為我們需要的新材料才會被建議做科研上的投資,而不是所有有可能性的材料”。