華文網

美國科學家研究通過“小”資料設計新材料

日前,美國科研人員在英國《自然通訊》發表題為《從資料中學習來設計功能材料沒有反演對稱性》的論文,闡述了一種依託更少的資料篩選並設計材料的方法。該論文第一作者是新墨西哥州洛斯阿拉莫斯國家實驗室的普拉桑納·巴拉幹德蘭(Prasanna Balachandran),

接著是西北大學的研究生約書亞·楊(Joshua Young),洛斯阿拉莫斯實驗室的資深研究員圖拉伯·魯克曼(Turab Lookman)等也參與了論文撰寫。

論文主題受美國國家自然科學基金和洛斯阿拉莫斯實驗室指導研發計畫的資助。西北大學麥考米克工程學院材料科學與工程領域的助理教授詹姆斯·蘭丁內利(James M. Rondinelli)的團隊專注於一類二維複合氧化物的研究。

這些材料展現出了很多使得某些技術實現的特性,如鐵電性和壓電性,並可以與在現在電子設備中發現的傳統半導體材料接合。但很少有層狀材料在某些幾何形狀中具有這些性質(這些性質對開發電子、通信和能源問題至關重要),這意味著採用傳統方法制訂新材料設計指南的資料非常少。

蘭丁內利表示:“在這個材料族中,資料量是很小的。目前來看,

大約只有10~15種材料被認為擁有人們迫切想要的性能……這裡並沒有很多資料可以拿來使用。傳統的資料科學通常應用在解決大資料問題上,對領域知識的需求較少。”

研發一種新型功能材料本來就很難,從相對小範圍的已知材料族中搜索非常特定的性質就更加困難。為此,來自西北大學工程學院和洛斯阿拉莫斯實驗室的團隊成立了一個工作室,他們開發了一套創新的工作流程,

結合機器自主學習和密度函數理論計算,為具有有用電子性能的新材料創建設計指南,例如材料的鐵電性和壓電性等。蘭丁內利說,“當研究人員尋找新的材料時,一般來說他們都從有大量資料的相似的材料中尋找。無論如何,新材料的研發都是一件不容易的事情,但是我們知道如何從大量的資料資料中提煉有價值的資訊。”蘭丁內利表示。“當你缺乏很多資訊時,
從資料中學習變成了一件非常艱難的事”。“雖然資料量小是這個問題的本質,”巴拉幹德蘭補充道,“但是我們的方法還是奏效的,因為我們可以將我們對材料的理解(領域知識)和資料結合在一起,指導機器進行學習”。

因此,該團隊開始建立已知材料的資料庫,並且開始應用機器自主學習的方法(電腦科學的一個子領域),從資料中學習並建立演算法,並運用演算法做出更準確的預測。“結合機器學習的方法,我們可以將人們想研發新材料的化學成分識別出來,作為候選組分”。經過了對超過3000種潛在的材料的核查,這種資料科學方法找到了超過200種有前途的候選材料。隨後,該團隊還應用了幾種嚴密的量子力學計算方法,評估了潛在材料的原子結構並檢驗了其穩定性。這項工作將潛在候選材料的範圍縮小到了19種,並建議立刻採用這19種材料進行試驗合成。

通常在開發新材料時,具有潛在可能性的材料數量太多,以至於不能探索和發展每一種材料,因為篩選潛在材料的過程非常昂貴,科學家們必須有選擇的進行重點科研投資。“我們的工作有潛力幫助節約大量的時間和資源,”巴拉幹德蘭說,“通過機器的判斷後,只有那些最有潛力成為我們需要的新材料才會被建議做科研上的投資,而不是所有有可能性的材料”。

“結合機器學習的方法,我們可以將人們想研發新材料的化學成分識別出來,作為候選組分”。經過了對超過3000種潛在的材料的核查,這種資料科學方法找到了超過200種有前途的候選材料。隨後,該團隊還應用了幾種嚴密的量子力學計算方法,評估了潛在材料的原子結構並檢驗了其穩定性。這項工作將潛在候選材料的範圍縮小到了19種,並建議立刻採用這19種材料進行試驗合成。

通常在開發新材料時,具有潛在可能性的材料數量太多,以至於不能探索和發展每一種材料,因為篩選潛在材料的過程非常昂貴,科學家們必須有選擇的進行重點科研投資。“我們的工作有潛力幫助節約大量的時間和資源,”巴拉幹德蘭說,“通過機器的判斷後,只有那些最有潛力成為我們需要的新材料才會被建議做科研上的投資,而不是所有有可能性的材料”。