提到人工智慧, 可能會想到下圍棋、預測股市等功能導向的應用。 對於偏創造性的工作, 例如科學研究, 直覺上來說人工智慧好像無用武之地。
在機器學習系列有提到, 人工智慧的起源早於1940年代, 使用電腦協助人類解決問題並不是特別新穎的概念。 但直到近10年, 因為摩爾定律使計算成本降低、深度學習的廣泛應用等因素, 本來人們認為難解的問題現在都漸漸有解, “人工智慧”一詞也越來越熱門。 除了各種軟體服務之外, 人工智慧現在也廣泛應用在科學之中。
●到底哪裡厲害?人工智慧從資料中萃取知識
計算是為了獲得更多資訊。 如果我們事先提供許多資訊給演算法, 它計算量就低。 例如:在電腦裡搜尋檔案, 我們事先指定資料夾位置,
資訊需求量和計算量就像魚與熊掌一般, 但人工智慧厲害的地方在於打破“不能兼得”的規則[注1]。 我們不需要親手在演算法中放入資訊, 人工智慧能自己從大資料中汲取資訊, 使資訊量和計算量的需求都很低。 同樣以檔案搜尋為例, 這代表:就算忘記檔案位置, 我們不指定資料夾, 人工智慧會分析使用者歸檔習慣, 光看檔名就知道檔案位置。
圖一、演算法的特性圖。 一般的演算法中(如搜尋檔案), 我們寫入的資訊越多(提供資料夾位置), 它的計算量就越少, 時間也越短。 反之, 計算量多, 時間也長。 但對於基於深度學習的人工智慧, 我們不需要事先放入資訊也能達到低計算量。 這對演算法設計者非常方便, 也提升了演算法本身的應用度和發展性。
●人工智慧和相對論研究:簡化複雜的理論
在品質很大的天體附近空間會被扭曲。 廣義相對論預測, 儘管是真空, 光線走的不再是直線,
圖二、重力透鏡觀測資料和未知重力場參數的關係。 光線從宇宙深處到達地球,
天文觀測就像是一個函數, 能把來自宇宙深處的光轉換成我們看的到的影像(圖二)。 而資料處理就像是一個反函數, 用望遠鏡的影像來回推未知的遙遠重力場參數, 這是一個非常複雜的反函數。 這就像是如果有班級學號, 可以快速的從畢業紀念冊中找出照片;但只有一張照片, 反推出這個人的班級學號卻非常困難, 只能一張一張比對照片。 相同地,要準確地分析一個重力透鏡,一個一個比對參數和資料,要花上好幾周的時間才能完成[注2]。
相較之下,人工智慧非常擅長學習並簡化複雜的函數,應用在重力透鏡上計算時間減少千萬倍(沒錯,就是字面上的一千萬倍)。簡化複雜函數的方法是用深度學習中的人工神經網路,細節可以參考之前的文章。讓人工智慧從大資料中學習重力透鏡影像和重力場參數之間的關係後,只要約1秒就能完成100組重力透鏡資料分析。儘管準確度比起一個一個比對參數稍差,但大都也落在95%信心水準之中,對大多數的研究已非常足夠。
有趣的是,這個演算法不僅計算速度快,設計演算法的速度也快。我們不須要把相對論的知識寫進演算法,只要把人臉辨識的演算法稍作修改即可。唯一要做的是把人臉的資料庫改成重力透鏡的資料庫,人工智慧就能自己學習如何分析相對論效應。
●人工智慧和量子力學研究:從資料中學習量子波函數的形狀
相對論和量子理論是物理學的兩大學門,在量子力學的研究中也能見到人工智慧的蹤影。當今量子物理的研究重點之一是量子多體物理問題,研究粒子在交互作用下產生的奇特現象。通常在研究量子力學時,第一步是寫下波函數的基底(basis)。但在多體問題中,波函數要滿足和包利不相容原理有關的對稱性,這個對稱性使波函數變得非常冗長。如圖三所示,光是三個粒子的波函數都寫不完了,更別提更多粒子。
在前幾段曾經有提到,人工智慧特別擅長簡化複雜的函數,這也包括了波函數。科學家建立一個資料庫,裡面有多體物理量子態和波函數的關係。再使用深度學習法,讓人工智慧從資料庫中學習多體問題中的波函數應該長什麼樣子。目前,科學家用這種方法研究100個粒子的交互作用,發現和傳統的方法吻合,速度卻快上許多。若應用在更多粒子上,也許能發現更多傳統方法無法預測的現象,推展量子多體物理知識的邊界。
圖三、在量子多體問題中,波函數的基底隨著粒子數目成指數成長。這代表要完整解決多體問題的薛丁格方程是不切實際的。因此,物理學家用人工智慧找出近似的波函數,並且驗證這個方法和傳統理論方法吻合。
除了上述的兩個物理學的例子之外,在電機科學中,許多大公司早已將人工智慧應用在積體電路設計中。在材料科學中,科學家用人工智慧找出數千種穩定存在的二維材料,數目遠遠超過透過實驗所發現的。有人會認為人工智慧仍只是參與科學研究中功能導向的部分,但筆者認為這樣的說法只對了一半。目前人工智慧也許不能從頭到尾一條龍地生產知識,但以上述的例子看來,它確確實實地跟知識的核心息息相關。知識藏在實驗和資料之中,我們讓人工智慧去挖掘。若它發現資料中我們從未思考過的面向,我們能說它不具有創造力嗎?
[注1] 現在,如果有人聊到“人工智慧”,他通常指的是“人工智慧”中的“機器學習法”中的“深度學習”。在本文中的人工智慧指的都是深度學習法。
[注2] 除了一個一個參數比對,科學家還會加上一些統計方法,但分析資料仍要花上好幾周。
相同地,要準確地分析一個重力透鏡,一個一個比對參數和資料,要花上好幾周的時間才能完成[注2]。相較之下,人工智慧非常擅長學習並簡化複雜的函數,應用在重力透鏡上計算時間減少千萬倍(沒錯,就是字面上的一千萬倍)。簡化複雜函數的方法是用深度學習中的人工神經網路,細節可以參考之前的文章。讓人工智慧從大資料中學習重力透鏡影像和重力場參數之間的關係後,只要約1秒就能完成100組重力透鏡資料分析。儘管準確度比起一個一個比對參數稍差,但大都也落在95%信心水準之中,對大多數的研究已非常足夠。
有趣的是,這個演算法不僅計算速度快,設計演算法的速度也快。我們不須要把相對論的知識寫進演算法,只要把人臉辨識的演算法稍作修改即可。唯一要做的是把人臉的資料庫改成重力透鏡的資料庫,人工智慧就能自己學習如何分析相對論效應。
●人工智慧和量子力學研究:從資料中學習量子波函數的形狀
相對論和量子理論是物理學的兩大學門,在量子力學的研究中也能見到人工智慧的蹤影。當今量子物理的研究重點之一是量子多體物理問題,研究粒子在交互作用下產生的奇特現象。通常在研究量子力學時,第一步是寫下波函數的基底(basis)。但在多體問題中,波函數要滿足和包利不相容原理有關的對稱性,這個對稱性使波函數變得非常冗長。如圖三所示,光是三個粒子的波函數都寫不完了,更別提更多粒子。
在前幾段曾經有提到,人工智慧特別擅長簡化複雜的函數,這也包括了波函數。科學家建立一個資料庫,裡面有多體物理量子態和波函數的關係。再使用深度學習法,讓人工智慧從資料庫中學習多體問題中的波函數應該長什麼樣子。目前,科學家用這種方法研究100個粒子的交互作用,發現和傳統的方法吻合,速度卻快上許多。若應用在更多粒子上,也許能發現更多傳統方法無法預測的現象,推展量子多體物理知識的邊界。
圖三、在量子多體問題中,波函數的基底隨著粒子數目成指數成長。這代表要完整解決多體問題的薛丁格方程是不切實際的。因此,物理學家用人工智慧找出近似的波函數,並且驗證這個方法和傳統理論方法吻合。
除了上述的兩個物理學的例子之外,在電機科學中,許多大公司早已將人工智慧應用在積體電路設計中。在材料科學中,科學家用人工智慧找出數千種穩定存在的二維材料,數目遠遠超過透過實驗所發現的。有人會認為人工智慧仍只是參與科學研究中功能導向的部分,但筆者認為這樣的說法只對了一半。目前人工智慧也許不能從頭到尾一條龍地生產知識,但以上述的例子看來,它確確實實地跟知識的核心息息相關。知識藏在實驗和資料之中,我們讓人工智慧去挖掘。若它發現資料中我們從未思考過的面向,我們能說它不具有創造力嗎?
[注1] 現在,如果有人聊到“人工智慧”,他通常指的是“人工智慧”中的“機器學習法”中的“深度學習”。在本文中的人工智慧指的都是深度學習法。
[注2] 除了一個一個參數比對,科學家還會加上一些統計方法,但分析資料仍要花上好幾周。