您的位置:首頁>正文

軟銀投鉅資的機器人完勝人類科學家400倍,人工智慧有望全面接管生物實驗室

2016 年 10 月, 日本軟銀(SoftBank)領銜多家頂級風投, 向一家當時還名不見經傳的初創公司 Zymergen 投資總計 1.3 億美元。 在此 B 輪融資完成後, 美國前任能源部長、諾獎得主朱棣文也加入了 Zymergen 董事會。

簡單而言, Zymergen 是一家專注于合成生物學的美國初創公司, 主要開發用於工業發酵的基因工程細菌, 並結合機器學習, 進行自動化分析和生物資訊學處理。 昨日, 《Science》網站刊文首次披露這家神秘公司的創業野心以及背後的一些技術細節。

合成生物學雖然叫“生物學”, 其實卻與工程學理念更為接近。 相比機械零件、電路元件等傳統工程學科, 合成生物學擺弄的生物零件更複雜、更多變。 研究者通過調控相關基因通路對細胞進行“程式設計”, 讓它們像微型工廠或機器一樣, 生產特定產品或完成特殊任務。

傳統的生物學操作方式是:提供一些有限數量的假設, 由人類科學家在實驗室裡每個月進行 10 次測試,

但現在有一種機器人每週可執行多達 1000 次實驗, 這相當於將效率提升了400倍。 但這些機器人只能服從命令, 這意味著輸入正確的命令是這一過程中真正的瓶頸。

這些機器人屬於 Zymergen 公司, 這是一家專注于合成生物學的公司。 2014年, 這家公司搬進了一個位於加州三藩市灣區的廢舊電子工廠。

在一大堆設備中, 有一個名叫 Echo 的機械臂, 它正抓起一個有著上百個裝滿液體的方格的塑膠盒。 在將塑膠盒放入託盤前, Echo會對其條碼進行掃描, 接下來會發生的事情, 就不是人眼能看得見的了。

圖丨由AI控制的機械臂正在對微生物菌群進行液移

Zymergen公司的聯合創始人、分子生物學家、運營和工程副總裁Jed Dean說:“這個過程並不是手工進行移液的簡單複製, 而是一種完全不同的方式。 ”

機器人並不是使用傳統的移液管吸取液體後再轉移到每個方格中, 而是使用每秒 500 次的聲波脈衝, 讓液體震動並形成小液滴, 這些液滴要比每次人工移液的量小數千倍。 所以, 機器人並不會直接接觸液體。

實際上, 整個流程中並沒有太多未來元素, 稍微有點規模的生物實驗室中都在使用機器人和條碼系統。 哪怕是上文提到的移液技術, 這種稱為“聲波液移技術”(Acoustic Droplet Ejection)其實也已經存在十多年了。

圖丨聲波液移技術可在非物理接觸情況下, 實現微量液體的精准提取

然而, 有意思的是, 當Jed Dean被問到現在這些機器人在做什麼實驗時, 他居然理直氣壯的回答道:“我不知道。 ”

的確, 整套實驗流程都由電腦程式自行設定及操作, 如果想要知道實驗相關資訊, 只需要去電腦螢幕上看一眼就行了, 何必要時時刻刻記在腦子裡呢?

Zymergen公司的首席執行官Joshua Hoffman說:“整個實驗過程中只有一名人類科學家參與, 負責實驗結果分析和事實檢查。 ”但解讀實驗資料、生成假設、規劃實驗這類工作, Zymergen的終極目標將是“去除一切人類直覺的干擾”, 實現科學實驗的全過程人工智慧。

圖丨Zymergen公司的首席執行官Joshua Hoffman

Zymergen的做法代表了生物技術公司的一種趨勢:利用人工智慧來增強、甚至取代人類在科學研究中的作用,即實現“AI驅動的生物技術”。

從宏觀上看,就像工廠裡的生產流水線一樣,科學發現也是一個循序漸進的過程:科學家們發表論文,然後指導在實驗室中完成實驗,進而得到全新的發現,最終又會以科學論文的形式呈現出來。這是一個標準的週期,就連當今最典型的人工智慧以自動化的優勢代替人力勞動也是遵循這個路線:

圖丨“AI驅動的生物技術”流程圖

作為上述“AI驅動的生物技術”中的重要環節,Zymergen所做的工作就是為生物燃料、塑膠、藥品等提供工業化的微生物配方。為了提高微生物的生產效率,客戶們往往會將主力菌種直接送到Zymergen,然後由那裡的機器人對每種微生物的基因進行分析和修補,從而得到一個高效版本的的工程微生物。

但問題是,那些被客戶送到Zymergen的微生物已經是高度優化過的。所以說,如果要在這個基礎上進一步提高效率,就只能進行更深層次的基因組研究、設計實驗、分析資料。換句話說,越是要壓榨出最後那點效率提升,越是要求更先進的技術手段。

圖丨Zymergen的實驗流程基本實現了完全自動化

那麼,究竟怎樣用演算法來設計實驗?一個原始微生物約有 5000 個基因,假設有10種可以改變給定的基因的方法,那麼就有了 5 萬種不同的組合。然後,可以用1000個菌株進行實驗,每一個菌株都有可能突變,也許 25 個菌株就會產生足夠的目標化學品。這樣的菌株就可以用於下一輪實驗育種,其餘的菌株則放入冷凍室。

實際上,只是盲目地提高效率並不會帶來科學發現上的重大進展。因為如果把所有的突變都組合成一個單一的微生物,往往不能達到“1+1>2”的效果,很有可能顧此失彼——微生物反而因此呈現出“病態”,這類病態菌株可能還不如先前未經改造的原始菌株。

因此,要選出正確的路徑,這就需要一張“地圖”。這張“地圖”可以顯示所有突變造成的影響,而且還是基於多個維度的,因為人類需要為機器學習設定一個方向。

舉例而言,在合成生物學中,一條代謝通路通常擁有十幾或幾十個基因表達產物——有些對生產率的改善微不足道,有些卻舉足輕重,而代謝通路之間也經常存在交流,互相調節。想要成功製造一個工程細菌,一般要經過成百上千次的實驗試錯,才能一步步逼近正確答案。

在分子生物學中所提到的“代謝通路”(metabolic pathway),通常是指某個或某幾個基因表達所涉及的全部酶或信號分子。細胞內這些不同代謝通路組成了代謝網路,令生物保持其內環境穩定。

然而,Zymergen的模式卻完全不同,他們專門為此開發了一套機器學習系統,讓人工智慧技術從浩如煙海的實驗資料中進行分析,指出代謝通路的要害,並根據需求找出相應的、能實現特定功能的基因表達,把這個表達寫入微生物中,最後生產出所需的微生物,從而避免了繁雜的試錯過程。

圖丨迷宮——細胞的代謝通路匯總

但是,這裡有個尷尬的問題:當機器人終於發現那些能提高產量的遺傳變化時,它們對背後具體的生物化學機制一無所知。

如果實驗不能加深我們對生物學原理的理解,那這真的能稱為“科學”麼?對於 Zymergen 的首席技術官 Aaron Kimball 來說,這個哲學觀點可能並不那麼重要,而且他的解釋也相當直接:“能給我們帶來收入的是最終結果,而不是我們是否明白其中的原理。”

到目前為止,Zymergen公司的機器人實驗室將化學生產微生物的效率提高了10%以上。這個數字看起來並不起眼,但要知道,化學工業中有一些部門十分依賴微生物發酵,一點小的技術改進都有可能節省大量的成本、帶來更多的收益,甚至會超過美國國家科學基金會 70 億美元的年度預算。

機器人也許會發現那些被科學家忽略了的有益遺傳變化,因為大多數能提高生產率的基因與人類所能預見的產物沒有直接關係。如果沒有正確的組合,一些基因可能根本無法表達。 Jed Dean說:“我已經在幾種不同的微生物中看到了這種模式。如果不使用機器學習,尋找正確的基因組合就像試圖破解極其複雜的密碼,人類的直覺和信心很容易被問題的複雜性所壓倒。”

圖丨人類的直覺會增加科學研究中的不確定性?

科學研究能在多大程度上交給機器來完成,不同領域的研究人員會有不同的答案。加州大學大衛斯分校電腦科學家Ilias Tagkopoulos認為:“為了最大限度地提高資訊收益,為了更接近目標,我們應該讓資料決定實驗步驟。”這位教授的研究領域是遺傳學,在他看起來永無止境的研究課題裡,包括了預測細菌如何適應不斷變化的醫院環境、設計出更健康的零食等諸多問題。

如果機器真的能夠在某些科研任務中取代部分人類勞動,想必很多科學家都會欣然接受。與工廠工人或計程車司機不同,大多數研究科學家都希望將部分工作自動化,特別是分子和細胞生物學,其中人工移液、培養細胞、菌落數量統計等繁瑣且高成本的環節尤其如此。

一名研究生的小失誤可能會浪費數周的辛苦工作。更糟糕的是,為研究生設計實驗的那位博士數月的努力可能也付諸東流了。

圖丨高效運行中的Zymergen自動化設備

然而,人工智慧為生物技術領域帶來的也不全是驚喜。在嘗試利用AI技術解讀數據和設計實驗之後,也有一些生物學家表示失望。

斯坦福大學計算生物化學家Rhiju Das的主要工作是研究分子如何折疊以設計新藥。他表示,目前的機器學習方法仍然無法完成相應任務。與人類科學家相比,AI在RNA設計問題上的表現非常糟糕,這些“設計”任務似乎還是需要人類的直覺。

圖丨Zymergen公司的自動化設備

此外,人工智慧的“黑盒子”問題在生物技術領域似乎表現得更為突出,由 AI 控制的研究工作所取得成果將缺乏可解釋性。

對此,卡內基·梅隆大學的電腦科學家Adrien Treuille提出了一個有趣的觀點:我們正在離“可解釋的”科學時代越來越遠。研究人員不僅要依靠電腦來從事科研,而且甚至需要電腦去解釋其中的原理。生物學如此複雜,而目前的AI技術又處於起步階段,把一切都交給電腦,人類真的能放心嗎?

圖丨Zymergen公司的首席執行官Joshua Hoffman

Zymergen的做法代表了生物技術公司的一種趨勢:利用人工智慧來增強、甚至取代人類在科學研究中的作用,即實現“AI驅動的生物技術”。

從宏觀上看,就像工廠裡的生產流水線一樣,科學發現也是一個循序漸進的過程:科學家們發表論文,然後指導在實驗室中完成實驗,進而得到全新的發現,最終又會以科學論文的形式呈現出來。這是一個標準的週期,就連當今最典型的人工智慧以自動化的優勢代替人力勞動也是遵循這個路線:

圖丨“AI驅動的生物技術”流程圖

作為上述“AI驅動的生物技術”中的重要環節,Zymergen所做的工作就是為生物燃料、塑膠、藥品等提供工業化的微生物配方。為了提高微生物的生產效率,客戶們往往會將主力菌種直接送到Zymergen,然後由那裡的機器人對每種微生物的基因進行分析和修補,從而得到一個高效版本的的工程微生物。

但問題是,那些被客戶送到Zymergen的微生物已經是高度優化過的。所以說,如果要在這個基礎上進一步提高效率,就只能進行更深層次的基因組研究、設計實驗、分析資料。換句話說,越是要壓榨出最後那點效率提升,越是要求更先進的技術手段。

圖丨Zymergen的實驗流程基本實現了完全自動化

那麼,究竟怎樣用演算法來設計實驗?一個原始微生物約有 5000 個基因,假設有10種可以改變給定的基因的方法,那麼就有了 5 萬種不同的組合。然後,可以用1000個菌株進行實驗,每一個菌株都有可能突變,也許 25 個菌株就會產生足夠的目標化學品。這樣的菌株就可以用於下一輪實驗育種,其餘的菌株則放入冷凍室。

實際上,只是盲目地提高效率並不會帶來科學發現上的重大進展。因為如果把所有的突變都組合成一個單一的微生物,往往不能達到“1+1>2”的效果,很有可能顧此失彼——微生物反而因此呈現出“病態”,這類病態菌株可能還不如先前未經改造的原始菌株。

因此,要選出正確的路徑,這就需要一張“地圖”。這張“地圖”可以顯示所有突變造成的影響,而且還是基於多個維度的,因為人類需要為機器學習設定一個方向。

舉例而言,在合成生物學中,一條代謝通路通常擁有十幾或幾十個基因表達產物——有些對生產率的改善微不足道,有些卻舉足輕重,而代謝通路之間也經常存在交流,互相調節。想要成功製造一個工程細菌,一般要經過成百上千次的實驗試錯,才能一步步逼近正確答案。

在分子生物學中所提到的“代謝通路”(metabolic pathway),通常是指某個或某幾個基因表達所涉及的全部酶或信號分子。細胞內這些不同代謝通路組成了代謝網路,令生物保持其內環境穩定。

然而,Zymergen的模式卻完全不同,他們專門為此開發了一套機器學習系統,讓人工智慧技術從浩如煙海的實驗資料中進行分析,指出代謝通路的要害,並根據需求找出相應的、能實現特定功能的基因表達,把這個表達寫入微生物中,最後生產出所需的微生物,從而避免了繁雜的試錯過程。

圖丨迷宮——細胞的代謝通路匯總

但是,這裡有個尷尬的問題:當機器人終於發現那些能提高產量的遺傳變化時,它們對背後具體的生物化學機制一無所知。

如果實驗不能加深我們對生物學原理的理解,那這真的能稱為“科學”麼?對於 Zymergen 的首席技術官 Aaron Kimball 來說,這個哲學觀點可能並不那麼重要,而且他的解釋也相當直接:“能給我們帶來收入的是最終結果,而不是我們是否明白其中的原理。”

到目前為止,Zymergen公司的機器人實驗室將化學生產微生物的效率提高了10%以上。這個數字看起來並不起眼,但要知道,化學工業中有一些部門十分依賴微生物發酵,一點小的技術改進都有可能節省大量的成本、帶來更多的收益,甚至會超過美國國家科學基金會 70 億美元的年度預算。

機器人也許會發現那些被科學家忽略了的有益遺傳變化,因為大多數能提高生產率的基因與人類所能預見的產物沒有直接關係。如果沒有正確的組合,一些基因可能根本無法表達。 Jed Dean說:“我已經在幾種不同的微生物中看到了這種模式。如果不使用機器學習,尋找正確的基因組合就像試圖破解極其複雜的密碼,人類的直覺和信心很容易被問題的複雜性所壓倒。”

圖丨人類的直覺會增加科學研究中的不確定性?

科學研究能在多大程度上交給機器來完成,不同領域的研究人員會有不同的答案。加州大學大衛斯分校電腦科學家Ilias Tagkopoulos認為:“為了最大限度地提高資訊收益,為了更接近目標,我們應該讓資料決定實驗步驟。”這位教授的研究領域是遺傳學,在他看起來永無止境的研究課題裡,包括了預測細菌如何適應不斷變化的醫院環境、設計出更健康的零食等諸多問題。

如果機器真的能夠在某些科研任務中取代部分人類勞動,想必很多科學家都會欣然接受。與工廠工人或計程車司機不同,大多數研究科學家都希望將部分工作自動化,特別是分子和細胞生物學,其中人工移液、培養細胞、菌落數量統計等繁瑣且高成本的環節尤其如此。

一名研究生的小失誤可能會浪費數周的辛苦工作。更糟糕的是,為研究生設計實驗的那位博士數月的努力可能也付諸東流了。

圖丨高效運行中的Zymergen自動化設備

然而,人工智慧為生物技術領域帶來的也不全是驚喜。在嘗試利用AI技術解讀數據和設計實驗之後,也有一些生物學家表示失望。

斯坦福大學計算生物化學家Rhiju Das的主要工作是研究分子如何折疊以設計新藥。他表示,目前的機器學習方法仍然無法完成相應任務。與人類科學家相比,AI在RNA設計問題上的表現非常糟糕,這些“設計”任務似乎還是需要人類的直覺。

圖丨Zymergen公司的自動化設備

此外,人工智慧的“黑盒子”問題在生物技術領域似乎表現得更為突出,由 AI 控制的研究工作所取得成果將缺乏可解釋性。

對此,卡內基·梅隆大學的電腦科學家Adrien Treuille提出了一個有趣的觀點:我們正在離“可解釋的”科學時代越來越遠。研究人員不僅要依靠電腦來從事科研,而且甚至需要電腦去解釋其中的原理。生物學如此複雜,而目前的AI技術又處於起步階段,把一切都交給電腦,人類真的能放心嗎?

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示