您的位置:首頁>科技>正文

我覺得AI開發藥物炒過頭了,無論哈佛還是斯坦福,我用論文說話

大量投資正湧入人工智慧藥物研發領域。 Big Pharma投入鉅資, Sanofi和GSK藥物公司也分別與初創人工智慧公司Exscientia簽署了價值3億和4200萬美元的藥物研發協定。 矽谷風投公司Andreessen Horowitz成立了價值4.5億美元的生物投資基金, 致力於將人工智慧應用於藥物研發。 投資熱潮空前高漲, 眾多製藥或生物科技公司及投資者舉棋不定:2018年加入投資大軍, 還是伺機觀察?

筆者認為投資需謹慎。 坦白講, 人工智慧研究團隊經常誇大其研發成果, 炒作行為十分普遍。

為證實這一觀點, 我考察了big Pharma(藥物設備公司), AstraZeneca公司, Harvard和Stanford大學以及初創智慧公司Insilico Medicine近期開展的各項研究,

這些實驗室極具聲望, 研究也涉及其他領域。

其他公司的情況也不容樂觀。 例如, IBM Watson過度炒作其專利人工智慧平臺。 這一詭計幫助其逃避了公眾譴責, 在現實面前仍然不堪一擊。

然而, 並不意味應全盤否定人工智慧。 藥物研發屬於創新領域, 需緊跟時代潮流。 “第一個吃螃蟹”的公司會獲得巨大的競爭優勢, 可取的折中方案是快速且謹慎地採取行動, 需同時聘請非專業人員。

製藥公司可點擊此處連結http://www.startcrowd.club/, 諮詢Startcrowd獲取非專業服務。 Startcrowd雲平臺是家聚集了眾多人工智慧專家和愛好者, 擬提供的獨立的非專業服務。 各大公司可從網上教育中的佼佼者中挖掘人才, Startcrowd也因此避免了製藥業的利益衝突。

此種非專業服務有助於人們對機器輔助方法重拾信心。

製藥業行家都知道, 20世紀80年代製藥業曾出現“史詩級”失敗。 大型製藥公司未能兌現工業4.0製藥智慧化的承諾。

圖為1981年《財富》雜誌封面

筆者認為2018年這種情況將大有改觀。 一方面, 人工智慧發展突飛猛進;另一方面, 網上教育和社交媒體等新興力量崛起,

工業愈發受到制衡, 研發組織有望進一步發展。 同行審查機制也愈發開放, 打擊了虛假炒作。 而Startcrowd的目的就是加快這一進程。

接下來談談技術問題, 以近期的人工智慧炒作為例。

本篇論文(https://arxiv.org/abs/1701.01329)中, AstraZeneca研究團隊(聯手其他團隊)試圖借助迴圈神經網路和增強學習等技術製造新型分子。 這一論題至關重要, 因為人工智慧唯有實現製造工藝的多樣性, 才具備創新價值。

這篇文章之所以引起我的注意, 是因為其大篇幅評估這一模型, 似乎頗有深度。 文章介紹了基於穀本相似度(Tanimoto-similarity)與編輯距離(Levenshtein distance)的各種度量指標, 借助柱狀圖、小提琴圖和t-SNE(流體學習方法), 進行了大量視覺化處理。

然而, 文章中的所有測量都圍繞獨立的人工智慧分子與天然分子展開,

卻忽略了人工智慧分子間的距離, 造成了多樣性的假像:人工智慧分子與天然分子的遠距離會讓人們誤以為AI具有創造性, 並認為AI探索了化學界的新領域, 得到了如圖所示的成果:

真正的多樣性:人工智慧分子(藍)與天然分子(紅)

然而, 如果人工智慧分子間距離很小, 則表示該模型生成的大量分子全部位於同一位置, 毫無多樣性可言。 實際情況如圖所示:

多樣性假像:人工智慧分子(藍)與天然分子(紅)確實不同, 但各人工智慧分子幾近相同

簡言之, AstraZeneca發表的這篇文章刻意回避了要害問題。 且在近期的兩篇論文(https://arxiv.org/abs/1704.07555, https://arxiv.org/abs/1711.07839)也未解決該問題。

圖:棘手的要害問題

如想瞭解更多技術討論,請見本論文6-7頁(https://drive.google.com/file/d/1K7YxMUMEKLoCsFIE9GtCZbanhq6FXb6G/view)

哈佛大學某研究小組曾考察上述人工智慧生成的分子樣品,也發現其缺乏多樣性。該小組試圖糾正錯誤,並提出ORGAN模型,見這兩篇論文:https://arxiv.org/abs/1705.10843,https://chemrxiv.org/articles/ORGANIC_1_pdf/5309668/3。

該小組旨在建立名為“discriminator(鑒別器)”的另一神經網路鑒別生成物,否定反常的分子產物,從而生成多種化學產物,實現化學現實主義。該設計靈感來源於人工智慧領域的一個熱議概念,即生成式對抗網路(GAN)。

哈佛大學的設計很有趣,但評估方案卻很糟糕。他們宣稱ORGAN模型要比AstraZeneca的模型好得多,但評估依據僅憑自身觀察,沒有任何量化支持(見這篇論文第三頁https://arxiv.org/abs/1705.10843)。儘管開展了定量實驗,也無法證明其結論。

這也算是意料之中,因為哈佛大學研究小組與AstraZeneca一樣,只比較了人工智慧分子與天然分子間的距離,而避開比較人工智慧分子彼此間的距離。

此外,哈佛大學研究小組的模型訓練方法也存在漏洞。查看其訓練記錄(他們公開訓練記錄的做法值得讚揚)後便一目了然。該小組的鑒別器否定產物的標準十分嚴苛,過分追求完美,也基本上抵消了GAN的實用價值。

理由可能為,該研究小組的“完美”鑒別器來自SeqGAN論文,該篇論文闡述了建立ORGAN模型。然而,這只是推測,因為SeqGAN團隊與ORGAN團隊不同,未將訓練日誌公佈於眾,也就無人重複他們的實驗。

更多技術討論可見本篇文章5-6頁。筆者將該文章推送給了ORGAN團隊負責人Alan Aspuru-Guzik。他回答說:

我仍然在等待正式回應。

斯坦福大學的一支大型研究團隊旨在將人工智慧和深入學習應用於化學領域。團隊負責人Vijay Pande也是Andreessen Horowitz的創業投資人,共同管理該公司4.5億美元規模的生物基金。他們的王牌專案是分子網路(MoleculeNet),這是一個“測試分子性質機器學習方法而特別設計的標準檢查程式”,程式設計非常嚴格,含諸多化合物、圖表以及深度學習模型。特別是,該項目主要用於檢查graph-CNN和其他由斯坦福研究團隊開發的用於特定化學領域的神經網路。

然而,Pande團隊也忽略了一個明顯的要害問題,即未將其資料插入字元級卷積神經網路(character-level Convolutional Neural Network,簡稱char-CNN)。2015年以來,Char-CNN經常用於AI領域的文本處理,比Char-CNN更簡單。插入SMILES字串,即可使用Char-CNN。

他們為什麼要避免如此簡單的任務?其論文(https://arxiv.org/abs/1703.00564)第17頁中提到:

“Recent work has demonstrated the ability to learn useful representations from SMILES strings using more sophisticated methods, so it may be feasible to use SMILES strings for further learning tasks in the near future.”

“近期工作成果表明,可使用更複雜的方法,從SMILES字串中學習有用的表示,所以不久的將來,可將SMILES字串用於更複雜的機器學習任務。

坦白講,我很懷疑斯坦福大學團隊能否實現對其如此複雜的char-CNN。他們甚至在另一篇論文(https://arxiv.org/abs/1706.01643)中也使用了char-CNN。合理但又有失顏面的理由是,他們擔心或許char-CNN勝於其研發的模型。這意味著其傾心的graph-CNN模型將會被自己研發的MoleculeNet檢查程式駁回,有悖於團隊議程。

該團隊的議程是什麼?MoleculeNet模型與採用該模型的DeepChem庫密切相關。DeepChem是由斯坦福大學指導設計的開源庫。如果char-CNN比graph-CNN更好,那麼就無需使用DeepChem。因為若想建立先進模型,僅需使用簡單的TensorFlow或PyTorch。2018年,開源框架就是戰略資產。例如,穀歌借助開源Android佔領了移動作業系統市場。DeepChem也試圖佔領AI藥物研發市場,這或許就是MoleculeNet模型故意“忽略”char-CNN的原因。

DeepChem的使用體驗進一步驗證了我的猜想。我曾嘗試在項目中使用DeepChem,卻發現不能混用DeepChem模型和非DeepChem模型。然而,混用DeepChem鑒別器和非DeepChem生成器十分有利於對抗訓練。但我僅能使用DeepChem代碼,此等霸王條款完全出乎我的意料。為擺脫桎梏,實現開源DeepChem,我不得不破解其複雜代碼(破解版DeepChem的連結在此https://github.com/mostafachatillon/deepchem)。多虧項目並非十分複雜,不然很難做到這一點。所以我認為,DeepChem想要採用封閉的技術策略佔領AI的化學應用領域。鑒此,DeepChem與Marc Andreessen投資合作便不足為奇。

圖:DeepChem和Andreessen Horowitz擬採用封閉技術使佔領AI化學市場。

MoleculeNet團隊成員雖未對char-CNN進行基準測試,但卻為MoleculeNet和DeepChem設計精緻的登陸頁面,這表明他們會優先考慮PR,而非科學。這是矽谷典型的戰略,創業公司設計類比產品來吸引流量,然後依靠研究團隊建立真實產品。

圖:矽谷深知門面比實力更有用

在生成模型領域,Insilico Medicine是眾多AI創業公司中的先驅。本論文(http://pubs.acs.org/doi/abs/10.1021/acs.molpharmaceut.7b00346)中(可使用Sci-Hub破解付費門檻),Alex Zhavoronkov及其團隊提出了一種先進的“生成對抗自編碼器模型”,即 DruGAN。我一直懷疑這一模型的先進之處。

滿足藥物研發需求方面,它不夠先進。其缺陷與其他生成模型相同,可能會導致失敗。

此外,相較於先前使用了更複雜工具的文獻而言,它也不先進。Alex Zhavoronkov在其文中第9-10頁有所提及,但未引用:

本研究使用的MACCS分子指紋並非分子結構的理想表達。SMILES(文章地址:https://arxiv.org/abs/1610.02415)、InChI及分子圖(文章地址:https://arxiv.org/abs/1603.00856)。此外,更多其他化學和生物相關的分子結構表達或可作為更好的模型訓練方法。

該團隊用於基準測試的變分自動編碼器(VAE)也並不先進。文章中提及,DruGAN比VAE更先進。但Github上的一位DruGAN設計者卻不這麼認為:

實際上,我們未像AAE(DruGAN)那樣調整VAE網路,所以這種比較不公平。我認為可以引入VAE,超越AAE。

因此,我認為,DruGAN僅比其8個月前發表的文章中模型先進一些。整篇文章反復提及他們對之前工作所做的改進,所以所謂的“先進”也只是一種自我進步。

結論

總之,許多AI藥物研發人員都過分炒作其研究成果和發現。為進一步消除AI炒作現象,引入強大的反專業服務至關重要。Startcrowd可提供類似服務。

編譯:科技行者

圖:棘手的要害問題

如想瞭解更多技術討論,請見本論文6-7頁(https://drive.google.com/file/d/1K7YxMUMEKLoCsFIE9GtCZbanhq6FXb6G/view)

哈佛大學某研究小組曾考察上述人工智慧生成的分子樣品,也發現其缺乏多樣性。該小組試圖糾正錯誤,並提出ORGAN模型,見這兩篇論文:https://arxiv.org/abs/1705.10843,https://chemrxiv.org/articles/ORGANIC_1_pdf/5309668/3。

該小組旨在建立名為“discriminator(鑒別器)”的另一神經網路鑒別生成物,否定反常的分子產物,從而生成多種化學產物,實現化學現實主義。該設計靈感來源於人工智慧領域的一個熱議概念,即生成式對抗網路(GAN)。

哈佛大學的設計很有趣,但評估方案卻很糟糕。他們宣稱ORGAN模型要比AstraZeneca的模型好得多,但評估依據僅憑自身觀察,沒有任何量化支持(見這篇論文第三頁https://arxiv.org/abs/1705.10843)。儘管開展了定量實驗,也無法證明其結論。

這也算是意料之中,因為哈佛大學研究小組與AstraZeneca一樣,只比較了人工智慧分子與天然分子間的距離,而避開比較人工智慧分子彼此間的距離。

此外,哈佛大學研究小組的模型訓練方法也存在漏洞。查看其訓練記錄(他們公開訓練記錄的做法值得讚揚)後便一目了然。該小組的鑒別器否定產物的標準十分嚴苛,過分追求完美,也基本上抵消了GAN的實用價值。

理由可能為,該研究小組的“完美”鑒別器來自SeqGAN論文,該篇論文闡述了建立ORGAN模型。然而,這只是推測,因為SeqGAN團隊與ORGAN團隊不同,未將訓練日誌公佈於眾,也就無人重複他們的實驗。

更多技術討論可見本篇文章5-6頁。筆者將該文章推送給了ORGAN團隊負責人Alan Aspuru-Guzik。他回答說:

我仍然在等待正式回應。

斯坦福大學的一支大型研究團隊旨在將人工智慧和深入學習應用於化學領域。團隊負責人Vijay Pande也是Andreessen Horowitz的創業投資人,共同管理該公司4.5億美元規模的生物基金。他們的王牌專案是分子網路(MoleculeNet),這是一個“測試分子性質機器學習方法而特別設計的標準檢查程式”,程式設計非常嚴格,含諸多化合物、圖表以及深度學習模型。特別是,該項目主要用於檢查graph-CNN和其他由斯坦福研究團隊開發的用於特定化學領域的神經網路。

然而,Pande團隊也忽略了一個明顯的要害問題,即未將其資料插入字元級卷積神經網路(character-level Convolutional Neural Network,簡稱char-CNN)。2015年以來,Char-CNN經常用於AI領域的文本處理,比Char-CNN更簡單。插入SMILES字串,即可使用Char-CNN。

他們為什麼要避免如此簡單的任務?其論文(https://arxiv.org/abs/1703.00564)第17頁中提到:

“Recent work has demonstrated the ability to learn useful representations from SMILES strings using more sophisticated methods, so it may be feasible to use SMILES strings for further learning tasks in the near future.”

“近期工作成果表明,可使用更複雜的方法,從SMILES字串中學習有用的表示,所以不久的將來,可將SMILES字串用於更複雜的機器學習任務。

坦白講,我很懷疑斯坦福大學團隊能否實現對其如此複雜的char-CNN。他們甚至在另一篇論文(https://arxiv.org/abs/1706.01643)中也使用了char-CNN。合理但又有失顏面的理由是,他們擔心或許char-CNN勝於其研發的模型。這意味著其傾心的graph-CNN模型將會被自己研發的MoleculeNet檢查程式駁回,有悖於團隊議程。

該團隊的議程是什麼?MoleculeNet模型與採用該模型的DeepChem庫密切相關。DeepChem是由斯坦福大學指導設計的開源庫。如果char-CNN比graph-CNN更好,那麼就無需使用DeepChem。因為若想建立先進模型,僅需使用簡單的TensorFlow或PyTorch。2018年,開源框架就是戰略資產。例如,穀歌借助開源Android佔領了移動作業系統市場。DeepChem也試圖佔領AI藥物研發市場,這或許就是MoleculeNet模型故意“忽略”char-CNN的原因。

DeepChem的使用體驗進一步驗證了我的猜想。我曾嘗試在項目中使用DeepChem,卻發現不能混用DeepChem模型和非DeepChem模型。然而,混用DeepChem鑒別器和非DeepChem生成器十分有利於對抗訓練。但我僅能使用DeepChem代碼,此等霸王條款完全出乎我的意料。為擺脫桎梏,實現開源DeepChem,我不得不破解其複雜代碼(破解版DeepChem的連結在此https://github.com/mostafachatillon/deepchem)。多虧項目並非十分複雜,不然很難做到這一點。所以我認為,DeepChem想要採用封閉的技術策略佔領AI的化學應用領域。鑒此,DeepChem與Marc Andreessen投資合作便不足為奇。

圖:DeepChem和Andreessen Horowitz擬採用封閉技術使佔領AI化學市場。

MoleculeNet團隊成員雖未對char-CNN進行基準測試,但卻為MoleculeNet和DeepChem設計精緻的登陸頁面,這表明他們會優先考慮PR,而非科學。這是矽谷典型的戰略,創業公司設計類比產品來吸引流量,然後依靠研究團隊建立真實產品。

圖:矽谷深知門面比實力更有用

在生成模型領域,Insilico Medicine是眾多AI創業公司中的先驅。本論文(http://pubs.acs.org/doi/abs/10.1021/acs.molpharmaceut.7b00346)中(可使用Sci-Hub破解付費門檻),Alex Zhavoronkov及其團隊提出了一種先進的“生成對抗自編碼器模型”,即 DruGAN。我一直懷疑這一模型的先進之處。

滿足藥物研發需求方面,它不夠先進。其缺陷與其他生成模型相同,可能會導致失敗。

此外,相較於先前使用了更複雜工具的文獻而言,它也不先進。Alex Zhavoronkov在其文中第9-10頁有所提及,但未引用:

本研究使用的MACCS分子指紋並非分子結構的理想表達。SMILES(文章地址:https://arxiv.org/abs/1610.02415)、InChI及分子圖(文章地址:https://arxiv.org/abs/1603.00856)。此外,更多其他化學和生物相關的分子結構表達或可作為更好的模型訓練方法。

該團隊用於基準測試的變分自動編碼器(VAE)也並不先進。文章中提及,DruGAN比VAE更先進。但Github上的一位DruGAN設計者卻不這麼認為:

實際上,我們未像AAE(DruGAN)那樣調整VAE網路,所以這種比較不公平。我認為可以引入VAE,超越AAE。

因此,我認為,DruGAN僅比其8個月前發表的文章中模型先進一些。整篇文章反復提及他們對之前工作所做的改進,所以所謂的“先進”也只是一種自我進步。

結論

總之,許多AI藥物研發人員都過分炒作其研究成果和發現。為進一步消除AI炒作現象,引入強大的反專業服務至關重要。Startcrowd可提供類似服務。

編譯:科技行者

Next Article
喜欢就按个赞吧!!!
点击关闭提示