您的位置:首頁>科技>正文

巨頭開源的機器學習框架:250萬行代碼,價值超8000萬美元

選自Medium

作者:Ben Blume

機器之心編譯

參與:李澤南

當今的科技公司面對開源幾乎都持有開放態度, 在穀歌、Facebook 等公司分別支持不同的機器學習框架之後, 百度、騰訊和阿裡巴巴也紛紛推出了自己的機器學習框架。 隨著資源的不斷豐富, 人工智慧的研究門檻正在降低, AI 領域正呈現繁榮的趨勢。 科技巨頭們為開源框架究竟做出了多少貢獻?近日, 來自風投機構 Atomico 的 Ben Blume(畢業于劍橋大學)做出了自己的估算, 在統計了各家公司和機構推出的 13 款機器學習框架後, 他認為這些共計超過 250 萬行代碼的框架價值超過 8000 萬美元。

上週五, 穀歌 DeepMind 發佈了基於 TensorFlow 的高級框架 Sonnet, 一個幫助開發者在 TensorFlow 中快速構建神經網路的開源模組。 這是一個具有重要意義的舉措, 它意味著來自 DeepMind 二百五十餘名頂級工程師的內部技術從此可以被世人所用。 從此, 所有開發者在面對機器學習問題時將變得更加從容。

事實上, 在過去幾年裡, 全世界最大的幾家科技公司(包括穀歌、Facebook、微軟、IBM、百度、亞馬遜、騰訊和阿裡巴巴等)和眾多大學實驗室已經開源了至少 250 萬行機器學習平臺的代碼, 這相當於超過 650 名開發者一年的工作量, 或 8000 萬美元的開發成本。

目前, 所有人都可以免費使用這些工具, 而其中的很多如 TensorFlow 和 Paddle 都擁有大量的學習資料和範例。 因此, 它們可以被視為任何想要投身機器學習領域公司令人難以置信的穩固基礎。

最受歡迎的幾種機器學習框架, 以代碼行數排序。

開源的大潮還在繼續, 具有學術背景的研究者和工程師正在推動他們在科技公司雇主不斷為開源社區做出貢獻。 這種現象引出了一個有關如何安置人才的有趣問題——人工智慧的生態系統需要的是所有人才集中在有限幾個機構中開展核心問題研究,

並不斷開源其重要研究成果;還是讓所有人才分散到大量小團隊中去解決應用方向的問題?

很多早期初創公司都在尋找機器學習人才的時候發現他們難以和穀歌、Facebook 這樣的公司競爭, 後者通常擁有大量資源, 為人工智慧研究提供了絕佳環境。 但如果大公司拒絕公開自己的研究成果, 僅僅為利潤考慮, 這種「囤積」人才的做法可能會打擊整個行業的創新。

幸運的是, 目前大多數公司都沒有做出這樣的選擇。 通過開源自己的研究, 這些公司正在通過向開發者提供構建機器學習業務的基礎工具加速自身以及行業的創新步伐。

現在看來效果是顯著的, 在領英網(LinkedIn)上, 已有超過 7000 個職位在要求中提到了上述機構推出的框架。

來自 FirstMark 的 Matt Turck 在最近一篇文章《Firing on All Cylinders: The 2017 Big Data Landscape》中寫道:

我們正在目睹新堆疊的出現, 其中大資料技術被用於核心資料工程的挑戰, 機器學習被用於從資料中挖掘價值(以分析、判斷或行動的形式)。 換句話說:大資料提供管道, 人工智慧帶來智慧。

我們正站在新變革的臨界點上:「大資料+人工智慧」堆疊強大到幾乎可以解決現實世界的任何問題。

即使是目前層出不窮的初級應用看起來也有很大潛力。 DeepMind 通過機器學習技術已將穀歌資料中心的冷卻系統能耗降低了 40%, 顯示了強大的能力。 除此之外, 醫療、農業、物流和公司業務流程等領域都已被機器學習滲透:

Kheiron 使用電腦視覺分析醫療影像, 並自動生成放射成像報告, 可節省放射科醫師 60% 的時間

Connecterra 正在使用機器學習分析部署在奶牛身上的感測器傳來的資料, 識別早期行為, 可將產奶量提高 20%

DigitalGenius 使用機器學習挖掘客戶服務資料, 以此並向客服人員提供有關回復內容的建議, 將生產力提高了大約 30%

經濟學中的正常收益率曲線

如果我們認為人工智慧的影響遵從正常收益率曲線,那麼「成熟度(Maturity)」就是發展人工智慧應用的投入,「收益(Yield)」是基於目前技術水準的改進潛力。令人興奮的是,目前我們在很多問題上都處於起步階段,投入獲得的回報是豐厚的。在未來十年裡,現有機器學習技術的收益曲線將會變得平緩,但目前來看大部分技術都是值得推進的。

雖然機器學習具有光明的前景,需要明確的是,目前構建人工智慧和機器學習驅動的公司並不是一件容易的事。所有初創企業都會面臨招聘人才、獲取訓練資料和進行商業驗證這三個挑戰。但隨著開源社區的繁榮以及更多需求的發掘,其中兩個問題都正被解決。良好的創業環境正為企業家、研究者和工程師鋪平道路。

經濟學中的正常收益率曲線

如果我們認為人工智慧的影響遵從正常收益率曲線,那麼「成熟度(Maturity)」就是發展人工智慧應用的投入,「收益(Yield)」是基於目前技術水準的改進潛力。令人興奮的是,目前我們在很多問題上都處於起步階段,投入獲得的回報是豐厚的。在未來十年裡,現有機器學習技術的收益曲線將會變得平緩,但目前來看大部分技術都是值得推進的。

雖然機器學習具有光明的前景,需要明確的是,目前構建人工智慧和機器學習驅動的公司並不是一件容易的事。所有初創企業都會面臨招聘人才、獲取訓練資料和進行商業驗證這三個挑戰。但隨著開源社區的繁榮以及更多需求的發掘,其中兩個問題都正被解決。良好的創業環境正為企業家、研究者和工程師鋪平道路。

Next Article
喜欢就按个赞吧!!!
点击关闭提示