華文網

Google收購Kaggle!拿下最大機器學習及資料競賽平臺

李林 舒石 編譯整理

量子位·QbitAI 出品

全球最大的機器學習及資料科學競賽平臺Kaggle,

即將被Google收入囊中。來自TechCrunch的消息透露,雖然這項收購的細節尚未披露,但基本確定會在明天召開的Google三藩市Cloud Next大會上對外宣佈。

至於這兩家對收購傳聞的態度,Google依然是“不對傳聞置評”,TechCrunch電話聯繫了Kaggle聯合創始人、CEO Anthony Goldbloom,他的反應是“拒絕否認這項收購(declined to deny that the acquisition is happening)”。

Kaggle是2010年由Goldbloom和Ben Hamner聯合創立的,現在平臺上大約有100萬名資料科學家,基本上可以說是舉辦資料科學和機器學習競賽的不二之選。

月初,Google也用上了這個平臺,他們在Kaggle上舉辦的YouTube視頻分類比賽《Google Cloud & YouTube-8M Video Understanding Challenge》依然在進行中,總獎金額10萬美元,有235支隊伍參與。這個比賽的目標,是更好的用演算法對視頻進行等級分類。

這個比賽所用的資料集,就是YouTube發佈的700多萬部YouTube視頻,平均每個視頻已經打上3.4個標籤。比賽和Google雲計算平臺也有著密切的關聯。

目前在Kaggle上獎金最高的比賽是《Data Science Bowl 2017》,總獎金額100萬美元,目前有1377支隊伍參與角逐。今年的主題是如何通過大資料和人工智慧的方式,可以更早的對美國肺癌患者進行確診以及展開干預。

比賽的資料集,是美國國家癌症研究所提供的數千組高解析度肺部掃描資料。

Kaggle上參賽最多的挑戰是《Titanic: Machine Learning from Disaster》。這個項目要求參賽者使用機器學習的工具,

對泰坦尼克號上的乘客船員進行生存幾率預測。其實這是Kaggle的一個入門挑戰,適用于新手或者剛入門的資料科學家。

雖然Kaggle所處的行業競爭也很激烈,DrivenData、TopCoder、HackerRank等對手虎視眈眈,Kaggle依然借先發優勢和對細分領域的專注保持著領先地位。

Google這次收購看中的可能是Kaggle的用戶群體而非技術。

這次收購,可以說是買下了最大、最活躍的資料科學家社區,Google能夠借此提升這個人群的關注度。通過TensorFlow等開源專案,Google在做的也是這樣的事情。

從TechCrunch獲得的消息來看,Google會在收購後維持Kaggle平臺的運營,保持原有品牌。

和其他競賽平臺一樣,Kaggle上也有求職公告板,不知道Google對這一部分打算如何處置。

Kaggle自2010年成立以來,總共融資1250萬美元(資料來自Crunchbase,另一家創投資料庫PitchBook顯示是1275萬美元),

投資方包括Index Ventures,SV Angel,Max Levchin,Naval Ravikant,Google首席經濟學家Hal Varian,Khosla Ventures和尤裡·米爾納。

今天AI還搞了哪些大新聞?