華文網

Cloudera聯合創始人:與其說是AI ,不如說是決策自動化|AI科學家談AI

一隻黑色水筆,加一塊白板,Cloudera聯合創始人Amr Awadallah就可以非常清楚地向你解釋一個個看起來晦澀難懂的技術名詞。

“我非常不喜歡人工智慧這個說法,現在更準確的說法是決策的自動化,

我們如何來搜集資料,利用資料進行分析,並盡可能多地讓機器做出一部分的決定。”他在白板前一邊寫下這些技術名詞並標明其歸屬於IaaS、PaaS和SaaS的哪一層,一邊向第一財經記者解釋說明諸如亞馬遜、微軟、IBM公司的發力點。

Amr Awadallah是Cloudera聯合創始人,也是這家今年剛剛在美IPO的機器學習和資料分析平臺提供商的CTO。他擁有埃及開羅大學電氣工程學學士學位與碩士學位,以及斯坦福大學電氣工程學博士學位。

2000年7月,Amr創辦的首家初創企業Viva Smartisan被雅虎收購,他此後曾擔任雅虎智慧產品工程部副總裁。2008年,他建立了Cloudera。

“我們的目標就是希望能夠正確使用分析解決今天還沒解決的問題。” Amr這樣定位自己在人工智慧領域中要做的事情。

用開源打破封閉

“我不喜歡那種靠著每年收取維護費用,但實際上什麼維護工作都沒有做的公司。” Amr說。他做了一套開源的構架,從Hadoop架構起家,

慢慢延伸出其他25種分析解決工具,形成了共用資料體驗平臺。

打造開源系統,提供共用資料體驗,這是Amr認為實現決策自動化的進步。“客戶並不是科技公司,他們是要用科技來解決自己的商業上的問題,除了像BAT這樣的公司,那些公司甚至都沒有動機和能力來做軟體上的程式設計。他們應該想的是如何利用這個平臺去成為更好的銀行、醫院、電信公司等等。” Amr說。

從Amr的角度而言,

Cloudera與微軟、亞馬遜是競合關係。一方面,微軟和亞馬遜提供的最底層的基礎架構,也就是IaaS,而另一方面在PaaS平臺上,客戶有著對SQL、機器學習、搜索和批量處理的需求。在這個領域,Cloudera要直面和巨頭的競爭。“亞馬遜會對應不同的需求有不同的團隊獨立運作,但Cloudera希望把這些服務打通,方便使用者能夠在統一的平臺上進行管理和監測,同時滿足政府和審計的需求。” Amr說。

JP摩根就利用Cloudera平臺開發了一套軟體,

用於審核他們相關的法律文書和合同,律師的服務費很高,機器學習可以讓機器審核大部分的文稿,只有非常特別的條款才由律師完成。Amr說,10分鐘的機器審核可以節約人類14000個小時的工作時間。

如今,這個曾經獲得英特爾投資的公司已經有了20億美元的市值。

Amr更傾向於把IBM的Watson視為直接的對手。“Watson是一個黑盒子,你把資料要交給他們,你不知道他們是如何訓練的。

資料就是力量,Watson會提供給你一個看起來像醫生的系統,但作為客戶失去了自身價值的附加值,比如醫院、製造業,你會失去控制力。而我們開源的這個過程是完全對客戶可見 ,他們依然保留著智慧財產權,否則這對客戶將是一種傷害,因為他們就不會再去有智慧財產權,我們不是和他們在競爭。”他說。

在新模式方面,如果嘗試了開源,並讓企業客戶看到了機器學習的全過程,那麼這家企業的核心競爭力要如何保證?

為了保持商業模式的獨特性,Cloudera會進一步增加其他專屬的業務核心模組,比如用於監管、分發以及安全、加密、審計的模組還有資料備份是不開源的。

那麼為什麼這樣的軟體還沒有迅速普及?這樣的軟體通常會和客戶共同開發,也有人願意主動來進行協力廠商的開發,“律師事務所本身可能是沒有動力來做這樣的事情,因為這會侵害到他們的利益,可這是我們的客戶正是需要這個服務。” 目前,Cloudera前三大行業客戶分別來自金融、電信和政府領域,政府主要用它們來研究一些網路安全證券和反洗錢的問題。

這就是商機所在,也是為何當實力非凡的科技巨頭向各個行業滲透帶來變革時,人工智慧領域仍有新的企業異軍突起,向巨頭發出挑戰。

中國企業迎頭趕上

談到競爭,中國就是一個繞不開的市場。Amr也不否認這一點,“中國是一個非常重要的市場。”

在中國,也有不少企業與Cloudera的合作,比如美的通過與Cloudera合作全面融合了來自1萬多家旗艦店、3億用戶以及眾多合作夥伴、供應商、管道商的大量資料,重新構建IT系統、實現集中化管理,以解決找到使用者、使產品契合使用者需求、以合理價格完成銷售的三大核心問題。

“他們(客戶)會利用我們的開源軟體,也不需要給我們錢,直到他們找到了自己的附加價值所在,可以利用這個平臺進行不斷的嘗試,讓機器人做決定,一旦把真的可以投入生產,再來找我們把這件事上商業化,等到維護、運營和優化的時候再來找我們。”Amr說。

事實上,開源系統遵循著不同的協定。GPL的出發點是代碼的開源/免費使用和引用/修改/衍生代碼的開源/免費使用,但不允許修改後和衍生的代碼作為閉源的商務軟體發佈和銷售,代表之一是Linux。還有一類是BSD開源協議,這是一個讓使用者可以自由使用、修改原始程式碼,也可以將修改後的代碼作為開源或者專有軟體再發佈。

Cloudera選擇了BSD開源協議,這就註定是一條長期的道路。目前根據Cloudera在SEC披露的文件,公司雖然在2016年和2017年上半年分別營收2.61億美元和1.69億美元,但仍處於淨虧損狀態。 “我們的合作目標就是全球8000家能夠每年營收在100億美元以上的企業。” Amr說。

在這一點上,中國企業也在發揮自己在開源系統上的作用,例如華為。“我們不做(軟硬結合的方案)這樣的事情,但是良性的競爭可以更好地促進市場發展。”

作為勞動者,AI的應用帶來工作的變化又該如何應對?這是每一個人都在關心的問題。 Amr 只對此發表了個人看法:“我們可能再也不能夠從學校畢業之後就出去當律師,然後幹60年。未來的工作,除了真正需要20%的專家之外,剩下的80%的人可能都不會有工作了。”因此他的建議是“要成為非常快速的學習者”。

那麼這家企業的核心競爭力要如何保證?

為了保持商業模式的獨特性,Cloudera會進一步增加其他專屬的業務核心模組,比如用於監管、分發以及安全、加密、審計的模組還有資料備份是不開源的。

那麼為什麼這樣的軟體還沒有迅速普及?這樣的軟體通常會和客戶共同開發,也有人願意主動來進行協力廠商的開發,“律師事務所本身可能是沒有動力來做這樣的事情,因為這會侵害到他們的利益,可這是我們的客戶正是需要這個服務。” 目前,Cloudera前三大行業客戶分別來自金融、電信和政府領域,政府主要用它們來研究一些網路安全證券和反洗錢的問題。

這就是商機所在,也是為何當實力非凡的科技巨頭向各個行業滲透帶來變革時,人工智慧領域仍有新的企業異軍突起,向巨頭發出挑戰。

中國企業迎頭趕上

談到競爭,中國就是一個繞不開的市場。Amr也不否認這一點,“中國是一個非常重要的市場。”

在中國,也有不少企業與Cloudera的合作,比如美的通過與Cloudera合作全面融合了來自1萬多家旗艦店、3億用戶以及眾多合作夥伴、供應商、管道商的大量資料,重新構建IT系統、實現集中化管理,以解決找到使用者、使產品契合使用者需求、以合理價格完成銷售的三大核心問題。

“他們(客戶)會利用我們的開源軟體,也不需要給我們錢,直到他們找到了自己的附加價值所在,可以利用這個平臺進行不斷的嘗試,讓機器人做決定,一旦把真的可以投入生產,再來找我們把這件事上商業化,等到維護、運營和優化的時候再來找我們。”Amr說。

事實上,開源系統遵循著不同的協定。GPL的出發點是代碼的開源/免費使用和引用/修改/衍生代碼的開源/免費使用,但不允許修改後和衍生的代碼作為閉源的商務軟體發佈和銷售,代表之一是Linux。還有一類是BSD開源協議,這是一個讓使用者可以自由使用、修改原始程式碼,也可以將修改後的代碼作為開源或者專有軟體再發佈。

Cloudera選擇了BSD開源協議,這就註定是一條長期的道路。目前根據Cloudera在SEC披露的文件,公司雖然在2016年和2017年上半年分別營收2.61億美元和1.69億美元,但仍處於淨虧損狀態。 “我們的合作目標就是全球8000家能夠每年營收在100億美元以上的企業。” Amr說。

在這一點上,中國企業也在發揮自己在開源系統上的作用,例如華為。“我們不做(軟硬結合的方案)這樣的事情,但是良性的競爭可以更好地促進市場發展。”

作為勞動者,AI的應用帶來工作的變化又該如何應對?這是每一個人都在關心的問題。 Amr 只對此發表了個人看法:“我們可能再也不能夠從學校畢業之後就出去當律師,然後幹60年。未來的工作,除了真正需要20%的專家之外,剩下的80%的人可能都不會有工作了。”因此他的建議是“要成為非常快速的學習者”。