您的位置:首頁>正文

圓桌論壇|“大資料小智慧”時代,資料隱私與資料共用間的鴻溝難以逾越

4月26日, GMIC大會在北京國家會議中心召開。 本屆大會主題為“AI”生萬物, 邀請政府官員、人工智慧領域科學家、企業家、投資人等各界人士共同探討最新趨勢。 全球人工智慧領袖峰會作為GMIC大會的首場峰會, 旨在探討在基礎硬體、大資料與開源平臺、深度學習為代表的演算法等人工智慧領域的深度洞見。

在主題為《AI技術和商業化》圓桌論壇中, 分享嘉賓為加州大學伯克利分校教授邁克爾·喬丹, IDG資本合夥人牛奎光, 騰訊AI實驗室主任張潼;該論壇由小米首席架構師、人工智慧與雲平臺副總裁崔寶秋主持。

以下為《AI技術和商業化》圓桌論壇實錄,

由品途商業評論(ID:pintu360)精編整理, 有刪減:

崔寶秋:大家下午好。 很高興請到業內AI領軍人物和大家做一個圓桌論壇。 我先簡單介紹下今天參與論壇的幾位嘉賓。 騰訊的張潼博士、Michael Jordan、IDG的牛奎光, 我在小米負責人工智慧與雲平臺。 Michael Jordan來自學術界, 牛總來自投資界。 希望今天的話題能夠爆發出火花。

第一個話題。 大家都知道, 2016年以來AI非常火, 很多公司在談“ABC”(AI、Bigdata、Cloud)、AI戰略和佈局。 中美互聯網巨頭公司是怎麼佈局AI的?在傳統系統架構中如何增加AI元素?今天我們就聽聽幾位嘉賓的分享。

張潼:現在AI等於非常火, 可以看到陸陸續續的一些所謂的AI研究院開始建立。 比較早的像微軟、Google、Facebook;國內的百度、阿裡、騰訊。 這件事總體來講有幾種原因。

一, 支援業務, 説明底層技術開發。 像騰訊AILab, 我們會和產品部門合作, 把技術放到產品中去;比如騰訊有內容, 我們會做內容理解或者推薦;騰訊有遊戲, 我們會做一些遊戲的AI落地;騰訊還有社交, 我們會根據一些場景做語音辨識類以及自然語言處理等技術, 然後在產品中運用。 所以大公司如果有一個AI團隊, 一定要基於自己的業務場景進行研究。

二, 做前沿研究, 包括發表文章、跟學術界合作;以及做開源技術;另外, 做能夠顯示AI能力的專案。 這是個逐漸的過程, 類似阿爾法狗專案。

三, 與產業結合, 比如給一些平臺提供API服務;

Michael Jordan:就我個人而言, 我認為不是微軟、Facebook或者Google這樣的巨頭公司技術領先, 而是基於事實的經驗, 比如亞馬遜在機器學習方面是最早開始研究和應用的。

上世紀九十年代, 亞馬遜就用AI和深度學習很好的進行供應鏈建模。 另外, 它們還做AB測試, 可以看一下亞馬遜網站, 每個圖元都做過AB測試, 亞馬遜知道這是正確的圖元、正確的顏色, 可以讓人們願意使用。 這都是很多年以前了。 AI只是簡單的數學, 是一種簡單的方式, 更有價值的是資料。 高品質的資料才可以生成相應的價值。

崔寶秋:接下來的問題比較具有挑戰性, 就是技術與商業之間的分歧。 這裡最主要的問題, 發展AI是技術優先還是商業優先?很多公司挖了很多教授和純研究人員, 可能因為種種原因技術落不了地, 很難推進AI戰略。

牛奎光:我大概從2014年開始看AI。 我覺得, 當時它本質上是計算能力大大增加、計算成本大大下降之後導致的結果。

在應用上, 很多電腦可以做的事情可以超過人。 這樣就帶來一大波AI應用的機會。 所以我們看到了像人臉識別、視覺識別、語音辨識, 能力提高了一大層, 包括自動駕駛。 應該說, 在“大資料、小智慧”的時代, AI應用取得了比較快的發展。

但就目前來講, 從研究的角度看, 其實在所謂的“小資料、大智慧”這個事情上還有很多基礎性理論沒有突破。 可能更多的是技術在單個地方應用, 比如視覺、語音類的, 以及某些特定行業語義的知識圖譜等。

我想, 如果前三年是某個單項技術引領企業發展重要的時候, 那麼經過這幾年的建設之後, 不斷進步的技術組合應該應用到具體的行業裡去,

這可能是接下來的一個趨勢或很大的機會。

張潼:就現在AI公司來講, 關鍵是怎麼形成壁壘, 在商業模式上非常重要, 因為很多技術到達一定程度後要依賴於商業。 所有公司做AI都要基於自己的場景來做。 所以跟企業的場景和資料非常相關。 另外, 技術一定要跟商業結合, 形成壁壘, 這樣別人才會很難進入。

崔寶秋:第三個話題, 大家可能比較感興趣。 關於大資料分享與隱私。 大數據前在AI浪潮中扮演著不可磨滅的角色。 你們如何看資料共用?資料隱私和大資料驅動決策之間的分歧如何解決?尤其, 最近Facebook發生的大資料醜聞。 這個話題大家怎麼看?

Michael Jordan:關於資料分享。 大家不應該把它看做是一個孤立的問題, 因為有時候涉及到醫療資料或者網路資料。

比如醫療資料,大家一定要保護病患隱私,但是我們也希望它能夠幫助我們得到醫療的改進,治療疾病,比如基因組序列,這是我自己的資料,我希望來決定我的資料怎麼被使用。如果你希望資料來説明我治療疾病,我可能願意給你提供資料。但是要用來銷售給公司,我就不同意了。所以我們需要比較一下,對於放棄隱私時所造成的後果會是什麼。

關於Facebook,我覺得它之所以是醜聞,是因為它並不會帶來很大價值,通過把我保密的資料銷售給別人,不能夠給我帶來價值,也不能給人帶來價值。當然,這是一種社會性網路,可是我是被迫參與的,我沒有給它提供更多資料,沒有獲得更多益處,它打破了一定的生態系統。

總之,我們現在要考慮利弊。我們也希望開發者瞭解這一點,我們並不是說資料分享就是糟糕的。當然了,當我們提到網路安全的時候,有些不一樣。

牛奎光:我對這個問題特別感興趣,而且我已經想了五六年了。現在資料是真正價值的承載者。資料的價值只有在流動過程中,才能更好的發揮價值。事實上,從2012年,從大資料這個詞熱起來,到現在,大家想一想你腦子裡有沒有一個NO.1的資料交易所,沒有。這個事的現象其實是為什麼呢?

第一,這跟資料本身的特點有關係,跟之前我們交換的東西不一樣。你交換了資料之後,別人可以很方便的拷貝一份。我們再去理解資料的本質,其實不是說資料本身不能夠被審計,而是說資料的加工方式不能被審計。也就是說,怎麼用資料,它的計算其實是特別重要的。但是計算也就意味著對資料的加工,目前在技術手段上是沒有辦法去審計的。

第二,數據是誰的。我們在社交網路上的資料,資料究竟是屬於我的還是屬於平臺的?或者有多少是屬於我的多少是屬於平臺的?在問這個問題之前,從社會學或者叫經濟學上講,它還得有一個成本可分擔的原則。就是說,由我去擁有我自己的資料,技術上這個成本是不是可行?在今天,有了像區塊鏈這樣的技術,使這個問題的解決開始有希望。

從我的角度上來講,我特別希望,這個問題被解決,資料絕對要流動起來,對所有的人都好。但是應該是以一個合理的方式流動。

張潼:這是一個非常核心的問題。因為大家如果刨去商業來談,如果資料能夠對人類產生價值的話肯定使越共用越好。但中間有幾個問題。第一,在商戰上,資料肯定是核心壁壘。有時候在公司內部都出現這樣的情況,各個組織之間不願意共用。第二,隱私問題。目前來講,沒有任何其他的激勵情況下,現在使用者資料基本上是輕易不能夠洩露的。

另外,其實資料交換起來也是存在幾個問題的,比如格式不一樣,如何做規劃,如何去髒資料等。還有一個問題,資料價值怎麼衡量。

崔寶秋:請幾位嘉賓每人用一兩句話,就這兩個話題表達你的觀點。第一個,現在AI創業公司從零開始,沒有資料,如何快速發展生存下去,它們的機會在哪裡?第二個,關於開源技術,也請三位各自發表一下觀點。

牛奎光:我覺得創業公司擁有的東西就是聰明的腦袋、努力工作和演算法,本質上講,就是對行業的理解,找到細分行業,通過能力來解決實際問題。第二個,我覺得開源是一個非常偉大的思想和想法。比如計算問題,如果能開源將是非常好的思維方式和解決方案。

Michael Jordan:開源在美國已經佔據上游了。其實很多東西都是開源的。有些公司會因為有很多開源技術而自豪,因為它們認為別人是可以站在巨人肩膀繼續開發的。所以開源是非常棒的一件事。

張潼:我個人很擁抱開源,中國相對來說在這方面發展不多,但是我相信未來這是會慢慢開始的。另外,從創業公司來講,可能有些人技術比較好,有基礎技術。另外,如果沒有資料,可以切入比較細的場景,通過案例積累技術和場景經驗。

崔寶秋:非常好。再次感謝三位業界領袖從不同角度對我們關心的幾大話題做出分析。今天由於時間關係不能再細細討論下去,再次感謝各位,也感謝各位聽眾,謝謝大家。

比如醫療資料,大家一定要保護病患隱私,但是我們也希望它能夠幫助我們得到醫療的改進,治療疾病,比如基因組序列,這是我自己的資料,我希望來決定我的資料怎麼被使用。如果你希望資料來説明我治療疾病,我可能願意給你提供資料。但是要用來銷售給公司,我就不同意了。所以我們需要比較一下,對於放棄隱私時所造成的後果會是什麼。

關於Facebook,我覺得它之所以是醜聞,是因為它並不會帶來很大價值,通過把我保密的資料銷售給別人,不能夠給我帶來價值,也不能給人帶來價值。當然,這是一種社會性網路,可是我是被迫參與的,我沒有給它提供更多資料,沒有獲得更多益處,它打破了一定的生態系統。

總之,我們現在要考慮利弊。我們也希望開發者瞭解這一點,我們並不是說資料分享就是糟糕的。當然了,當我們提到網路安全的時候,有些不一樣。

牛奎光:我對這個問題特別感興趣,而且我已經想了五六年了。現在資料是真正價值的承載者。資料的價值只有在流動過程中,才能更好的發揮價值。事實上,從2012年,從大資料這個詞熱起來,到現在,大家想一想你腦子裡有沒有一個NO.1的資料交易所,沒有。這個事的現象其實是為什麼呢?

第一,這跟資料本身的特點有關係,跟之前我們交換的東西不一樣。你交換了資料之後,別人可以很方便的拷貝一份。我們再去理解資料的本質,其實不是說資料本身不能夠被審計,而是說資料的加工方式不能被審計。也就是說,怎麼用資料,它的計算其實是特別重要的。但是計算也就意味著對資料的加工,目前在技術手段上是沒有辦法去審計的。

第二,數據是誰的。我們在社交網路上的資料,資料究竟是屬於我的還是屬於平臺的?或者有多少是屬於我的多少是屬於平臺的?在問這個問題之前,從社會學或者叫經濟學上講,它還得有一個成本可分擔的原則。就是說,由我去擁有我自己的資料,技術上這個成本是不是可行?在今天,有了像區塊鏈這樣的技術,使這個問題的解決開始有希望。

從我的角度上來講,我特別希望,這個問題被解決,資料絕對要流動起來,對所有的人都好。但是應該是以一個合理的方式流動。

張潼:這是一個非常核心的問題。因為大家如果刨去商業來談,如果資料能夠對人類產生價值的話肯定使越共用越好。但中間有幾個問題。第一,在商戰上,資料肯定是核心壁壘。有時候在公司內部都出現這樣的情況,各個組織之間不願意共用。第二,隱私問題。目前來講,沒有任何其他的激勵情況下,現在使用者資料基本上是輕易不能夠洩露的。

另外,其實資料交換起來也是存在幾個問題的,比如格式不一樣,如何做規劃,如何去髒資料等。還有一個問題,資料價值怎麼衡量。

崔寶秋:請幾位嘉賓每人用一兩句話,就這兩個話題表達你的觀點。第一個,現在AI創業公司從零開始,沒有資料,如何快速發展生存下去,它們的機會在哪裡?第二個,關於開源技術,也請三位各自發表一下觀點。

牛奎光:我覺得創業公司擁有的東西就是聰明的腦袋、努力工作和演算法,本質上講,就是對行業的理解,找到細分行業,通過能力來解決實際問題。第二個,我覺得開源是一個非常偉大的思想和想法。比如計算問題,如果能開源將是非常好的思維方式和解決方案。

Michael Jordan:開源在美國已經佔據上游了。其實很多東西都是開源的。有些公司會因為有很多開源技術而自豪,因為它們認為別人是可以站在巨人肩膀繼續開發的。所以開源是非常棒的一件事。

張潼:我個人很擁抱開源,中國相對來說在這方面發展不多,但是我相信未來這是會慢慢開始的。另外,從創業公司來講,可能有些人技術比較好,有基礎技術。另外,如果沒有資料,可以切入比較細的場景,通過案例積累技術和場景經驗。

崔寶秋:非常好。再次感謝三位業界領袖從不同角度對我們關心的幾大話題做出分析。今天由於時間關係不能再細細討論下去,再次感謝各位,也感謝各位聽眾,謝謝大家。

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示