您的位置:首頁>科技>正文

XSUMMIT|圓桌論壇:智慧型機器人與未來

為進一步推動中國乃至全球科技創新, 鼓勵並扶持創新發明者, 保障廣大創新成果得到轉化及應用, 2017年3月17日在北京國家會議中心隆重舉辦XSUMMIT未來科技峰會(簡稱:XSUMMIT峰會)。 第六屆全球遊戲大會暨XSUMMIT峰會的主題:“連接未來”, 是科技創新與文化創意方面的年度國際“雙創”盛典。 本屆XSUMMIT峰會議題圍繞人工智慧等前沿科技熱點展開, 邀請到多位極具聲望與影響力的科技界大牛到場分享, 共同展望未來。

一見CEO范曉燕, 圖靈機器人聯合創始人郭家, 達闥科技創始人兼CEO黃曉慶與Vinci智慧頭機創始人兼CEO朱大衛以“智慧型機器人與未來”為主題展開圓桌論壇對話, 以下為對話實錄:

范曉燕:非常有幸今天主持這個論壇。 今天臺上幾位嘉賓也是在這個行業內非常資深的創業者。 首先, 先從黃總這邊先做一個自我介紹。 介紹一下自己, 然後介紹一下公司的產品和業務。

黃曉慶:各位嘉賓大家好, 我是達闥科技黃曉慶, 我覺得今天參加這個會議非常有意思。 因為我不是做遊戲的, 我們現在做雲端機器人, 我們公司希望成為一個服務機器人的運營商。 但是我的兒子是搞遊戲的, 他現在在《英雄聯盟》的開發商。 他從小玩遊戲, 一直玩到大, 最後玩到遊戲專業, 畢業以後又搞遊戲。 所以我對遊戲行業的人挺熟, 大概知道你們玩什麼遊戲。 最核心的是我覺得機器人和遊戲之間, 特別是雲端機器人和遊戲之間就有一個不可分隔的聯繫。 如果我們來看一個大型的線上遊戲, 如果線上遊戲裡面的人物從螢幕裡面走出來, 嚴格地說他就是機器人。 今天我來到這兒可以跟大家交流, 我幾乎可以想像對MMO特別熟悉的人,

你們將來在雲端智慧時代應該有不可比擬的競爭優勢。 我也很希望有志於把虛擬遊戲人物從虛擬搬到實物世界的人才來找我。

朱大衛:大家好, 我叫朱大衛, 我們做的是一個Vinci智慧耳機。 其實我們做的事情相當於人在動態的場景中間解決一個讓人如何更好和資訊連接的一個問題。 最開始是音樂服務, 就是怎麼讓人可以在on the go這個場景下更好地聽歌。 我們做的是一個隨身攜帶的智慧型機器人的感覺。

包括在美國也好, Vinci也好。 從第一天開始, 因為我們要針對年輕人, 我們要給他提供一種新興的服務, 我覺得這裡面很重要的是遊戲化的設計, 比如用新的人工智慧技術再加上遊戲化的技術創新一種音樂服務,

這是我們Vinci正在做的。 所以, 簡單來說就是這樣。

郭家:大家好!我是來自圖靈機器人的郭家, 圖靈機器人可能有些朋友是知道的, 因為我們一直在做2B的生意, 就是跟開發者合作。 就是把我們核心技術提供給各種開發者做他們的產品。 機器人這個產品很廣, 我們公司只專注於語義分析和智慧對話, 所以我們一直做的就是説明虛擬機器人實現智慧對話這部分的功能。 為什麼到遊戲這邊跟大家聊聊, 也是因為有一些做遊戲的朋友用了我們的技術, 做一些他們自己的虛擬形象, 用在包括VR、APP上, 所以我們希望今天有更多的探討。

范曉燕:今年其實人工智慧是大家非常關注的一個領域, 整個投資也是非常熱, 也是一個非常大的風口。

前段時間我看達闥科技剛公佈了A輪一億美元的融資, 我想黃總能不能介紹一下這輪融資背後的故事, 包括這輪融資在後面佈局上有哪些戰略?

黃曉慶:對, 在2月23號我們做了一個產品發佈會宣佈了融資。 嚴格地說, 我們的產業目標是基於一個非常重要的假設, 這個假設就是我們如果要做出一個認知能力接近或者達到人的水準的一個電子大腦。 它理論上會比我們的大腦要大、重, 耗電超過100萬倍。 也就是說, 你不可能說有足夠的空間把這個大腦放在機器人頭上, 自然把這個大腦安放到我們的頭上。 因為我們的電子大腦是用電子技術, 也就是用電子導電。 但是, 我們人的大腦不是用電子技術, 我們的大腦嚴格地說是用例子在導電。 當然人的大腦是類比的,電腦是數位的,這裡有很多差異。可是通訊網路給我們帶來了機會,通訊網路傳送速率是我們人的神經系統傳送速率的一百萬倍。理論上講,我們可以把一個信號用一百毫秒的時間從一個點傳到幾萬公里之外,但是大自然只能把我們神經信號從大腦傳到腳下,可能還傳一半。如果從頭傳到腳要300毫秒,要知道大自然在這個領域裡面又比人類在運算和傳輸能力上又差一百萬倍,所以科學是公平的。雖然耗電、重量大了一百萬倍,但是性能會強大到多過一百萬倍。如果我們可以用這個技術把運算的能力用通訊能力置換,我們把大腦放在雲端,我們就可以造出跟人類一樣聰明的機器人,機器人變成了一個阿凡達。

我們為什麼要融資很多錢做這件事情,因為它需要很多基礎設施,我們要解決很多很困難的問題。最核心的問題我們要打造一個生態環境,也就是要在機器人領域裡面創造標準。像通信領域一樣,就是這個產業鏈要形成。看我們現在做的機器人。所有做的機器人都是從頭到尾自己幹,幹出來的東西基本上就是玩具,我說的是服務型機器人。所以,我們沒有形成工業能力,我們通信業是很嚴謹的。很優秀的工業能力和標準的架構,我們可以借鑒。所以,我們要去做這件事情,所以我們要去建一些網路,要能夠把機器人接到雲裡面。這不是容易的事情,要有性能和安全的保證。最終我們要有精神連接器,要保證做機器人的企業他們不需要去關心這個大腦的問題,他們也不需要去關心神經網路的問題,他們只關心身體的問題。然後我們給它打造一個控制器,他只要接進去就完成這個工作。所以,從這個角度來說,我們完成的架構可以為未來雲端機器人的架構打下一個基礎。同時,我們也完成了在資訊安全和雲端智慧領域的架構,所以我們也很希望和遊戲業合作。線上遊戲本來就是一個雲端智慧的架構,但是線上遊戲業在移動通信的產業裡面目前還是比較落後的,越來越多的遊戲開始從PC走向了移動。但是,這個趨勢是剛剛才開始。MMO線上遊戲在移動平臺上玩還是有一定的問題,有性能的問題,傳輸延時的問題,有本身的遊戲終端處理能力的問題。剛才Google的同事介紹了Daydream,不知道你們有沒有玩過Daydream,我是玩過,我一看頭暈,為什麼?它的處理能力太差了,沒有能夠達到比如30毫秒的處理延遲。所以轉頭的時候,人在轉,身體感覺你轉了,可是景色沒轉,延遲了大概100毫秒,那你就完蛋了。20分鐘,我估計你就歇菜了,要吐出來了。VR,我問我們家小孩,你玩不玩VR?他說我認為VR未來沒戲?我說為什麼?他說VR如果有戲,玩遊戲的人至少要玩40分鐘不會頭暈。現在所有人玩20分鐘就頭暈了,所以如果VR不解決這個問題,我估計就沒戲。

范曉燕:黃總之前也在運營商這塊做了很多年,有非常豐富的經驗,所以其實在人工智慧整個生態體系下做了很大的基礎戰略的佈局。我覺得能夠為未來的很多中小公司提供更多的基礎和幫助。朱總怎麼看待這波人工智慧的熱潮?

朱大衛:我們現在講的人工智慧好像有點大,有點寬。在美國分成三個部分,這個潮流裡面大家會比較那個什麼的。第一塊,比如MLAAS,就是可能一些新的技術出來做服務端,也適應了中國2B的一些服務。其實是說以前在中國很多2B市場還沒有特別成熟,現在正好興起了,我覺得還是能夠創造一些價值,還是蠻清晰的。這是一方面。第二,比如語音辨識在一些垂直領域的技術比較成熟,會產生一些垂直的服務應用,我都是偏應用層面的做法。第三,美國才剛剛出來一個,包括特斯拉,也包括我們說到得自動駕駛之類的,它就是一個全棧設計的垂直型的解決方案。Vinci從2014年開始就希望說我們是on the go這個場景下去解決這個問題。因為這部分企業建立的維度和曾經我們看待這個用戶的需求,以及消費者維度和解決方案的需求跟原來的不太一樣。所以,我自己來看,我比較關注這三個方面。很多伺服器肯定雲端大腦幫你處理,這個我覺得還處於早期,還是一個基礎建設的鋪路階段。Vinci我們是2C的,我們也蠻少的,所以我們又要給大家創造價值。當然,我現在從home場景看,亞馬遜的衝擊還蠻大,它服務到一個爆發點,不斷地服務。今天是一個遊戲的探討,我認為如何用新的深度學習,或者對話交互。就是一系列的語音,這些交互對遊戲行業的改變。亞馬遜上面還蠻少的,但是我認為這是一個方向,就是如何一個對話式催生的一種新的遊戲化的設計是什麼樣的,我覺得也蠻好玩的。

范曉燕:上周你們剛在798發佈了新品,新品主打的功能也是基於社交和互動的場景?

朱大衛:是的,我們Vinci在2月27號發佈了新的一代中文版,這版其實早就在美國發佈了,在智慧耳機領域還是不錯,在美國融資超過一百美金。我們在中國主打了兩個部分,第一,還是我們原來聽懂你,包含語音辨識、語音理解,包括一定的情感計算。通過這樣我們做了一個相當於音樂這個垂直領域的一個東西。第二,我們也希望開始催生一些新的服務出現,就是基於那個場景。所以,我們做了一個一起聽,相當於讓用戶和用戶之間同時可以一塊來互動,這樣催生一些基於不同連接的一些服務出現。我們中文版上個月剛發佈。

范曉燕:圖靈機器人其實在業內也是最早一批的探索者,郭總對於整個線下人物發展的這個過程怎麼看。

郭家:確實圖靈機器人做的比較早,我們從2009年開始創業,2010年註冊公司,那會兒不用說人工智慧,創業熱潮還沒有到來,那時候確實比較苦,苦到什麼程度呢?我們當時覺得沒有人跟我們做一樣的事情,是不是這個事不靠譜。這兩年逐漸多了起來,我覺得也不是我們看好,而是大家都看好這個事情,所以還有的做,也是因為這幾年的基礎設施建設到了這個階段了。實話實說,如果現在回顧創業的前期,2010年做一個AI的東西是比較早,就是這個視窗期其實並不是很合適。我們熬了這麼多年,一開始都是在做一些很基礎,很底層的東西,搭建的也是很苦。所有的代碼都是用C語言寫,寫的也非常苦,就為了追求效率,不用Java,當時也沒有大規模的雲計算支撐。但是,現在其實大家都可以用深度學習做很多的資料訓練,並且很多交互都是通過雲端完成,而不是一個產品線的東西,這也是因為基礎設施建設到了一定程度。

回過頭來看剛才您問的人工智慧現在發展的階段,確實這個事情比較火,所以我們也被請到這裡跟大家分享一下。我相信大家也都很聰明,現在人工智慧我們關注它這麼久是因為本身它市場有需求。但是反過來講,如果這個市場需求淡下去了,或者從業者沒有做出好東西出來,大家的關注度也會下來。至於我們對人工智慧關注的高還是低,其實並不影響創業者本身做這個事情,而是市場導向的。它好就是好,不好就是不好,對於我們來說,現在就是繼續耕耘,把它做的使用價值越來越多,這是我們現在的主要任務。

范曉燕:這幾年見證圖靈的發展非常敬佩啊,確實一直在堅持在這個領域持續不斷的去探索。剛才我們提到了說風口,包括也是當下大家都很關注的。但其實我相信這裡面一定是也有不少坑,在座的今天也很多創業者,應該也都比較關注。所以,因為整個涉及到大家剛才提到的智慧型機器人這個領域,其實集合了很多技術,包括圖像識別,語音交互,這麼多技術整合在一起,我相信這裡面也會有很多的問題。

接下來想聽聽大家對於現在整個在智慧型機器人技術層面上,可能哪些技術還有不太完善的地方?

黃曉慶:實際上機器人是我們人類一直的夢想,我本人就是一個科幻迷。如果我們看科幻裡面最著名的機器人的小說就是機器人三定律,把那個叫做基礎序列,在這些書裡面。我們人類在五六十年前,在50年代,60年代寫的這些書,他已經開始在想,當機器人成為我們社會的一員之後給我們社會帶來的一些影響。實際上AI這個詞也是在1956年由兩個人提出,從這個角度來說,我們可以看到人工智慧有50年的發展了。但是,後來就死掉了,到80年代人工智慧就沒人搞了,最後覺得這個東西做不出來,一直到了十年前才深度學習,突然一下又發現了,我們可以解決一些過去解決不了的人工智慧問題。比如說圖像識別,比如說對自然語言的識別,不是理解,現在就進入了對自然語言的理解。然後,我們最近也開始進行翻譯。像Google,最近在翻譯領域做了特別多的工作,已經出來的結果是我們過去無法想像的。

也許深度學習是人工智慧未來發展的道路,發展的目標是很清楚的,我們一定要做成像人一樣能夠認知,至於我們能不能朝這條路上自己走,能夠產生機器的意識,這件事情我相信它只是一個時間問題。但是,我們在這兒暫且不談。為什麼呢?我個人認為,如果我們做出來的一個機器突然產生了意識,是不是要要求人權?所以,最好是讓機器人成為人形的機器,他不是人,他要是人,我們就完了。所以,我們必須要機器人繼續成為人形的機器。它的工作和能力是要代替我們人類完成一些我們不想做的工作。

現在在技術上我們能做到這一點嗎?我敢肯定我們今天絕對做不出一個人形的很美麗的家庭保姆型的機器人,通用型的,絕對做不出來。從技術上我們可以看到,如果從機器人的領域來看,比較強大的就是美國的波斯頓杜比博士,他做出來的機器人在雪地裡,你踢他一腳他也不會倒。現在以Google為首的,繼續做機器人大腦,Google在認知方面做了特別多的工作,去年我們可以看到他們做的工作,進步很快,這個希望大家關注一下。

就算這些進步,我們今天能看到的是它的差距還是很大。如果我們要讓機器人理解自然語言,現在我們的水準大概停留在一個任務型,就是你讓機器人訂票,打電話,這個我估計是沒問題的,但是要跟機器人聊天,如果大家可以試試小冰和度秘,你去聊天很快就會煩了,你的使用效率很低,就算回到亞馬遜的音樂機器人,我不知道你們有沒有去體驗,我反正用了,我告訴你們我不會用它。後來我很巧妙的問了下,它的日活率並不高,我有手機,為什麼還要買一個音樂機器人。它的核心是什麼?如果純粹的沒有目標的聊天,現在我們的機器還沒有達到這個水準,我估計至少還得三到五年的研發,我們才可以到隨隨便便和一個機器人聊天。我們知道有一個非常偉大的測試叫圖靈測試,我們現在的機器人絕對過不了圖靈測試。回到機器人技術本身,人形的機器人到今天可以到處走,我覺得要商用可能還得一段時間。

范曉燕:朱總您做的產品接近C端,C端消費者對體驗要求比較高,您覺得體驗上面有哪些技術是還有待成熟的地方嗎?

朱大衛:我先說一個大的概念,當我們談到科技的時候,這裡邊包含了,尤其談人工智慧技術的時候,我覺得有四個層面。第一,基礎科學化。比如說,剛才說到很多近似科幻的東西,是不是能在本身的角度實現了,當然很多演算法的paper,很多深度學習的paper,它準確描述了某一類技術今天到了什麼層面,比如人工智慧。我覺得大家對科幻的很多理解,其實從五幾年開始,因為之前我在麻省理工,我覺得非常多的這種真正的科學技術是從來沒停過的。當然,這塊基本上由學校來完成。

第二,我們近期的這個階段,是因為工程化,其實都是工程化的提升,因為基礎,當它基礎比如從基礎演算法上大家已經OK了的話,我們工程化是因為資料大,這樣我們投入精力,可以把它工程化。我覺得在不同垂直領域,工程化大家看到的成熟度比較高了。然後有自動駕駛,語音辨識,比如圖像識別,這些工程化的成熟度已經開始滿足可以開始做產品化。

第三,產品化。Vinci做的是人工智慧比較產品化也好,服務化也好,是體驗,我們直接面對使用者服務。王總剛才說的事實是對的,就是結論未必我同意,但是事實是,今天亞馬遜上用戶真正高頻使用的應用還是很少,很像iPhone在一代和二代s的時候。當後面一個新的入口出現的時候,這時候它的服務是不是夠廣,夠好,夠深,本身的確沒有到那個程度。Vinci當然今天是on the go場景下,只是一個音樂我們打磨了兩三年的時間,還在打磨。這個時候大家問它說產品化有沒有到能夠使用者可用,因為到產品化要準確描述,或者準確描述是這樣的,任何一個產品化的過程都是經過初期試用者。今天home場景已經到初期大眾人群,但是我們只對一些對科技很新鮮,對於音樂也多種需求,需求稍高一點,另外體驗準確描述,就是到了這個層面。比如我們在美國,我認為2017年on the go的數量不會超過幾十萬,中國也不會超過這個數量級,如果一下子跨越那個數量,說明它的服務是滿足不了的,這是一個正常的階段。拋開場景,拋開人群談技術有點虛幻,而我認為無非就是這三個場景,大的對人服務的場景,當然還有工業、交通,車場景,就是on the go這個場景,這三大場景,它需要的技術還不是完全一樣。比如on the go上我們當然希望雲端一個智慧大腦出現,這樣幫助我們把很多在雲端呈現出來了,當然我們也需要低功耗的計算平臺出現,今天速度還不能滿足真正完美的交互,因為本地這個如果再去雲端跑一下,它是需要大家去探討的,究竟是不是所有計算都要放到雲端。當然,有一部分我認為說像原來我們在設計一個phone的時候,比如點一下按鈕都要經過雲端去做,交互層面,或者服務層面我們要考慮它究竟放在哪裡。當然,低功耗、計算平臺我們也是比較期待的。

另外,我們現在做的比較多也是相當於自然語言理解這部分的工作。Vinci實際上是跟三角獸合作的,大家談到泛聊天的時候本身有很多挑戰,泛聊天如果背後沒有情感計算作為支撐,它從體驗上太差了,但是情感計算本身,我們如何通過語音,通過語言識別人的一種情感,如果任務不先做起來,意圖本身就有問題,意圖先做完了,可能情感還有很長的時間,如果我們說到產品化還有蠻長的時間要弄。據我所知MIT有很多Lab在做,就是真正從人的裡面分析很精准的情感,今天分析點很粗淺的情感,分成幾類還是問題不大,但是想要精確的描述這種東西,我個人覺得還有點遠,目前來說有點遠,但是這塊的技術如果從技術本身它會相當棒。

范曉燕:所以才有這麼多創業者前仆後繼湧到這個領域裡面來。郭總對這個問題什麼看法?

郭家:我特別同意剛才說的那一點,大家知道奇點來臨的那一天,大家說2045年,我算算2045年我正好退休。2045年我們才能實現強人工智慧,所以如果拿強人工智慧的標準衡量現在,現在確實沒有什麼意義。另外一個角度,我們也應該更關注到,現在有些東西已經在某些場景下可以運用人工智慧運用的非常好。比如其實我們經常大家會聊到語音辨識,然後視覺圖像識別這塊,但是其實很多人工智慧的技術並不只是這些大家看得見的東西,比如說我們做LP的分析,包括Alpha go做的這些智慧決策,所以,它最終反映在並不是像語音辨識,實際上是推動了背後的邏輯決策層,這個層面其實所需要的資料量跟其他的人工智慧演算法一樣,都是需要非常大量的。因為我們知道現在所有的人工智慧大家圍繞的主題就是比如說多層的神經網路深度學習做訓練,顧名思義我們圍繞的所有東西都是演算法+資料,演算法大部分是開源的,人工智慧領域98%的演算法是開源的,包括圖靈會貢獻很多演算法到開源社區上,也有各個國家的科學家貢獻各種演算法的資料。如果大家演算法不一樣,拼的就是資料,這也是我們一直以來投入,我們公司其實主要就是人頭費,投入的最大量就是資料,我們想方設法做開放,讓更多人加入進來,就是積累資料。現在我們有不到40萬的開發者,每個開發者都是貢獻資料,這是我們的價值,我們希望跟各式各樣的實體機器人,虛擬機器人合作,希望把資料收集起來,這也是我們共同的方向。

朱大衛:的確演算法是開源的,我希望這個世界是平的。我認為共有資料應該被開放,才能夠讓整個行業發展。但是作為企業來說,我們自己公司本身的價值在哪裡?我們做垂直場景,垂直人群的原因,就在於我們認為長遠看起來大家資料肯定很多,如何有自己的資料。另外,奇點這個事情,2045年也是一個假設。

黃曉慶:不是假設,是推測。

朱大衛:我今天說的觀點它是個假設,這個東西是不可以被計算的。或者我們根據自己人類的經驗都很難預測明天會發生什麼。這個我個人的觀點它最多能稱之為假設。

黃曉慶:不管2045,還是2035都沒有意義,有意義的是我們人類已經接近這個時間了,這是一個有意義的事情。

朱大衛:這個我不太同意。

黃曉慶:學電腦科學的人一定要樂觀。

朱大衛:但是不能盲目樂觀。

黃曉慶:我講幾件事情,因為我是做架構的,我講一個很簡單的,我是在搞電腦的人裡面比較少的比較懂生物學的,因為我從小喜歡生物。你們看一下,一個蚊子和蒼蠅有多少個神經元,根據科學家研究不會超過一萬個神經元,但是蚊子和蒼蠅可以到處亂飛,不會撞到人和樹,所以很明顯,飛行不需要特別多的智慧。蚊子和蒼蠅也會叫,但是叫不出好聽的聲音。再走一步,鳥也會飛,而且飛的可能比蚊子和蒼蠅有更高的水準,但是鳥很厲害的是,鳥開始會叫,所以他已經有很基礎的能力了。但是,鳥會特別高級的詞彙嗎?他也不會,儘管鸚鵡會講人話。再走一層,猩猩,猩猩開始有語言了,但是它的語言不會超過500個語言。

范曉燕:這裡面其實有一個邊界,然後它是進化的。

黃曉慶:但是人類所掌控的語言的詞彙是一百萬級來計算的,就是我們人類能掌握的知識,所以差異在什麼?這個差異就是一個指數曲線的成長。我們人的大腦有一千億個神經元,可是在這個蒼蠅的大腦裡面只有一萬個。所以,如果要到語言水準,就不能是蒼蠅水準的計算能力,這個是雲端智慧要解放人類從計算能力上,什麼東西放在上面,什麼東西放在下面,就是看和認知有多遠。離認知越近,就需要巨大的運算量,離認知遠,計算量的需求可能不大,這就是為什麼自動駕駛確實可以讓汽車自動開,但是你敢把車弄到街上去嗎?不行,因為它有交通規則,交通規則就是一個非常難的一個認知問題,然後如果一個城管把你車停下來,說你停這兒,您聽我的,這就是一個更高層次的。

范曉燕:剛才的辯論其實挺好,說明其實在整個技術的成熟度上,大家不管是在時間還是在維度對這個都有不同的理解。

接下來我們聊聊行業,其實去年我們自己也做了一個VR的峰會,當時也聚集了很多VR的技術的從業者。從去年開始到今年新技術也驅動了很多人創業。其實我認為創業者都很不容易,因為很多創業的成熟不光需要30年、50年,但是我們現在要在商業這個領域做出一些用戶或者市場能夠接受的產品不容易,我想問一下大家覺得人工智慧現在在商業領域商業上轉化最快的接受度最高的垂直領域是哪個領域?

黃曉慶:我覺得實際上有很多領域我們都可以採用人工智慧技術。我幾乎感覺,今天我們發現人工智慧對我們人類的潛在幫助,就像當年我們發現原來關係型數據庫可以説明我們去組織資料是一樣的,像我們發現了搜尋引擎可以幫助我們人類去尋找到所有的網頁是一樣的。這是一種新的工具,這種工具能夠幫我們解決很多問題。

現在到底什麼樣的東西我覺得適合於用人工智慧呢?我覺得有兩類,一類就是我們覺得特別垂直的應用,人工智慧的技術能夠非常有效的替代人的一些煩瑣的工作,可以做一些重複性的工作。比如說,美聯社就實驗用人工智慧的技術來寫上市企業發佈的財務報表的評論,結果發現非常的有效。因為那個寫法反正都差不多,就可以用機器來寫。人工智慧技術寫出來跟人的水準差不多,所以他們用機器來寫。在我做的領域裡面,我認定了一個方向,我不會做玩具,要做能夠在一部分功能上取代人的東西,什麼領域比較容易呢?我覺得醫療領域比較合適。它可以在醫療領域取代人的工作,這一定非常有用。所以我們做了導盲,如果讓盲人利用人工智慧的技術出行,能夠“看見”東西,當然不是真正地看見,我們是用其他的方法實現這個想法。這就是剛性的需求。類似這些領域也比較合適。

當然,娛樂是第二個領域。娛樂我們是沒有太關注,但是我相信有很多互聯網的企業他們會關注用人工智慧的技術來娛樂。我覺得這也是非常有前景的。但是,把人工智慧設計為小孩的玩具我覺得沒戲。一個3歲的小孩,只要三天或者甚至不到三天的時間就能把它毀了。這是大人沒有辦法阻止的。

范曉燕:朱總講講。

朱大衛:講到商業化我們的角度就開始要發生變化了,商業化就是嫁接技術和使用者需求,或者為人服務,起碼先說這個角度,我們目前首先它肯定是為人服務的。這就是商業價值。這裡邊其實可以從簡單來說,無非就是兩種。第一,大家很容易去想到的就是比如提高效率,這個可以說是任何一個科技出來的時候蠻低價,就是直接邏輯。比如我們有了機器學習,可以在金融、保險,很多行業開始,比如寫文章,在這一類裡面是比較直接的一個邏輯,我覺得這塊是OK的。資料量夠大,我覺得這樣訓練,把人的工作替代掉,或者減輕人的工作輔助。如果再說的精准一點,一部分是替代,一部分是輔助,我覺得這樣不錯。

第二,其實資訊技術的產生更會催生大量的我都無法預知的服務。Vinci從第一天開始就有這個觀點:當新的技術到一定程度的時候,一定需要新的入口,新的交互。比如今天說到的Vinci打造的不會是一個新的生意入口,一個新的對話式交互,這個交互上它催生各種各樣新的服務,這個新的服務究竟是什麼?我認為我只能用一句話說,它是創新,它用來幹嘛?約束提高效率,像今天說的做遊戲,提高效率剩下的時間就得這個時候用新的這種做人工智慧的創新服務。我們利用這些垂直技術的發展,今天我自己個人的期待是它在未來的三年,從中文和英文領域會催生相當相當多我們以前都不知道叫它什麼的一些服務出現,這些才是真正恐怖的。

范曉燕:總結下來就是2B的需要提高效率,2C的需要提高體驗。

朱大衛:對。

范曉燕:郭總,我覺得圖靈這麼多年探索了各種各樣的方向,可不可以聽一下你們在商業化這個方向上的一些心得?

郭家:前面兩位已經說的比較明白了,我看在座的人也不多了,聊一聊一些資料,我覺得做一下支撐,這樣可能也是有一些乾貨在裡面。

我們一開始其實沒有去想開放技術以後有多大量,因為我們想像不到有誰會用對話式交互這種東西,結果後來每個月增長一萬個開發者,每個月每個月地增長,特別快,現在開放30幾個月,有30幾萬個開發者在裡面,所以說明這塊的需求很大。裡面是什麼人呢?有一個做遊戲的公司,就5個人,做一個類似于湯姆貓這樣的形象,去年3月份上線,每個月的收入十萬美元,就是五個人的團隊做,我也想像不到有這麼多人喜歡玩這種東西。其實你說我自己愛不愛玩,我其實也不愛玩,我也不知道為什麼就有那麼多人玩,娛樂方向確實要做好體驗。

從工具化角度來講,我們看到儘量把點做細才會有價值。我們都知道iPhone8明年要換OLED屏,為什麼這麼多年沒換,就是因為成本太高,因為OLED高分子以前都是人工一個一個篩選出來,現在MIT和哈佛大學一起做了一個很簡單的一步動作,就是用機器學習自動把這些篩選出來,就這一步讓成本大幅下降。

再舉個例子,我們知道大眾汽車十幾年前就有自動摩托車了,只要自動擋的基本上都有,我在大眾的同學說我們準確率已經很高了,90%幾為什麼沒有人用?我覺得如果錯一次我就不用了。

朱大衛:這就是為什麼真正到C端的時候,我們認為應該從音樂體驗開始的原因。一個是本身它就是一個剛需,在戶外走路的時候。另外,當技術還不是完全百分之百的可靠,環境比較複雜,各種條件比較複雜的時候,我們想一首歌聽如果準確率發生一點變化還是OK的,用戶能夠形成正回饋。但是,在某些領域,用戶剛需比較強的時候就要求非常高了,所以這個是一個麻煩。

黃曉慶:汽車內部的問題,90年代我就買過車,是支持語音辨識的。在4S店的時候你很高興,比如60到80分貝噪音的情況下這些語音辨識就壞掉了,所以到現在我覺得這也是一個難題。

朱大衛:這個就說到Vinci了,其實我們第一天選這個on the go頭機的原因就是因為它離嘴近,我們第一天就思考如何講座,因為離嘴近,當然美國有一些軍用技術是可以做到剛才咱們說的60到80分貝的降噪,這個我們會在今年夏天的新品中給大家亮相,真正讓語音這塊的輸入變得可靠起來。當然,穩定性、速度、降噪,我們覺得速度也是我們比較關注的一個,當然還包括功耗,光一個這麼細的一個問題,只是一個大家看似覺得語音辨識今天技術很完整了,但是真正應用到產品化還有A、B、C、D很多要解決的工程化問題。

范曉燕:特別感謝大家在商業化上面提供的非常誠懇,而且很乾貨的建議。最後一個問題,我們展望一下未來,未來一到三年,三年之內比如說其實每個公司都有機器人,你們的機器人在未來的三年會發展成什麼樣的功能,什麼樣的新的可能性,給大家描繪一個能夠打動在座大家的這麼一個場景。

黃曉慶:我覺得三年的時間,我們就會看到一些非常多的機器人的技術會進入到我們的日常生活。應該說,你可以看到比如我們現在做的一些雲端智慧領域,類似於我們在做導航的這樣的一些垂直的應用。你會看到更智慧的巡邏,就是安防的巡邏這樣的一些技術。你會看到在公共場所,比如說在物流領域這些可以在人行道上走的小車。在醫院我們現在在美國看到有很多醫院做這些。任務重複性,相對定義很清晰的我覺得能夠肯到,語音介面我覺得可以做到任務型的時候就很准了,要跟它聊天估計還會有問題。到了電腦視覺,我覺得基本上我們看到的今天就是用立體視覺可以有3D,在立體視覺的定義之下,也許在有結構光和無結構光綜合應用的情況下面可以實現釐米級甚至毫米級以上的這種機器人的視覺技術,我覺得是應該可以的。如果到釐米級,就意味著它可以把傢俱、床這些都可以放到正確的位置上,如果到毫米級,理論上可以幫你穿針,我覺得可以到這個水準。

朱大衛:我還是考慮的蠻小的,我認為在on the go這個場景下,我們希望這個對話式服務應該百花齊放的。當然,這個基本上都是任務型,以任務型為導向的,包含了我們日常說的通訊,溝通、娛樂、工具,圍繞這幾塊做的。我覺得在這一塊,今天在英文和中文都會呈現爆發式的增長,三年以內百萬級的服務問題不大,就是真正大家能用起來的任務型的服務。

第二,對於Vinci來說,我們希望三年之後會成為全球範圍之內,當然我們不只是在中國,因為我們在美國,包括在國際市場打開的比中國還要靠前一點,我們希望在國際市場中英文領域可以走在前面,然後成為on the go這個環境下真正對話式的入口就好了。

郭家:我覺得三年其實變化還是很大的,但是不會有想像中那麼大。因為其實在人類發展過程中大部分的工作是由於資訊更快速的、更流暢的發展,而在一些具體的適用性的產業上發展很慢。可以回顧一下,比如航空業,100多年來的發展非常慢,醫療業一兩百年發展都是非常慢,但是什麼發展快?信息業。我認為從整個產業角度來講,螢幕的東西會無處不在,桌子、椅子、牆,包括家裡的鏡子,螢幕類的會無處不在,資訊會無處不在,當都有螢幕,都有資訊,都上網之後,我們圖靈提供的價值就是讓它跟機器人助理的角色可以統一起來,也就是每個人基於不同的家庭場景不同,不同的設備下都有一個自己的虛擬助理。這個虛擬助理是我們考慮的,別的是圖靈不擅長的,我們把這個對話做好。

范曉燕:再次感謝大家給我們描繪了一個非常美好的人工智慧的未來,這個論壇到此結束!

關於GMGC:

GMGC成立於2012年9月,是全球協力廠商移動遊戲行業組織,目前在全球擁有30多個國家或地區近300名會員企業,成員中包含開發商、發行商、服務商、投資商等。GMGC秉持“共建共用,合作共贏”的理念,為產業上下游企業搭建合作、交流、學習的平臺,促進產業共同發展。由GMGC主辦的全球遊戲大會(GMGC北京)、全球遊戲開發者大會暨天府獎盛典(GMGC成都)、亞洲移動遊戲大會(GMGC馬尼拉)、中國(昆山)數字娛樂節(GMGC昆山)每年分別在北京、成都、上海、深圳、昆山乃至亞洲各大城市舉辦,上述活動已經發展成為業界最具規模和影響力的行業盛會,產業風向標。同時,GMGC還提供全方位的專屬會員的服務專案,如創新沙龍、全球商務考察、CEO晚餐會、GMGC之夜等商務社交活動,幫助中外會員企業拓展業務及建立更多的夥伴關係並促進發展。

當然人的大腦是類比的,電腦是數位的,這裡有很多差異。可是通訊網路給我們帶來了機會,通訊網路傳送速率是我們人的神經系統傳送速率的一百萬倍。理論上講,我們可以把一個信號用一百毫秒的時間從一個點傳到幾萬公里之外,但是大自然只能把我們神經信號從大腦傳到腳下,可能還傳一半。如果從頭傳到腳要300毫秒,要知道大自然在這個領域裡面又比人類在運算和傳輸能力上又差一百萬倍,所以科學是公平的。雖然耗電、重量大了一百萬倍,但是性能會強大到多過一百萬倍。如果我們可以用這個技術把運算的能力用通訊能力置換,我們把大腦放在雲端,我們就可以造出跟人類一樣聰明的機器人,機器人變成了一個阿凡達。

我們為什麼要融資很多錢做這件事情,因為它需要很多基礎設施,我們要解決很多很困難的問題。最核心的問題我們要打造一個生態環境,也就是要在機器人領域裡面創造標準。像通信領域一樣,就是這個產業鏈要形成。看我們現在做的機器人。所有做的機器人都是從頭到尾自己幹,幹出來的東西基本上就是玩具,我說的是服務型機器人。所以,我們沒有形成工業能力,我們通信業是很嚴謹的。很優秀的工業能力和標準的架構,我們可以借鑒。所以,我們要去做這件事情,所以我們要去建一些網路,要能夠把機器人接到雲裡面。這不是容易的事情,要有性能和安全的保證。最終我們要有精神連接器,要保證做機器人的企業他們不需要去關心這個大腦的問題,他們也不需要去關心神經網路的問題,他們只關心身體的問題。然後我們給它打造一個控制器,他只要接進去就完成這個工作。所以,從這個角度來說,我們完成的架構可以為未來雲端機器人的架構打下一個基礎。同時,我們也完成了在資訊安全和雲端智慧領域的架構,所以我們也很希望和遊戲業合作。線上遊戲本來就是一個雲端智慧的架構,但是線上遊戲業在移動通信的產業裡面目前還是比較落後的,越來越多的遊戲開始從PC走向了移動。但是,這個趨勢是剛剛才開始。MMO線上遊戲在移動平臺上玩還是有一定的問題,有性能的問題,傳輸延時的問題,有本身的遊戲終端處理能力的問題。剛才Google的同事介紹了Daydream,不知道你們有沒有玩過Daydream,我是玩過,我一看頭暈,為什麼?它的處理能力太差了,沒有能夠達到比如30毫秒的處理延遲。所以轉頭的時候,人在轉,身體感覺你轉了,可是景色沒轉,延遲了大概100毫秒,那你就完蛋了。20分鐘,我估計你就歇菜了,要吐出來了。VR,我問我們家小孩,你玩不玩VR?他說我認為VR未來沒戲?我說為什麼?他說VR如果有戲,玩遊戲的人至少要玩40分鐘不會頭暈。現在所有人玩20分鐘就頭暈了,所以如果VR不解決這個問題,我估計就沒戲。

范曉燕:黃總之前也在運營商這塊做了很多年,有非常豐富的經驗,所以其實在人工智慧整個生態體系下做了很大的基礎戰略的佈局。我覺得能夠為未來的很多中小公司提供更多的基礎和幫助。朱總怎麼看待這波人工智慧的熱潮?

朱大衛:我們現在講的人工智慧好像有點大,有點寬。在美國分成三個部分,這個潮流裡面大家會比較那個什麼的。第一塊,比如MLAAS,就是可能一些新的技術出來做服務端,也適應了中國2B的一些服務。其實是說以前在中國很多2B市場還沒有特別成熟,現在正好興起了,我覺得還是能夠創造一些價值,還是蠻清晰的。這是一方面。第二,比如語音辨識在一些垂直領域的技術比較成熟,會產生一些垂直的服務應用,我都是偏應用層面的做法。第三,美國才剛剛出來一個,包括特斯拉,也包括我們說到得自動駕駛之類的,它就是一個全棧設計的垂直型的解決方案。Vinci從2014年開始就希望說我們是on the go這個場景下去解決這個問題。因為這部分企業建立的維度和曾經我們看待這個用戶的需求,以及消費者維度和解決方案的需求跟原來的不太一樣。所以,我自己來看,我比較關注這三個方面。很多伺服器肯定雲端大腦幫你處理,這個我覺得還處於早期,還是一個基礎建設的鋪路階段。Vinci我們是2C的,我們也蠻少的,所以我們又要給大家創造價值。當然,我現在從home場景看,亞馬遜的衝擊還蠻大,它服務到一個爆發點,不斷地服務。今天是一個遊戲的探討,我認為如何用新的深度學習,或者對話交互。就是一系列的語音,這些交互對遊戲行業的改變。亞馬遜上面還蠻少的,但是我認為這是一個方向,就是如何一個對話式催生的一種新的遊戲化的設計是什麼樣的,我覺得也蠻好玩的。

范曉燕:上周你們剛在798發佈了新品,新品主打的功能也是基於社交和互動的場景?

朱大衛:是的,我們Vinci在2月27號發佈了新的一代中文版,這版其實早就在美國發佈了,在智慧耳機領域還是不錯,在美國融資超過一百美金。我們在中國主打了兩個部分,第一,還是我們原來聽懂你,包含語音辨識、語音理解,包括一定的情感計算。通過這樣我們做了一個相當於音樂這個垂直領域的一個東西。第二,我們也希望開始催生一些新的服務出現,就是基於那個場景。所以,我們做了一個一起聽,相當於讓用戶和用戶之間同時可以一塊來互動,這樣催生一些基於不同連接的一些服務出現。我們中文版上個月剛發佈。

范曉燕:圖靈機器人其實在業內也是最早一批的探索者,郭總對於整個線下人物發展的這個過程怎麼看。

郭家:確實圖靈機器人做的比較早,我們從2009年開始創業,2010年註冊公司,那會兒不用說人工智慧,創業熱潮還沒有到來,那時候確實比較苦,苦到什麼程度呢?我們當時覺得沒有人跟我們做一樣的事情,是不是這個事不靠譜。這兩年逐漸多了起來,我覺得也不是我們看好,而是大家都看好這個事情,所以還有的做,也是因為這幾年的基礎設施建設到了這個階段了。實話實說,如果現在回顧創業的前期,2010年做一個AI的東西是比較早,就是這個視窗期其實並不是很合適。我們熬了這麼多年,一開始都是在做一些很基礎,很底層的東西,搭建的也是很苦。所有的代碼都是用C語言寫,寫的也非常苦,就為了追求效率,不用Java,當時也沒有大規模的雲計算支撐。但是,現在其實大家都可以用深度學習做很多的資料訓練,並且很多交互都是通過雲端完成,而不是一個產品線的東西,這也是因為基礎設施建設到了一定程度。

回過頭來看剛才您問的人工智慧現在發展的階段,確實這個事情比較火,所以我們也被請到這裡跟大家分享一下。我相信大家也都很聰明,現在人工智慧我們關注它這麼久是因為本身它市場有需求。但是反過來講,如果這個市場需求淡下去了,或者從業者沒有做出好東西出來,大家的關注度也會下來。至於我們對人工智慧關注的高還是低,其實並不影響創業者本身做這個事情,而是市場導向的。它好就是好,不好就是不好,對於我們來說,現在就是繼續耕耘,把它做的使用價值越來越多,這是我們現在的主要任務。

范曉燕:這幾年見證圖靈的發展非常敬佩啊,確實一直在堅持在這個領域持續不斷的去探索。剛才我們提到了說風口,包括也是當下大家都很關注的。但其實我相信這裡面一定是也有不少坑,在座的今天也很多創業者,應該也都比較關注。所以,因為整個涉及到大家剛才提到的智慧型機器人這個領域,其實集合了很多技術,包括圖像識別,語音交互,這麼多技術整合在一起,我相信這裡面也會有很多的問題。

接下來想聽聽大家對於現在整個在智慧型機器人技術層面上,可能哪些技術還有不太完善的地方?

黃曉慶:實際上機器人是我們人類一直的夢想,我本人就是一個科幻迷。如果我們看科幻裡面最著名的機器人的小說就是機器人三定律,把那個叫做基礎序列,在這些書裡面。我們人類在五六十年前,在50年代,60年代寫的這些書,他已經開始在想,當機器人成為我們社會的一員之後給我們社會帶來的一些影響。實際上AI這個詞也是在1956年由兩個人提出,從這個角度來說,我們可以看到人工智慧有50年的發展了。但是,後來就死掉了,到80年代人工智慧就沒人搞了,最後覺得這個東西做不出來,一直到了十年前才深度學習,突然一下又發現了,我們可以解決一些過去解決不了的人工智慧問題。比如說圖像識別,比如說對自然語言的識別,不是理解,現在就進入了對自然語言的理解。然後,我們最近也開始進行翻譯。像Google,最近在翻譯領域做了特別多的工作,已經出來的結果是我們過去無法想像的。

也許深度學習是人工智慧未來發展的道路,發展的目標是很清楚的,我們一定要做成像人一樣能夠認知,至於我們能不能朝這條路上自己走,能夠產生機器的意識,這件事情我相信它只是一個時間問題。但是,我們在這兒暫且不談。為什麼呢?我個人認為,如果我們做出來的一個機器突然產生了意識,是不是要要求人權?所以,最好是讓機器人成為人形的機器,他不是人,他要是人,我們就完了。所以,我們必須要機器人繼續成為人形的機器。它的工作和能力是要代替我們人類完成一些我們不想做的工作。

現在在技術上我們能做到這一點嗎?我敢肯定我們今天絕對做不出一個人形的很美麗的家庭保姆型的機器人,通用型的,絕對做不出來。從技術上我們可以看到,如果從機器人的領域來看,比較強大的就是美國的波斯頓杜比博士,他做出來的機器人在雪地裡,你踢他一腳他也不會倒。現在以Google為首的,繼續做機器人大腦,Google在認知方面做了特別多的工作,去年我們可以看到他們做的工作,進步很快,這個希望大家關注一下。

就算這些進步,我們今天能看到的是它的差距還是很大。如果我們要讓機器人理解自然語言,現在我們的水準大概停留在一個任務型,就是你讓機器人訂票,打電話,這個我估計是沒問題的,但是要跟機器人聊天,如果大家可以試試小冰和度秘,你去聊天很快就會煩了,你的使用效率很低,就算回到亞馬遜的音樂機器人,我不知道你們有沒有去體驗,我反正用了,我告訴你們我不會用它。後來我很巧妙的問了下,它的日活率並不高,我有手機,為什麼還要買一個音樂機器人。它的核心是什麼?如果純粹的沒有目標的聊天,現在我們的機器還沒有達到這個水準,我估計至少還得三到五年的研發,我們才可以到隨隨便便和一個機器人聊天。我們知道有一個非常偉大的測試叫圖靈測試,我們現在的機器人絕對過不了圖靈測試。回到機器人技術本身,人形的機器人到今天可以到處走,我覺得要商用可能還得一段時間。

范曉燕:朱總您做的產品接近C端,C端消費者對體驗要求比較高,您覺得體驗上面有哪些技術是還有待成熟的地方嗎?

朱大衛:我先說一個大的概念,當我們談到科技的時候,這裡邊包含了,尤其談人工智慧技術的時候,我覺得有四個層面。第一,基礎科學化。比如說,剛才說到很多近似科幻的東西,是不是能在本身的角度實現了,當然很多演算法的paper,很多深度學習的paper,它準確描述了某一類技術今天到了什麼層面,比如人工智慧。我覺得大家對科幻的很多理解,其實從五幾年開始,因為之前我在麻省理工,我覺得非常多的這種真正的科學技術是從來沒停過的。當然,這塊基本上由學校來完成。

第二,我們近期的這個階段,是因為工程化,其實都是工程化的提升,因為基礎,當它基礎比如從基礎演算法上大家已經OK了的話,我們工程化是因為資料大,這樣我們投入精力,可以把它工程化。我覺得在不同垂直領域,工程化大家看到的成熟度比較高了。然後有自動駕駛,語音辨識,比如圖像識別,這些工程化的成熟度已經開始滿足可以開始做產品化。

第三,產品化。Vinci做的是人工智慧比較產品化也好,服務化也好,是體驗,我們直接面對使用者服務。王總剛才說的事實是對的,就是結論未必我同意,但是事實是,今天亞馬遜上用戶真正高頻使用的應用還是很少,很像iPhone在一代和二代s的時候。當後面一個新的入口出現的時候,這時候它的服務是不是夠廣,夠好,夠深,本身的確沒有到那個程度。Vinci當然今天是on the go場景下,只是一個音樂我們打磨了兩三年的時間,還在打磨。這個時候大家問它說產品化有沒有到能夠使用者可用,因為到產品化要準確描述,或者準確描述是這樣的,任何一個產品化的過程都是經過初期試用者。今天home場景已經到初期大眾人群,但是我們只對一些對科技很新鮮,對於音樂也多種需求,需求稍高一點,另外體驗準確描述,就是到了這個層面。比如我們在美國,我認為2017年on the go的數量不會超過幾十萬,中國也不會超過這個數量級,如果一下子跨越那個數量,說明它的服務是滿足不了的,這是一個正常的階段。拋開場景,拋開人群談技術有點虛幻,而我認為無非就是這三個場景,大的對人服務的場景,當然還有工業、交通,車場景,就是on the go這個場景,這三大場景,它需要的技術還不是完全一樣。比如on the go上我們當然希望雲端一個智慧大腦出現,這樣幫助我們把很多在雲端呈現出來了,當然我們也需要低功耗的計算平臺出現,今天速度還不能滿足真正完美的交互,因為本地這個如果再去雲端跑一下,它是需要大家去探討的,究竟是不是所有計算都要放到雲端。當然,有一部分我認為說像原來我們在設計一個phone的時候,比如點一下按鈕都要經過雲端去做,交互層面,或者服務層面我們要考慮它究竟放在哪裡。當然,低功耗、計算平臺我們也是比較期待的。

另外,我們現在做的比較多也是相當於自然語言理解這部分的工作。Vinci實際上是跟三角獸合作的,大家談到泛聊天的時候本身有很多挑戰,泛聊天如果背後沒有情感計算作為支撐,它從體驗上太差了,但是情感計算本身,我們如何通過語音,通過語言識別人的一種情感,如果任務不先做起來,意圖本身就有問題,意圖先做完了,可能情感還有很長的時間,如果我們說到產品化還有蠻長的時間要弄。據我所知MIT有很多Lab在做,就是真正從人的裡面分析很精准的情感,今天分析點很粗淺的情感,分成幾類還是問題不大,但是想要精確的描述這種東西,我個人覺得還有點遠,目前來說有點遠,但是這塊的技術如果從技術本身它會相當棒。

范曉燕:所以才有這麼多創業者前仆後繼湧到這個領域裡面來。郭總對這個問題什麼看法?

郭家:我特別同意剛才說的那一點,大家知道奇點來臨的那一天,大家說2045年,我算算2045年我正好退休。2045年我們才能實現強人工智慧,所以如果拿強人工智慧的標準衡量現在,現在確實沒有什麼意義。另外一個角度,我們也應該更關注到,現在有些東西已經在某些場景下可以運用人工智慧運用的非常好。比如其實我們經常大家會聊到語音辨識,然後視覺圖像識別這塊,但是其實很多人工智慧的技術並不只是這些大家看得見的東西,比如說我們做LP的分析,包括Alpha go做的這些智慧決策,所以,它最終反映在並不是像語音辨識,實際上是推動了背後的邏輯決策層,這個層面其實所需要的資料量跟其他的人工智慧演算法一樣,都是需要非常大量的。因為我們知道現在所有的人工智慧大家圍繞的主題就是比如說多層的神經網路深度學習做訓練,顧名思義我們圍繞的所有東西都是演算法+資料,演算法大部分是開源的,人工智慧領域98%的演算法是開源的,包括圖靈會貢獻很多演算法到開源社區上,也有各個國家的科學家貢獻各種演算法的資料。如果大家演算法不一樣,拼的就是資料,這也是我們一直以來投入,我們公司其實主要就是人頭費,投入的最大量就是資料,我們想方設法做開放,讓更多人加入進來,就是積累資料。現在我們有不到40萬的開發者,每個開發者都是貢獻資料,這是我們的價值,我們希望跟各式各樣的實體機器人,虛擬機器人合作,希望把資料收集起來,這也是我們共同的方向。

朱大衛:的確演算法是開源的,我希望這個世界是平的。我認為共有資料應該被開放,才能夠讓整個行業發展。但是作為企業來說,我們自己公司本身的價值在哪裡?我們做垂直場景,垂直人群的原因,就在於我們認為長遠看起來大家資料肯定很多,如何有自己的資料。另外,奇點這個事情,2045年也是一個假設。

黃曉慶:不是假設,是推測。

朱大衛:我今天說的觀點它是個假設,這個東西是不可以被計算的。或者我們根據自己人類的經驗都很難預測明天會發生什麼。這個我個人的觀點它最多能稱之為假設。

黃曉慶:不管2045,還是2035都沒有意義,有意義的是我們人類已經接近這個時間了,這是一個有意義的事情。

朱大衛:這個我不太同意。

黃曉慶:學電腦科學的人一定要樂觀。

朱大衛:但是不能盲目樂觀。

黃曉慶:我講幾件事情,因為我是做架構的,我講一個很簡單的,我是在搞電腦的人裡面比較少的比較懂生物學的,因為我從小喜歡生物。你們看一下,一個蚊子和蒼蠅有多少個神經元,根據科學家研究不會超過一萬個神經元,但是蚊子和蒼蠅可以到處亂飛,不會撞到人和樹,所以很明顯,飛行不需要特別多的智慧。蚊子和蒼蠅也會叫,但是叫不出好聽的聲音。再走一步,鳥也會飛,而且飛的可能比蚊子和蒼蠅有更高的水準,但是鳥很厲害的是,鳥開始會叫,所以他已經有很基礎的能力了。但是,鳥會特別高級的詞彙嗎?他也不會,儘管鸚鵡會講人話。再走一層,猩猩,猩猩開始有語言了,但是它的語言不會超過500個語言。

范曉燕:這裡面其實有一個邊界,然後它是進化的。

黃曉慶:但是人類所掌控的語言的詞彙是一百萬級來計算的,就是我們人類能掌握的知識,所以差異在什麼?這個差異就是一個指數曲線的成長。我們人的大腦有一千億個神經元,可是在這個蒼蠅的大腦裡面只有一萬個。所以,如果要到語言水準,就不能是蒼蠅水準的計算能力,這個是雲端智慧要解放人類從計算能力上,什麼東西放在上面,什麼東西放在下面,就是看和認知有多遠。離認知越近,就需要巨大的運算量,離認知遠,計算量的需求可能不大,這就是為什麼自動駕駛確實可以讓汽車自動開,但是你敢把車弄到街上去嗎?不行,因為它有交通規則,交通規則就是一個非常難的一個認知問題,然後如果一個城管把你車停下來,說你停這兒,您聽我的,這就是一個更高層次的。

范曉燕:剛才的辯論其實挺好,說明其實在整個技術的成熟度上,大家不管是在時間還是在維度對這個都有不同的理解。

接下來我們聊聊行業,其實去年我們自己也做了一個VR的峰會,當時也聚集了很多VR的技術的從業者。從去年開始到今年新技術也驅動了很多人創業。其實我認為創業者都很不容易,因為很多創業的成熟不光需要30年、50年,但是我們現在要在商業這個領域做出一些用戶或者市場能夠接受的產品不容易,我想問一下大家覺得人工智慧現在在商業領域商業上轉化最快的接受度最高的垂直領域是哪個領域?

黃曉慶:我覺得實際上有很多領域我們都可以採用人工智慧技術。我幾乎感覺,今天我們發現人工智慧對我們人類的潛在幫助,就像當年我們發現原來關係型數據庫可以説明我們去組織資料是一樣的,像我們發現了搜尋引擎可以幫助我們人類去尋找到所有的網頁是一樣的。這是一種新的工具,這種工具能夠幫我們解決很多問題。

現在到底什麼樣的東西我覺得適合於用人工智慧呢?我覺得有兩類,一類就是我們覺得特別垂直的應用,人工智慧的技術能夠非常有效的替代人的一些煩瑣的工作,可以做一些重複性的工作。比如說,美聯社就實驗用人工智慧的技術來寫上市企業發佈的財務報表的評論,結果發現非常的有效。因為那個寫法反正都差不多,就可以用機器來寫。人工智慧技術寫出來跟人的水準差不多,所以他們用機器來寫。在我做的領域裡面,我認定了一個方向,我不會做玩具,要做能夠在一部分功能上取代人的東西,什麼領域比較容易呢?我覺得醫療領域比較合適。它可以在醫療領域取代人的工作,這一定非常有用。所以我們做了導盲,如果讓盲人利用人工智慧的技術出行,能夠“看見”東西,當然不是真正地看見,我們是用其他的方法實現這個想法。這就是剛性的需求。類似這些領域也比較合適。

當然,娛樂是第二個領域。娛樂我們是沒有太關注,但是我相信有很多互聯網的企業他們會關注用人工智慧的技術來娛樂。我覺得這也是非常有前景的。但是,把人工智慧設計為小孩的玩具我覺得沒戲。一個3歲的小孩,只要三天或者甚至不到三天的時間就能把它毀了。這是大人沒有辦法阻止的。

范曉燕:朱總講講。

朱大衛:講到商業化我們的角度就開始要發生變化了,商業化就是嫁接技術和使用者需求,或者為人服務,起碼先說這個角度,我們目前首先它肯定是為人服務的。這就是商業價值。這裡邊其實可以從簡單來說,無非就是兩種。第一,大家很容易去想到的就是比如提高效率,這個可以說是任何一個科技出來的時候蠻低價,就是直接邏輯。比如我們有了機器學習,可以在金融、保險,很多行業開始,比如寫文章,在這一類裡面是比較直接的一個邏輯,我覺得這塊是OK的。資料量夠大,我覺得這樣訓練,把人的工作替代掉,或者減輕人的工作輔助。如果再說的精准一點,一部分是替代,一部分是輔助,我覺得這樣不錯。

第二,其實資訊技術的產生更會催生大量的我都無法預知的服務。Vinci從第一天開始就有這個觀點:當新的技術到一定程度的時候,一定需要新的入口,新的交互。比如今天說到的Vinci打造的不會是一個新的生意入口,一個新的對話式交互,這個交互上它催生各種各樣新的服務,這個新的服務究竟是什麼?我認為我只能用一句話說,它是創新,它用來幹嘛?約束提高效率,像今天說的做遊戲,提高效率剩下的時間就得這個時候用新的這種做人工智慧的創新服務。我們利用這些垂直技術的發展,今天我自己個人的期待是它在未來的三年,從中文和英文領域會催生相當相當多我們以前都不知道叫它什麼的一些服務出現,這些才是真正恐怖的。

范曉燕:總結下來就是2B的需要提高效率,2C的需要提高體驗。

朱大衛:對。

范曉燕:郭總,我覺得圖靈這麼多年探索了各種各樣的方向,可不可以聽一下你們在商業化這個方向上的一些心得?

郭家:前面兩位已經說的比較明白了,我看在座的人也不多了,聊一聊一些資料,我覺得做一下支撐,這樣可能也是有一些乾貨在裡面。

我們一開始其實沒有去想開放技術以後有多大量,因為我們想像不到有誰會用對話式交互這種東西,結果後來每個月增長一萬個開發者,每個月每個月地增長,特別快,現在開放30幾個月,有30幾萬個開發者在裡面,所以說明這塊的需求很大。裡面是什麼人呢?有一個做遊戲的公司,就5個人,做一個類似于湯姆貓這樣的形象,去年3月份上線,每個月的收入十萬美元,就是五個人的團隊做,我也想像不到有這麼多人喜歡玩這種東西。其實你說我自己愛不愛玩,我其實也不愛玩,我也不知道為什麼就有那麼多人玩,娛樂方向確實要做好體驗。

從工具化角度來講,我們看到儘量把點做細才會有價值。我們都知道iPhone8明年要換OLED屏,為什麼這麼多年沒換,就是因為成本太高,因為OLED高分子以前都是人工一個一個篩選出來,現在MIT和哈佛大學一起做了一個很簡單的一步動作,就是用機器學習自動把這些篩選出來,就這一步讓成本大幅下降。

再舉個例子,我們知道大眾汽車十幾年前就有自動摩托車了,只要自動擋的基本上都有,我在大眾的同學說我們準確率已經很高了,90%幾為什麼沒有人用?我覺得如果錯一次我就不用了。

朱大衛:這就是為什麼真正到C端的時候,我們認為應該從音樂體驗開始的原因。一個是本身它就是一個剛需,在戶外走路的時候。另外,當技術還不是完全百分之百的可靠,環境比較複雜,各種條件比較複雜的時候,我們想一首歌聽如果準確率發生一點變化還是OK的,用戶能夠形成正回饋。但是,在某些領域,用戶剛需比較強的時候就要求非常高了,所以這個是一個麻煩。

黃曉慶:汽車內部的問題,90年代我就買過車,是支持語音辨識的。在4S店的時候你很高興,比如60到80分貝噪音的情況下這些語音辨識就壞掉了,所以到現在我覺得這也是一個難題。

朱大衛:這個就說到Vinci了,其實我們第一天選這個on the go頭機的原因就是因為它離嘴近,我們第一天就思考如何講座,因為離嘴近,當然美國有一些軍用技術是可以做到剛才咱們說的60到80分貝的降噪,這個我們會在今年夏天的新品中給大家亮相,真正讓語音這塊的輸入變得可靠起來。當然,穩定性、速度、降噪,我們覺得速度也是我們比較關注的一個,當然還包括功耗,光一個這麼細的一個問題,只是一個大家看似覺得語音辨識今天技術很完整了,但是真正應用到產品化還有A、B、C、D很多要解決的工程化問題。

范曉燕:特別感謝大家在商業化上面提供的非常誠懇,而且很乾貨的建議。最後一個問題,我們展望一下未來,未來一到三年,三年之內比如說其實每個公司都有機器人,你們的機器人在未來的三年會發展成什麼樣的功能,什麼樣的新的可能性,給大家描繪一個能夠打動在座大家的這麼一個場景。

黃曉慶:我覺得三年的時間,我們就會看到一些非常多的機器人的技術會進入到我們的日常生活。應該說,你可以看到比如我們現在做的一些雲端智慧領域,類似於我們在做導航的這樣的一些垂直的應用。你會看到更智慧的巡邏,就是安防的巡邏這樣的一些技術。你會看到在公共場所,比如說在物流領域這些可以在人行道上走的小車。在醫院我們現在在美國看到有很多醫院做這些。任務重複性,相對定義很清晰的我覺得能夠肯到,語音介面我覺得可以做到任務型的時候就很准了,要跟它聊天估計還會有問題。到了電腦視覺,我覺得基本上我們看到的今天就是用立體視覺可以有3D,在立體視覺的定義之下,也許在有結構光和無結構光綜合應用的情況下面可以實現釐米級甚至毫米級以上的這種機器人的視覺技術,我覺得是應該可以的。如果到釐米級,就意味著它可以把傢俱、床這些都可以放到正確的位置上,如果到毫米級,理論上可以幫你穿針,我覺得可以到這個水準。

朱大衛:我還是考慮的蠻小的,我認為在on the go這個場景下,我們希望這個對話式服務應該百花齊放的。當然,這個基本上都是任務型,以任務型為導向的,包含了我們日常說的通訊,溝通、娛樂、工具,圍繞這幾塊做的。我覺得在這一塊,今天在英文和中文都會呈現爆發式的增長,三年以內百萬級的服務問題不大,就是真正大家能用起來的任務型的服務。

第二,對於Vinci來說,我們希望三年之後會成為全球範圍之內,當然我們不只是在中國,因為我們在美國,包括在國際市場打開的比中國還要靠前一點,我們希望在國際市場中英文領域可以走在前面,然後成為on the go這個環境下真正對話式的入口就好了。

郭家:我覺得三年其實變化還是很大的,但是不會有想像中那麼大。因為其實在人類發展過程中大部分的工作是由於資訊更快速的、更流暢的發展,而在一些具體的適用性的產業上發展很慢。可以回顧一下,比如航空業,100多年來的發展非常慢,醫療業一兩百年發展都是非常慢,但是什麼發展快?信息業。我認為從整個產業角度來講,螢幕的東西會無處不在,桌子、椅子、牆,包括家裡的鏡子,螢幕類的會無處不在,資訊會無處不在,當都有螢幕,都有資訊,都上網之後,我們圖靈提供的價值就是讓它跟機器人助理的角色可以統一起來,也就是每個人基於不同的家庭場景不同,不同的設備下都有一個自己的虛擬助理。這個虛擬助理是我們考慮的,別的是圖靈不擅長的,我們把這個對話做好。

范曉燕:再次感謝大家給我們描繪了一個非常美好的人工智慧的未來,這個論壇到此結束!

關於GMGC:

GMGC成立於2012年9月,是全球協力廠商移動遊戲行業組織,目前在全球擁有30多個國家或地區近300名會員企業,成員中包含開發商、發行商、服務商、投資商等。GMGC秉持“共建共用,合作共贏”的理念,為產業上下游企業搭建合作、交流、學習的平臺,促進產業共同發展。由GMGC主辦的全球遊戲大會(GMGC北京)、全球遊戲開發者大會暨天府獎盛典(GMGC成都)、亞洲移動遊戲大會(GMGC馬尼拉)、中國(昆山)數字娛樂節(GMGC昆山)每年分別在北京、成都、上海、深圳、昆山乃至亞洲各大城市舉辦,上述活動已經發展成為業界最具規模和影響力的行業盛會,產業風向標。同時,GMGC還提供全方位的專屬會員的服務專案,如創新沙龍、全球商務考察、CEO晚餐會、GMGC之夜等商務社交活動,幫助中外會員企業拓展業務及建立更多的夥伴關係並促進發展。

Next Article
喜欢就按个赞吧!!!
点击关闭提示