滴滴副總裁章文嵩表示, 滴滴所面臨的問題複雜度比 AlphaGo 要複雜得多。 棋聖聶衛平反問, 圍棋有 361個格子, 你知道這其中的變化量是多少嗎?
AI 科技評論按, 日前, 滴滴副總裁章文嵩的一段演講片段掀起了一波吐槽滴滴的高潮。
他的原文如下:
「所以說, 我們這個問題的複雜度, 比下圍棋要複雜一百倍以上, 就比 AlphaGo 面臨的問題複雜一百倍, 因為我們知道一天有 86400 秒, 如果除以兩秒鐘撮合一次, 我們的步數我們要考慮 43200 步, 我們知道下圍棋, 格子裡面只有 19 乘 19, 最多 361 步, 而且都有確定性的解, 是贏, 還是輸, 還是平局。 那我們實際上最優解是怎麼樣?都是目前我們在不斷反覆運算,
這段話核心觀點如下——滴滴所面臨的問題複雜度比 AlphaGo 要複雜得多。
但是事情已經發生, 出現了很多(讓人覺得標題沒常識的)新聞:
嗯, 對於演算法, 章文嵩根本就沒有進行比較(攤手)。
值得注意的一點是, 這些新聞都圍繞棋聖聶衛平展開。
據媒體報導, 在江蘇薑堰觀戰世界女子圍棋擂臺賽期間, 心直口快的聶衛平聽說了章文嵩的言論, 忍不住反問:
「我就問一句, 圍棋有 361 個格子, 你知道這其中的變化量是多少嗎?……中國圍棋協會主席林建超在擔任總參辦公廳主任時組織力量進行研究, 得出的結論是圍棋變化是 10 的 808 次方。 如果圍棋的演算法比滴滴都簡單, 何須擁有巨大資金和技術支撐的 AlphaGo 團隊出馬,
棋聖在這裡高冷地表示, 我們圍棋並不簡單。 當然, 他的這番言論中也出現了一個小 bug——「如果圍棋的演算法比滴滴都簡單」, 事實上章文嵩在演講中並沒有將兩者的演算法進行比較。
隨後, 章文嵩發文詳細說明了滴滴派單問題的複雜性:
在圍棋裡, 每一步落子都會影響棋局變化。 在 19*19 的棋盤上, 最多對弈 361 步, 若不考慮棋盤的對稱性, 圍棋的變化是 361 的階乘, 約 10 的 768 次方..., 這已經是一個驚人的量。
滴滴派單問題是極為複雜的時空調度問題, 一天有幾千萬乘客在不同的時空中發出需求, 也有大幾百萬司機在不同的時空出現, 每一次不同的派單都會影響不同的時空裡供需分佈,
圍棋的規則是確定的,是完美資訊博弈,AlphaZero 可以自己根據規則創造出棋譜,AlphaGo 和 AlphaZero 在圍棋上可以超過人類棋手。而在開放問題上,AlphaGo 和 AlphaZero 目前還不能超越人類,例如,在星際爭霸上還打不過人類,在王者榮耀上也勝不過人類。相信在大家共同努力下,技術不斷突破邊界,我們人類也有信心駕馭它,為人類的智慧不斷增長而服務。在不同的戰場,我們一起加油。
以上。
然而,不幸地是,他的話語又捅出了簍子。身為前阿裡雲 CTO,LVS(Linux Virtual Server)開源軟體創始人,雖然對技術是極懂的,但是看起來卻不那麼懂圍棋。
他說道,「我們知道下圍棋,格子裡面只有 19 乘 19,最多 361 步。」
隨後,他也為自己的失誤道歉並表示,雖然自己前面的說法有誤,但圍棋的複雜度並不是無限提升的:
但是,解決的問題越複雜就意味著更厲害嗎?
對於這一問題,其實已經有一大批知乎 er 展開了討論。
雖然提問的打開方式並不怎麼正確:
如何看待滴滴章文嵩稱,滴滴的演算法比 AlphaGo 複雜 100 倍?(章文嵩哪裡有說滴滴的演算法比 AlphaGo 複雜了???)
隨後引發了一大波不明真相的群眾的歪樓,大家都在嘲笑:
你這個演算法有什麼可比的。
演算法更複雜,不就證明代碼越費時費力,不就證明你的工程水準不高?
(不明覺厲)
當然,也有正正經經研究過事情始末的人,表達了這樣的言論:
從理論上來說兩個問題在很多層面上都是 NP-hard 的複雜度,無從談起誰更複雜,當事人只是要說明滴滴的時效性要求高、資料量大的事實。
在這兩種言論之間,也有人站在客觀的立場看待這一問題。
知乎上一位匿名使用者表示,雖然圍棋的複雜度或許更高,但從用戶體驗上來看,滴滴並沒有成功解決問題:
第一,圍棋場景複雜度也許更高。
圍棋的場景複雜度,並不在於其每一步最多 361 種選擇。它複雜在,坐在你對面是高智商的對手。需時刻提防對手隨時「留陷阱」,要每一步皆需統籌全域,並能大致預測對方接下來幾步落子位置,且要有與之相應的應對措施。
而滴滴的派單場景呢,沒有「高智商對手」主動「下絆子」是前提。在這種相對穩定又絕對動態的情境下進行派單。具體每一步的複雜程度有多高,按照章所言,43200 種選擇。
我沒有讀過 AlphaGo 源碼,所以只能做一個不負責的數字推斷:
鑒於隨著棋局的進行,每一步的落子選擇也減少,因而保守假設平均每一步有 100 種選擇。
之前看到報導說 AlphaGo 最多可以提前預判 50 步棋。如此,AlphaGo 每走一步棋需要考慮 100 的 50 次方。這個數字相信遠遠超過 43200 吧。
100 的 50 次方這個數字可能有點誇張,畢竟 AlphaGo 不是窮舉的。但是肯定不是章以為的「最多 361 種選擇」這麼簡單。
第二,用戶體驗上來看,滴滴沒有成功解決問題。
目前看來,AlphaGo 是成功解決了圍棋爭霸這個難題了。
至於滴滴嘛,他的派單演算法有多複雜先不談,但是其提供的服務說實話是沒辦法硬著脖子講「完全解決」這四個字的。
退一萬步講,假設派單場景確實比下圍棋複雜的多。那麼,章的行為就像某些人宣稱的:「我在試圖形成一個比相對論更高的模型,雖然還沒成功,但是我比愛因斯坦更偉大!」
第三,章文嵩本人非演算法領域。
有很多答主都提到了,他是阿裡的高級專家,是真正的系統級開發高手。但是問題就在這兒。
其實 AlphaGo 演算法跟系統開發是兩個截然不同的領域。
相比對演算法方面的評價,其實他在 AlphaGo 的網路延遲、分散式運算效率、CPU 利用率等問題上會更專業。
至於演算法複雜度,鑒於 Deep Learning 是強凸優化強矩陣變換的一種統計學習演算法,我相信滴滴內部的演算法相關負責人應該更有發言權。
AI 科技評論也將持續跟進這一問題的後續,敬請期待。
PS:關於滴滴的調度系統,滴滴研究院副院長、密西根大學終身教授葉傑平博士曾非常全面地進行了揭秘,大家可以在看過之後,再回望這場鬧劇。
不斷反覆運算和改進。圍棋的規則是確定的,是完美資訊博弈,AlphaZero 可以自己根據規則創造出棋譜,AlphaGo 和 AlphaZero 在圍棋上可以超過人類棋手。而在開放問題上,AlphaGo 和 AlphaZero 目前還不能超越人類,例如,在星際爭霸上還打不過人類,在王者榮耀上也勝不過人類。相信在大家共同努力下,技術不斷突破邊界,我們人類也有信心駕馭它,為人類的智慧不斷增長而服務。在不同的戰場,我們一起加油。
以上。
然而,不幸地是,他的話語又捅出了簍子。身為前阿裡雲 CTO,LVS(Linux Virtual Server)開源軟體創始人,雖然對技術是極懂的,但是看起來卻不那麼懂圍棋。
他說道,「我們知道下圍棋,格子裡面只有 19 乘 19,最多 361 步。」
隨後,他也為自己的失誤道歉並表示,雖然自己前面的說法有誤,但圍棋的複雜度並不是無限提升的:
但是,解決的問題越複雜就意味著更厲害嗎?
對於這一問題,其實已經有一大批知乎 er 展開了討論。
雖然提問的打開方式並不怎麼正確:
如何看待滴滴章文嵩稱,滴滴的演算法比 AlphaGo 複雜 100 倍?(章文嵩哪裡有說滴滴的演算法比 AlphaGo 複雜了???)
隨後引發了一大波不明真相的群眾的歪樓,大家都在嘲笑:
你這個演算法有什麼可比的。
演算法更複雜,不就證明代碼越費時費力,不就證明你的工程水準不高?
(不明覺厲)
當然,也有正正經經研究過事情始末的人,表達了這樣的言論:
從理論上來說兩個問題在很多層面上都是 NP-hard 的複雜度,無從談起誰更複雜,當事人只是要說明滴滴的時效性要求高、資料量大的事實。
在這兩種言論之間,也有人站在客觀的立場看待這一問題。
知乎上一位匿名使用者表示,雖然圍棋的複雜度或許更高,但從用戶體驗上來看,滴滴並沒有成功解決問題:
第一,圍棋場景複雜度也許更高。
圍棋的場景複雜度,並不在於其每一步最多 361 種選擇。它複雜在,坐在你對面是高智商的對手。需時刻提防對手隨時「留陷阱」,要每一步皆需統籌全域,並能大致預測對方接下來幾步落子位置,且要有與之相應的應對措施。
而滴滴的派單場景呢,沒有「高智商對手」主動「下絆子」是前提。在這種相對穩定又絕對動態的情境下進行派單。具體每一步的複雜程度有多高,按照章所言,43200 種選擇。
我沒有讀過 AlphaGo 源碼,所以只能做一個不負責的數字推斷:
鑒於隨著棋局的進行,每一步的落子選擇也減少,因而保守假設平均每一步有 100 種選擇。
之前看到報導說 AlphaGo 最多可以提前預判 50 步棋。如此,AlphaGo 每走一步棋需要考慮 100 的 50 次方。這個數字相信遠遠超過 43200 吧。
100 的 50 次方這個數字可能有點誇張,畢竟 AlphaGo 不是窮舉的。但是肯定不是章以為的「最多 361 種選擇」這麼簡單。
第二,用戶體驗上來看,滴滴沒有成功解決問題。
目前看來,AlphaGo 是成功解決了圍棋爭霸這個難題了。
至於滴滴嘛,他的派單演算法有多複雜先不談,但是其提供的服務說實話是沒辦法硬著脖子講「完全解決」這四個字的。
退一萬步講,假設派單場景確實比下圍棋複雜的多。那麼,章的行為就像某些人宣稱的:「我在試圖形成一個比相對論更高的模型,雖然還沒成功,但是我比愛因斯坦更偉大!」
第三,章文嵩本人非演算法領域。
有很多答主都提到了,他是阿裡的高級專家,是真正的系統級開發高手。但是問題就在這兒。
其實 AlphaGo 演算法跟系統開發是兩個截然不同的領域。
相比對演算法方面的評價,其實他在 AlphaGo 的網路延遲、分散式運算效率、CPU 利用率等問題上會更專業。
至於演算法複雜度,鑒於 Deep Learning 是強凸優化強矩陣變換的一種統計學習演算法,我相信滴滴內部的演算法相關負責人應該更有發言權。
AI 科技評論也將持續跟進這一問題的後續,敬請期待。
PS:關於滴滴的調度系統,滴滴研究院副院長、密西根大學終身教授葉傑平博士曾非常全面地進行了揭秘,大家可以在看過之後,再回望這場鬧劇。