華文網

下一次人機大戰結局會怎樣

■程智

據網上消息,穀歌的AlphaGO將在5月下旬與世界第一的圍棋高手柯潔進行一次人機大戰。

從上一次AlphaGO與韓國棋手李世石的對決來看,機器僅以輸一場的結果獲得大勝。那時,AlphaGO還是以Master的身份在網路上與包括柯潔在內的眾多圍棋高手進行車輪大戰,結果是大獲全勝。這也說明在與李世石的對決之後,AlphaGO的演算法又獲得了改進。連柯潔也感歎人類在幾千年時間中所積累的圍棋知識,在AlphaGO面前也只是一個“皮毛”。

可想而知5月份的對決中,

AlphaGO將毫無懸念地獲得全勝。之所以要進行這一場比賽,主要還是滿足一下世人的好奇心:究竟人類與電腦的差距有多大?

隨著AlphaGO銳不可當的攻勢,AlphaGO的演算法也逐漸公開出來,並為大眾所熟悉。雖然過去AlphaGO的作者已經在《自然》上發表了其演算法,但是限於論文的專業性,不是這一領域的人並不會關注。

從網上披露出來的演算法細節來看,AlphaGO運用了多種神經網路技術,通過不斷的學習與實戰,

將人類棋手每一步可能的落子位置以最大的可能預測出來,然後再結合電腦準確無誤的計算能力,判斷採用何種方法來進行應對是最佳的策略。

這種演算法如果不是程式設計方面的問題,理論上人類棋手是無法戰勝的。這也是我不看好5月份人機對決的原因。

那麼,是否由此就可以推斷既然電腦這麼聰明,今後必將統治人類了呢?我認為,這種想法有些杞人憂天。

或者說至少現在的計算基本理論需要做一個徹底的改變,才能夠讓人類擔憂自己的未來。

這裡略微分析一下電腦和人類的區別。

對於電腦來說,它的強項在於計算,不會犯錯誤。而且隨著技術的進步,電腦的計算能力會更加強大。因此對於那些已經制定好規則,然後需要不斷重複的步驟去完成的任務,電腦比人類強大得多。

而對人類來說,強項在於經常犯錯誤,

且在可望的將來,人類也不可能進化出超級聰明的新人類。當然更重要的是世界是人類創造出來的,人類具備制定這個世界規則的能力。

這裡有一個疑問:為何“犯錯誤”也是一個強項?因為按照通常的觀點,犯了錯誤自然導致錯誤的結果,而這些錯誤的結果不是人類所期望的,是需要避免的。然而在與電腦等非人類對決時,這些錯誤就可能變成自己的優勢,因為它超出了電腦的計算能力。

更有意思的是,人類的錯誤直接導致錯誤規則的制定,在這些錯誤規則面前,電腦強大的計算能力只會導致更愚蠢的結果。

以即將舉行的人機大戰來說,如果完全按照現行的規則,柯潔勢必會輸給電腦。然而,我們若在比賽的過程中按照人類的要求改變一下圍棋的規則,比如規定在佈局的時候直接點三三或者在一二線落子,則必須扣除目數,又或者按照一些經典的棋譜,設置多級指標,符合某某形狀的落子可以增加目數,而偏離這些形狀的落子則要減少目數。這些新規則出來以後,相信AlphaGO一定會“目瞪口呆”,柯潔必將大獲全勝。

當然每個規則都有對應的演算法,過一段時間後,AlphaGO也會在新規則下完勝,這時候人類只需要再重新制定規則就可以了。

這只是一種設想,這樣的事情永遠也不會發生,AlphaGO的創造者也表示,創造AlphaGO並不是為了贏棋,而是為了檢驗電腦與人類的差距。同時從這個設想也可以看出,諸如AlphaGO這樣的電腦技術還遠沒有到能夠統治人類的地步。要製造出一些科幻電影中那種統治欲望非常強烈的電腦,必須首先讓這些電腦能夠制定人類世界的規則,而在我看來這是不可能的。

(http://blog.sciencenet.cn/u/gzchengzhi)

《中國科學報》 (2017-05-19 第2版 博客)

又或者按照一些經典的棋譜,設置多級指標,符合某某形狀的落子可以增加目數,而偏離這些形狀的落子則要減少目數。這些新規則出來以後,相信AlphaGO一定會“目瞪口呆”,柯潔必將大獲全勝。

當然每個規則都有對應的演算法,過一段時間後,AlphaGO也會在新規則下完勝,這時候人類只需要再重新制定規則就可以了。

這只是一種設想,這樣的事情永遠也不會發生,AlphaGO的創造者也表示,創造AlphaGO並不是為了贏棋,而是為了檢驗電腦與人類的差距。同時從這個設想也可以看出,諸如AlphaGO這樣的電腦技術還遠沒有到能夠統治人類的地步。要製造出一些科幻電影中那種統治欲望非常強烈的電腦,必須首先讓這些電腦能夠制定人類世界的規則,而在我看來這是不可能的。

(http://blog.sciencenet.cn/u/gzchengzhi)

《中國科學報》 (2017-05-19 第2版 博客)