下一次人機大戰結局會怎樣

時間＼2017-05-19

■程智

據網上消息，穀歌的AlphaGO將在5月下旬與世界第一的圍棋高手柯潔進行一次人機大戰。

從上一次AlphaGO與韓國棋手李世石的對決來看，機器僅以輸一場的結果獲得大勝。那時，AlphaGO還是以Master的身份在網路上與包括柯潔在內的眾多圍棋高手進行車輪大戰，結果是大獲全勝。這也說明在與李世石的對決之後，AlphaGO的演算法又獲得了改進。連柯潔也感歎人類在幾千年時間中所積累的圍棋知識，在AlphaGO面前也只是一個“皮毛”。

可想而知5月份的對決中，

AlphaGO將毫無懸念地獲得全勝。之所以要進行這一場比賽，主要還是滿足一下世人的好奇心：究竟人類與電腦的差距有多大？

隨著AlphaGO銳不可當的攻勢，AlphaGO的演算法也逐漸公開出來，並為大眾所熟悉。雖然過去AlphaGO的作者已經在《自然》上發表了其演算法，但是限於論文的專業性，不是這一領域的人並不會關注。

從網上披露出來的演算法細節來看，AlphaGO運用了多種神經網路技術，通過不斷的學習與實戰，

將人類棋手每一步可能的落子位置以最大的可能預測出來，然後再結合電腦準確無誤的計算能力，判斷採用何種方法來進行應對是最佳的策略。

這種演算法如果不是程式設計方面的問題，理論上人類棋手是無法戰勝的。這也是我不看好5月份人機對決的原因。

那麼，是否由此就可以推斷既然電腦這麼聰明，今後必將統治人類了呢？我認為，這種想法有些杞人憂天。

或者說至少現在的計算基本理論需要做一個徹底的改變，才能夠讓人類擔憂自己的未來。

這裡略微分析一下電腦和人類的區別。

對於電腦來說，它的強項在於計算，不會犯錯誤。而且隨著技術的進步，電腦的計算能力會更加強大。因此對於那些已經制定好規則，然後需要不斷重複的步驟去完成的任務，電腦比人類強大得多。

而對人類來說，強項在於經常犯錯誤，

且在可望的將來，人類也不可能進化出超級聰明的新人類。當然更重要的是世界是人類創造出來的，人類具備制定這個世界規則的能力。

這裡有一個疑問：為何“犯錯誤”也是一個強項？因為按照通常的觀點，犯了錯誤自然導致錯誤的結果，而這些錯誤的結果不是人類所期望的，是需要避免的。然而在與電腦等非人類對決時，這些錯誤就可能變成自己的優勢，因為它超出了電腦的計算能力。

更有意思的是，人類的錯誤直接導致錯誤規則的制定，在這些錯誤規則面前，電腦強大的計算能力只會導致更愚蠢的結果。

以即將舉行的人機大戰來說，如果完全按照現行的規則，柯潔勢必會輸給電腦。然而，我們若在比賽的過程中按照人類的要求改變一下圍棋的規則，比如規定在佈局的時候直接點三三或者在一二線落子，則必須扣除目數，又或者按照一些經典的棋譜，設置多級指標，符合某某形狀的落子可以增加目數，而偏離這些形狀的落子則要減少目數。這些新規則出來以後，相信AlphaGO一定會“目瞪口呆”，柯潔必將大獲全勝。

當然每個規則都有對應的演算法，過一段時間後，AlphaGO也會在新規則下完勝，這時候人類只需要再重新制定規則就可以了。

這只是一種設想，這樣的事情永遠也不會發生，AlphaGO的創造者也表示，創造AlphaGO並不是為了贏棋，而是為了檢驗電腦與人類的差距。同時從這個設想也可以看出，諸如AlphaGO這樣的電腦技術還遠沒有到能夠統治人類的地步。要製造出一些科幻電影中那種統治欲望非常強烈的電腦，必須首先讓這些電腦能夠制定人類世界的規則，而在我看來這是不可能的。

（http：//blog.sciencenet.cn/u/gzchengzhi）

《中國科學報》 (2017-05-19 第2版博客)

又或者按照一些經典的棋譜，設置多級指標，符合某某形狀的落子可以增加目數，而偏離這些形狀的落子則要減少目數。這些新規則出來以後，相信AlphaGO一定會“目瞪口呆”，柯潔必將大獲全勝。

當然每個規則都有對應的演算法，過一段時間後，AlphaGO也會在新規則下完勝，這時候人類只需要再重新制定規則就可以了。

（http：//blog.sciencenet.cn/u/gzchengzhi）

《中國科學報》 (2017-05-19 第2版博客)