史上今日：2016年3月15日圍棋“人機大戰”結束

2016年3月15日，圍棋“人機大戰”在韓國首爾進行最後一盤的對弈，韓國棋手李世石九段執黑中盤280手告負，至此他的總比分1比4不敵“阿爾法圍棋”，在本次“人機大戰”中宣告失敗。

阿爾法圍棋的主要工作原理是“深度學習”，其核心是“策略網路”和“價值網路”兩種不同的深度神經網路。其中， “價值網路”主要任務是一邊推算一邊判斷局面，一旦局面處於明顯劣勢時，就直接拋棄一些路線；而“策略網路”則是負責減少搜索的寬度，

判斷某些棋步該不該走，防止隨便送子給別人吃。

這兩個工具通過相互合作做出一些類似於人們思考的行為， “挑選”出那些比較有前途的棋步，拋棄明顯的差棋，從而將計算量控制在電腦可以完成的範圍裡，以期取得最終的勝利。

事實上阿爾法圍棋的強大，除了其本身採用了最先進的深度學習技術，利用深度神經網路對棋盤的局勢進行了預測之外，還在於研發團隊在前期搜集了大量圍棋名人對弈的歷史資料，使得這一人工智慧機器可以迅速汲取眾多圍棋高手的棋局，充分利用人類棋手的即有經驗。

這次“阿爾法圍棋”的勝利，代表著人工智慧在自主學習、自我完善等方面有了更進一步的發展。

隨著人工智慧的應用，必將會在推動電腦技術的不斷進步，人類生活方式的持續改善等方面產生更加深遠的影響，為人類社會做出巨大的貢獻。

本作品為“科普中國-科技創新里程碑”原創轉載時務請注明出處

作者：孔祥宇

史上今日：2016年3月15日 圍棋“人機大戰”結束