您的位置:首頁>體育>正文

史上今日:2016年3月15日 圍棋“人機大戰”結束

2016年3月15日, 圍棋“人機大戰”在韓國首爾進行最後一盤的對弈, 韓國棋手李世石九段執黑中盤280手告負, 至此他的總比分1比4不敵“阿爾法圍棋”, 在本次“人機大戰”中宣告失敗。

阿爾法圍棋的主要工作原理是“深度學習”, 其核心是“策略網路”和“價值網路”兩種不同的深度神經網路。 其中, “價值網路”主要任務是一邊推算一邊判斷局面, 一旦局面處於明顯劣勢時, 就直接拋棄一些路線;而“策略網路”則是負責減少搜索的寬度,

判斷某些棋步該不該走, 防止隨便送子給別人吃。

這兩個工具通過相互合作做出一些類似於人們思考的行為, “挑選”出那些比較有前途的棋步, 拋棄明顯的差棋, 從而將計算量控制在電腦可以完成的範圍裡, 以期取得最終的勝利。

事實上阿爾法圍棋的強大, 除了其本身採用了最先進的深度學習技術, 利用深度神經網路對棋盤的局勢進行了預測之外, 還在於研發團隊在前期搜集了大量圍棋名人對弈的歷史資料, 使得這一人工智慧機器可以迅速汲取眾多圍棋高手的棋局, 充分利用人類棋手的即有經驗。

這次“阿爾法圍棋”的勝利, 代表著人工智慧在自主學習、自我完善等方面有了更進一步的發展。

隨著人工智慧的應用, 必將會在推動電腦技術的不斷進步, 人類生活方式的持續改善等方面產生更加深遠的影響, 為人類社會做出巨大的貢獻。

本作品為“科普中國-科技創新里程碑”原創 轉載時務請注明出處

作者: 孔祥宇

Next Article
喜欢就按个赞吧!!!
点击关闭提示