廖啟宏: AlphaGo戰勝李世石：人類向右機器向左

王寧牛津大學互聯網學院數據科學高級研究員

2016年 3月 16日

為期數天的人機圍棋大戰，最終以AlphaGo 4比1的勝利拉下帷幕。回想比賽之前，李世石其實被很多人看好，畢竟是世界頂尖九段高手而且還曾經贏了18個世界冠軍。而最終李世石只是憑借機器的重大失誤而扳回一局，AlphaGo的強大特別是大局觀令很多職業選手震驚。
面對這個幾乎被碾壓的結果，對很多人可以說是意料之外。

圍棋是迄今為止人類發明的最複雜的遊戲。在小小的19乘19的棋盤上，雙方各持黑白，輪流下子，只要一方將另一方子圍住就可以吃掉。國際象棋只有64個格子，而圍棋卻有361個格子，其策略選取的複雜度已經加大了好幾十個量級。而圍棋的難度更在於，在看似簡單的遊戲規則裏面，每一步的變化加上「打劫」等特殊規則所產生的運算複雜度是天文數字量級的。

有人計算過，要是把圍棋所有的狀態用窮舉法全部列出大概需要 10的170次方（相比之下國際象棋只有10的46次方）。因此，圍棋也被認為是人工智能攻克信息完全博弈遊戲最後的堡壘。

縱觀人機對戰的歷史，往往是以機器的勝利而告終。1997年IBM的深藍打敗了國際象棋世界冠軍卡斯帕羅夫。2011年IBM的Watson在智力問答電視比賽中徹底打敗兩名世界冠軍。

短短不到幾年的時間，人工智能又攻破了幾乎永遠不可能被攻破的領域——圍棋。如果說，相比1997年IBM深藍的暴力博弈樹遍歷而言，深藍的勝利只是硬件速度的勝利和計算機的勝利。AlphaGo今天的勝利才真正是人工智能的勝利，它標誌著真正人工智能的時代已經開啟。

1997年IBM的深藍打敗了國際象棋世界冠軍卡斯帕羅夫

其實人工智能作為一個學科已經發展了半個多世紀，一直有一群默默無聞的人們從事著這方面的研究，而這次人機大戰才真正的把人工智能放在的鎂光燈下，成為大眾矚目的焦點。

如果說之前的深藍電腦還處於「暴力」人工智能的階段，現在的以AlphaGo為代表的深度學習和強化學習把人工智能推向了頂峰。通過Google發表的文章可以看出，通過深度學習採用海量的專業棋譜訓練策略網絡，再用強化學習通過自我博弈訓練估值網絡，最終結合兩個網絡通過蒙特卡洛樹進行下子決策。

可以看出，這一套流程並不是一種技術的勝利，而是多種人工智能技術結合的產物。這也是近幾年來人工智能的發展方向，通過結合多種模型對問題進行分層和抽像，從而部分地模擬了大腦認知、思考和決策過程。

AlphaGo今天的完勝將會對人類的未來產生深遠的影響。為此，有人歡呼雀躍，有人憂心忡忡。歡呼者為人類在這一領域取得的長足進步而高興，憂心者擔心機器將會在未來取得越來越明顯的優勢，從而最終會取代人類。

牛津大學的一份研究報告已經表明未來70%的工作將有可能被機器所取代。我們在未來會看到人工智能被應用在越來越多的領域，特別是需要進行決策領域，比如智能駕駛，醫療診斷，金融交易等。

相信人類智慧將會和人工智能分工協作，取長補短，相互學習，共同提高

近期的連線雜誌Wired就報道了總部位於香港的Aidyia混合多種人工智能進行進行金融交易，並且可以通過表現不斷改進。總部位於紐約的Rebellion Research也推出了完全由人工智能運營管理的投資基金。

總部位於倫敦的對衝基金機構Castilium用人工智能模擬交易員和基金經理的推理和決策過程，並將其用於自動化交易。

無疑，未來是機器智能和人類智慧共存的時代。其實面對人工智能，人類大可不必驚慌。人工智能系統還很大程度上依賴於特徵提取和訓練方式，還遠未達到通用系統的程度。雖然AlphaGo取得了突破性進展，但是也只是在信息完全的領域的突破，人工智能在很多信息不完全領域還是一籌莫展。

機器向左，人類向右。我們都知道，人的大腦是不對稱的，右腦與直覺和情感有關；左腦與邏輯和決策有關。也許未來人工智能將會在左腦的領域超越人類，而面對於人類的靈性、感情和情緒人工智能還是一片空白。在不久的將來，相信人類智慧將會和人工智能分工協作，取長補短，相互學習，共同提高。
（責編：歐陽成）

2016ai

廖啟宏

薤白

2016年3月16日星期三

AlphaGo戰勝李世石：人類向右機器向左

沒有留言:

張貼留言

薤白

2016年3月16日 星期三

AlphaGo戰勝李世石：人類向右 機器向左

沒有留言:

張貼留言

2016年3月16日星期三

AlphaGo戰勝李世石：人類向右機器向左