王寧 牛津大學互聯網學院數據科學高級研究員
2016年 3月 16日
為期數天的人機圍棋大戰,最終以AlphaGo 4比1的勝利拉下帷幕。回想比賽之前,李世石其實被很多人看好,畢竟是世界頂尖九段高手而且還曾經贏了18個世界冠軍。而最終李世石只是憑借機器的重大失誤而扳回一局,AlphaGo的強大特別是大局觀令很多職業選手震驚。
面對這個幾乎被碾壓的結果,對很多人可以說是意料之外。
圍棋是迄今為止人類發明的最複雜的遊戲。在小小的19乘19的棋盤上,雙方各持黑白,輪流下子,只要一方將另一方子圍住就可以吃掉。國際象棋只有64個格子,而圍棋卻有361個格子,其策略選取的複雜度已經加大了好幾十個量級。而圍棋的難度更在於,在看似簡單的遊戲規則裏面,每一步的變化加上「打劫」等特殊規則所產生的運算複雜度是天文數字量級的。
有人計算過,要是把圍棋所有的狀態用窮舉法全部列出大概需要 10的170次方(相比之下國際象棋只有10的46次方)。因此,圍棋也被認為是人工智能攻克信息完全博弈遊戲最後的堡壘。
縱觀人機對戰的歷史,往往是以機器的勝利而告終。1997年IBM的深藍打敗了國際象棋世界冠軍卡斯帕羅夫。2011年IBM的Watson在智力問答電視比賽中徹底打敗兩名世界冠軍。
短短不到幾年的時間,人工智能又攻破了幾乎永遠不可能被攻破的領域——圍棋。如果說,相比1997年IBM深藍的暴力博弈樹遍歷而言,深藍的勝利只是硬件速度的勝利和計算機的勝利。AlphaGo今天的勝利才真正是人工智能的勝利,它標誌著真正人工智能的時代已經開啟。
1997年IBM的深藍打敗了國際象棋世界冠軍卡斯帕羅夫
其實人工智能作為一個學科已經發展了半個多世紀,一直有一群默默無聞的人們從事著這方面的研究,而這次人機大戰才真正的把人工智能放在的鎂光燈下,成為大眾矚目的焦點。
如果說之前的深藍電腦還處於「暴力」人工智能的階段,現在的以AlphaGo為代表的深度學習和強化學習把人工智能推向了頂峰。通過Google發表的文章可以看出,通過深度學習採用海量的專業棋譜訓練策略網絡,再用強化學習通過自我博弈訓練估值網絡,最終結合兩個網絡通過蒙特卡洛樹進行下子決策。
可以看出,這一套流程並不是一種技術的勝利,而是多種人工智能技術結合的產物。這也是近幾年來人工智能的發展方向,通過結合多種模型對問題進行分層和抽像,從而部分地模擬了大腦認知、思考和決策過程。
AlphaGo今天的完勝將會對人類的未來產生深遠的影響。為此,有人歡呼雀躍,有人憂心忡忡。歡呼者為人類在這一領域取得的長足進步而高興,憂心者擔心機器將會在未來取得越來越明顯的優勢,從而最終會取代人類。
牛津大學的一份研究報告已經表明未來70%的工作將有可能被機器所取代。我們在未來會看到人工智能被應用在越來越多的領域,特別是需要進行決策領域,比如智能駕駛,醫療診斷,金融交易等。
相信人類智慧將會和人工智能分工協作,取長補短,相互學習,共同提高
近期的連線雜誌Wired就報道了總部位於香港的Aidyia混合多種人工智能進行進行金融交易,並且可以通過表現不斷改進。總部位於紐約的Rebellion Research也推出了完全由人工智能運營管理的投資基金。
總部位於倫敦的對衝基金機構Castilium用人工智能模擬交易員和基金經理的推理和決策過程,並將其用於自動化交易。
無疑,未來是機器智能和人類智慧共存的時代。其實面對人工智能,人類大可不必驚慌。人工智能系統還很大程度上依賴於特徵提取和訓練方式,還遠未達到通用系統的程度。雖然AlphaGo取得了突破性進展,但是也只是在信息完全的領域的突破,人工智能在很多信息不完全領域還是一籌莫展。
機器向左,人類向右。我們都知道,人的大腦是不對稱的,右腦與直覺和情感有關;左腦與邏輯和決策有關。 也許未來人工智能將會在左腦的領域超越人類,而面對於人類的靈性、感情和情緒人工智能還是一片空白。在不久的將來,相信人類智慧將會和人工智能分工協作,取長補短,相互學習,共同提高。
(責編:歐陽成)
2016ai
沒有留言:
張貼留言