為何說AlphaGo戰勝李世石是個大事件?
[摘要]AlphaGo取得的經驗可以在多個領域中得到應用。
騰訊科技訊 谷歌(微博)DeepMind人工智能AlphaGo兩度戰勝瞭傳奇圍棋選手李世石。這是人工智能(AI)歷史上的重大時刻。“我非常吃驚,”李世石說道。“我沒想到會輸。我沒有想到AlphaGo能下得如此完美。”
然而,AlphaGo的勝利為什麼會引起如此多的關註?想要真正理解該問題,就要先瞭解圍棋的特性和DeepMind團隊如何去破解圍棋中的各個難點。
圍棋起源於中國,是一項擁有3000年歷史的抽象棋類遊戲。圍棋盤由19條橫線19條豎線組成,棋手通過落子圍住對手的棋子來獲勝。雖然規則不多,但變化多端的棋路讓其變得非常台中靜電機出租深奧,因為任何細微的變化都有可能引起戰局的突變。
去年AlphaGo與歐洲冠軍樊麾之戰裁判托比 萬寧(Toby Manning)表示:“圍棋是世界上最為復雜的智力遊戲之一。它的規則非常簡單,但這些規則卻導致瞭棋局的復雜性。”托比還引述瞭20世紀傳奇國際象棋和圍棋選手愛德華 拉斯克(Edward Lasker)的話:“國際象棋中有許多巴洛克式規則(意為華而不實),它們都是人們故意添加的,而圍棋則不同,它的規則簡單巧妙,有機統一,邏輯嚴密,如果宇宙中還有其他智慧生物,我想他們也會愛上圍棋。”
正是因為圍棋超凡的復雜性,棋手需要經過多年的訓練,磨練自己的直覺並學習識破各種棋路,才能成為高手。“圍棋一開始吸引你的是,它的規則簡單易懂。它的復雜性又能讓你不會感到厭倦,樂在其中,”韓國圍棋桃園靜電機出租協會高秘書長Lee Ha-jin說道。“即使你已經是多年的老手,你依然會發現自己還有許多新東西可學,你隻希望變得更好,再更好。”
我采訪過的每位圍棋選手對這項運動的評價都如出一轍:圍棋的魅力就在於簡單規則背後的無窮變化。這些復雜的變化正是計算機程序難以掌握的地方。計算機隻能通過觀察棋盤獲得有限的數據,下好每一步棋都需要大量直覺。
加拿大阿爾伯塔大學計算機科學傢喬納森 謝弗(Jonathan Schaeffer)說:”國際象棋和西洋棋與圍棋不同,它們不需要選手對棋局做復雜的形勢評估,隻需一點經驗,你就知道下一步該怎麼走,衡量各個棋子的價值是選手最重要的任務 如果在國際象棋中多出一個’車’,那你就基本勝券在握瞭。但這種方法在圍棋中都行不通。從人類的角度來看,圍棋的棋路過於復雜多變,難以為其編程。直到AlphaGo之前,沒有能創建出有效的評估函數系統。”
那麼DeepMind是如何做到的呢?它使用瞭深度學習和類神經網絡技術來學會下圍棋。就像Google Photos能幫你從無數圖片中找出貓咪一樣,其背後是該應用對大量貓咪圖片進行瞭像素級的分析。而AlphaGo的智能則來自對人類棋手比賽中數百萬棋局和落子的學習。
讓AlphaGo的棋力有瞭長足進步的原因是,DeepMind對它曾經練習過的棋局進行改進,讓它再次練習,如此反復好幾百萬次,AlphaGo棋力不斷強化和增進。這種方法讓AlphaGo形成“策略網絡”,幫助其預測對手的下一步棋,進而又形成瞭“價值網絡”,讓AlphaGo學會瞭確定和評估棋局。在棋局中,AlphaGo已經可以快速分析各種可能性,提前考慮後面幾步的落子和排兵佈陣瞭。上述兩個神經網絡讓AlphaGo省去瞭很多工作:策略網絡減小瞭搜索范圍,價值網絡讓其不用自己在“心裡”走完所有步驟就能得出結論。
這一增強版的學習系統讓AlphaGo變得更像人類,比純粹依靠運算能力搜索最佳走棋而戰勝國際象棋大師卡斯帕羅夫的IBM深藍電腦更加智能,深藍所采用的方法用在圍棋上根本行不通。這也是DeepMind不會在比賽間歇對AlphaGo進行調整的原因。AlphaGo隻通過自學來提高棋力,單場比賽不會對自學效果產生多大影響。
DeepMind公司創始人戴密斯 哈薩比斯(Demis Hassabis)稱,自從去年10月打敗歐洲冠軍樊麾以來AlphaGo的棋力有瞭進步,但由於其能力已經達到邊際效益遞減點,DeepMind也就沒有再對硬件進行投資,所以AlphaGo的運算能力幾乎沒有變化。
不過深藍電腦的開發人員認為AlphaGo在國際象棋上並不一定是世界最強。IBM研發工程師穆雷 坎貝爾(Murray Campbell)說道:“我相信DeepMind可以開發出戰勝所有國際象棋大師的程序。不過我不認為AlphaGo可以在所有棋類比賽中站上世界之巔。為什麼這麼說呢?因為國際象棋在對搜索能力的要求上與圍棋有著本質上的不同,搜索能力是深藍戰勝人類的重要因素。雖說圍棋上電腦也需要深度搜索來輔助,但圍棋更重視直覺和對棋局形勢的判斷與預估。而對國際象棋來說,除瞭搜索和編程,就別無他法瞭。”
不過DeepMind公司可不這麼想,他們認為在AlphaGo上取得的經驗可以在多個領域中得到應用。哈薩比斯曾講述過深藍電腦上的AI與AlphaGo的不同,他認為前者是狹義AI,後者是常規AI,區別在於後者更加靈活,適應性也更強。DeepMind相信,其機器學習技術將會被應用於機器人學、智能手機助手系統和醫療制度。上個月,DeepMind宣佈與英國國民健康服務達成瞭一項協議。
其實無論隨後三場比賽結果如何,AlphaGo都已經創造瞭歷史。上周在被問及李世石被打敗對圍棋意味著什麼時,Lee Ha-jin說:“圍棋曾經是唯一一項沒有被計算機打敗的棋類運動,我們一直以此為榮,但現在我們再也不能這樣說瞭,所以感到有點失望。”
不過AlphaGo的勝利也會從另一個角度推動該項運動的發展。美國圍棋協會成員對AlphaGo的棋力感到十分震驚,他們認為AlphaGo有時落子的方式有些一反常規,如果自己這樣下棋,肯定會被老師罵。
“我們當然非常震驚,”美國圍棋協會運營副總裁傑克遜表示。“業內一直有所謂正統的落子套路,AlphaGo這樣不按套路出牌能給我們帶來什麼啟示呢?難道它要引發業界大地震?難道我們此前辛苦訓練學會的那些技能都是錯誤的嗎?”(翼飛)
油煙處理機租賃
- Nov 02 Thu 2017 15:06
為何說AlphaGo戰勝李世石是個大事件?
close
全站熱搜
留言列表