台中產後護理之家推薦【部落客推薦】台中五星級月子中心～好幸福的媽咪－彌補往年

深度學習工程師：為什麼AlphaGo難取勝？

按：作者李理，出門問問NLP工程師。

AlphaGo在與歐洲圍棋冠軍樊麾(Fan Hui)的對壘

從技術的角度分析，個人覺得，3月份AlphaGo要戰勝李世石難度是比較大的。為什麼呢？請看下文。

一、AlphaGo的兩大核心技術MCTS(MonteCarloTreeSearch)

MCTS之於圍棋就像Alpha-Beta搜索之於象棋，是核心的算法，而比賽時的搜索速度至關重要。就像深藍當年戰勝時，超級計算機的運算速度是制勝的關鍵因素之一。

MCTS的4個步驟：Selection，Expansion，Evaluation(rollout)和Backup

MCTS的並行搜索：

(1)LeafParallelisation

最簡單的是LeafParallelisation，一個葉子用多個線程進行多次Simulation，完全不改變之前的算法，把原來的一次Simulation的統計量用多次來代替，這樣理論上應該準確不少。但這種並行的問題是需要等待最慢的那個結束才能更新統計量；而且搜索的路徑數沒有增多。

(2)RootParallelisation

多個線程各自搜索各自的UCT樹，最後投票

(3)Tree台中坐月子中心費用Parallelisation

這是真正的並行搜索，用多個線程同時搜索UCT樹。當然統計量的更新需要考慮多線程的問題，比如要加鎖。

另外一個問題就是多個線程很可能同時走一樣的路徑（因為大傢都選擇目前看起來Promising的孩子），一種方法就是臨時的修改virtualloss，比如線程1在搜索孩子a，那麼就給它的Q(v)減一個很大的數，這樣其它線程就不太可能選擇它瞭。當然線程1搜索完瞭之後要記得改回來。

《ALock-freeMultithreadedMonte-CarloTreeSearchAlgorithm》使用瞭一種lock-free的算法，這種方法比加鎖的方法要快很多，AlphaGo也用瞭這個方法。

Segal研究瞭為什麼多機的MCTS算法很難，並且實驗得出結論使用virtualloss的多線程版本能比較完美的scale到64個線程(當然這是單機一個進程的多線程程序）。AlphaGo的Rollout是用CPU集群來加速的，但是其它的三個步驟是在一臺機器完成的，這個就是最大的瓶頸。

DCNN(DeepConvolutionalNeuralNetwork)

（使用深度神經網絡訓練的PolicyNetwork和ValueNetwork）

神經網絡訓練的時間一般很長，即使用GPU，一般也是用天來計算。Google使用GPUCluster來訓練，從論文中看，訓練時間最長的ValueNetwork也隻是用50個GPU訓練瞭一周。

給定一個輸入，用卷積神經網絡來預測，基本運算是矩陣向量運算和台中坐月子費用卷積，由於神經網絡大量的參數，用CPU來運算也是比較慢的。所以一般也是用GPU來加速，而AlphaGo是用GPU的cluster來加速的。

更多技術細節請參考我的文章《alphaGo對戰李世石誰能贏？兩萬字長文深挖圍棋AI技術》

1.論文送審時(2015年11月)AlphaGo的水平

論文裡使用EloRating系台中坐月子中心價格表統的水平：

a圖是用分佈式的AlphaGo，單機版的AlphaGo，CrazyStone等主流圍棋軟件進行比賽，然後使用的是EloRating的打分。

筆者認為AlphaGo的水平超過瞭FanHui（2p)，因此AlphaGo的水平應該達到瞭2p。【不過很多人認為目前Fanhui的水平可能到不瞭2p】

b圖說明瞭PolicyNetworkValueNetwork和Rollout的作用，做瞭一些實驗，去掉一些的情況下棋力的變化，結論當然是三個都很重要。

c圖說明瞭搜索線程數以及分佈式搜索對棋力的提升，這些細節我們會在下一節再討論，包括AlphaGO的架構能不能再scalable到更多機器的集群從而提升棋力。

AlphaGo的真實棋力

筆者這裡根據一些新聞做推測。而且從文章提交Nature審稿到3月份比賽還有一段不短的時間，AlphaGo能不能還有提高也是非常關鍵。這裡我隻是推測一下在文章提交Nature時候AlphaGo的棋力。至於AlphaGo棋力能否提高，我們下一節分析實現細節時再討論（假設整體架構不變，系統能不能通過增加機器來提高棋力）。

網上很多文章試圖通過AlphaGo與fanhui的對局來估計AlphaGo的棋力，我本人圍棋水平離入門都比較遠，所以就不敢發表意見瞭。我隻是搜索瞭一些相關的資料，主要是在弈城上一個叫DeepMind的賬號的對局信息來分析的。

比如這篇《金燦佑分析deepmind棋譜認為99%與谷歌團隊相關》。作者認為這個賬號就是AlphaGo。如果猜測正確的話，AlphaGo當時的棋力在弈城8d-9d之間，換成我們常用的rankingsystem的話大概也就是6d-7d（業餘6段到7段）的水平，如果發揮得好，最多也許能到1p的水平，戰勝fanhui也有一定合理性（很多人認為fanhui目前實際水平可能已經沒有2p瞭，那算1p的話也差不多）

知乎的這個話題AlphaGo也有很多討論，可供參考。

二、AlphaGo到比賽前可台中坐月子中心價格能的提升

不同分佈式版本的水平比較，使用的是Elorating標準

最強的AlphaGo使用瞭64個搜索線程，1920個CPU的集群和280個GPU的集群（其實也就二十多臺機器）

三、AI戰勝圍棋大師李世石：我看懸之前我們討論過分佈式MCTS時說過，MCTS很難在多機上並行，所以AlphaGo還是在一臺機器上實現的LockFree的多線程並行，隻不過Rollout和神經網絡計算是在CPU和GPU集群上進行的。Google的財力肯定不隻二三十臺機器，所以分佈式MCTS的搜索才是最大的瓶頸。如果這個能突破，把機器堆到成百上千臺應該還是能提高不少棋力的。

我個人估計在3月與李世石的對弈中這個架構可能還很難有突破，可以增強的是RLPolicy的自對弈學習，不過這個提升也有限（否則不會隻訓練一天就停止瞭，估計也收斂的差不多瞭）。

所以，這一次，AI的勝算並沒有李世石的大。

http://news.zol.com.cn/572/5720105.html

news.zol.com.cn

true

中關村在線

http://news.zol.com.cn/572/5720105.html

台中坐月子中心推薦 report

4380

按：作者李理，出門問問NLP工程師。AlphaGo在與歐洲圍棋冠軍樊麾(Fan Hui)的對壘從技術的角度分析，個人覺得，3月份AlphaGo要戰勝李世石難度是比較大的。為什麼呢？請看下文。一、AlphaGo的兩大核心技術MCTS(MonteCarloTreeSearch)MCTS之...

台灣電動床工廠電動床

AUGI SPORTS｜重機車靴｜重機車靴推薦｜重機專用車靴｜重機防摔鞋｜重機防摔鞋推薦｜重機防摔鞋

AUGI SPORTS｜augisports｜racing boots｜urban boots｜motorcycle boots

台中坐月子費用台中坐月子中心價格台中坐月子中心費用台中產後護理之家推薦台中頂級月子中心

tfkjyna9yf

彌補往年

tfkjyna9yf 發表在痞客邦留言(0) 人氣()

E-mail轉寄

彌補往年

彌補往年

台中產後護理之家推薦【部落客推薦】台中五星級月子中心～好幸福的媽咪

歷史上的今天

留言列表

站方公告

活動快報

奶油般...

我的好友

熱門文章

文章分類

最新文章

最新留言

動態訂閱

文章精選

文章搜尋

新聞交換(RSS)

誰來我家

參觀人氣

QR Code

POWERED BY

彌補往年

彌補往年

台中產後護理之家推薦 【部落客推薦】台中五星級月子中心～好幸福的媽咪

歷史上的今天

留言列表

站方公告

活動快報

奶油般...

我的好友

熱門文章

文章分類

最新文章

最新留言

動態訂閱

文章精選

文章搜尋

新聞交換(RSS)

誰來我家

參觀人氣

QR Code

POWERED BY

台中產後護理之家推薦【部落客推薦】台中五星級月子中心～好幸福的媽咪