134. 給你們來一個七定王-《重生之AI教父》
第(2/3)頁
從理論上來說,圍棋問題的輸入和孟繁岐非常擅長的圖像類其實很像。
彩色圖片在計算機中的形式就是多通道矩陣,通常為3通道,代表三原色。
比如,一張分辨率為224x224的圖片,就是以三個[224, 224]矩陣的形式進行存儲。
一般來說,每個位置的取值在0~255之間。
對于圍棋這個情況來說,它的輸入就像是一個19x19的單通道圖片。
19x19表示棋盤上所有的落子地點,而每個地點的取值就只有三種狀態,黑,白,無子。
可以用[-1,0,1]三個數字來指代。
而圍棋智能的目標,所謂的下棋。
如果不考慮其中原理的話,它的外在反饋其實就是給定這樣一個[19,19]的棋盤,希望程序可以在上面僅改變一個無子的數字0到給定的棋子類型(數字-1或者1),同時使得該方獲勝的概率盡可能地變大。
“棋盤就是一副黑白的單通道分辨率為19的圖像?!边@個事情在普通人看來比較不會想到。
不過對于比較熟悉圖像技術和深度神經網絡的孟繁岐來說,是很自然的事情和概念。
“我們從深度神經網絡的突破中獲得了靈感,在2012年底的AlexNet之前,瘋狂石頭這款圍棋智能提供的準確率是最高的,達到35%左右。
目前主要是在研究,如何使用深度神經網絡使得圍棋智能的判斷更加精準。
Alex和你引領的深度神經網絡在分類問題上有了驚人的突破,這是我們今年啟動這個項目的一大原因。
我們目前在嘗試收集大量的專業對弈棋譜,目前已經有了十多萬場比賽的內容。而從這十萬多場比賽當中,又可以抽離出上百萬個單次落子。
通過這個數據,我們現階段在確立合適的網絡結構,在這個方面,我想你是專家中的專家?!?
“我大概了解了?!泵戏贬犕曛蠡久靼琢薉eepMind現階段的想法和進展情況。
雖然此前黃博士在圍棋AI項目上有過很多研究,但阿爾法圍棋項目畢竟才剛剛開始,同時也是基于全新的深度網絡技術。
目前為止,他們還沒有形成一整套的學習以及對抗的思路,那一套策略網絡-評估網絡-強化學習-蒙特卡洛搜索的總體結構還沒有成型。
還停留在比較早期的階段,甚至還沒有最后決定到底使用怎樣的網絡結構比較好,此時正在對模型本身的結構進行測試和設計。
“這方面確實是我比較擅長的方向,尤其最近,我在CPU和小模型的設計上有一些想法,這些內容應該會對你們有一定的幫助?!?
第(2/3)頁
主站蜘蛛池模板:
潼关县|
文昌市|
馆陶县|
伊春市|
渭南市|
永泰县|
西青区|
岗巴县|
通州市|
工布江达县|
重庆市|
陈巴尔虎旗|
新晃|
铜山县|
渑池县|
彭水|
长丰县|
孝昌县|
鄯善县|
建昌县|
永康市|
连江县|
黄骅市|
德庆县|
田东县|
开封县|
日照市|
六盘水市|
阿拉善左旗|
台前县|
承德县|
铜梁县|
弋阳县|
林西县|
玛纳斯县|
普定县|
建瓯市|
香格里拉县|
普兰县|
阳西县|
江华|