听书阁_书友最值得收藏的免费小说阅读网

134. 給你們來一個七定王-《重生之AI教父》


    第(2/3)頁

    從理論上來說,圍棋問題的輸入和孟繁岐非常擅長的圖像類其實很像。

    彩色圖片在計算機中的形式就是多通道矩陣,通常為3通道,代表三原色。

    比如,一張分辨率為224x224的圖片,就是以三個[224, 224]矩陣的形式進行存儲。

    一般來說,每個位置的取值在0~255之間。

    對于圍棋這個情況來說,它的輸入就像是一個19x19的單通道圖片。

    19x19表示棋盤上所有的落子地點,而每個地點的取值就只有三種狀態,黑,白,無子。

    可以用[-1,0,1]三個數字來指代。

    而圍棋智能的目標,所謂的下棋。

    如果不考慮其中原理的話,它的外在反饋其實就是給定這樣一個[19,19]的棋盤,希望程序可以在上面僅改變一個無子的數字0到給定的棋子類型(數字-1或者1),同時使得該方獲勝的概率盡可能地變大。

    “棋盤就是一副黑白的單通道分辨率為19的圖像?!边@個事情在普通人看來比較不會想到。

    不過對于比較熟悉圖像技術和深度神經網絡的孟繁岐來說,是很自然的事情和概念。

    “我們從深度神經網絡的突破中獲得了靈感,在2012年底的AlexNet之前,瘋狂石頭這款圍棋智能提供的準確率是最高的,達到35%左右。

    目前主要是在研究,如何使用深度神經網絡使得圍棋智能的判斷更加精準。

    Alex和你引領的深度神經網絡在分類問題上有了驚人的突破,這是我們今年啟動這個項目的一大原因。

    我們目前在嘗試收集大量的專業對弈棋譜,目前已經有了十多萬場比賽的內容。而從這十萬多場比賽當中,又可以抽離出上百萬個單次落子。

    通過這個數據,我們現階段在確立合適的網絡結構,在這個方面,我想你是專家中的專家?!?

    “我大概了解了?!泵戏贬犕曛蠡久靼琢薉eepMind現階段的想法和進展情況。

    雖然此前黃博士在圍棋AI項目上有過很多研究,但阿爾法圍棋項目畢竟才剛剛開始,同時也是基于全新的深度網絡技術。

    目前為止,他們還沒有形成一整套的學習以及對抗的思路,那一套策略網絡-評估網絡-強化學習-蒙特卡洛搜索的總體結構還沒有成型。

    還停留在比較早期的階段,甚至還沒有最后決定到底使用怎樣的網絡結構比較好,此時正在對模型本身的結構進行測試和設計。

    “這方面確實是我比較擅長的方向,尤其最近,我在CPU和小模型的設計上有一些想法,這些內容應該會對你們有一定的幫助?!?
    第(2/3)頁

主站蜘蛛池模板: 潼关县| 文昌市| 馆陶县| 伊春市| 渭南市| 永泰县| 西青区| 岗巴县| 通州市| 工布江达县| 重庆市| 陈巴尔虎旗| 新晃| 铜山县| 渑池县| 彭水| 长丰县| 孝昌县| 鄯善县| 建昌县| 永康市| 连江县| 黄骅市| 德庆县| 田东县| 开封县| 日照市| 六盘水市| 阿拉善左旗| 台前县| 承德县| 铜梁县| 弋阳县| 林西县| 玛纳斯县| 普定县| 建瓯市| 香格里拉县| 普兰县| 阳西县| 江华|