第(1/3)頁 人工智能研發(fā)這一塊,無論是今世還是前世,無論是硬件還是軟件條件,目前國內(nèi)都是遠(yuǎn)遠(yuǎn)落后于國外的。 當(dāng)下國內(nèi)人工智能水平,尤其是游戲ai的智能水平,還停留在“監(jiān)督學(xué)習(xí)”階段。 所謂“監(jiān)督學(xué)習(xí)”,即是指人類出題,告訴ai正確的答案,并賦予相應(yīng)的對策的學(xué)習(xí)方式,類似于中小學(xué)填鴨式教育。 反映到游戲應(yīng)用場景里,就是那種識別看到人類玩家后,人機(jī)會(huì)主動(dòng)進(jìn)行攻擊,最多再加一些設(shè)定,比如hp小于30%時(shí),會(huì)自己找掩體躲避,當(dāng)敵人躲在某處時(shí)間過長時(shí),會(huì)扔一顆手雷過去。 但這些都是很死板的程序判斷,嚴(yán)格來說還不具備人工智能的特點(diǎn),并不是真正意義上的人工智能。 而國際上,早在97年的時(shí)候,ibm用專門設(shè)計(jì)的計(jì)算機(jī),就下贏了國際象棋冠軍。 當(dāng)然了,那會(huì)兒所謂的計(jì)算機(jī)也不能稱之為ai,之所以能下贏國際象棋冠軍,采用的是暴力破解方法,也就是窮舉法,把所有可能的下法全部計(jì)算一遍,然后對比人類的棋譜,選擇最優(yōu)解。 也就是所謂的“大力出奇跡”。 但是到了圍棋這里,沒法再這樣窮舉了。 力量再大,終有極限,圍棋的可能性走法,遠(yuǎn)超宇宙中全部原子之和,即使用目前最牛逼的超算,也要算幾萬年,在量子計(jì)算機(jī)成熟之前,電子計(jì)算機(jī)幾無可能勝任這樣的任務(wù)。 于是,程序員給阿爾法狗多加了一層算法:先計(jì)算哪里需要計(jì)算,哪里需要忽略,然后再有針對性地計(jì)算。 通俗點(diǎn)說,就是計(jì)算機(jī)具有了學(xué)習(xí)能力,能夠感知、判斷并完成決策,這便具備了ai的基本特征。 不過,機(jī)器的學(xué)習(xí)方式,和人類有著質(zhì)的不同,人通過觀察少數(shù)特征,就能推及多數(shù)未知,也就是具有“舉一反三”的能力。 但機(jī)器不行,它必須不斷地試錯(cuò)排除,不斷地識別計(jì)算,才能得出結(jié)果。 而且在這個(gè)學(xué)習(xí)過程中,需要三個(gè)基本條件:算法、算力、數(shù)據(jù)。 算法就是計(jì)算方法,也可以稱之為計(jì)算模型,比如識別一只狗和識別一段人類語音,其算法是不同的,應(yīng)用場景不同算法就不同,這需要程序員進(jìn)行相應(yīng)的設(shè)計(jì)和優(yōu)化。 但有了算法,沒有算力和數(shù)據(jù),ai也無法進(jìn)行學(xué)習(xí)。 就如同“巧婦難為無米之炊”,算法是食譜,算力就是烹飪工具,數(shù)據(jù)則是食材,光懂得烹飪方法,沒有烹飪工具和食材,一樣無法烹飪出美味的佳肴。 所以要想在人工智能方面有所建樹,最根本的就是要解決算法、算力和數(shù)據(jù)這三個(gè)基本條件。 目前國際上人工智能技術(shù)研發(fā)進(jìn)展緩慢,主要就是受制于算力和數(shù)據(jù),不過這方面恰好是沸騰的優(yōu)勢。 經(jīng)過多年布局,目前這三個(gè)基本條件及其外延條件,盡管與國外還無法相提并論,但在國內(nèi)已經(jīng)基本具備,所以人工智能技術(shù)研發(fā)上,方杰認(rèn)為是時(shí)候發(fā)一下力了。 首先算法方面,說白了就是兩個(gè)分支條件:程序開發(fā)人才和算法訓(xùn)練平臺。 人才這一塊國內(nèi)目前并不缺,沸騰研究院、中科院自動(dòng)化研究所、華為、騰訊等,在相關(guān)領(lǐng)域本來就有大量的科研人才。 而這次發(fā)力,方杰還直接拿錢把在海外工作的不少華裔專家砸回到了國內(nèi)來。 至于算法平臺,那可是老本行,不就是游戲么,這方面沸騰集團(tuán)擁有天然優(yōu)勢。 ai的學(xué)習(xí),就是通過游戲進(jìn)行學(xué)習(xí)的。 當(dāng)然,ai游戲與人類游戲,稍稍有點(diǎn)區(qū)別,即針對性更強(qiáng),目的不是為了讓ai從游戲里獲得成就感,而是為了使其學(xué)習(xí)進(jìn)步,并幫助人類完成各種工作任務(wù)。 比如紅白機(jī)時(shí)機(jī)就有一款非常簡單的游戲:打方塊。 其游戲玩法是玩家左右滑動(dòng)控制一個(gè)具有彈力的短板,接球并反彈小球,消除游戲界面上方一排排的小方塊,消掉所有方塊就能通關(guān)游戲,并以此獲得成就感。 如果將這款游戲用作ai訓(xùn)練平臺,通過特定的算法和強(qiáng)化學(xué)習(xí),ai就會(huì)從一開始完全接不住球,到后來不光能接住球,還能準(zhǔn)確計(jì)算出小球的反彈角度,消掉上方所有方塊。 甚至經(jīng)過一段時(shí)間的訓(xùn)練和學(xué)習(xí),ai還能找到最優(yōu)的通關(guān)方式。 比如先精準(zhǔn)消掉左上角的幾個(gè)方塊,打通所有方塊的上方路徑,然后再把小球打進(jìn)去,讓小球在方塊陣的上方,在墻壁與方塊陣之間來回反復(fù)反彈,每趟能連擊消除幾十個(gè)方塊,大大提高了通關(guān)速度,并且獲得更多的連擊分?jǐn)?shù)加成。 這樣的游戲思路和技術(shù),可能只有高玩才能想到和做到,到了這一步,ai在打方塊這款游戲里的技術(shù)水平,顯然已經(jīng)超過了普通玩家,其學(xué)習(xí)方式,就不是“監(jiān)督學(xué)習(xí)”了,而是“強(qiáng)化學(xué)習(xí)”,ai擁有了自主學(xué)習(xí)的能力。 同樣的方式,如果將ai放入其他游戲,或者說不同算法模型里不斷地的學(xué)習(xí)總結(jié),那么一樣也能訓(xùn)練培養(yǎng)出能力極強(qiáng)的ai出來。 從本質(zhì)上看,培養(yǎng)教導(dǎo)ai,其實(shí)與教育小孩沒有太大區(qū)別。 那么反過來說,通過游戲進(jìn)行寓教于樂學(xué)習(xí),才是人類小時(shí)候最佳的教育學(xué)習(xí)方式,將游戲視為洪水猛獸,是不可取的,在教育方法上,自我強(qiáng)化學(xué)習(xí)也要比填鴨式“監(jiān)督學(xué)習(xí)”效果更好。 算法問題解決了,接下來就要滿足算力和數(shù)據(jù)的條件。 數(shù)據(jù)不必多說,游戲訓(xùn)練平臺本身就是在不斷地收集數(shù)據(jù),隨著ai智能不斷提升,數(shù)據(jù)收集的速度和質(zhì)量也在不斷提升,而在實(shí)際運(yùn)用場景中,遍布全網(wǎng)的大數(shù)據(jù)了解一下? 比如未來的人工智能無人駕駛技術(shù),現(xiàn)在沸騰汽車、沸騰出行就已經(jīng)在收集相關(guān)數(shù)據(jù)了。 為什么數(shù)據(jù)很重要,就重要在這里,誰擁有大數(shù)據(jù),誰才能做ai,否則連人工智能的門檻都邁不進(jìn)去。 而顯然,沸騰集團(tuán)和方洲國際在數(shù)據(jù)收集方面,絕對是全球領(lǐng)先的,軟硬件基礎(chǔ)比其他國際互聯(lián)網(wǎng)大鱷打得都要好。 而收集、統(tǒng)計(jì)、處理這些數(shù)據(jù),又需要海量的算力支持,這就涉及到超算中心項(xiàng)目了。 經(jīng)過兩年的布局和發(fā)展,目前沸騰超算中心已經(jīng)建立了超過100座超算機(jī)房,投資額超過300億,但算力依然供不應(yīng)求。 其中科研云計(jì)算、云網(wǎng)吧是目前超算中心最大的兩個(gè)業(yè)務(wù)板塊,其中又以科研云計(jì)算的需求為最。 原因很簡單,國內(nèi)提供能這么強(qiáng)大算力,并且服務(wù)費(fèi)用這么低廉的超算中心,只有沸騰超算中心了。 眾所周知,搞科研很燒錢,而計(jì)算機(jī)科研燒錢主要就是燒在了人力、硬件和電力上。 人力方面還好說,畢竟是高科技人才,值那個(gè)價(jià),要做相關(guān)科研,這是必須的投入。 而硬件方面,根據(jù)摩爾定律,計(jì)算機(jī)硬件更新?lián)Q代的速度很快,如果讓科研機(jī)構(gòu)自己時(shí)不時(shí)地升級硬件設(shè)備,成本太高,根本耗不起,但如果不更新升級硬件設(shè)備,能耗大不說,工作效率也低,并非長久之計(jì)。 而且還要考慮硬件折舊問題,許多硬件電子設(shè)備長期滿負(fù)荷運(yùn)轉(zhuǎn),使用壽命比家庭電腦低得多,沸騰超算中心前頭一邊在新建機(jī)房,后面又一邊在更換老舊損壞設(shè)備,運(yùn)營成本居高不下。 第(1/3)頁