4)GPU在四年時間里提速65倍 我們先從訓(xùn)練開始。全新Pascal GPU的項(xiàng)目投資約20億美元,是數(shù)千名工程師花費(fèi)三年多時間的工作成果。作為首款經(jīng)深度學(xué)習(xí)優(yōu)化的圖形處理器,Pascal的網(wǎng)絡(luò)處理速度比Kepler圖形處理器要快65倍。如果一臺計(jì)算機(jī)配備八臺通過VIDA NVLink連接的Pascal圖形處理器,即可創(chuàng)建有史以來最高吞吐量的互連結(jié)構(gòu),其網(wǎng)絡(luò)處理速度比250臺傳統(tǒng)服務(wù)器還要快。” ‘’每天數(shù)百億次互聯(lián)網(wǎng)查詢很快將需要人工智能,這意味著每次查詢將需要進(jìn)行數(shù)十億次的數(shù)學(xué)運(yùn)算。云服務(wù)的總負(fù)載將很龐大,以確保實(shí)時響應(yīng)。為了得到更快速的數(shù)據(jù)中心推理性能,我們公布了Tesla P40和P4 GPU。 P40使數(shù)據(jù)中心推理吞吐量加速40倍。這是超大規(guī)模數(shù)據(jù)中心的典型。” ”軟件是VIDA深度學(xué)習(xí)平臺的重要組成部分。在訓(xùn)練方面,我們有CUDA和cuDNN。在推理方面,我們公布了一款優(yōu)化推理引擎TensorRT。TensorRT通過融合一個層級和多個層級內(nèi)的操作,簡化低貢獻(xiàn)權(quán)重,將精確度降至FP16或INT8,以及采用許多其他技術(shù),從而改善性能,同時不損害準(zhǔn)確度。” ”將來,數(shù)十億計(jì)的人工智能設(shè)備,將利用深度學(xué)習(xí)來執(zhí)行智能的任務(wù)。無人機(jī)將自主導(dǎo)航通過一個倉庫,找到相關(guān)物品并撿取。便攜式醫(yī)療儀器將利用人工智能,現(xiàn)場診斷血液樣本。智能攝像機(jī)將學(xué)會向我們警告我們關(guān)心的情況。我們已經(jīng)針對此類智能物聯(lián)網(wǎng)設(shè)備,創(chuàng)建了一臺高效能人工智能超級計(jì)算機(jī)。Jetson TX1是一個信用卡大小的模塊,只用10瓦功率就可以達(dá)到1 TeraFLOP FP16性能。其架構(gòu)與我們最強(qiáng)大的GPU相同,可以運(yùn)行所有相同軟件。” ”簡而言之,我們提供一個端到端人工智能計(jì)算平臺——從GPU到深度學(xué)習(xí)軟件和算法,從訓(xùn)練系統(tǒng)到車載人工智能計(jì)算機(jī),從云到數(shù)據(jù)中心到個人電腦到機(jī)器人。VIDA的人工智能計(jì)算平臺無處不在,方便AI開發(fā)者使用。” 他的專業(yè)理解能力,讓他能跟得上朱教授的節(jié)奏。 旁邊專業(yè)速記的記者,打字速度都沒他快,不時探頭過來抄錄。 一只小白手伸過來,不停地扯他的衣袖。 以為是小孩子搗亂,林燃看都懶得看,將小白手撥拉到一邊。