第43章 又雙叒叕突破啦-《重生之AI教父》
第(2/3)頁
以國內(nèi)996大廠的內(nèi)卷風氣,很難容下長回報周期的基礎(chǔ)建設(shè)。
早些時候看看不出區(qū)別,只覺得國內(nèi)大廠頻繁在xx榜單上露面,刷榜,又是超過這個,又是超過那個。
直到語言大模型階段,基礎(chǔ)語料數(shù)量和質(zhì)量上的劣勢才暴露無遺。
“其實這也不能完全怪華國的大廠風氣,美國的互聯(lián)網(wǎng)起步要早,并且很多領(lǐng)域的文獻材料歸檔做得特別好。”孟繁岐也曾仔細思索過這方面的問題。
“像github,arxiv這樣的大型公開社區(qū),里面都是非常優(yōu)質(zhì)的外文代碼或者論文。這些也不只是美國人自己的積累。而是通過免費公用的形式,收割了全世界的數(shù)據(jù)。”
“華國人在github上貢獻的代碼行數(shù)也不在少數(shù),反過來看看華國的論文社區(qū),就比如知網(wǎng),純純就是毒瘤。里面屯點碩博生的論文,還要論頁數(shù)收費。就連下載之后的閱讀器,甚至都需要專門的....”
此消彼長之下,差了多少珍貴的數(shù)據(jù)啊...
只是此時此刻,李彥弘應(yīng)該還沒有想到這么大規(guī)模的數(shù)據(jù)用于訓練。因而孟繁岐也不急于一時和他討論后面語言類的技術(shù),以及生成式的大模型。
最近一兩年內(nèi),孟繁岐的重心還是在視覺圖像算法這邊。
“李總,我個人相信ai技術(shù)的開源程度是相對的,不可以一直這樣透明下去。只是最后成為壁壘的可能并不是模型本身這個純技術(shù)范疇,更多的可能是計算能力,高質(zhì)量的大規(guī)模數(shù)據(jù),以及一些精髓的訓練與反饋方式等等。”
“即便是現(xiàn)在的開源時期,算法產(chǎn)生到模型和代碼公之于眾,其實正常來說,有個半年到一年的時間差,都是正常的。”
“對學術(shù)界來說,這不是一個特別長的時間,但對業(yè)界能夠真實落地的方向來說。這個時間導致的結(jié)果可能是天差地別,甚至是一個企業(yè)生與死的區(qū)別和距離。”
李彥弘聞言微微頷首,他自然明白孟繁岐話里暗示的意思。
假設(shè)說,李彥弘他想要推出一個實時高性能的圖像檢測應(yīng)用,目前市面上的算法是沒有能夠支持他所需要的計算速度和準確度的。
即便孟繁岐愿意公開手里的結(jié)果,以論文的審閱方式,至少也是半年后,人們才會知道其中的技術(shù)細節(jié)。
再加上復現(xiàn)和試錯的時間,他能夠在8-9個月內(nèi)的時間里把技術(shù)應(yīng)用進去,就已經(jīng)很快了。
但如果與孟繁岐合作,自然就能夠提前8-9個月直接獲得這項技術(shù)。
第(2/3)頁
主站蜘蛛池模板:
永胜县|
应城市|
铁力市|
乌兰浩特市|
白城市|
文山县|
榆中县|
濉溪县|
申扎县|
连云港市|
玉门市|
涟水县|
三亚市|
托克逊县|
崇仁县|
普格县|
云龙县|
陆良县|
九龙城区|
兴安盟|
武汉市|
扎囊县|
叙永县|
武定县|
平泉县|
张掖市|
开远市|
武陟县|
泗洪县|
通渭县|
芜湖市|
陇西县|
云和县|
平塘县|
曲阜市|
南昌县|
江城|
革吉县|
丹东市|
津南区|
孝昌县|