听书阁_书友最值得收藏的免费小说阅读网

第43章 又雙叒叕突破啦-《重生之AI教父》


    第(2/3)頁

    以國內(nèi)996大廠的內(nèi)卷風氣,很難容下長回報周期的基礎(chǔ)建設(shè)。

    早些時候看看不出區(qū)別,只覺得國內(nèi)大廠頻繁在xx榜單上露面,刷榜,又是超過這個,又是超過那個。

    直到語言大模型階段,基礎(chǔ)語料數(shù)量和質(zhì)量上的劣勢才暴露無遺。

    “其實這也不能完全怪華國的大廠風氣,美國的互聯(lián)網(wǎng)起步要早,并且很多領(lǐng)域的文獻材料歸檔做得特別好。”孟繁岐也曾仔細思索過這方面的問題。

    “像github,arxiv這樣的大型公開社區(qū),里面都是非常優(yōu)質(zhì)的外文代碼或者論文。這些也不只是美國人自己的積累。而是通過免費公用的形式,收割了全世界的數(shù)據(jù)。”

    “華國人在github上貢獻的代碼行數(shù)也不在少數(shù),反過來看看華國的論文社區(qū),就比如知網(wǎng),純純就是毒瘤。里面屯點碩博生的論文,還要論頁數(shù)收費。就連下載之后的閱讀器,甚至都需要專門的....”

    此消彼長之下,差了多少珍貴的數(shù)據(jù)啊...

    只是此時此刻,李彥弘應(yīng)該還沒有想到這么大規(guī)模的數(shù)據(jù)用于訓練。因而孟繁岐也不急于一時和他討論后面語言類的技術(shù),以及生成式的大模型。

    最近一兩年內(nèi),孟繁岐的重心還是在視覺圖像算法這邊。

    “李總,我個人相信ai技術(shù)的開源程度是相對的,不可以一直這樣透明下去。只是最后成為壁壘的可能并不是模型本身這個純技術(shù)范疇,更多的可能是計算能力,高質(zhì)量的大規(guī)模數(shù)據(jù),以及一些精髓的訓練與反饋方式等等。”

    “即便是現(xiàn)在的開源時期,算法產(chǎn)生到模型和代碼公之于眾,其實正常來說,有個半年到一年的時間差,都是正常的。”

    “對學術(shù)界來說,這不是一個特別長的時間,但對業(yè)界能夠真實落地的方向來說。這個時間導致的結(jié)果可能是天差地別,甚至是一個企業(yè)生與死的區(qū)別和距離。”

    李彥弘聞言微微頷首,他自然明白孟繁岐話里暗示的意思。

    假設(shè)說,李彥弘他想要推出一個實時高性能的圖像檢測應(yīng)用,目前市面上的算法是沒有能夠支持他所需要的計算速度和準確度的。

    即便孟繁岐愿意公開手里的結(jié)果,以論文的審閱方式,至少也是半年后,人們才會知道其中的技術(shù)細節(jié)。

    再加上復現(xiàn)和試錯的時間,他能夠在8-9個月內(nèi)的時間里把技術(shù)應(yīng)用進去,就已經(jīng)很快了。

    但如果與孟繁岐合作,自然就能夠提前8-9個月直接獲得這項技術(shù)。
    第(2/3)頁

主站蜘蛛池模板: 永胜县| 应城市| 铁力市| 乌兰浩特市| 白城市| 文山县| 榆中县| 濉溪县| 申扎县| 连云港市| 玉门市| 涟水县| 三亚市| 托克逊县| 崇仁县| 普格县| 云龙县| 陆良县| 九龙城区| 兴安盟| 武汉市| 扎囊县| 叙永县| 武定县| 平泉县| 张掖市| 开远市| 武陟县| 泗洪县| 通渭县| 芜湖市| 陇西县| 云和县| 平塘县| 曲阜市| 南昌县| 江城| 革吉县| 丹东市| 津南区| 孝昌县|