第41章 未來模型的大與小-《重生之AI教父》
第(3/3)頁
孟繁岐雖有重生的優勢,但有一位長者說得好。
人吶,就不知道,自己不可以預料。
一個人的命運啊,當然要靠自我奮斗,但是也要考慮到歷史的進程。
“華國的氛圍是否適合最前沿的ai技術發展?此話怎講?”李彥弘如今也是走在開拓道路上,這件事情自然是他非常關心的事情。
“李總是這個時候唯一愿意親自出馬來找我的人,我便也掏心掏肺跟您說幾句心里話。”孟繁岐回顧了一下ai整體的發展脈絡,如此說道,“alexnet和我的dreamnet現在徹底打開了深度學習的大門,可以預見,在短時期內,各個方向和領域的ai模型性能將會有一個巨大的突破。”
“不錯,如今正是比拼時速的時候,一步快,則步步快。”李彥弘點頭稱是,肯定了這個前提。
“技術上的指標是一回事,從總體的趨勢上來看,如果想要真的把ai的技術落地,讓人們都可以使用,無非就是把模型做大或者做小。”
“做大或者做小...?你是指終端還是云端兩種發展的方向?”李彥弘很快跟上了孟繁岐的思路。
“沒錯,學術研究的時候起初不會過多關注模型的參數量大小,和它的計算損耗。但實際投入使用的時候,則會必然分出極致優化縮減的小模型,和強調性能開放接口給人使用的云端大模型。”
“在早期的時候,可能會反復魔改和調整模型的結構和設計,讓模型盡可能快,盡可能好。但久而久之,隨著數據的積累,篩選,更高質量的標注,以及最重要的,更大的模型參數量。”
“規模極其龐大的模型,會在某一個臨界點徹底產生質變,讓絕大部分小模型失去價值。尤其是以語言語音類,和圖像生成類模型。它們的使用體驗是無法向下的。”
孟繁岐回想起重生前,李總面對chatgpt(3.5版本)和gpt-4,強行頂住壓力提早推出的大模型文心一言,不得不在心中嘆了口氣。
其實文心一言并不是一無是處,只是這種與人交互的智能模型,如果相形見絀,就會顯得特別不堪一擊。
第(3/3)頁