第(1/3)頁
可惜歡樂的時光總是短暫的,除了孟繁岐和唐璜兩位休了學的人,其他的四位仍舊有學業在讀。
這次正常上課的時間,能和孟繁岐一同過來,已經是相當不容易了。
再拖延了幾天,終究還得趕回學校,否則掛上三四科也不是沒有可能。
孟繁岐有心提攜身邊人一把,但也不至于一路護送,讓人本科也別念完,這個不現實。
這次帶他們過來,主要是讓他們見識了解一下AI界現在的情況和潛力。
準備繼續留在國內的劉旭,麥芒和秦慧三人,孟繁岐自然是有著自己的安排和打算的。
他希望幾人協助去做的最重要的事情,就是在國內建立一個優質中文數據庫。
這個東西是未來中文ChatGPT能夠取得成功最最關鍵的因素。
孟繁岐有信心憑借自己的能力把西方AI界的資源盡數收入囊中,但他卻解決不了中文優質數據不足的這個根本難題。
這也是重生前,困擾華國諸多科技公司的最大原因,優質的中文數據遠少于英文。
而優質數據就是AI時代的石油。
華國互聯網起步晚,數據積累遜色一些是一方面,一個個都忙著在賺快錢則是另一方面。
這種白白投錢進去,收集數據,標注數據的臟活累活誰肯做呢?
為了中文和華國AI在四五年后的ChatGPT時代能夠跟上節奏,這件事就只能由孟繁岐提前布局了。
這可是個黑洞一般吞噬金錢的大工程,一位員工的使用成本,一年少說就得十萬塊,招百來個人,一年過去就是數千萬。
收獲得只有一堆堆無情的數據,這件事情短期內不會有任何的營收。
四五年的長線,孟繁岐少說得砸三五個億進去,如果想要數據的質量和規模上精益求精,十幾個億進去也不是沒可能。
“還好跟谷歌簽了分成合約,否則真不知道哪里去弄這些錢。”
孟繁岐感到了些許的壓力,仔細計算了幾筆賬之后,他意識到自己想做的事情成本似乎遠高于自己的想象。
給谷歌的推薦廣告算法更新得盡快提上日程了。
第(1/3)頁