378. 繪圖AI的三種形式-《重生之AI教父》
第(2/3)頁
隱姓埋名,一舉奪得繪畫大賽金獎的那副【太空歌劇院】便是Midjourney的作品。
按理來說,這個路線更具美感,既能夠起到震撼宣傳的效果,又能吸引大量用戶,應該是上上之選。
不過對比開源的擴散模型辦法,Midjourney使用的是公共平臺機器人來處理用戶的請求。
由于其封閉盈利的模式,孟繁岐對這款AI的具體技術細節(jié)知之甚少,也不清楚它最為核心的技術關鍵是什么,因而只得放棄這條線路。
“如果從前世的知名度和受歡迎情況來看,擴散模型和Midjourney會更加穩(wěn)定,不過DALLE在我重生前已經和ChatGPT進行了組合,有非常大的潛力,考慮到以后的發(fā)展情況的話我需要對兩者路線進行融合。”
正是因為需要集兩家之長處,孟繁岐的擴散繪圖AI才會比預期要晚了幾個月。
最終形成了一個比較成熟的壓縮、擴散、和隱空間再擴散三步走的系統(tǒng)。
這種整體做法的實驗、討論和最終確定,耗費的時間甚至比正式訓練還要久。
“也不知道量子計算機這種計算性能數(shù)量級提升的東西什么時候能弄出來,如果算力夠快,其實能省事不少。”孟繁岐想起這件事情還是覺得疲倦。
之所以要拆分出這么多模塊,其中最大的原因就是計算資源消耗的問題。
圖像的分辨率是平方,T方法內的運算又有維度上平方的操作,用戶覺得256和512分辨率的圖片差不多,可反應到全局則往往會是一個數(shù)量級的提升。
為此,只得將擴散模型的學習步驟放到低緯度空間里進行采樣。
說直白點,就是先把分辨率搞低,從而極大地減少擴散前后步驟的計算量。
“這樣做會不會有損性能?使得生成的圖片效果不夠好?”決定發(fā)布這版本算力上有所閹割的擴散模型,CloseAI內部也提出了這樣的擔憂。
畢竟算法方面其實可以做得更好,雖然代價會大一些。
第(2/3)頁
主站蜘蛛池模板:
星子县|
博野县|
隆昌县|
公安县|
乐平市|
陵川县|
裕民县|
潜江市|
呼和浩特市|
徐汇区|
郸城县|
宜兰县|
于都县|
萨嘎县|
酉阳|
商水县|
开阳县|
邮箱|
新疆|
监利县|
蕉岭县|
曲阜市|
云安县|
衡东县|
合山市|
博客|
正定县|
朝阳区|
错那县|
马山县|
寿宁县|
临江市|
肥乡县|
阿克|
靖州|
尼勒克县|
天祝|
武穴市|
文水县|
碌曲县|
天津市|