听书阁_书友最值得收藏的免费小说阅读网

378. 繪圖AI的三種形式-《重生之AI教父》


    第(2/3)頁

    隱姓埋名,一舉奪得繪畫大賽金獎的那副【太空歌劇院】便是Midjourney的作品。

    按理來說,這個路線更具美感,既能夠起到震撼宣傳的效果,又能吸引大量用戶,應該是上上之選。

    不過對比開源的擴散模型辦法,Midjourney使用的是公共平臺機器人來處理用戶的請求。

    由于其封閉盈利的模式,孟繁岐對這款AI的具體技術細節(jié)知之甚少,也不清楚它最為核心的技術關鍵是什么,因而只得放棄這條線路。

    “如果從前世的知名度和受歡迎情況來看,擴散模型和Midjourney會更加穩(wěn)定,不過DALLE在我重生前已經和ChatGPT進行了組合,有非常大的潛力,考慮到以后的發(fā)展情況的話我需要對兩者路線進行融合。”

    正是因為需要集兩家之長處,孟繁岐的擴散繪圖AI才會比預期要晚了幾個月。

    最終形成了一個比較成熟的壓縮、擴散、和隱空間再擴散三步走的系統(tǒng)。

    這種整體做法的實驗、討論和最終確定,耗費的時間甚至比正式訓練還要久。

    “也不知道量子計算機這種計算性能數(shù)量級提升的東西什么時候能弄出來,如果算力夠快,其實能省事不少。”孟繁岐想起這件事情還是覺得疲倦。

    之所以要拆分出這么多模塊,其中最大的原因就是計算資源消耗的問題。

    圖像的分辨率是平方,T方法內的運算又有維度上平方的操作,用戶覺得256和512分辨率的圖片差不多,可反應到全局則往往會是一個數(shù)量級的提升。

    為此,只得將擴散模型的學習步驟放到低緯度空間里進行采樣。

    說直白點,就是先把分辨率搞低,從而極大地減少擴散前后步驟的計算量。

    “這樣做會不會有損性能?使得生成的圖片效果不夠好?”決定發(fā)布這版本算力上有所閹割的擴散模型,CloseAI內部也提出了這樣的擔憂。

    畢竟算法方面其實可以做得更好,雖然代價會大一些。
    第(2/3)頁

主站蜘蛛池模板: 星子县| 博野县| 隆昌县| 公安县| 乐平市| 陵川县| 裕民县| 潜江市| 呼和浩特市| 徐汇区| 郸城县| 宜兰县| 于都县| 萨嘎县| 酉阳| 商水县| 开阳县| 邮箱| 新疆| 监利县| 蕉岭县| 曲阜市| 云安县| 衡东县| 合山市| 博客| 正定县| 朝阳区| 错那县| 马山县| 寿宁县| 临江市| 肥乡县| 阿克| 靖州| 尼勒克县| 天祝| 武穴市| 文水县| 碌曲县| 天津市|