Hugging Face 開發8 億參數文生成圖模型aMUSEd,幾秒鐘內可產生AI 影像

根據站長之家1 月5 日報道,Hugging Face 團隊正試圖透過一款名為aMUSEd 的新模型加快速度,該模型可以在短短幾秒鐘內生成圖像,比其他競爭對手如Stable Diffusion 更快。這款輕量級的文本到圖像模型基於Google的MUSE 模型,參數規模約為8 億。 aMUSEd 可以部署在行動裝置等裝置上。它的速度來自於它的建造方式。 aMUSEd 採用了一種稱為Masked Image Model(MIM)的架構,而不是Stable Diffusion 和其他影像生成模型中的潛在擴散。 Hugging Face 團隊表示,MIM 減少了推理步驟,從而提高了模型的生成速度和可解釋性。而且它的小尺寸也使得它運行速度很快。

Total
0
Shares
Related Posts