據品玩援引HuggingFace 報導,百度的視覺技術研究團隊近日發布論文,推出了一款視頻生成模型產品VideoGen。論文顯示,研究團隊先通過圖像生成模型用文本生成高質量圖片,之後引入了一個以參考圖像和文本提示為條件的高效級聯潛在擴散模塊,用於生成潛在視頻,之後通過增強型視頻解碼器將潛在視頻表示映射為高清視頻。
巴比特訊