微軟推出人工智能模型CoDi,可互動和生成多模態內容

據IT 之家7 月11 日報導,微軟近日推出了名為可組合擴散模型(CoDi),這是一種獨特的、基於可組合擴散的人工智能模型,其設計目標是互動和生成多模態內容。微軟設計CoDi 的目標,旨在解決傳統單一模態AI 模型的局限性。以同步視頻和音頻為例,獨立生成的信息流拼接在一起時可能存在不一致和對齊的問題。 CoDi 採用了獨特的可組合生成策略,在擴散過程中對齊多模態,從而生成相互交織的模式,並且CoDi 能夠處理任意輸入模式並生成任意模態的內容。據悉,CoDi 由Microsoft Azure 認知服務研究團隊與北卡羅來納大學教堂山分校合作開發,也是Microsoft 項目i-Code 的一部分,該項目使用人工智能來增強人機交互。

Total
0
Shares
Related Posts