據Odaily星球日報消息,7月14日,Meta發布多模態語言模型CM3leon。 CM3leon是一種檢索增強、基於標記、僅解碼器的多模態語言模型,能夠生成和填充文本與圖像。 CM3leon是第一個使用改編自純文本語言模型的配方進行訓練的多模態模型,包括大規模檢索增強預訓練階段和第二個多任務監督微調(SFT)階段。作為一個通用模型,它可以進行文本到圖像和圖像到文本的生成,能夠引入產生高質量輸出的獨立對比解碼方法。
巴比特訊