原文來源:量子位
圖片來源:由無界AI 生成
AI繪畫王座上的MidJourney,終於迎來強勁對手。
最新挑戰者Ideogram橫空出世,開局就靠免費註冊吸引眾多目光。
最矚目的特性:在圖中精準生成文字,英偉達科學家範麟熙直接毫不客氣地用它畫了一個“It’s over, Midjourney”。
背後公司Ideogram AI,谷歌AI繪畫4大牛集體離職的創業項目,坐標多倫多,帶著1650萬美元(約1.2億人民幣)種子輪融資席成交量而來。
創始團隊中前4人都是谷歌文生圖研究Imagen論文作者,組成一個擴散模型頂級研究團隊。
谷歌藏著掖著這麼久都不給大家玩的先進研究成果,終於被他們給開放出來。
Ideogram AI種子輪融資由a16z和Index Ventures領投。
個人投資者中也不乏知名人物,如OpenAI創始成員Andrej Karpathy,強化學習大牛Pieter Abbeel,Node.js創始人Ryan Dahl、GitHub聯合創始人Tom Preston-Werner等。
甚至團隊的老上司,前谷歌大腦掌門人Jeff Dean也有參與。
別看創始團隊都是技術出身,Ideogram AI在宣傳造勢方面也一點不含糊,直接在𝕏上號召大家刷二創tag,開啟了一波病毒營銷。
AI學會精準畫出文字
讓AI精準畫出文字,一直是個難題。雖然SDXL和Midjourney新出的局部重繪功能有所改善,但網友反饋成功率一直不太高,需要反复嘗試。
Ideogram一搞定這個痛點,直接被網友們玩出花了。
讓文字出現在指示牌上、同時適應環境光影,沒問題。
做一個咖啡拉花也沒問題。
抽像風格的海報,也可以搞出風格合適的字體。
一句話直出品牌logo更是生產力屬性拉滿。
從網友們分享的提示詞中也可以看出,增加畫文字成功概率的“咒語”也很簡單,就一個單詞:
typography(印刷排版)
不過很可惜的是,它還不太能掌握中文。
拋開文字,Ideogram的圖像生成能力,出圖質量可以比肩MidJourney和Stable Diffusion。
如果與Imagen使用完全相同的技術,那麼使用谷歌T5而不是OpenAI CLIP作為語言編碼模型,意味著Ideogram對提示詞裡空間關係描述的理解還要更強。
有人成功用它生成一組風格一致的圖像。
再結合視頻生成工具Pika Labs直接搞出電影預告片風格的短片。
擴散模型頂級研究團隊
Ideogram AI創始團隊共7人,其中4人都是谷歌Imagen的合著者。
其中共同一作Mohammad Norouzi任CEO,他在多倫多大學計算機科學博士就讀期間拿到了谷歌ML博士獎學金。
畢業後他加入谷歌大腦工作了7年,除了生成模型之外也是也是谷歌神經機器翻譯團隊的原始成員,Hinton團隊自監督對比學習框架SimCLR的合著者。
共同一作William Chan (陳俊樂)任新公司CTO,他先後就讀於加拿大滑鐵盧大學、卡內基梅隆大學。
他2012年加入谷歌時先做的機器學習廣告工程,後轉到谷歌大腦作NLP研究。
第三位共同一作Chitwan Saharia本科畢業於孟買理工學院,2019年加入谷歌,現在是Ideogram的聯合創始人。
第四位聯創Jonathan Ho博士畢業於UC伯克利,曾在OpenAI工作一年,後加入谷歌。
他除了是Imagen論文的核心貢獻者,還是去噪擴散模型奠基之作《Denoising Diffusion Probabilistic Models》的一作,這篇論文合著者中的Pieter Abbeel也是Ideogram AI的投資人。
創始團隊中的另外三人,Shayaan Abdullah曾是Twitter的機器學習工程師,於今年4月離職,後加入Ideogram AI。
Jacob Lu為軟件工程師,加入Ideogram之前曾在亞馬遜等公司任職;Jenny Lei是軟件工程實習生,加入Ideogram AI之前曾在谷歌實習。
還要做視頻生成
Ideogram AI的四位聯創在谷歌期間,還完成了視頻生成的後續工作Imagen Video。
在一年前就已經實現了生成1280*768分辨率、每秒24幀的高清視頻片段。
實際上在今年3月,量子位就曾從投資市場獲悉他們的天使輪估值達到1億美元,更多VC想給錢而趕不上、投不進,以及他們創業方向的更多消息:
不僅做圖像生成,將來還要做視頻生成。
無論Imagen還是Imagen Video,谷歌出於安全、倫理等方面考慮都未曾放出試玩、API或開源代碼。
研究成果無法轉化為應用,是近年來不少從谷歌離職創業者遇到的共同問題。
如大模型那邊的Transformer八位作者中,Cohere創始人Aidan Gomez就曾表示離開的原因是“我在谷歌沒有看到大模型發揮它真正的力量”。
Ashish Vaswani與Niki Parmar離開谷歌創辦Adept AI與Essential AI的原因也是“谷歌希望用Transformer優化現有產品,而我們希望創造新產品”。
後來這些研究者所擔心的事也確確實實發生了:
儘管2021年5月(比ChatGPT訓練數據截止日期還早)谷歌就已經開發出了LaMDA對話大模型與聊天機器人,但在推出產品方面有太多顧慮,最終18個月後被隔壁ChatGPT一手直接面對公眾開放搶盡了風頭。
……
吸取了這些教訓,新成立的Ideogram AI也拿出一副盡量開放、先把用戶吸引進來玩的架勢。
最初宣布了1000人測試名額,但沒一會就滿了。
今天似乎又開放了一些名額,量子位上午註冊時並沒有遇到排隊。
總之名額應該還是有限的,感興趣的朋友抓緊了。
試玩地址:
https://ideogram.ai
參考鏈接:
[1]https://ideogram.ai/launch
[2]https://x.com/ideogram_ai/status/1694024927853129757
[3]https://x.com/DrJimFan/status/1694358069638275463
[4]https://x.com/WilliamLamkin/status/1694535089575637048
資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載