撰寫:Theo Priestley,《未來從現在開始》的作者
編譯:深潮TechFlow
2011 年8 月20 日,a16z 的創始人Marc Andreessen 在華爾街日報上發表了一篇具有重要意義的文章《為什麼軟件正在吞噬世界? 》。
*注:此篇文章撰寫於2022 年9 月26 日,以下為正文內容。
你看,這一切都源於機器和深度學習的進步,這些進步在DALL-E、MidJourney、Stable Diffusion 以及最近NVIDIA 發布的Get3D 中得到了爆發。
NVIDIA 發布的的新技術GET3D AI 工具將會d對許多初創公司產生影響,這些公司都在努力開發掃描物體以填充元宇宙工具和應用程序。
“令人驚嘆的是,NVIDIA GET3D 只需要使用2D 圖像進行訓練,就能夠生成高保真度的紋理和復雜的幾何細節,生成的3D 對象採用了流行的圖形軟件應用程序所使用的相同格式,因此用戶可以立即將它們導入到3D 渲染器和遊戲引擎中進行進一步編輯。”
據NVIDIA 稱,僅用兩天的時間,就使用A100 Tensor Core GPU 將約1 百萬張圖像輸入到GET3D 中。這意味著它將以超乎想像的速度和規模顛覆其他手動掃描日常物品的工具。
AI 帶來的瞬間生成帶紋理的3D 形狀的能力,對遊戲開發者而言將成為改變遊戲規則的關鍵,有助於他們快速向虛擬世界填充各種有趣的對象。
借助另一個NVIDIA AI 工具StyleGAN-NADA 的幫助,開發者還可以通過文本提示對對象應用各種風格,例如創建破舊的建築或覆蓋泥漿的4×4 車等。
這些生成的圖像最終將作為通用場景描述(USD)文件格式,NVIDIA 和其他公司正在努力將其推廣為對象的互操作標準之一。
這意味著,人們可以通過上傳自己的圖像來在像Sketchfab 這樣的平台上賺錢的民主化創作者經濟的承諾,實際上已經成為過去。
例如,Quixel 的Megascan 庫可以被新工具吸收並應用於企業。
在MidJourney、DALL-E 和現在的Stable Diffusion 之間,我們很快就能輸入文本提示,AI 將從中生成元宇宙。
完全實現的3D 和沈浸式環境並不遙遠,我敢打賭,在不到2 年的時間裡,我們就可以為Unity 或虛幻引擎創建一個插件,能夠使用幾個短語或單詞,自動生成虛擬世界以實現這個目的。
雖然已經出現了一些縮短設計過程的工具,但這個旅程的最後一步只是告訴AI 你想要的結果,幾乎沒有其他涉及。
然後,用戶可以調整形狀或保持原樣。我們已經看到“提示工程師”的跡象——那些了解如何操作獲取最佳初始結果所需短語的人,他們將湧現出來,並至少在短期內佔據優勢地位。
但他們不是真正的創作者,而AI 將在支配該行業的同時使這些人留在後面。
Fabian Stelzer 已經用社區驅動的敘述和這些工具創建了一組100%生成的科幻短片,這非常令人興奮,因為它展示了AI 如何民主化創造力,但同時也消除了許多通常會參與這些項目的傳統創作者。
能夠在探索這個世界的同時“即興生成預告片”的體驗非常令人興奮,這是未來的一瞥。
隨著這些工具接受更多的真實世界數據進行訓練,將只會增加它們更快地實現的可能性。
但已經有了反對聲音。
圖像傳媒集團和流行的庫存圖像和編輯攝影供應商Getty 本周宣布,將禁止使用人工智能藝術作品,引用版權問題。
“這些模型的產出和圖像元數據以及包含在圖像中的那些個人權利問題沒有得到解決,因此存在版權方面的真正擔憂。我們正在積極採取行動,以造福我們的客戶。”
Getty 是一個巨大的圖像庫,被全世界的媒體公司使用。它包含圖像和原始照片,訂閱者可以使用這些圖像和原始照片來說明他們的文章,但需支付許可費。
Getty 宣布將加強對其平台上使用AI 製作的圖像的監管,並表示任何使用Stable Diffusion、DALL-E 和Midjourney 等程序製作的圖像都將被禁止使用。
所以現在出現了分歧——創作者和使用AI 進行創作的人之間的戰爭。這將導致在整個行業中產生連鎖反應。軟件可能正在吞噬世界,但AI 正在迅速地吞噬創作者經濟,甚至在這個行業開始之前就已經發生了。
原文鏈接
聲明:本內容為作者獨立觀點,不代表0x财经 立場,且不構成投資建議,請謹慎對待,如需報導或加入交流群,請聯繫微信:VOICE-V。
來源:深潮TechFlow