神經網絡如何改變美術世界


美術歷來是人類文化的主要產物之一。幾個世紀以來,它讓人們能夠表達自己並講述故事。

最早出現洞穴畫,然後是油畫和攝影。現在,“圖像”人工智能時代,尤其是神經網絡時代已經到來。

ForkLog 發現了哪些AI 模型用於處理圖片,以及此類系統是否可以取代藝術家。

研究人員在1950 年代和1960 年代開始應用算法來創建圖像。神經網絡允許你複製藝術家的風格,將草圖變成逼真的插圖,使肖像栩栩如生,並創建新圖像。開發和訓練算法的成本從零到數億美元不等。人工智能藝術可以激發靈感,但它的可訪問性會產生許多問題。

人工智能藝術簡史

AI 生成藝術的歷史可以追溯到計算機圖形學的發現和計算機的發明。然後研究人員使用基本算法來創建簡單的圖案和形狀。

1967 年,德國數學家和科學家Frieder Nacke 開發了一個名為Matrix Multiplications 的組合,由12 個圖像組成。他創建了一個方陣,並在其中填充了連續相乘的數字。

研究人員將獲得的結果翻譯成給定間隔的圖像,其中每個值都被分配了某種形狀和顏色的視覺符號。然後他根據矩陣的值將圖形放在柵格中。

在他的工作中,Nake 經常使用隨機數生成器,並且可能部分自動化了乘法過程。

圖片來自Frieder Nake 的矩陣乘法組合。資料:泰特。

1973 年,藝術家Harold Cohen 開發了AARON 算法套件,該套件能夠徒手繪製某些物體。他發現系統開始創建以前未知的形式。

起初,該程序生成抽像畫,然後學會繪製更複雜的形狀,包括岩石、植物和人。

圖片由AARON 生成。數據:新地圖集。

自1990 年以來,研究人員和藝術家一直在機器人技術中使用人工智能模型,教機器如何創作繪畫和雕塑。

2015 年,谷歌工程師Alexander Mordvintsev 推出了DeepDream 計算機視覺程序,該程序使用成交量積神經網絡通過算法幻視來發現和改進圖像中的模式。

該系統的工作原理是根據原始圖像的哪些片段類似於某些熟悉物體的模型來扭曲原始圖像。

當谷歌發布該方法並開放算法的源代碼時,市場上出現了許多工具和服務,允許任何人將他們的照片轉換為“迷幻”圖像。

原始圖像(左)並使用DeepDream 處理(右)。數據:MartinThoma。

2022年,人工智能藝術被應用在多個領域,包括營銷、時尚和娛樂。

使用OpenAI 的DALL-E 2 算法創建的Cosmopolitan 印刷封面。數據:國際化。

模型還有助於創作繪畫。

Jason Allen 使用Midjourney 算法創作的Théâtre D’opéra Spatial 繪畫。數據:主板。用於處理圖像的神經網絡

2022年可能會隨著人工智能藝術成為主流的時間而載入史冊。基於不同算法構建的高質量工具的蓬勃發展使每個擁有智能手機和互聯網連接的人都可以使用神經創造力。

AI 模型允許你複製藝術家的風格,將草圖變成逼真的插圖,使肖像栩栩如生,並創建新圖像。不同或相似的方法和工具用於不同的任務。

神經風格遷移(NST) 是一種基於成交量積神經網絡的技術,可讓你創建一幅以執行方式模仿另一幅圖像的繪畫。用戶可以將走狗的照片轉換成Katsushika Hokusai 的印刷品,或者生成Jan Vermeer 的蒙娜麗莎。

內容的原始照片(左)、具有所需樣式的圖像(中)和結果(右)。數據:Instapainting。

生成對抗神經網絡(GAN) 負責使用其他圖像的風格創作新的藝術作品或繪畫作品。這些算法同時包含兩個模型:生成內容的生成器和評估內容的鑑別器。

基於GAN 的系統可以繪製類似於訓練數據中心化的圖像,包括人臉、貓臉、家具和其他物體。

由生成對抗神經網絡創建的不存在的人的面孔。數據:此人不存在。

此外,生成對抗神經網絡將有助於“恢復”景觀草圖。

使用Nvidia Canvas 工具將草圖轉換為逼真的風景。數據:英偉達。

然而,當今最流行的藝術創作工具是基於AI 的文本圖像生成器,它們使用OpenAI GPT-3 等語言模型。

使用穩定擴散生成的圖像。數據:詞彙。

這種系統的座右銘是“打印和接收”。用戶需要用自然語言提出任何查詢,例如“穿著宇航員服的長發綹的駱駝”,算法將根據提示生成圖片。

“穿著宇航員服,留著長發綹的駱駝”的圖片。資料:中途。

文本描述可以包含大量單詞,添加或刪除這些單詞會極大地改變結果。他們在創建圖像方面發揮著關鍵作用。甚至有一些特殊的市場,那些願意的人可以花錢購買特定圖像樣式的請求。

開發人員在大量圖像及其文本描述上訓練AI 生成器,訓練模型以尋找它們之間的聯繫。他們還經常使用擴散過程——該算法從一組隨機點開始生成並逐漸改進圖像,使其更接近給定的提示並消除噪聲。

大多數流行的AI 生成器都有內容創建限制:它們不能描繪裸體、暴力、現實面孔或政治人物。此類OpenAI 工具包括DALL-E 2、Google Imagen 和Midjourney。有時他們的使用是有償的。

但是,有些系統沒有這種限制,例如穩定擴散。 Stability AI 工具的開發者表示,該模型沒有過濾器,可以創建任何內容。

使用穩定擴散創建的唐納德特朗普的形象。數據:詞彙。

文本圖像生成器可用於完善完成的作品。 8 月,OpenAI 推出了Outpainting 功能,讓DALL-E 2 可以通過提示擴展繪畫。

Jan Vermeer 的“戴珍珠耳環的女孩”及其擴展版本,使用DALL-E 2 創建。數據:OpenAI。開發一個神經網絡需要多少錢?

這是最模棱兩可的問題。答案是:從零到幾億美元。

首先,需要知識來創建和訓練AI 算法。沒有編程技能和不想花錢在價格上的用戶首先需要了解神經網絡的原理。有許多免費文章、資源和服務,例如Teachable Machine 教育Google項目可以幫助你。

你還需要了解Python 等編程語言以及用於開發和訓練神經網絡的庫– TensorFlow、PyTorch 或其他。

此外,你需要為所需任務收集訓練數據集:你可以自己創建、從開源獲取或購買。要開發按需圖像生成器,你需要一組圖片及其文字描述。

模型的準確性直接取決於數據的質量和數量。它還受到所使用的設備和所花費的計算資源的影響。

通過以上所有內容,你可以免費創建一個用於處理圖像的神經網絡。

然而,Meta、亞馬遜、蘋果、微軟和Alphabet 等大公司正在向此類產品投資數百億美元。成本包括研究、開發、培訓、性能測試、部署、商業化和技術支持。有時在這個過程中花費數年時間,結果,項目可能被關閉,或者相反,變得不可替代。

視覺AI 算法的優缺點

使用神經網絡創作藝術品的優勢之一是生成逼真的數據。此類圖像將用於電影、廣告、遊戲和其他領域。

人工智能算法跳出框框“思考”。他們能夠以原始方式創建以前未知的圖像,異常排列對象並混合紋理。這樣的藝術可以成為大型項目的靈感來源。

通過技術和數據的不斷現代化,AI藝術也在不斷進化,不斷帶來新的理念。

此外,算法可以加快一些問題的解決。借助神經網絡,你可以創建徽標、剪輯並用於營銷目的。

在這些缺點中,值得強調的是缺乏人類情感。有時這是一個優勢,但在創作藝術品時,很多人需要一個故事。

由於訓練數據集有限,人工智能藝術可能會變得乏味。如果沒有對新數據集進行不斷的現代化和培訓,生成的圖像將開始重複並失去其獨特性。

此外,開發人員無法控制神經網絡的創作過程。訓練後,算法會根據設置的權重輸出結果,如果不適合你,就得重新訓練模型。

但使用人工智能的主要擔憂是道德問題。開發人員並不總是能夠控制技術的分發和使用。算法不能被認為是作品的作者,但創作者對其不正確的“行為”承擔責任。

由於技術的可用性,攻擊者可以使用人工智能創建圖像來欺騙人們、竊取他們的身份並傳播仇恨言論。

神經網絡會取代藝術家嗎?

曾幾何時,攝影被認為是一種新的創意趨勢。經過近200年的存在,它並沒有取代藝術家和藝術家,而是迫使他們發展和適應。

這造就了新一代的創意人。藝術家和攝影師開始共同創作作品,這些作品可以令人驚喜、吸引和激發對美的思考。

藝術,無論以何種形式出現,都會讓人有感覺。新的藝術方面還有很多空間可以喚起以前未知的感覺。

生成式人工智能的創造者可以稍微改變現有的創造力形式,但他們不會破壞它們。

DALL-E 2、Stable Diffusion 和Midjourney 等工具可能會繼續演變成非常複雜的藝術引擎,並幫助藝術家完成他們的工作。

隨著神經網絡的充分和不斷發展,人們將能夠定期使用技術來激發和擴展他們的思想可能性。

在Telegram 上訂閱ForkLog 新聞:ForkLog AI – 來自AI 世界的所有新聞

在文本中發現錯誤?選擇它並按CTRL+ENTER

資訊來源:由0x資訊編譯自FORKLOG。版權歸作者Марина Глайборода所有,未經許可,不得轉載

Total
0
Shares
Related Posts