當全球最大圖庫,決定「擁抱AI」


圖片來源:由無界AI生成

時代的一粒灰,落在個人頭上就是一座山。

AI 時代浪潮的一朵浪花,落在任何公司頭上,要不是海嘯,​​就是「潑天富貴」?

身為全球最大圖片社,主打「真實」的Getty Images 曾經明令禁止AI 生成內容進入圖庫。但最近,Getty 卻推出了自己的AI 產生工具Generative AI by Getty Images。

是什麼讓Getty 產生了一百八十度的態度大轉變?作為內容交易平台的Getty,是否有可能在AI 時代,成為另一種巨頭?

所有這些問題,Getty Images 的CEO Craig Peters 最近在程式碼大會上,與The Verge 主編Nilay Patel 進行了長談,解釋了Getty 的AIGC 工具如何在版權和收益上幫助創作者,以及其背後的思考。

以下就是Craig Peters 對話內容的截選,由極客公園編譯:

01 絕對「安全」的AIGC 工具

Nilay:首先,讓我們從新聞開始吧,因為很多人都以為你會反對AI「搶奪」內容,但你卻在本周宣布推出了一款AI 工具,這太令人費解了。

Craig:是的,我們推出了AI 影像產生工具-G​​enerative AI by Getty Images。該產品還結合了英偉達(Nvidia)提供的Edify 大模型,該模型可在英偉達的生成式AI 模型庫Picasso 上使用。

Getty 推出的AIGC 工具|Getty Images

選擇合作,是因為我們希望可以利用英偉達(Nvidia)的算力,推出一款「獨特」的AI 工具。

首先,這個工具尊重它訓練庫的「智慧財產權」。它是經過「授權」的——它只根據Getty Images 的創意內容進行訓練,而且我們還會向這些內容的創作者支付「報酬」。因此,當我們從這項服務中獲得更多收入時,這些創作者也會因為他們對工具的貢獻而獲得回報。

其次,它完全符合商業安全標準,因此不會有第三方智慧財產權糾紛。它不能製作“深度偽造”的內容。它不知道「教皇」是什麼,也不知道 [巴黎世家] 是什麼,更不會將兩者混在一起。

我們認為第一版工具的品質相當出色,其產生的圖片的品質和環境渲染都比預期的要好。

Nilay:你認為在你所處的「市場」裡,人們想要這樣的照片嗎?

Craig:當然。首先,生成式AI(AIGC)並不是突然出現的。它已經存在多年。我們的合作夥伴英偉達(Nvidia)實際上推出了第一個從文字到圖像的GANs 模型。因此,我們知道它即將到來,我們向客戶提出的問題是:「你們打算如何使用它?你們需要什麼?」

用提示詞「衣冠楚楚的人在代碼大會上席地而坐」產生的圖片|Getty Images

我們為客戶創造服務,讓他們在更高層次上創造,節省他們的時間、金錢,並消除他們的智慧財產權風險。

最後一點在AI 領域至關重要。我們從客戶那裡聽到的每一句話都是:「我們想使用這項技術。」從媒體客戶到機構客戶,再到企業客戶,情況各不相同。他們都希望透過這些工具釋放自己的創造力,但他們都需要確保不會侵犯第三方的智慧財產權。

全球各地的情況也各不相同。如果你有一張圖片,但它產生了第三方品牌的形象,或某人的名字和肖像,如Travis Kelce 或Taylor Swift,這就是一個問題。

但在智慧財產權方面還有更「細微」的問題,例如展示帝國大廈的圖像。你可能會因此被起訴。紋身也是有版權的。煙火其實也是有版權的。格魯奇兄弟公司(Grucci Brothers)就擁有那個笑臉煙火的版權。

因此,我們在其中加入了很多內容,以確保客戶在使用時“絕對安全”此外,我們也準備好了“賠償”,以防萬一,儘管,我們相信不會有問題的。

02 與創作者分成的「模式問題」

Nilay:這也有它的另一面。你知道所有的訓練資料都是你的。那接下來,你就可以說:「好吧,我們要付錢給我們的創作者了。」但這要怎麼用「模型」來「規範」呢? ——「我們生成了這張圖片。有人為此向我們支付了報酬,現在我們要向你支付多少美金呢?」

Craig:在我們的案例中,是在「像素」層面上,但我想這個問題早先是圍繞著「音頻」提出的。答案是,現在還不存在這些「模型」我們測試了很多「模型」,但發現它們不足以實現歸因。

因此,目前我們的方法是根據兩點來分配「報酬」:你的內容在訓練中心化佔多大比例?然後,隨著時間的推移,這些內容在我們的授權世界中表現如何?

這同時代表了「質量」和「數量」的代表,是兩者的一種「融合。」

Nilay:所以,你只是在使用固定的「模式?」

Craig:是的,隨著時間的推移,我們也會對此進行評估。如果我們找到更公平的方法,我們一定會接受。事實上,我們一直在尋找可以做到這一點的技術,但目前來看,我認為這還達不到我們的目標。

提示詞「流行明星和超級盃球員開敞篷車」產生的圖片|Getty Images

Nilay:這裡的「動態」非常有趣。因此,如果你的客戶希望為廣告活動產生一張照片或其他東西,我可能會去使用Getty 的工具,而不是聘請攝影師。它會比僱用真正的攝影師更便宜嗎?

Craig:這還有待時間考證。但我認為這是一種完全不同的模式。這是一種以「呼叫成本計算(cost-per-call)」的模式,是一種生成模式。你玩過這個工具;我認為這是一個非常好的工具,它能引導你完成提示,你從一開始就能獲得高品質、高解析度的圖片。

但這是「機械式」的工作。我認為,這與授權「預拍攝(pre-shot)」相比,是有差異的,因為後者是我們與客戶一起花時間研究的內容。

歸根究底,我們還是要盡量節省客戶的「時間」,因為這是他們所應用的最昂貴的東西。

我認為,在某些情況下,這可能很有創意,但不一定是最省時。而在許多情況下,我們的「預拍攝(pre-shot)」可以更真實、更有效率,因為你正在「搜尋」——你不用為搜尋付費。你會得到各種各樣的內容,包括真實的人物、真實的地點。在很多情況下,品牌都很在意這一點。但這可能是一個更“高效”的過程。

因此,我認為,隨著時間的推移,我們會發現這一點。

Nilay:Getty 在攝影領域「獨樹一格」你僱用了一群攝影師,把他們送到危險的地方。你們製作了大量新聞照片。你是否從自己的創作者那裡聽到AIGC 是「問題」?

Craig: 我不會說我們從自己的創作者那裡聽到AI是個問題。我們代表全球50 多萬攝影師。因此你可以想像,在這些受眾中,有很多不同的觀點和看法,把這些觀點和看法乘以1000,你會得到更多。

我們聽到的是對「智慧財產權」的擔憂——最終,人們會透過訂閱服務或其他模式,利用自己的「智慧財產權」對事物進行訓練,從而創造價值。

歸根結底,人們希望解決這個問題。但我們從客戶那裡聽到的還是,他們想要創造,想要使用這些工具。

我們的觀點從一開始就是這樣:我們相信AI 可以為整個社會帶來建設性的利益,但它需要考慮一些事情,因此我們一直在尋求交易數據的「透明度」。

我們認為,創作者和智慧財產權擁有者有權決定是否對他們的材料進行訓練,這些模型的創建者不應該被第230 條之類的條款所涵蓋,如果你創建了這些模型並將其公佈於眾,你就應該承擔一定的責任。

再次強調,身為媒體的一員,我們最不想做的事就是製作出一個真正可以製作「深度偽造」的工具。

03 Getty VS 所有AI 公司

Nilay:這裡面有一些大的想法。在我短暫的版權律師生涯和更長的記者生涯中,我發現沒有人真正關心版權法。他們不關心智慧財產權,他們只關心「錢。」但現在,錢是一些非常棘手的版權問題的下游。

你剛剛也聽到微軟的技術長Kevin Scott 說,他和微軟公司都認為,「這一切都建立在合理使用的基礎上,而合理使用的論點最終會成功,或以某種方式被修改。 」

由Stable Diffusion 工具產生的Getty 版權標誌的圖片|the verge/Stable Diffusion

然而,從很多方面來看,你都站在了這問題的另一面。你正在起訴Stability 公司使用了大量Getty 的圖片。如果你贏了,也許整個「大樓」都會倒塌。你想過這場官司的利害關係嗎?

Craig:這起訴訟關係重大。我們提起訴訟是有原因的。我們從根本上相信,智慧財產權擁有者有權擁有他們的內容,不管它是否被用於訓練集,如果這是他們的選擇,他們應該有權得到補償。

我不接受Kevin 所說的我讀過Moby Dick(白鯨),所以,首先,這些電腦不是人;其次,它們實際上是公司實體,而且正在賺錢,這是你的觀點。在許多情況下,他們利用這些技術瞄準了現有的市場,就像是安迪沃荷(Warhol)的案例….

這就是我們在這裡的原因。我們比其他人更熱衷於智慧財產權。

Nilay:很明顯,你正在跟Stability 公司打官司。但其實還有很多其他公司可能正在用Getty Images 的圖像訓練AI,你們是否與微軟、谷歌或OpenAI 聊過這個「問題?」

Craig:我們正在進行「建設性」的對話。至於結果是否有成效,仍不得而知。

首先,我認為這裡面有一層公關的廢話,例如「好吧,我要加入這個群組,我要努力洗白我的名聲,因為我是這個群組的成員。但是,我不會圍繞它做任何事情。我什麼也不做。我只是引用了我的公司名稱出現在該網站上這一事實。」我認為這不是真正的參與。

我認為我們對法律可以有不同的觀點,但我希望我們的模式能證明的一點是,投入優質原料能創造更好的產出。它能創造出更有社會責任感的產品,而且我認為企業會採用這種產品。

我們的確正在討論這個問題,但我們不會偏離基本點,那就是:我們認為,如果你是知識產權所有者,你應該有權決定是否在AI 訓練中使用你的內容,而且你應該為此獲得「補償。」這並不意味著微不足道的「檢查」,這是這些工具的「基石。」

04 何謂「真」?

Nilay:我還想談兩個主題:你和我談了很多關於「真實性」的問題。你提到了「深度偽造」。 Getty 公司的確已經出版了我們這個時代最重要的一些照片。從歷史上看,這就是Getty 在我們的文化中所扮演的角色。

你對我說過,光是把這些東西標為「真品」是不夠的,這裡還有另一個問題。請描述你認為的另一個問題是什麼呢?

Craig:我認為,現在的問題是,你無法分辨什麼是「真實的」。在這個世界上,AI 可以大規模地生產內容,你可以在廣度、範圍和時間尺度上傳播這些內容,最終,「真實性」會被擠掉。

現在,我認為我們的品牌有助於突破這一障礙。我認為我們的「聲譽」也能起到一定的作用,我認為,歸根結底,這是有價值的,但我確實擔心在這個世界上…

我聽說去年AI 生成影像的數量超過了相機的拍攝數量。這太驚人了。想想我們在AI 應用曲線上所處的位置——是在以指數級的速度發展。

再者,你想想這個世界上存在著邪惡的個人、組織和機構,這讓我很擔心。當五角大廈的圖像被放出來時,我們的新聞編輯室都沸騰了,充斥著「這是真的嗎?」的疑問,我們接到了很多電話要求我們去「驗證」。現在,讓我們把它帶入2024 年的大選中。

深度偽造DeepFake 圖片已經混淆了真實和虛假,這很危險|Maverick AI

Nilay:既然已經預見到了,你們自己的真實圖像、照片,將要和AI 生成的圖片競爭,那麼在2024 年大選之前,你們是否採取了任何特別措施呢?

Craig:是的。我們正在和美聯社、法新社、合作夥伴、甚至競爭對手等多方進行交易所,探討「我們該怎麼做?」雖然我們正在採取措施,但還沒有完美的解決方案。

而且,大選的日期不會改變,我們離它還越來越近。因此,我認為,在「讓我們快馬加鞭,打破常規…」的前提下,將科技推向世界,是一件非常重要的事情。

Nilay:你是「內容真實性倡議(Content Authenticity Initiative)」小組的成員吧?

Craig:我們正在討論。坦白說,我們還沒有採納。我們不確定現在這樣做是否正確。

首先,它把責任和投資放在了創作原創內容、真實內容的人身上,而不是製作生成性內容的平台和生成性工具身上,我們認為這有點背道而馳,甚至從根本上說,這有點「倒退」了。

生成工具應該進行投資,以便圍繞生成內容創建正確的解決方案。但就目前看來,這主要是「元資料」的問題,而「元資料」很容易被剝離。

你們是我們的客戶。你們使用我們的圖像。當你們把我們的「元數據」放到你們的內容管理系統(CMS)時,你們會立即剝離我們的元數據,因為這樣會更輕,頁面載入和其他一切都會更快。

這樣做有道理的,因為你們在「競爭」搜尋引擎優化(SEO)和其他一切你們需要做的事情。所以,你要剝離它。

因此,我認為我們需要關注的是… 這也是我們與Kevin 、微軟及其團隊合作的地方,他們向白宮做出了識別AI 生成性內容承諾,讓我們深受鼓舞。因為我們也想做同樣的事情,但我們想以一種真正抓住核心的方式來做。

Nilay:還有最後一件大事。我們剛開始交談時,你就和我討論過,當網路出現時,攝影市場不可避免地發生了永恆的改變,更多的人可以進行創作,我們的分銷平台也發生了變化。定價崩盤了。我認識很多專業攝影師,他們的職業生涯隨著網路的出現而消失。

你有這種感覺嗎?你建立了一個企業來應對這種情況–你改變了這門「生意。」你覺得現在也是這樣嗎?變化的程度一樣嗎?

Craig:我認為這顯然有很多的變化,但我們所做的事情仍然是有價值的。

不管是能夠激發創造力的工具,還是具有高度「真實性」的內容,都能以有意義的方式吸引終端用戶,並打動他們——如果你是一家媒體公司,打動他們去了解某個問題;如果你是一家企業,打動他們真正參與你的品牌或產品。我不認為這會消失。

我認為這帶來了不同的挑戰,而駕馭和解決這些挑戰是非常有趣的。

而讓攝影師、攝影師、作家… 能夠創作出更多作品的最重要一點就是──我們讓更多創作者參與創作。正如我們推出這個AI 工具,不是為了解除創作者的中介地位,而是為了扶持創作者。

這是我們的最終目標,如果我們做到了這一點,我想世界就會變得「美好。」我認為像Getty 圖片社這樣的公司會因此而蓬勃發展,而那些與我們合作的公司也會因此而蓬勃發展。

但是,如果我們試圖「消滅」創作者,我認為這必將是一個「悲哀」的世界,這對我們的業務和那些試圖謀生的人來說都將是一個「災難。」

資訊來源:由0x資訊編譯自8BTC。版權所有,未經許可,不得轉載

Total
0
Shares
Related Posts