2023年隨著人工智能採用的快速發展而迅速啟動,從ChatGPT的推出到AI DJ,這項技術正在徹底改變常規做法,影響著消費者、創作者和行業領導者。
同樣,人工智能技術也在徹底改變娛樂業,包括播客。也許這場革命中最具爭議的部分是人工智能語音生成,這引起了創作者的合理擔憂,他們擔心自己的聲音會在未經許可的情況下被使用。
然而,播客創作者卻有一個特別的機會來將他們的聲音變現。新的工具允許他們根據文本生成主持人閱讀的廣告、介紹,甚至整個劇集,從而減少在演播室花費的時間和對昂貴錄音設備的需求。但人工智能語音生成是一把雙刃劍,它既給創作者帶來了便利,也給他們帶來了風險,因為他們的聲音可能被未經授權的使用者濫用,從而造成錯誤信息的傳播。
新機遇:音頻廣告中的AI
廣告商已經在使用人工智能技術微調播客廣告。今年2月,美國最大的音頻媒體公司iHeartMedia宣布與音頻智能平台Sounder合作,為播客廣告客戶提供新的品牌安全技術,允許在廣告投放前評估和解釋播客內容的含義和背景,從而幫助品牌做出品牌安全和適合性的判斷。
據報導,iHeartMedia利用Sounder的音頻數據云技術,為其旗下超過750個原創播客節目提供這項服務,其中包括一些世界上最大的播客和創作者。這些節目每月有超過3.92億次下載和收聽,比排名第二至第四的播客版權商加起來還多。
此外,播客平台Acast利用人工智能技術推出了一種新的對話式定位工具,可以根據劇集的內容,將廣告放置在最合適的位置,從而提升廣告的效果和品牌安全性。
如果一個品牌想要宣傳其環保理念,那麼對話式定位工具就可以將其廣告放置在播客中討論環境問題或可持續發展的部分。這樣可以增加廣告的相關性和吸引力,同時避免與不符合品牌價值或敏感話題的內容相衝突。
現在,一些公司正在探索如何使用人工智能技術來製作完整的音頻廣告。
譬如,音頻廣告技術公司Adswizz正在開發一項基於人工智能的語音生成工具,旨在幫助播客廣告客戶更精準地投放廣告。這些工具由Adswizz的技術創新實驗室開發,利用AI和機器學習算法來解釋播客內容,並根據品牌的要求和目標來定位廣告,從而消除僱傭配音演員的成本。
然而,播客主持人朗讀的廣告被認為更有效,因為播客聽眾信任他們的主持人,對廣告的相關性比一般消費者更敏感。這為主持人自己利用人工智能語音模型提供了機會。
據TechCrunch報導,Spotify已經在其AI DJ功能中使用了AI技術製作播客廣告的方法,通過訓練一個AI模型來模仿其文化合作部門主管兼播客主持人Xavier “X” Jernigan的聲音。現在,Spotify可能將這種技術應用到廣告領域。
Spotify高管兼播客主持人Bill Simmons透露,Spotify正在測試人工智能技術,將使播客能夠即時生成用自己聲音朗讀的廣告。這樣,創作者可以在更短的時間內製作出聽起來像是主持人親自朗讀的廣告,從而增加廣告數量和收入。
除此之外,這項技術還可以幫助定位聽眾,並翻譯成各種語言的廣告,前提是主持人允許複製他們的聲音。這種工具可能會吸引更多的廣告商和創作者加入Spotify,這與Spotify最近轉向為獨立創作者服務的方向一致。
然而,Spotify並不是唯一一個致力於這類功能的平台。例如,Podcastle推出的一款名為Revoice的AI語音克隆工具,可以用AI技術創建一個與真實主持人相似的數字聲音。
Revoice的使用方法很簡單,用戶只需錄製自己朗讀70個不同的句子,以及一個法律免責聲明,以保護用戶的聲音安全和隱私。然後,Podcastle的AI算法會在24小時內處理並生成用戶的數字聲音。用戶可以在Podcastle平台上輸入任何內容,讓AI用數字聲音生成高質量的音頻文件。
新風險:錯誤信息的傳播
播客的聲音可能是他們最寶貴的資源之一。對於許多創作者來說,他們的聲音是他們唯一的標識,尤其是那些不製作播客視頻的人。
Joe Rogan是一位著名的播客主持人,他的節目《The Joe Rogan Experience》邀請了各行各業的嘉賓,進行了深入的對話。但在今年5月,有人用人工智能技術創造了一個虛構的播客,模仿了Joe Rogan和一些從未上過他節目的嘉賓的對話。
這個播客叫做《Joe Rogan AI Experience》,由一位澳大利亞的創意總監Hugo製作,他用了一個可以克隆任何聲音的文本轉語音平台,和一個基於ChatGPT的對話生成器。 Hugo說,他只是出於好玩而做了這個項目,並沒有想要威脅真正的Joe Rogan或其他播客主持人。
Hugo發布了第一集播客一個月前,其中模擬了Joe Rogan和OpenAI創始人Sam Altman的對話。這個對話很詭異地涉及了人工智能製造虛假內容的風險,而這正是這個播客所做的。
此外,Hugo還製作了其他幾集播客,模仿了Joe Rogan和Andrew Tate、Steve Jobs等嘉賓的對話。這些對話雖然有時候有點荒謬或無聊,但也有時候聽起來很逼真或有趣。 Hugo說,他希望通過這個項目展示人工智能技術的發展和潛力,也提醒人們要警惕虛假內容的危害。
與此同時,TikTok還刪除了一個用Joe Rogan的聲音製作的虛假病毒廣告。
事實上,新聞是播客的主要類型,這意味著錯誤的內容可能會帶來嚴重的後果,導致錯誤信息大規模傳播。人工智能語音生成工具正在以閃電般的速度發展,但圍繞保護其聲音的監管將需要時間來發展。不過,如果平台能夠制定有效的措施,防止濫用和標記未授權的作品,播客甚至可以藉助人工智能技術將他們的聲音拓展到其他娛樂形式。
比如,播客主持人可以將自己的聲音授權給電影和電視。在《星球大戰》系列電影中,黑武士Darth Vader的聲音一直由演員James Earl Jones來配音,他的聲音深沉而威嚴,給觀眾留下了深刻的印象。然而,現年91歲的瓊斯表示,他想要放下這個角色,讓人工智能來接替他。
據《Vanity Fair》報導,Jones已經將他過去的聲音作品的權利轉讓給了迪士尼,允許烏克蘭的初創公司Respeecher利用人工智能技術,在迪士尼+的《Obi-Wan Kenobi》中重現他的聲音。
Respeecher使用聲音片段來“克隆”一個演員的聲音,讓製作方可以在沒有演員在場的情況下錄製新的台詞。 Skywalker Sound的監督音效編輯Matthew Wood告訴《Vanity Fair》,當Jones“提到他想要放棄”Darth Vader的角色時,他就向Jones提出了這個選項。
在Jones同意讓盧卡斯影業使用人工智能生成的聲音後,《Vanity Fair》稱,製作方委託Respeecher讓Darth Vader聽起來像45年前的Jones,在迪士尼+的《Obi-Wan Kenobi》中呈現出那種“黑暗面”的惡棍氣質。這也是為什麼你可能會注意到,在《Obi-Wan Kenobi》中,Darth Vader聽起來很像他在早期電影中的樣子,而不是Jones在2019年的《星球大戰:天行者崛起》中的實際聲音。
與藝術家、演員和其他娛樂創作者不同,播客最具價值的資產是他們的語音——這意味著他們更有動機去探索如何與AI語音技術合作,而不是抵制它。