試水ChatGPT 切不可以身家試法

在之前的文章(《熱度“狂飆”的ChatGPT,亟待“合規剎車”》)中我們討論了當紅風頭正盛的ChatGPT,分析了它的技術本質、應用場景和法律風險初探。而在近期的《流浪地球》系列電影中,“虛擬數字人”的概念博人眼球。這不禁讓我想起另一個紅極一時的概念,“深度偽造(DeepFake)”、“AI換臉”。

深度合成技術

事實上,“虛擬數字人”的構建離不開包括偽造技術在內的深度合成技術,而ChatGPT是深度合成領域下的一類模型。數據深度合成(Deep Synthesis)本身是一個中性概念,泛指借助深度學習算法模型等智能化方案自動生成文本、圖像、語音、視頻等數據內容的一系列處理技術。其中文本因為其較強的字符特徵,只需滿足空間序上的合理性,與視頻、音頻類型數據的處理思路略有不同。

在ChatGPT一類的大型語言模型中,包含預訓練和下游任務訓練兩個部分。在預訓練階段,模型從大量的數據中學習複雜的上下文聯繫,並將這種聯繫向量化。 Next-token-prediction 和masked-language-modeling 是用於預訓練語言模型的核心技術。在第一種方法中,模型被給定一個詞序列作為輸入,並被要求預測序列中的下一個詞,而在第二種方法中,其輸入句子中的一些詞被替換為特殊token,例如[MASK],模型被要求預測應該插入到[MASK]位置的正確的詞。同時,在下游任務訓練中,In-content Learning(語境學習)被提出以提升模型在各個場景任務下的表現能力。譬如標註者會給模型一個提示性的輸入,讓模型更加清楚的感知到應該輸出的範式。

在圖像、音頻類深度偽造模型中,生成網絡”(generative network)或“生成器”(generator)負責製作複製原始數據集特徵的合成數據如圖片、音頻記錄、視頻等,並製作“深度合成物”;鑑別網絡(discriminative network)或者說鑑別器(discriminator)則負責識別合成的數據,檢測該視頻是否為偽造。通過反复的“無監督學習”過程,“生成網絡”製作並修改“深度合成物”,直到“鑑別網絡”無法再檢測出該合成物係經“深度合成”,最終形成高保真的信息內容。

總體而言,基於深度學習的數據合成技術隨著算力的發展逐漸從研究型走向應用型,主要應用在文本合成、視覺合成、聽覺合成等三大領域,因循數據收集、模型訓練、偽造內容等核心步驟,創造虛擬數字人及其所處的生態環境。

相關戲仿性應用產品迅速迭代,一方面,數據深度合成的正向應用將創建的文本段落、虛擬角色、聲音模擬、視頻渲染等廣泛應用到社交通訊、娛樂文化等眾多場景之中,提升信息處理效率,增進臨場體驗。另一方面,深度合成內容難以精準及時地予以鑑識,部分主體傳播虛假信息,操控受眾反應,嚴重威脅整個社會的安全體係與保障機制,因此亟待構建和完善規模化的規制體系。

《互聯網信息服務深度合成管理規定》解析

我國國家互聯網信息辦公室、中華人民共和國工業和信息化部、中華人民共和國公安部在2022年11月3日通過了《互聯網信息服務深度合成管理規定》(下稱“規定”),該規定基於深度合成應用的定性和風險的評估,從而提出包括內容標誌、主體報備、用戶實名制、內容審核機制、救濟機制、個人信息保護和數據安全等方面的規制措施。

內容標誌

深度合成服務提供者(下稱“服務提供者”)對使用其服務生成或者編輯的信息內容,應當採取技術措施添加不影響用戶使用的顯著標識,從而防止公眾混淆誤認。

主體報備和用戶實名制

具有輿論屬性或者社會動員能力的服務提供者和技術支持者應當按照《互聯網信息服務算法推薦管理規定》履行備案手續,並在網站、應用程序公示,同時按照國家有關規定開展安全評估(相關合規流程仍在摸索之中);服務提供商需要對深度合成服務使用者進行真實身份信息認證。颯姐團隊認為之後會出台針對深度合成內容專門的備案手續。

內容審核機制和救濟機制

服務提供者應當加強深度合成內容管理。採取技術或者人工方式對輸入數據和合成結果進行審核,建立健全用於識別違法和不良信息的特徵庫,完善入庫標準、規則和程序,記錄並留存相關網絡日誌。

服務提供者應當建立健全闢謠機制。發現利用深度合成服務製作、複製、發布、傳播虛假信息的,應當及時採取闢謠措施,保存有關記錄,並向網信部門和有關主管部門報告。

個人信息保護和數據安全

服務提供者和技術支持者應當加強訓練數據管理,採取必要措施保障訓練數據安全,若數據集中包含個人信息,則需遵循個保法相關規定和配套標準。

算法安全評估

規定要求合成服務提供者和技術支持者應當加強技術管理,定期審核、評估、驗證生成合成類算法機制機理,強調了處理具有生物識別信息、可能涉及國家信息的模型、模板需要進行安全評估,相關審核、評估機制尚未明確要求。颯姐團隊認為該類評估由於企業對核心技術披露的限制以及當前評估技術的局限性,困難重重。

寫在最後

深度合成歸根結底是人工智能技術,尤其是算力發展的產物,其獨特的創造性注定會逐漸走入生產生活,因此監管體系和合規體系的構建是必然路徑。

深度合成技術上的特殊性要求我們一方面做好深度合成配套法律法規、標準的製定和完善,企業逐步摸索出一條合規路徑,另一方面投入到深度合成檢測追踪技術的開發與應用,法律、技術雙管齊下,為做優產業發展環境提供重要基石,最終促進整個行業的健康發展。

Total
0
Shares
Related Posts