4月11日,國家互聯網信息辦公室(以下簡稱“網信辦”)起草發布了《生成式人工智能服務管理辦法(徵求意見稿)》,並向社會公眾展開為期一個月的意見徵求。
這份管理辦法(徵求意見稿)共計21條,從適用範圍看,既包括了提供生成式人工智能服務的主體,也包括使用這些服務的組織和個人;管理辦法覆蓋了生成式人工智能輸出內容的價值導向、服務提供方的訓練原則、隱私權/知識產權等各項權利的保護等等。
GPT類生成式自然語言大模型及產品出現後,既讓公眾體驗到了人工智能的飛躍式進步,也暴露出安全風險,包括產生帶偏見和歧視性的內容、數據洩露、侵犯隱私、AI造假等問題。全球範圍,各國對人工智能的監管漸成趨勢。
在中國,《生成式人工智能服務管理辦法》一旦出台,國內生成式AI的大模型及產品提供方不能再無序亂“成交量”了,採用者使用生成式AI時也有了規範圈。
為生成內容設“禁區”
“研發、利用生成式人工智能產品,面向中華人民共和國境內公眾提供服務的,適用本辦法。
本辦法所稱生成式人工智能,是指基於算法、模型、規則生成文本、圖片、聲音、視頻、代碼等內容的技術。 ”
4月11日,網信辦公佈的《生成式人工智能服務管理辦法(徵求意見稿)》(以下簡稱《辦法》)在第二條中明確了《辦法》的適用主體和“生成式人工智能”的定義。
從該條內容看,諸如百度、阿里、騰訊、華為等目前已經公開表示有生成式大模型及產品的公司,如果對中國境內用戶提供服務,將在《辦法》的管理範圍內,而用戶使用相關產品和服務,也需要遵守《辦法》的規定。
《辦法》也強調了,國家支持人工智能算法、框架等基礎技術的自主創新、推廣應用、國際合作,鼓勵優先採用安全可信的軟件、工具、計算和數據資源。
在這一前提下,《辦法》為生成式人工智能產品或服務的提供方劃定了“禁區”,包括生成的內容和研發的基本原則。
在內容上,《辦法》要求:利用生成式人工智能生成的內容應當體現社會主義核心價值觀,不得含有顛覆國家政權、推翻社會主義制度,煽動分裂國家、破壞國家統一,宣揚恐怖主義、極端主義,宣揚民族仇恨、民族歧視,暴力、淫穢色情信息,虛假信息,以及可能擾亂經濟秩序和社會秩序的內容;利用生成式人工智能生成的內容應當真實準確,採取措施防止生成虛假信息。
在研發上,《辦法》要求提供方在算法設計、訓練數據選擇、模型生成和優化、提供服務等過程中,採取措施防止出現種族、民族、信仰、國別、地域、性別、年齡、職業等歧視。
從這些要求看,《辦法》基本涵蓋了市面上的自然語言大模型產品在用戶實操中暴露出來的安全及倫理問題,包括產生歧視性偏見、虛假信息等內容
人類藉由生成式AI產出的問題內容已經層出不窮地出現在網絡上。
比如,ChatGPT曾為用戶諮詢“如何入店行竊”時提供過步驟,儘管附上了“入店行竊違法的提示”;它的“角色扮演”功能曾被用戶誘導以DAN(Do Anyting Now)身份回答問題,給出的答案裡出現了“爆粗口”的情況;還有人用ChatGPT測試的假消息在國內傳播,成了“闢謠”的內容。
微軟集合進搜素引擎Bing的聊天機器人,被海外媒體人曝光“辱罵用戶”;AI生圖應用Midjourney更是被人利用造出過“教皇穿巴黎世家羽絨服”、“馬斯克與通用汽車CEO約會”的假圖,甚至還有人用它製造了各種不存在的地震歷史和太陽風暴災害等等。
有關教皇(左)與馬斯克的假圖
針對虛假信息、辨別AI生成內容層面,《辦法》要求提供者從源頭上“能夠保數據的真實性、準確性、客觀性、多樣性”;應當按照《互聯網信息服務深度合成管理規定》對生成式的圖片、視頻等內容進行標識;而生成式人工智能產品研製中採用人工標註時,提供者應當制定符合本辦法要求,清晰、具體、可操作的標註規則,對標註人員進行必要培訓,抽樣核驗標註內容的正確性。
中國監管為生成式人工智能的內容設置禁區,某種程度上也是在要求提供大模型及產品的企業把好預訓練和數據的關。
強調數據來源和個人信息保護
除了對生成內容強調價值觀導向、社會公德、遵守法律及反歧視外,《辦法》也對生成式人工智能相關的預訓練及數據來源、個人信息保護等權益做出要求。
例如,《辦法》要求,提供者應當對生成式人工智能產品的預訓練數據、優化訓練數據來源的合法性負責,不含有侵犯知識產權的內容;數據包含個人信息的,應當徵得個人信息主體同意;對用戶輸入信息和使用記錄承擔保護義務,不得非法留存能夠判斷出用戶身份的輸入信息,不得根據用戶輸入信息和使用情況進行畫像,不得向他人提供用戶輸入信息。
生成式AI產生的數據侵權問題也確實存在,比如,用戶在使用對話式機器人滿足一些工作需求時,難免會上傳公司的資料,如不注意,很可能造成商業秘密的洩露。此前,韓國電子巨頭三星在對ChatGPT提出“限問令”後就表示,內部數據因員工與該應用的交互而出現洩露。
《辦法》不僅指向生成式人工智能產品和服務的提供者,也對產品和服務使用者劃定了原則。
比如,不利用生成內容損害他人形象、名譽及其他合法權益,不進行商業炒作、不正當營銷。
由於《辦法》時根據上位法《中華人民共和國網絡安全法》《中華人民共和國數據安全法》《中華人民共和國個人信息保護法》等法律、行政法規制定,這些法律法規將適用於違反《辦法》的行為,包括侵犯知識產權、侵犯個人信息等違法行為。
《辦法》共計21條,其中有13條明確針對“提供者”,即利用生成式人工智能產品提供聊天和文本、圖像、聲音生成等服務的組織和個人。
公眾可通過三條途徑反饋意見
由此可見,《辦法》一旦正式出台,國內做生成式大模型及產品的企業及採用方將須在規則範圍內行事。據網信辦官網顯示,公眾可以通過三個渠道提出反饋意見,反饋的截至日期為2023年5月10日。
資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載