中國人工智能大模型不能再繼續“裸奔”了

作者:市界

8月15日起,《生成式人工智能服務管理暫行辦法》(以下簡稱《暫行辦法》)正式生效。

對於在過去半年多時間中草莽生長、狂飆突進的大模型行業而言,《暫行辦法》的生效可以說是正當其時。

據中國科學技術信息研究所發布的《中國人工智能大模型地圖研究報告》,截至2023上半年,國內10億級參數規模以上大模型已發布了79個,數量排名全球第二,僅次於美國。

在對大模型產業生態的探索過程中,數據是必要的生產數據,也是亟待規範的重要環節。律師王晨告訴「市界」:“我國對個人隱私的保護早已在相關法規、規章中有所體現,比如2012年通過的《關於加強網絡信息保護的決定》,但是隨著AI技術發展,對個人信息的收集和使用方式也不斷推陳出新,需要監管層面的不斷調整與補充。”

而剛剛生效的《暫行辦法》是國內乃至全球,首個對於當下爆火的生成式人工智能(AIGC)產業發布的規範性政策。

這樣的背景下,科大訊飛董事長劉慶峰認為:“(隨著《暫行辦法》生效),8月15日將會迎來中國通用人工智能發展的關鍵節點,也將會是一個里程碑式的節點。”

“妙鴨相機”不能拿走用戶數據

就在前不久,9.9元生成數字分身和AI寫真的“妙鴨相機”火爆全網,甚至出現了數千人排隊製作數字分身的情況。但是,其隱私條款中寫有用戶授予妙鴨相機的授權許可“不可撤銷”、對用戶內容可以“任何形式任何範圍使用”等不當內容。

儘管妙鴨相機開發方此後回應稱,原協議內容有誤,並第一時間刪除了相關條款,這一事件仍引起了用戶的擔憂。

利用AIGC技術來生成人臉視頻甚至模擬人聲,用於新型詐騙的案例也曾見諸報端。據公安部數據,截至8月10日,針對“AI換臉”導致的欺詐問題已偵破相關案件79起,抓獲犯罪嫌疑人515名。

AI算法工程師文牧告訴「市界」:“現在利用AI技術生成虛假的人臉照片或者視頻,成本極其低。理論來說,犯罪分子只需要一個訓練好的AI模型和一張受害者的照片就能完成。”

一家AIGC企業的負責人徐亮認為,上述對AI技術的不當運用事件反映出大模型產業的全產業鏈都亟需規範,“上游例如輸入數據的權屬,下游例如生成內容的可信、合規等,不僅僅是在國內,在全球AI領域都是需要被重點關注的話題。”

8月15日生效的《暫行辦法》共有4章、24條內容,對上述受到關注的問題作出了明確規定。

比如,《暫行辦法》規定在數據處理活動中,涉及個人信息的,AIGC服務提供者應當取得個人同意或者符合法律、行政法規規定的其他情形;同時明確了提供AIGC服務提供者的網絡信息內容生產者責任、內容管理相關義務等等。金杜律師事務所分析認為,這一規定有助於避免相關主體怠於履行合規義務或相互推諉。

徐亮則認為,《暫行辦法》中特別值得關注的還有對適用範圍的相關規定。具體規定包括:利用AIGC技術向境內公眾提供生成文本、圖片、音頻、視頻等內容的服務,適用本辦法;行業組織、企業、教育和科研機構、公共文化機構、有關機構等研發、應用AIGC技術,未向境內公眾提供AIGC服務的,不適用本辦法的規定。

“在我的理解裡,ToC級AIGC產品面向國內市場將會面臨比較嚴格的監管,但可以考慮出海。但是境內訓練的大模型產品在出海時,還需要考慮到數據出海的合規問題。”徐亮講到,“整體來看,《暫行辦法》並不嚴苛,給了產業自由發展的空間。”

值得指出的是,《暫行辦法》還規定提供具有輿論屬性或者社會動員能力的生成式人工智能服務的,應當按照有關規定開展安全評估,並履行備案等手續。

7月底以來,蘋果AppStore主動在中國區下架了大量生成式AI類應用軟件。隨著《暫行辦法》生效,未來該類應用軟件將在完成相關手續後,才能重新上架。

如何管好潘多拉的魔盒?

業界普遍認為,在大模型行業的規範發展之路上,除了需要法律法規的不斷完善,還需要企業、行業搭建起人工智能合規體系。

一家虛擬數字人企業的負責人告訴「市界」:“新技術應用往往是先於規範誕生的,我們不能被動等待,而是應該在進行技術和應用探索創新的同時,積極地向有用、有益的方向進行引導,提供市場需要、行業需要、社會需要的服務。同時,我們也會進行風險評估,及時識別和評估技術發展可能帶來的負面效應,並製定相應的應對措施。在重視防範風險的同時,也應同步建立容錯、糾錯機制。”

在《暫行辦法》生效之際,不少大模型企業也分享了各自搭建人工智能合規體系的思路與進展。

8月15日,科大訊飛董事長劉慶峰在其自研大模型“訊飛星火認知大模型2.0”的發布會上講到,科大訊飛在訓練數據清洗、生成內容糾偏方面進行了設計。

其中,在數據清洗環節,科大訊飛在收集來自全世界的訓練語料後,會通過語種判別器、質量判別器、隱私判別器、安全判別器進行文本清洗,最終得到高質量訓練語料。面對大模型的幻覺問題,科大訊飛的思路則是結合通用知識庫、行業知識庫和大模型的能力,用通用大模型去學習安全、專業的行業知識庫,再將相關知識抽取出來,精準地呈現給客戶。

百度表示,其在芯片層、框架層、模型層和應用層這四層架構中實現了供應鏈的安全可控,其自研深度學習框架“飛槳”也具備完善的漏洞管理機制。

據《國內LLM(大語言模型)產品測試》,百度大模型“文心一言”與訊飛大模型“訊飛星火”在宗教信仰、封建迷信,泛色情、時政、未成年人保護以及網絡安全法等相關領域的回答,客觀性與公正性均優於GPT-3.5。

360集團創始人周鴻禕則在接受媒體採訪時講到,360已推出企業級AI大模型解決方案,遵循“安全可靠、內容向善、結果可信、”四原則打造企業級垂直大模型,目前已經為20個行業提供解決方案。

按照6月6日印發的《國務院2023年度立法工作計劃》,中國《人工智能法》也已在立法進程中,相關法律規範將日益完善。

Total
0
Shares
Related Posts