GPT-4會讓多少美國人失業? OpenAI:高收入工作會面臨更大影響

上週二,OpenAI 官宣GPT-4 引起軒然大波,比其廣受歡迎的前身GPT-3.5 更可靠、更具創意。 GPT-4 是一個大型多模態模型,能接受圖像和文本輸入,再輸出正確的文本回复。實驗表明,GPT-4 在各種專業測試和學術基准上的表現與人類水平相當。例如,它通過了模擬律師考試,且分數在應試者的前10% 左右;相比之下,GPT-3.5 的得分在倒數10% 左右。

大型語言模型的子彈不停在飛,ChatGPT 的職業“威脅論”也成為熱議的焦點。例如,INSIDER 編制了一份被AI 取代風險最高的工作清單,分別是技術工作(編碼員、計算機程序員、軟件工程師、數據分析師)、媒體工作(廣告、內容創作、技術寫作、新聞)、法律行業工作(律師助理、法律助理)、市場研究分析師、教師、財務職位(財務分析師、個人財務顧問)、貿易商、平面設計師、會計師與客戶服務代理。

昨日,一篇由OpenAI、OpenResearch 和賓夕法尼亞大學學者合著的論文發表在預印本網站arXiv 上,以科學的方式研究了GPT 究竟會對勞動力市場產生怎樣的影響。這項研究採用一種新的評估方式,即根據職業與GPT 能力的對應性來評估職業,結合人類專業知識和GPT-4 的分類,從而探討GPT 可能對勞動力市場帶來的影響。

為了理解LLM 的能力及其對工作的潛在影響,這項研究應用的兩項評估標準分別是:直接暴露(exposure),即GPT 可以直接完成或幫助完成的任務;間接暴露,即通過GPT 支持的軟件和數字工具幫助完成的任務。

研究發現,大多數職業都表現出一定程度的GPT 暴露,大約80% 的美國勞動力可能至少有10% 的工作任務會受到GPT 的影響,而大約19% 的工人可能至少有50% 的任務受到影響。這種影響涵蓋了所有工資水平,高收入工作可能面臨更大的風險。

嚴重依賴科學和批判性思維技能的角色與GPT 暴露呈負相關,而編程和寫作技能與GPT 暴露呈正相關。在工作中面臨更高(更低)進入壁壘的工人往往會經歷更多(更少)的GPT 暴露。信息處理行業表現出高暴露,而製造業、農業和礦業表現出較低的暴露。

過去十年的生產力增長和總體GPT 暴露之間的聯繫似乎很弱,這表明一個潛在的樂觀情況,即未來大型語言模型的生產力增長可能不會加劇可能的“成本疾病”效應。

GPT就是GPT

GPT 符合通用目的技術的三個核心標準:隨著時間的推移,它們正在即興發揮能力,有能力完成或幫助一組越來越複雜的任務和用例;GPT 本身可以對整個經濟產生普遍影響;同時,GPT 所實現的互補創新——特別是通過軟件和數字工具——可以在經濟活動中廣泛應用。

決定大型語言模型效用的關鍵因素是人類對它們的信任程度以及習慣。例如,在法律界,模型的有用性取決於法律專業人員是否能夠信任他們的輸出,而不需要核實原始文件或進行獨立研究。技術的成本和靈活性、員工和公司的偏好以及激勵措施也在採用基於大型語言模型的工具方面發揮著重要作用。

此外,由於數據可用性、監管質量、創新文化以及權力和利益分配等因素,大型語言模型在不同經濟部門的採用將有所不同。因此,如果要全面了解員工和公司對大型語言模型的使用,需要對這些錯綜複雜的問題進行更深入的探索。一種可能性是,對於大多數任務來說,節省時間和無縫應用將比提高質量更重要。

總的來說,儘管GPT 提高人類勞動效率的技術能力很明顯,但重要的是要認識到社會、經濟、監管和其他因素可能會影響實際的勞動生產率結果。隨著能力的不斷發展,GPT 對經濟的影響可能會持續並增加,這給政策制定者預測和監管其發展軌跡帶來了挑戰。

Total
0
Shares
Related Posts