據甲子光年報導,數據標註圈正在面臨行業內捲和被AI 取代的風險。一方面,數據直標註需求激增導致大量標註工人和中間商一同湧入,單價更低了。從業者表示,在2022 年疫情期間,每天拉框(用方框框定選定對象)6 小時,每月可以獲得有4~5 千元的收入。現在隨著整個行業陷入內捲,每月收入只有2~3 千元。另一方面,數據標註員訓練的AI,正在人類監督中自我學習,進行自標註。在蘇黎世大學的調查報告中,研究人員通過實測發現,ChatGPT 在15 項標註任務中的處理能力高於眾包人員。大模型嵌入眾包平台的進度條也被拉快了。洛桑聯邦理工學院之後的研究發現,已有超過30% 的眾包標註者在處理文本標註時使用了大模型。
巴比特訊