黃土高原上,沒上過大學的女人們在餵養AI


作者:南風窗高級記者 朱秋雨

來源:南風窗

見到曹亞麗時,她正心無旁騖地緊盯電腦屏幕,左手的三個手指覆蓋在A、W、S、D四鍵上,右手則放在鍵盤的上下鍵。

她的雙手配合嫻熟,背挺得很直,彷彿鋼琴家靈活地按動琴鍵。

每隔兩秒,曹亞麗手指動一下,那是她面對一張圖作出判斷的時間。

曹亞麗從事的職業——AI訓練師(人工智能訓練師)——在2020年被國家正式列為新興職業。每天,她和同事們通過貼標籤、畫框、排序、找不同等方式,為文字、圖像、語音做標註,餵養AI。至於給數據標註後具體用來做什麼,曹亞麗還說不出來。

曹亞麗所在的陝西榆林愛豆科技有限公司(以下簡稱“清澗愛豆”),2019年成立,目前有180餘名數據標註員。負責人魚濤介紹,其中,66%都是女性。

陝西榆林愛豆科技有限公司/朱秋雨 攝

類似的場景,還發生在呂梁山區的山西臨汾市永和數字就業中心。後者也是做AI數據標註的公司,133名員工中,128位都是女性。

其中,80%的人還有一重身份:寶媽。

這些女性很多是高中、中專學歷,沒上過大學。留在老家紮根後,她們變成別人口裡的妻子、媽媽。

6月見面時,多位員工向我回憶起一個場景——以前做全職媽媽,總會碰到向丈夫“伸手要錢”的時候,這樣的生活倒也並不恥辱,但讓人感到毫無價值。

如今,建立在黃土高原上的數字新產業,給了留守女人尊嚴與希望。在與人工智能的互動中,科技賦予了她們可以消弭先天差距的魔法,也煥發了黃土高原上人們全新的生機。

鼠標一點,都是錢

在兄妹三人中,曹亞麗自認為“屬我混得最差”。她是家裡老二,哥哥在內蒙古的國企工作,妹妹是教師。只有她,沒上過大學,多年在影樓做後期製作。

2019年,因家庭變故,她從西安回到清澗縣的父母家。

曹亞麗在清澗縣出生長大。這座2020年才脫貧的縣城,是作家路遙的故里。黃土壘成的溝壑環繞四周,只有河流沖擊的悠長河谷給了人們居住的空間。在人們的回憶裡,縣城內一大片的荒地,“沒有樓,都是山”。

與之伴隨的,是當地日漸空心化的產業。

陝西清澗縣/朱秋雨 攝

清澗縣是“中國紅棗之鄉”,以種植大個頭的狗頭棗聞名全國。但近年來,隨著氣候變化,黃土高原一到秋季就下雨。成熟紅棗最怕雨淋,農民常顆粒無收,被荒棄的農田就越來越多。

年輕人因此背井離鄉,到榆林、西安等地謀生,尋找希望。

30歲的曹亞麗,屬於逆行者。

回鄉後,她找不到工作,為此焦慮了一年。 2020年,她成為了坐辦公室的AI數據標註員。這是小縣城裡少有的新增就業崗位。

只需參加一個月培訓,曹亞麗就正式上崗。兩年多來,她都在做類似的事:給某地圖導航做標註。

她向我演示了一張行車記錄儀的圖,屏幕上下有兩個時間戳。數據標註員則需要人為將兩個時間相減,判斷差值。 “小於2秒就是合格的,按A;大於2秒不合格,選S;看不清,選D,無時間戳W。”

2023年2月16日,陝西省榆林市清澗縣,工作人員在進行數據標註。數據標註為人工智能產業中開發機器學習模型的一環。清澗縣數字就業中心成立三年多來,通過培訓當地女性、返鄉年輕人等做數據標註師,助力鄉村女性在本地就業/中新社記者張遠攝

曹亞麗說,難度不在於做減法,而是面對海量的圖片,標註員必須保持專注和準確率。

曹亞麗剛入職時,每天須看1.3萬張圖,她沒法在8小時工作時間內完成。而現在,她已經足夠熟練,6個多小時就能做完相同的工作量;努力加班的話,“一天能看3萬張”。

上述任務與人工智能界流行的“深度學習”有關。 2014年起,深度學習的一大主流發展路徑是有監督學習(supervised learning)。也就是說,要想讓機器智能,首先要餵養大量已經標註的數據,讓其自動學習、決策,完成特定任務。

而在AI進行算法迭代時,同樣需要處理、標註大量數據。據AI分析公司Cognilytica統計,在AI項目中,數據相關的處理過程佔超80%的時間。業內因此盛傳,“人工有多強大,智能才有多強大”。

人工智能的業務,從高大上的甲級寫字樓落到了黃土高原上。與縣城女人們多聊會兒天,便會感受到她們對這一新業務的渴望。

陝西榆林愛豆科技有限公司工作環境/朱秋雨 攝

曹亞麗說,因為按件計工資,她會每天早上5時半起床,不看手機,直奔公司。中午也不午休,吃完飯便上班到晚上10時、11時。

熱愛工作的不止曹亞麗。甚至愛豆科技有限公司的多位女性員工都說,她們想加班。一位兩個孩子的媽媽坐在我面前,穿著一件飄逸的粉色長裙,看著我的眼睛,堅定地說:“我就是想多掙錢。”

工作兩年後,她成為了某業務線的項目經理,每天加班到夜裡孩子的睡覺時間。月薪最高時,她拿了7000多元。

她說:“鼠標一點就是錢。”

她重複了一遍:“鼠標一點都是錢啊。”

說話的時候,她眼睛亮亮的。

寶媽的玫瑰花

人工智能的風,從清澗縣吹到了周圍的縣市。 2020年8月,與清澗臨近的山西臨汾永和縣,新設立了一個數字就業中心,招的也是人工智能訓練師。

對這個長期交通閉塞、只有兩條主幹道、多數樓房不超過4層的縣城而言,人工智能屬於格格不入的新事物。

永和縣愛豆科技有限公司總經理李林峰,對我說起他至今難以忘懷的場景。 2012年,他從永和縣到臨汾市上大學,通往縣城的第一條高速公路剛開通。

他興奮地與同學分享,家鄉有公路了。同學表現得十分詫異:“高速路,這不是(我們)從出生開始就有的東西嗎?”

“別人想像不到,有的地方連高速路都沒有。”李林峰說。

清澗縣城街景/朱秋雨 攝

與此同時,臨汾市主要的產煤區、鐵礦資源區、小麥產區,都與永和縣擦肩而過。直到2015年,永和縣內探測出天然氣,幾個氣站成為了吸納當地男性勞動力的用工企業。

經濟落後讓人止不住地外流。除了老人,縣城裡出現的身影多是婦女兒童。所以李林峰介紹:“我們永和有個最常見的家庭分工:男的出去開大貨車,一個月賺七八千;女人留守,照顧孩子。”

這解釋了為什麼2020年7月永和縣愛豆科技有限公司第一次招聘時,來報名的基本是女性。

劉霞,永和縣人,在2021年成為人工智能訓練師時,她的二娃剛滿1歲。而之前的七年,因為孩子出生,劉霞經歷了辭職、工作、又辭職。

她的上一份工作在加油站,需要兩班倒。上了一年多夜班,劉霞發現,不僅沒法照顧孩子,熬夜還讓她眼角多了皺紋。愛美的她,很敏感地感受到自己的變化,索性辭了職。 “自己都瞧不起自己”,但她又認為,這樣的生活像是縣城女人注定的命運。

劉換梅,34歲,陝西清澗,她是一名人工智能訓練師。這個聽起來很時髦的工作,是清澗縣和支付寶合作引到當地的

在永和縣結婚生子之前,劉霞曾在臨汾市服裝店賣了六年衣服。做銷售小妹時,她剛高中畢業,學習成績在班上排名前列。但兄妹四人,沒人上過大學,“那時覺得讀大學還不如學一門技術,出來早點掙錢”。父母也不管她,於是她獨自踏上異鄉打拼的路。

如今,在服裝店上班的記憶,只剩下“站一天,腿很麻”。但劉霞個性倔強。即使感到累,想著“別人都可以為什麼我不行”,她在服裝店乾了下去。

直到她到了25歲,縣城認為女人該結婚的年紀,在親人的催促下,劉霞覺得自己沒在臨汾“混出什麼名堂來”,回了老家,進入婚姻。

結婚一年後,與家鄉其他女人一樣,因為懷孕,她辭職了,三年沒工作。但她心裡很清楚:“我喜歡出去。”

從小,她和媽媽一樣,寧願到農村的地里幹農活,也不願意做家務。她告訴我,永和縣里,像她這樣想的全職主婦很多,大家都希望有一份自己的事業。但縣城長期只有服務業招人。一周7天上班,兼顧帶娃不現實。

清澗縣人民/朱秋雨 攝

2020年,開在縣城的AI企業,在招聘廣告上明晃晃寫著“週末雙休”,這讓坐月子的劉霞醞釀著出門工作。

更讓她按捺不住的是,同齡朋友中,幾位寶媽在朋友圈曬出在AI企業工作的狀態——“三八婦女節,她們每個人都有一支玫瑰花。”

這讓劉霞很羨慕。結婚七年,她沒有收到過丈夫的禮物。

就這樣,一傳十十傳百,對女性友好的人工智能工作在縣城傳開,吸引了大量“寶媽”報名。

李林峰也驚訝地發現,明明沒有刻意強調性別,但永和縣愛豆公司裡超過95%都是女性。

“人家給我們什麼我們做什麼,我們不挑。”一位永和寶媽說。她們更在意的是,做標註員拿人均三四千薪資,超過了縣城事業編的水平。

一家最大用工企業

AI標註產業讓黃土高原的人們如沐春風。但在外面的世界,是一個競爭激烈的市場。

據前瞻產業研究院統計,中國數據標註公司從2014年興起,到2017年達到發展高峰。那一年,相關融資事件達到9起。這個數字,也是接下來多年的高峰。 2018年起,與AI數據有關的公司融資量開始下滑。到了2021年,相關融資只剩下一年2筆。

一位業內人士透露,AI數據標註產業一大特點是勞動密集,因此,國內存在大量標註的小作坊、工作室。他們以低薪招人,互打“價格戰”。很長一段時間,數據標註行業處在成交量價格的粗放狀態。

不同標註之間的產能對比/36氪

相較之下,曹亞麗、劉霞等對數據標註的競爭感知不深。被問及會否擔心公司倒閉失業,她們直搖頭。

此前,清澗縣嘗試過多次產業扶貧,養豬、果業、畜牧業。清澗縣愛豆科技有限公司總經理魚濤回憶說:“人們能想到的農村能幹的,我們縣都乾過,幾乎都失敗”。

這一說法得到一位接近政府人士的側面認證。他回憶,清澗縣曾多次引進果業公司,做紅棗加工,但無一例外,來到清澗落地的企業,都以破產倒閉告終。

2019年,最早提出在小縣城發展人工智能的,是國家衛健委在清澗縣掛職的副縣長柳清海。而實際上,2019年時,清澗縣除了柳清海,沒人理解何為人工智能。

魚濤回憶,那一年,他還在清澗縣城投公司擔任副總,收到來自縣里的電話,對方讓他到新成立的公司當負責人。

他問電話那頭:“這(公司)是乾什麼的?”

電話那頭答:“我們也不清楚,只有柳書記知道。”

陝西清澗縣/朱秋雨 攝

與柳清海接觸後,魚濤理解了發展人工智能的思路。 “這至少是一個輕資產的項目。”萬一發展不好,也不會像此前破產的企業那麼慘烈,“船小好掉頭嘛”。

2019年,在國家衛健委的協調引進下,由中國婦女發展基金會、螞蟻集團、螞蟻公益基金會等發起的數字產業孵化項目“AI豆計劃”,落地清澗。

愛豆的第一次招聘在2019年夏天,招聘宣傳得轟轟烈烈,當地婦聯、團委、人社局等都幫忙發了招聘啟事,連電視台都打了廣告,但還是沒招攬到人。

這個職業對縣城人民來說,實在過於陌生。 “再加上以前也有一些倒閉的產業,大家也不太願意相信。”魚濤說。

直到2020年,受疫情影響,縣城人多數居家。此時,魚濤與幾名管理層將一台台電腦送至員工的家,讓他們居家辦公。

數字經濟的優勢,在此時體現了。

有一個月,一名員工拿到了1萬多元的薪水,遠超當地服務業2000元左右的工資。

這在小縣城迅速地成為爆炸性消息。清澗愛豆公司的名氣此後打響,來應聘的人源源不絕,很快成為當地最大用工企業。

清澗成為樣板。柳清海近日在接受媒體採訪時總結,清澗縣的經驗說明,數字經濟、人工智能有轉移到西部地區的空間。

接下來的三年,周邊縣城永和、子洲、綏德、延川縣的“AI豆計劃”數字就業中心陸續啟用,皆以清澗愛豆為母公司。據統計,這些中心共計吸納了超600名當地女性和返鄉就業青年加入。

縣城沒有天花板

數字化沒有停止對小縣城的革新。

清澗縣愛豆員工李阿倩向我提起,在一次接受采訪時,記者問她:“你知道ChatGPT嗎?”

李阿倩第一次聽說這個詞,“那時候我才感到自己的落後,這邊和外面還是有很大差距”。

雲測數據總經理賈宇航也曾告訴南風窗,隨著ChatGPT和大模型的發展,如今,數據標註的類型和內容越來越複雜。 “最早的人臉識別,只需要在人臉上做一個拉框的標註,就可以完成對應需要的訓練。”賈宇航舉例:“而現在,還要求對人臉的關鍵點、表情或者一些人臉的屬性或者姿態,例如半張臉被遮擋時等情況,進行標註。”

早期的人臉識別與現在的人臉識別需要訓練的內容有區別

魚濤也發現,ChatGPT等引發的大模型狂潮,對數據標註產業衝擊很大,標註難度也在階梯式上漲。 “我們這一批初中學歷的人,有的被AI取代了。我們已經沒任務給他們安排。”

如今面臨的,依然是四年前的問題——招人困難。

魚濤說:“200個人的標註公司已經是我們縣的天花板了。”目前,需要的是高學歷或者有專業背景的人,比如金融、醫療專業的年輕人。而這類人才,大部分都外出工作,或者回縣城考編。

相較魚濤,李林峰的焦慮要輕一些。

在他看來,紮根在黃土高原的數據標註企業,是一種更為特殊、少數的實踐。此前,永和縣政府曾嘗試過扶持電商直播等產業,但都沒能收到類似的效果。原因是,“電商沒能提供那麼多就業崗位”。

清澗縣城,新樓盤拔地而起/朱秋雨 攝

他認為,數據標註產業在黃土高原發展的優勢,恰恰在於它是勞動密集型產業,有助於吸納女性的就業。

據介紹,愛豆公司將90%以上的營收,用於員工薪酬福利。 59%的員工,是曾經的脫貧、低保、殘障等防返貧重點監測人口。

有產業和就業崗位,刺激人才回流、發揮女性力量才成為可能。以永和為例,2020年AI公司啟動時,員工中僅有一名大學生。而成立兩年多來,員工專科及以上學歷大學生佔比已超30%。

如今,寶媽們的身影不止出現在家、菜市場、校門口以及麻將館。在公司、美甲美容店和健身房裡,她們化著妝,背挺得很直。

而讓“清澗模式”廣為人知的魚濤,則有更大的野心。

如果一個縣城招200人是天花板,那麼他希望“多點開花”——今後周邊的每個縣都設立一個數字就業中心。 “如此一來,我們實力會更強。誰有大量的數據(需標註),我們一口就給吞下。”

文中配圖部分來源於視覺中國,部分來源於網絡

資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載

Total
0
Shares
Related Posts