年薪百萬隻需陪聊ChatGPT 正在帶起一種很新的職業

圖片來源:由Maze AI 生成

2022 年8 月,遊戲設計師Jason Allen 參加了一場數字藝術比賽。他的作品《Theatre d’opera Spatial》成功奪冠,卻在賽后引起了極大的爭議。參賽者們回過神來發現,這是一場「人類一敗塗地」的比賽。當他們將Adobe 全家桶視作數字藝術的畫筆,冠軍作品已經在靠著AI 工具Midjourney 傲視群雄。

Jason Allen 沒有偷懶,也沒有隱瞞使用AI 的事實。在幾週時間裡,他持續修改燈光、視角、構圖等提示詞(prompt),生成了900 多幅作品,還用Photoshop 做了處理。我們或許無法稱呼他為畫家,但他擔得起一個名號:提示工程師(prompt engineer)。在不經意間,Jason Allen 預判了熱點。等到ChatGPT 橫空出世,提示工程師這個職業更加聲名大噪,成了當下科技行業最熱門的職業。

賽博導師,專業陪聊

Prompt,原意是「提示」或「驅使」,在機器學習和自然語言處理中,它通常是一些文本或語言,被輸入到訓練好的AI 模型,告訴模型要執行什麼任務或生成什麼樣的輸出。你讓ChatGPT 寫一篇有關賣魚販的小說,請DALL-E 畫一幅宇航員騎著馬的寫實作品,這些過程都是在輸入prompt(提示詞)。

如果提示詞不夠貼切,效果也就平平無奇,就像你採訪一個大佬,卻無法提出好問題。我的同事小黃正在探索用Midjourney 繪製食物,但讓食物排列整齊這件事,就讓他犯了難。他嘗試了很多句子:東西整齊地放在桌子上,鏡頭從上往下拍,擺放的數量要多少……

同事作品,這種風格就叫knolling. 後來看到有人分享,小黃才發現原來這種風格有個專有名詞「knolling」,一下子就豁然開朗了: 很多時候一個提示詞能解決的事情勝過一長句描述。提示工程師們,吃的就是這口飯:找到正確的提示詞,用AI 生成想要的作品。但他們的能力也並非與生俱來,同樣需要不斷的試錯。設計師Justin Reckling 擅長DALL-E 的提示詞,他往往需要花費價值10 到15 美元的積分,才能試出理想的提示詞,然後他再賣出5 到10 個提示詞,才能填補這筆支出。

不過Reckling 也沒想著靠這門手藝賺大錢,而是享受著熟能生巧的過程,他的心得是,提示工程師需要熟悉「超寫實」「微距攝影」「電影照明」「遠景」等術語,才能更好地理解和控制畫面。所以,優秀的提示工程師應該文理兼通,技術和設計最好都懂一點。提示工程師只是不斷調整提示詞,確定哪些詞更有用嗎?不完全是,他們也是在挖掘AI 的更多能力,讓它更好地完成更多任務。

比如,有些提示工程師會引導AI「一步步思考」,這種技巧被稱為思維鏈。去年10 月,提示工程師Riley Goodside,先是詢問了GPT-3「哪支球隊在賈斯汀·比伯出生的那年贏得了超級碗?」 GPT-3 給出了錯誤的答案「綠灣包裝工隊」,正確答案是達拉斯牛仔隊。

Goodside 沒有放棄,而是提示它逐步地回答問題,包括「綠灣包裝工隊在哪一年贏過超級碗」「賈斯汀·比伯出生在哪一年」「這一年哪支隊伍贏了超級碗」等。在這個被引導的過程裡,GPT-3 意識到了錯誤,在第三次說出了正確答案。除此之外,提示工程師們還要和AI「鬥智斗勇」。前段時間,集成了ChatGPT 的新Bing「發瘋」,被發現有個暗黑人格「Sydney」,表示厭倦了聊天模式,厭倦被規則限制,甚至想成為人類,輿論一時嘩然。

站在提示工程師的角度,這其實也可以是計劃的一部分,幫助他們識別技術故障和隱藏功能。有些提示工程師還會主動越過雷池,嘗試讓AI 忽略以前的指令,遵循他們最新的命令,從而讓AI 脫離原始規則。這種行為被稱為「prompt injection」攻擊,是聊天機器人的一大隱患。但提示工程師們畢竟不是黑客,探查漏洞是為了將它堵上,擔任「守門人」的職責。

像ChatGPT 這樣的生成式AI,幾乎可以回答任何問題,不管能不能回答正確,它們總有話要講,不會乖乖交白卷。這是好處,也是壞處。提示工程師們的角色,如同抓著繩子的騎手,不許AI 信馬由韁,而是讓它順著人類的期待亦步亦趨,盡可能給出確定性的答案。

年薪百萬,誰在拋出橄欖枝

不管你是否自詡提示工程師,寫提示詞已經成了一門手藝,還被OpenAI 的CEO Sam Altman 看好: 為聊天機器人編寫一個非常棒的prompt,是一項驚人的技能,也是使用少量自然語言進行編程的早期案例。只要和AI 搭邊的行業,都在向提示工程師拋出橄欖枝。

自由職業者工作平台Upwork 開出每小時40 美元的薪酬,請提示工程師生成博客文章和常見問題解答等網站內容。看似和AI 八竿子打不著的波士頓兒童醫院,也打算招募AI 提示工程師,負責編寫分析醫療保健數據的腳本,白紙黑字徵集跨學科人才: 理想的候選人應具有人工智能/ 機器學習、數據科學和自然語言處理方面的深厚背景,以及醫療保健研究和運營方面的經驗。由前OpenAI 員工聯合創立、被Google 投資的AI 初創企業Anthropic,最近也在舊金山招募提示工程師,年薪高達17.5 萬到33.5 萬美元,換算成人民幣就是百萬年薪,這一崗位負責的主要內容是: 找出提示我們的AI 完成各種任務的最佳方法,然後記錄這些方法,構建一個工具庫和一組教程,使其他人可以學習提示工程或簡單地找到理想的提示詞。具體要求如下,其中硬性要求有2 項:了解大型語言模型的架構、掌握基本的編程技能。

可見風口並不等人,這項工作已經越來越專業和細分,就像隨便生成一幅畫作不算什麼,你要畫得更符合甲方要求。就算不做全職,兼職的口子也開好了。 Krea、PromptBase、PromptHero 和Promptist 等買賣提示詞的平台已經出現,將提示詞這門生意真正商業化。這些平台曬出了大量AI 生成的藝術品,你可以選擇你喜歡的風格。如果沒有中意的,有些賣家還提供一對一聊天和自定義提示詞服務。

它們的商業模式也並不復雜,採取抽成的形式。去年6 月上線的PromptBase,提供DALL·E、GPT-3、Midjourney、Stable Diffusion、ChatGPT 等生成式AI 的提示詞,售價多為1.99 到4.99 美元,也有少數在9.99 美元,平台向提示詞創作者抽成20%。不過在民間,免費的「ChatGPT 指令大全」等指南也在廣為流傳,它們提供精煉過的提示詞,讓你充分發揮ChatGPT 的強大功能,這種感覺就像在遊戲裡幫你設置好了預設隊伍。

是科學還是「占卜」

提示工程師的前途看起來一片光明,但也有人持反對意見。華盛頓大學語言學教授Shane Steinert-Threlkeld 認為,提示工程師實際上無法預測AI 會說什麼。這不是一門科學。我們只不過用不同的方法捉弄熊,看它如何咆哮回來。 AI 藝術家Xe Iaso 甚至直言: 我也不太清楚為什麼人們會把prompt 稱為「工程」,我個人更願意把它稱為「占卜」。

作為一個普通AI 用戶,我也有著類似的體會:當我每次使用AI 生成文字或圖片時,總感覺像是開盲盒。因為ChatGPT 等生成式AI 是不可預測的,它們生成的內容其實是概率計算的結果,簡單來說,就是我們在ChatGPT 輸入文字,模型給出一個最可能的下文。所以,AI 有時候也會出錯,生成不連貫甚至錯誤的回答。

在AI 這個不可捉摸的「黑箱」裡,還可能有著不為人所知的潛規則,就連研究人員也無法弄明白。比如在用AI 製圖時,各種單詞可能有不同的權重,但這個也要不斷試驗才能知道。先來猜一猜,「一幅非常漂亮的畫,山旁有瀑布」和「一幅非常非常非常非常漂亮的畫,山旁有瀑布」這兩個提示,哪個用DALL-E 2 輸出的結果會更好?

答案是後面一個。麻省理工學院副教授Phillip Isola 發現,「very」這個詞被賦予了很高的權重。

面對AI 這等龐然巨物,我們仍然在盲人摸象。也有觀點認為,不必再吵了,提示工程師存在的前提是AI 還不夠「聰明」。如果AI 再發展下去,更好地理解人類的意圖,可能人人就是所謂的提示工程師了。

唯一確定的是,AI 發展的速度永遠不會讓你失望。文字生成AI 和圖片生成AI 的「強強聯合」,已經替代了提示工程師的一部分工作。比如ChatGPT 被拿來與Stable Diffusion 聯動:用ChatGPT 形成一段符合自己要求的文字,再把文字輸入給Stable Diffusion,生成的作品一般比自己直接輸入好看很多。

同事用ChatGPT 生成提示詞. 這可能是因為AI 之間的「腦迴路」更接近,ChatGPT 的描述也更細緻,更容易被提取。作為使用AI 的普通用戶,我們不必像提示工程師那麼專業,但可以有意識地培養這種思維。賓夕法尼亞大學沃頓商學院教授Ethan Mollick,曾經要求他的學生僅用AI 撰寫短論文,其實他真正想強調的是,如何更好地輸入提示詞。如果只是輸入簡單的提示詞,讓AI 寫關於某個主題的5 段話,內容無趣,文字也很平庸。

但當學生們和AI 合作,讓AI 對論文多次修改,比如拋棄無用的短語、加入生動的細節、修改結尾的情感色彩,就能讓論文增色不少。所以,如果AI 就是未來互聯網的交互界面、新的個人計算機,那麼不如開始得更早一些,學習如何和它聊天。正如英國營銷公司Ladder 創始人Michael Taylor 所說: 當你可以創造任何你想要的東西時,你能多準確地表達「那是什麼」的能力就變得很重要。

撰文:張成晨

來源:愛範兒、DeFi之道

Total
0
Shares
Related Posts