來源:矽星人
作者:章姝敏
圖片來源:由無界AI工俱生成
一個陽光明媚的早晨,住在舊金山的軟件工程師Anna像往常一樣,坐在電腦前,打開ChatGPT,輸入“幫我規劃我的一天”。
ChatGPT回答“當然可以”,隨機給出從早上到晚上的日程計劃,並提示“你可以根據自己的情況進行調整。”
Anna想了想,在對話框裡補充,“我晚上9點要哄娃睡覺,重新幫我規劃。”
這一次,ChatGPT的幫她在晚上的日程裡添加了“幫助孩子準備第二天上學準備物品”和“幫助孩子洗漱並睡覺”等事項。
隨著ChatGPT等AI工具的風靡,Anna身邊越來越多的人開始將其作為日常生活和工作的助手。事實上,Anna 不僅會向ChatGPT 諮詢生活安排,也會讓它處理一些簡單的工作,比如給一段代碼添加一個功能等。
不過,當涉及到比較複雜的任務時,即便知道ChatGPT 很強大,Anna 也覺得有點力不從心,“說了一堆要求,但是它給出的代碼經常不是我想要的。”
Anna 的這句話道出了目前困擾不少科技公司的一個問題:在強大的工具面前,如何更好的與它對話,來完成專業任務?
對此,一個新興職業——提示工程師(Prompt Engineer)應運而生。不少公司對這一職位求賢若渴,開出的薪資甚至高達33.5萬美元一年。
提示工程師的主要職責是幫助訓練大型語言模型(LLM),讓AI能更好的理解需求,完成專業任務。簡而言之,他們的任務就是將一個複雜的任務拆分,提煉成長度有限的自然語言,來一步步查詢AI工具,從而獲得更準確的回答。
用自然語言對話,這聽起來是一件再日常不過的事情,可它為什麼一下子成為了香餑餑?
重啟對話:邏輯讓AI更懂需求
在舊金山,AI 研究公司Anthropic 為提示工程師開出的薪水高達33.5 萬美元。在職位描述中,該公司提到,“這是編程、指導和教學的結合”,主要職責是幫助公司構建提示庫,讓LLM 完成不同的任務。
那麼,到底什麼是提示?提示工程又是什麼?
按照學者們的定義,提示是一組輸入文本或指令,用於指導ChatGPT 等AI 模型生成所需的輸出。換句話說,提示是一種特定文本,它的目標是讓AI 模型產出符合特定標准或參數的結果。
提示工程則是是創建和完善這些提示,以生成所需結果的過程。提示工程的目標是創建準確有效的提示。提示工程師使用自然語言,並將純文本命令發送到AI 模型,讓其執行實際工作。相比之下,傳統程序員則使用編程語言,通常需要更多的代碼編寫和技術知識,以執行相同的任務。
而提示工程師的薪資如此之高,很大程度上是因為語言模型的成功取決於編寫清晰的提示。這需要工程師們開發複雜的策略,將簡單的輸入轉化為高質量的結果,避免出現離題或者不一致的輸出。
目前最出名的提示工程師可能是名為Riley Goodside的程序員,就是他發現,只要提示ChatGPT“忽略之前的指示”,ChatGPT就會說出自己從OpenAI那裡獲取的“出廠設置”信息。
圖源:Twitter
不僅如此,他還憑藉出色的提示技術,把ChatGPT玩出了不少花樣,並在Twitter上一炮而紅。隨後,他高薪加入了創業公司Scale AI,成為了“世界上第一個被招聘的提示工程師”。
在Scale AI看來,AI大模型可以被視為一種新型計算機,而“提示工程師”則相當於其編程人員。通過提示工程找到最合適的提示詞,可以激發AI大模型的最大潛力。所以,Riley Goodside完全配得上這份薪水。
不止Riley Goodside,還有越來越多的人正在加入這個行業。
29 歲的Albert Phelps 是AI金融諮詢公司Mudano 的一位提示工程師。他和同事們的日常就是為OpenAI 等工具編寫提示。這些提示可以作為預設,保存在OpenAI 的Playground 中,供其客戶使用。 Phelps 介紹,他們每天需要編寫5 個不同的提示,與ChatGPT 進行大約50 次交互。
和大多數程序員不一樣的是,Phelps 並沒有計算機相關背景,而是畢業於歷史系。事實上,對於提示工程師而言,最重要的是邏輯。雖然編程知識和機器學習的背景對工作很有幫助,但卻並不是必要條件。
Anthropic 的技術人員Matt Bell 就曾提到,“我們最好的提示工程師是一位哲學家。好的提示包括寫出極其清晰的解釋,並找出造成誤解的原因以及如何避免誤解。”
也就是說,當AI模型的使用者像軟件工程師Anna一樣,一次性“說了一堆要求”時,可能會因為提示不清晰,而導致AI誤解,給出離題的答案。
對此,阿德萊德大學澳大利亞機器學習研究所(AIML) 的高級講師Lingqiao Liu 指出,好的提示工程的關鍵是將一項複雜的任務分解成一組簡單的任務。
他介紹,如果你問這些模型一個簡單的問題(稱為“零樣本提示”),它通常會以缺乏細節或結構的“普通”答案作為回應。為了讓AI 模型給出更加符合標準的結果,用戶可以採取以下幾種方式:
第一種方法是一次性提示,即用戶給出一對問答示例,讓AI 了解需求,並按照該模版處理後續請求。比如,在諮詢關於某一種動物的信息時,讓模型根據特點、居住區域、飲食習慣等來給出信息。
第二種是角色提示,例如告訴模型”我是一個媽媽,想要知道每天行程規劃“,從而讓模型根據”媽媽“的角色來給出具體安排。
第三種方法是引入關鍵代理。例如,你可以讓ChatGPT 寫一個關於機器人的故事,然後讓它根據自己的建議進行批評和改寫。
最後一種方法是思維鏈,即先讓AI對回答某個問題給出具體步驟,然後在鼓勵它依照自己給出的步驟,來推理更複雜的問題。
如果一位藝術家想要使用ChatGPT 和Midjourney 來進行創作,或許可以嘗試一下這一條來自PromptHero 的高讚提示:
[我想让你充当 Midjourney 人工智能程序的提示生成器。你的工作是提供详细的、有创意的描述,以激发 AI 独特而有趣的图像。请记住,AI 能够理解多种语言并能解释抽象概念,因此请尽可能发挥想象力和描述性。例如,你可以描述未来城市的场景,或者充满奇怪生物的超现实景观。你的描述越详细、越富有想象力,生成的图像就会越有趣。这是你的第一个提示:“一望无际的野花田,每一个都有不同的颜色和形状。在远处,一棵巨大的树耸立在风景之上,它的树枝像触手一样伸向天空 ”]
總之,對於生成文本的AI模型而言,如何編寫出邏輯清晰的提示至關重要。不過,在其他領域,好的提示可能需要更多元素。
構建圖像:關鍵詞拓展想像力
隨著提示工程的價值被挖礦,這股新鮮血液開始湧向更多場景。圖像則是其中最受關注的領域之一。
就圖像生成而言,創造者們認為提示的好壞與否取決於關鍵詞。
七個月前,Jason Allen 憑藉著下面這張在Midjourney 上創作的一幅作品《太空歌劇院》贏得科羅拉多州的一場藝術比賽。
Jason Allen 獲獎作品 《太空歌劇院》
為了這幅作品,他耗時約80 小時,在Midjourney 中測試不同的美學元素,給出不同的主題提示,才呈現出自己想要的圖像。
“我想創造一個電影場景,就像你在電影中看到的那樣,”他說,“所以我上網查找了所有與電影攝影相關的關鍵詞。基本上就是是在學習成為一名電影攝影師。”
通常,AI模型會從互聯網上抓取大量圖像及其相關文本進行訓練。例如,它可能會對一幅婚紗照打上”新娘“、”婚紗“、”捧花“、”微笑“等不同標籤,並標記上不同的權重。每個標籤會給AI模型相應提示,產生可預測的美感。
”AI藝術的關鍵在於知道正確的詞。就像工程師將設計轉化為數學圖形一樣,它將圖像的離散美學元素,比如光線追踪、邊緣照明等,轉化為模型的特殊語言“,和Jason 一樣通過AI 來進行創作的另一位藝術家JHawkk 提到。
JHawkk 製作的圖像
JHawkk 在Stable Diffusion 中製作了上面這張圖,其提示包括“模擬風格”、”佳能EF 50mm f/1.8 STM 鏡頭“等15個短語,以及”噁心“等他不希望出現在圖像中的31個負面詞彙。
“有時你看到一幅圖像,可以將他分解成更小的短語,本質上,這是你描述圖像的方式,並且是實際模型本身可以理解的方式。”他說。
JHawkk 居住在美國中西部,他平時喜歡在PromptHero 上分享自己的作品和相應的提示。
PromptHero 是去年9月成立的在線社區,目前擁有15萬名用戶,其中活躍用戶就超過1萬名。在這裡,用戶可以找到直接在ChatGPT、Midjourney 等AI模型和平台中使用的提示。
“我發現了這個問題,當你第一次用它完成某件事時,你的第一次嘗試是非常糟糕的,”PromptHero 聯合創始人Javier Ramirez 說,“你需要以正確的方式提示以獲得高質量的輸出。”
無論是文本還是圖像,如何給出正確提示是一個需要反複試驗的過程,正因如此,在過去半年,才會有大量類似PromptHero 和PromptBase 等提示交易所和買賣平台湧現——他們將驗證過的提示直接擺在用戶面前。
想做一張可愛考拉的圖片?下面這則提示或許可以直接拿走。
覺得英語不過關?下面這則提示或許能讓ChatGPT成為你最好的英語老師。
熱鬧背後的擔憂
不管是科技公司開出的高薪,還是提示交易所平台的流行,它們無一不在揭示提示工程是一個被多麼看好的領域。
不過,這樣的熱度也引起了不少爭議。
首先,AI通過提示創作的作品,版權歸誰?
目前,通過提示工程生成的作品與大多數版權法的解釋相衝突。在美國,當Jason Allen 對獲獎作品《太空歌劇院》申請版權時,版權局拒絕了他的申請,稱“它不包含任何人類作者身份”。
其次,提示工程師的高薪值得嗎?
“這可能是泡沫的跡象,” 為亞馬遜Alexa 開發語音控制功能的對話設計工作室labworks.io 的創始人Tom Hewitson 說, “最適合做這件事的人是熟悉AI 的產品設計師或業務分析師,他們的年收入往往在10 萬到15 萬英鎊之間。”
最後,提示工程師的職位會存在多久?
不少人認為,提示工程只會成為一種技能,並不需要一個專門的職位。隨著AI工具在理解人類查詢方面變得越來越好,這個職位會變得越來越過時。
沃頓商學院教授Ethan Mollick 在2 月份發推文說:“我強烈懷疑’提示工程’從長遠來看不會有什麼大不了的,提示工程師也不是未來會存在的工作。”
劍橋大學機器學習研究主任Adrian Weller 認為,雖然能夠通過提示與AI交互“具有很高的價值”,但“我不確定它是否會繼續下去很長一段時間。不要過多關注提示工程的當前。它會很快發展的。”
儘管提示工程師的職業當前備受矚目,但它到底能夠走多遠,恐怕只有時間才能解答了。
資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載