小模型編排,讓1+1>2,企業工作更靈活,效率更高


善用小模型,發揮大功。

原文來源:機器之能

圖片來源:由無界AI生成

AI 的使用越來越廣泛,不限於個人對於它的使用。在企業中,也越來越流行運用AI 完善工作流程、推動工作進度。但不得不提的是,功能更強大的往往是規模較大的大模型,這會造成企業部署上的難題。 Silvio Savarese 發文針對這個問題談到了自己的想法,模型並不是越大越好,小模型組合起來能更好地處理工作內容。

以下是機器之心對原文進行的不改變原意的翻譯與整理。

原文網址:https://blog.salesforceairesearch.com/from-copilot-to-coorchestration/‌

最近幾個月,我寫了很多關於我稱之為LAM(Large Action Model)的文章,這是LLM 的更活躍、更自主的變體。它不僅能產生文字或圖像等內容,​​還能完成整個任務,甚至參與工作流程,並且無論是與人一起或自己完成都可以。今年,在Dreamforce 2023 大會上,隨著Einstein Copilot 的推出,這個願景向現實邁進了一大步。 Einstein Copilot 是Salesforce 的AI 會話助手,將在整個Salesforce 平台上推出,並準備整合到客戶所做的幾乎所有事情中。

Einstein Copilot:生成式AI 的未來一瞥

開箱即用的Einstein Copilot 很難不給人留下深刻印象。它從頭開始設計,透過在幾乎所有類型的工作流程中為使用者提供幫助,以安全的方式提高工作效率。它可以處理以自然語言發布的問題,並提供從公司安全的專有數據中提取的相關可信答案。這是我所相信的AI 在企業中的發展方向的清晰圖景:一個單一、可信的介面,圍繞著日常的人機互動而設計,並且能夠幫助完成各種任務。它展現了AI 的力量,確保科技符合企業的需求,而且我毫不懷疑它也將改變客戶的工作方式。而LAM,隨著其靈活性和功能的發展,將把這個已經非常強大的力量提升到一個新的水平。

讓生成式AI 模型「既小又大」

最近,生成式AI 領域的許多主題都圍繞著為LLM 和LAM 提供動力的模型規模和模型架構。隨著OpenAI 等公司不斷挑戰規模極限,參數數量遠超過千億,我們不難得出這樣的結論:越大越好。事實上,大型車型通常會吹噓它們的性能很難或不可能以其他方式實現。而隨著模型尺寸的增加,不可思議的複雜行為會出現,這表明越來越大的規模策略會帶來顯著的好處。

策略性縮小模型規模如何帶來巨大收益

雖然更大的模型不斷佔據新聞頭條,但一味地追求讓模型更大並非最佳策略。最明顯的就是,現在最大的模型計算成本高得嚇人,讓許多企業望塵莫及。而且,即使那些有能力部署它們的企業也必須承認,它們所承諾的高品質輸出可能會極其緩慢。此外,在信任、安全、有害性以及版權等所有權主張方面,我們仍然面臨一些問題,這都源自於超大規模模型所依賴的大量、全球來源的資料集。

這些缺點使得小型模型在許多領域越來越有吸引力。它們相對划算,並且可以調到驚人的速度。如今,專門設計的LLM 在某些情況下甚至可以完全在邊緣運行,包括終端用戶的行動裝置。而且由於他們需要較少的訓練,客戶可以在準備他們的資料集時發揮更積極的管理作用。這時,資料集所包含的內容的品質、安全性甚至法律地位方面都能取得巨大進展。

透過專注於更窄的領域,小模型產出品質也能與它們的「大兄弟」比肩。像ChatGPT 這樣的模型本質上是為每個人設計的,幫助完成家庭作業、晚餐食譜、回答有關科學、技術、歷史和流行文化的問題。相較之下,企業導向的生成式AI 可以而且應該專注於更小、更相關的問題領域。這顯然是雙贏:它意味著在不影響產出品質的情況下跌低進入門檻。

小模型的編排如何提供巨大的潛力

即使是小型模型也能提供大型解決方案,我們只需要換個想法來考慮規模問題。與其讓模型本身變得更大,不如將多個模型交織在一起,為更高層次的目標服務。這其中,每個模型都是根據特定目標設計的,並在經過精心策劃、嚴格審核和專有的資料集上進行過訓練。如果像Einstein Copilot 這樣的AI 智能體可以組合或協調,就像多個人類可以作為一個團隊完成比他們作為個體所能完成的更多的工作一樣,那會怎麼樣?例如一家餐廳,這是一個只有團隊合作才能實現的組織,每個成員都有自己的技能和專注領域:服務員負責點餐,廚師負責準備食物,接待員負責處理預訂和訂單,司機負責送餐。那麼,LAM 以類似的方式組織起來會是什麼樣子呢?

我最近一直在思考編排這個問題,我認為它是最令人興奮的技術之一,同時也是最實用的技術,能以安全、高效的方式帶來有用、自主的智能體。最重要的是,編排意味著,即使是最雄心勃勃的解決方案,也能保持透明,並為創作者和與之並肩工作的人們所知曉。請記住,在這種情況下,規模並不是來自於越來越大的神經網絡,而是來自獨立、定義明確的組件,它們以對人類有意義的方式組織起來。例如,與其訓練一個巨大的模型來記錄客戶會議記錄、從結果中得出推論、更新相應的客戶關係管理記錄,然後發送後續信息,不如將這些任務中的每一項都分配給一個單獨訓練的模型。

事實上,我的大部分研究生涯都是在機器人技術領域度過的,我不禁將目光投向了更遠的地方,想像在現實世界的空間裡也能實現這樣的編排工作。在工廠、辦公室、醫院,甚至是餐廳裡,實體模型與人類並肩工作,共同完成各種任務。這聽起來很高大上、很遙遠,但目前,編排潛力已經非常大了。

讓我們來談談它的好處。首先,編排讓我們免去了組成一個足夠大的資料集,並將單一模型變得如此靈活,解決跨領域智能體的困難,同時也免去了將大量差異巨大的資料放入單一訓練中心化所帶來的風險。此外,每個模型還可以透過RLHF 進行進一步微調。因此,在這個系統中,每個元件都是非常專業化的,用於完成更大任務中關鍵但易於管理的步驟。

當出現問題時,無論是在調試過程中,還是在生產過程中,都能透過單一的專用模型更容易識別問題,從而更有把握地理解和解決這些問題。即使是嚴重故障,也能以更穩健的模組化方式處理。並且多個模型協同工作,故障更容易被控制和隔離,當單一組件發生故障時,也有更多機會保持連續性。

生成式AI 的新藝術:跨越多個模型的設計

更重要的是,它將企業AI 模型的創建從純粹的技術任務提升為以人類利益相關者能夠理解的術語、對業務流程進行建模的任務。正像是一位優秀的管理者會將一個問題分解給一個團隊去解決,AI 編排的專家們也會擁有這樣的能力將一個問題分解給一系列專門建立的模型。

這個願景尤其令人興奮的一點是,它指向了一種新的技能,甚至可以稱之為新興藝術,我期待看到它在企業中的發展。 LAM 編排專家將從高層次思考問題,將企業的需求視為一項業務,而不僅僅是一個技術平台,並利用這種洞察力將大型、有意義的任務分解為一系列較小的任務,由LAM “團隊”共同解決。

他們的工作將基礎設施、資料科學和人機介面設計交織在一起。前者要確保這些模型團隊能夠安全且有效率地部署,後者要努力收集獨特的資料集,以解決更小、更不模糊的問題。換句話說,編排專家可能會成為企業AI 相關的新面孔,他們不再專注於神經網路的具體細節,而是更專注於如何建立強大、穩健的系統。

事實上,我最終希望的是,這種技能既不稀有也不排斥,而是普及開來,將LAM 的編排變成強大的個人化解決方案,在我們的職業生活中發揮越來越大的作用。隨著市場的出現,門檻可能會進一步降低,為世界帶來類似copilot 的LAM 編排解決方案,透過簡單方式,以驚人的規模讓生成式AI 發力。

有些人將直接使用這種市場解決方案,使LAM 編排成為現實的可能性。其他人則會把它們當作模組,與其他模組組合在一起,從而根據自己的需求組成各種規模的解決方案。但不管是在哪種情況下,最讓我興奮的是,生成式AI 與其說是由技術專家組成的精英小團體塑造的,不如說是由各個領域專業人士的創造力和遠見卓識塑造的。

事實上,這是我對未來工作的願景是:在這個世界裡,AI 支持人類的技能,使我們能夠在更高的層面上思考,簡化我們所做的一切,同時保留讓我們與眾不同的創造力、風格和視角。

總結

實現任何新願景都是漸進的,LAM 也不例外。但是,近年來的情況表明,它的每一步都將是變革性的。從最初的雛型開始,LLM 就展現了罕見的顛覆和創新潛力。 Einstein Copilot 等輔助智能體將這一標準提升到了更高的水平,它擁有直覺的介面、強大的信任和安全功能,並能與傳統的copilot 系統無縫整合。

資訊來源:由0x資訊編譯自8BTC。版權所有,未經許可,不得轉載

Total
0
Shares
Related Posts