微軟教GPT-4 自主使用Android


來自微軟研究院和北京大學的一個國際科學家團隊可能在人工智慧(AI)在作業系統中自主運作的能力方面邁出了革命性的一步。

他們最近的研究揭示了需要與作業系統互動的任務應用GPT-4 等大型語言模型(LLM) 的複雜性的新見解。

使用GPT-4 模型作為代理

傳統上,基於GPT-4 的系統擅長生成性任務,例如寫電子郵件或詩歌。然而,挑戰在於如何在一般環境中有效地將這些模型部署為代理,尤其是在作業系統的複雜性中。

作業系統需要採用多模式方法,需要在各種組件和應用程式之間共享訊息,這與用於強化學習訓練的虛擬世界相比,提出了截然不同的挑戰。

研究團隊遇到了一些障礙,包括作業系統內巨大且動態的操作空間、應用程式之間協作的需要以及前瞻性規劃的要求。這些複雜性超出了許多AI模型目前的能力,包括經過測試的Meta的開源Llama2 70B和OpenAI的GPT-3.5和GPT-4,所有這些都未能在團隊的測試中提供顯著的性能。

新的訓練環境“AndroidArena”

研究人員開發了一種名為AndroidArena 的新訓練環境,專門用於模擬與作業系統的交互,在本例中類似於Android。這使他們能夠識別法學碩士在嘗試操縱作業系統時面臨的核心問題:理解、推理、探索和反思。

研究的一個顯著突破是發現了一種相對「簡單」的方法,使模型的準確性提高了27%。透過向模型提供有關先前嘗試和行動的信息,團隊有效地解決了缺乏反思的問題,為模型提供了一種「記憶」形式。

這些發現對於開發更先進、更有效的人工智慧助理至關重要,這些助手能夠在作業系統中執行複雜的任務。最後,這項研究標誌著在實現能夠精確有效地操縱控制系統的完全自主人工智慧系統方面向前邁出了重要一步,為更先進的技術整合和自動化的未來打開了大門。

資訊來源:由0x資訊編譯自NEWSBIT。版權歸作者Hidde Scheper所有,未經許可,不得轉載

Total
0
Shares
Related Posts