OpenAI 最近推出了“Operator”,這是一種可以為用戶執行基於網絡的任務的人工智能代理。這個新工具旨在瀏覽網頁,通過鍵入、滾動和單擊按鈕與網頁進行交互。
特性和功能
操作員能夠執行各種重複性任務:
填寫表格訂購雜貨預訂酒店
OpenAI表示,使用人們日常使用的相同界面和工具不僅可以擴大人工智能應用的範圍,還有助於節省時間並開闢新的商機。
運營商背後的技術
該代理由新模型“計算機使用代理”(CUA) 提供支持,該模型:
GPT-4o 的視覺功能通過強化學習與高級推理相結合。 通過屏幕截圖觀察信息並使用鼠標和鍵盤模仿人類動作。
CUA 經過培訓,會在採取發送電子郵件或預訂酒店等重要操作之前要求確認,從而提供額外的安全和控制層。
現狀及未來計劃研究版本:Operator目前處於初步研究版本,旨在通過用戶反饋進行改進。 可用性:僅適用於美國的ChatGPT Pro 訂閱者,每月費用為200 美元,通過專用來源進行訪問。 需要改進的地方:代理還不夠完善,出現問題會要求用戶超越。 AI市場背景
值得注意的是,另一家人工智能初創公司Anthropic 於2024 年10 月發布了其Claude 3.5 Sonnet 模型的更新版本,該模型提供了與計算機類似的交互功能,例如光標移動、按鈕點擊和文本輸入。
OpenAI 引入Operator 標誌著AI 代理的開發向前邁出了一步,該代理可以自動執行日常任務,可能會影響我們與數字環境交互的方式。
資訊來源:由0x資訊編譯自CRYPTOBENELUX。版權歸作者Max Latupeirissa所有,未經許可,不得轉載