人類訓練的人工智慧能夠移動遊標並點擊按鈕

人工智慧新創公司Anthropic AI

AI新創公司Anthropic發布了Claude 3.5 Sonnet模型的更新版本，它可以像人一樣與電腦互動——行動遊標、按下按鈕和輸入文字。

推出升級版Claude 3.5 Sonnet 和新型號Claude 3.5 Haiku。我們還在測試版中引入了一項新功能：電腦使用。

開發人員現在可以指導Claude 像人們一樣使用電腦– 透過查看螢幕、移動遊標、點擊和鍵入文字。 pic.twitter.com/ZlywNPVIJP

– Anthropic (@AnthropicAI) 2024 年10 月22 日

「我們不是創建專門的工具來幫助克勞德執行特定任務，而是教他通用的電腦技能，讓他能夠使用為人們設計的各種標準解決方案和程序，」Anthropic 指出。

開發人員可以使用此功能自動執行重複流程、建置和測試軟體以及執行其他任務。為此，創建了一個API，使Claude 能夠感知電腦介面並與其互動。

該功能是實驗性的，因此可能會出現錯誤。 Asana、Canva、Cognition、DoorDash、Replit 和The Browser Company 開始對其進行測試。

這家人工智慧新創公司警告說：“人類毫不費力地執行的一些動作——滾動、拖動、縮放——給克勞德帶來了挑戰。”

同時推出的還有新的AI模式Claude 3.5 Haiku，將於10月底發表。在性能方面，它與該公司之前的旗艦神經網路Claude 3 Opus相匹配。

經過人類訓練的人工智慧可以移動遊標、按下按鈕和列印文本 Claude 3.5 Sonnet 和Claude 3.5 Haiku 在各種基準上與其他AI 的比較。數據：人為。

該公司以客戶回饋為論據，宣布對Claude 3.5 Sonnet 在程式設計領域進行了改進。 GitLab 指出人工智慧具有更強的推理能力，使其成為支援多步驟軟體開發流程的「理想選擇」。 Cognition 和The Browser Company 也給了不錯的評價。

程式設計也被認為是Claude 3.5 Haiku 模型的強項。它在SWE-bench Verified 上的得分為40.6%，領先許多競爭對手。

讓我們提醒您一下，10 月份，OpenAI 的AI 模型GPT-4o 在Solidity 語言程式設計評級中取得了最高分，擊敗了o1-preview、o1-mini 和競爭對手。

發現文本中有錯誤？選擇它並按CTRL+ENTER