AI新創公司Anthropic發布了Claude 3.5 Sonnet模型的更新版本,它可以像人一樣與電腦互動——行動遊標、按下按鈕和輸入文字。
推出升級版Claude 3.5 Sonnet 和新型號Claude 3.5 Haiku。我們還在測試版中引入了一項新功能:電腦使用。
開發人員現在可以指導Claude 像人們一樣使用電腦– 透過查看螢幕、移動遊標、點擊和鍵入文字。 pic.twitter.com/ZlywNPVIJP
– Anthropic (@AnthropicAI) 2024 年10 月22 日
「我們不是創建專門的工具來幫助克勞德執行特定任務,而是教他通用的電腦技能,讓他能夠使用為人們設計的各種標準解決方案和程序,」Anthropic 指出。
開發人員可以使用此功能自動執行重複流程、建置和測試軟體以及執行其他任務。為此,創建了一個API,使Claude 能夠感知電腦介面並與其互動。
該功能是實驗性的,因此可能會出現錯誤。 Asana、Canva、Cognition、DoorDash、Replit 和The Browser Company 開始對其進行測試。
這家人工智慧新創公司警告說:“人類毫不費力地執行的一些動作——滾動、拖動、縮放——給克勞德帶來了挑戰。”
同時推出的還有新的AI模式Claude 3.5 Haiku,將於10月底發表。在性能方面,它與該公司之前的旗艦神經網路Claude 3 Opus相匹配。
Claude 3.5 Sonnet 和Claude 3.5 Haiku 在各種基準上與其他AI 的比較。數據:人為。
該公司以客戶回饋為論據,宣布對Claude 3.5 Sonnet 在程式設計領域進行了改進。 GitLab 指出人工智慧具有更強的推理能力,使其成為支援多步驟軟體開發流程的「理想選擇」。 Cognition 和The Browser Company 也給了不錯的評價。
程式設計也被認為是Claude 3.5 Haiku 模型的強項。它在SWE-bench Verified 上的得分為40.6%,領先許多競爭對手。
讓我們提醒您一下,10 月份,OpenAI 的AI 模型GPT-4o 在Solidity 語言程式設計評級中取得了最高分,擊敗了o1-preview、o1-mini 和競爭對手。
發現文本中有錯誤?選擇它並按CTRL+ENTER
資訊來源:由0x資訊編譯自FORKLOG。版權所有,作者Владимир Слипер所有,未經許可,不得轉載