OpenAI再推新智能體Deep Research 在“人類的最後考試”中表現突出

OpenAI發布了一款新的人工智能工具“Deep Research”,旨在為用戶執行耗時的在線研究任務,涵蓋從復雜科學問題到汽車推薦等眾多領域。這一新工具進一步豐富了這家初創公司的人工智能代理陣容。 Deep Research可能需要5 到30 分鐘來完成其工作——在你離開或處理其他任務時深入挖掘網絡。最終輸出以報告的形式出現在聊天中,很快用戶還將看到嵌入的圖像、數據可視化和其他分析輸出,以增強清晰度。這次的時間大大提升了它的能力。例如,在“人類的最後考試”中,Deep Research取得了令人印象深刻的26.6% 的準確率——遠遠超過了其最接近的競爭對手DeepSeek R1,後者的得分低於10%。這一飛躍凸顯了系統的迭代優化和結構化綜合能力,證明了在人工智能快速發展的步伐中,有些任務確實需要時間。

Total
0
Shares
Related Posts