OpenAI再推新智能體Deep Research 在“人類的最後考試”中表現突出

OpenAI發布了一款新的人工智能工具“Deep Research”，旨在為用戶執行耗時的在線研究任務，涵蓋從復雜科學問題到汽車推薦等眾多領域。這一新工具進一步豐富了這家初創公司的人工智能代理陣容。 Deep Research可能需要5 到30 分鐘來完成其工作——在你離開或處理其他任務時深入挖掘網絡。最終輸出以報告的形式出現在聊天中，很快用戶還將看到嵌入的圖像、數據可視化和其他分析輸出，以增強清晰度。這次的時間大大提升了它的能力。例如，在“人類的最後考試”中，Deep Research取得了令人印象深刻的26.6% 的準確率——遠遠超過了其最接近的競爭對手DeepSeek R1，後者的得分低於10%。這一飛躍凸顯了系統的迭代優化和結構化綜合能力，證明了在人工智能快速發展的步伐中，有些任務確實需要時間。

OpenAI再推新智能體Deep Research 在“人類的最後考試”中表現突出

拉丁美洲加密貨幣市場在三年內大幅上漲800％，達到270億美元

資深分析師預測Shiba INU價格將在$0.00017到$0.00032之間快速上漲

加密貨幣市場在大幣下跌時呈現混合信號

德銀：貝森特的降息觀點與美聯儲模型相悖

扎克伯格計劃再次重組Meta的人工智能業務

現在XRP錢包94%被出售，但這或許會有所不同的原因在於此

失去上漲趨勢後，比特幣攤位超過$112,000

索拉納新聞：Solana 達到100,000 TP

OpenAI再推新智能體Deep Research 在“人類的最後考試”中表現突出

Related Posts