OpenAI推出了O3和O4-Mini-Mini系列


什麼是chatgpt以及如何使用它

Openai推出了新的“思維”模型O3和O4-Mini。 神經網絡的關鍵特徵是“思考”而不是通常的分析。 安全測試人員抱怨O3和O4-Mini欺騙的趨勢。 初創公司偽造著強調編程Jeadens的開發。

Openai宣布推出了新的O3和O4-Mini AI型號。兩者都專注於推理– 他們花費更多的時間在答案之前進行重新檢查。

首次推出OpenAI O3和O4-Mini-ur最智能和最有能力的模型。我們的推理模型可以在Actial-Web搜索,Python,圖像分析,文件解釋和圖像生成。 pic.twitter.com/rdaqv0x0we

– openai(@openai)2025年4月16日

O3被定位為最先進的“思考”神經網絡。根據內部測試,它超過了數學,編程,推理,科學和視覺意義的先前迭代。

O4-Mini在價格,速度和性能之間提供了競爭折衷。

兩種模型都可以查看網頁,分析Python的代碼,處理和生成圖像。它們以及O4-Mini-High變體都適用於訂戶Pro,Plus和Team。

根據該公司的說法,O3和O4-Mini模型不僅是識別圖像的第一個,而且“在他們的幫助下思考”。用戶可以將圖片上傳到Chatgpt – 例如,板上的圖案或PDF的K線走勢圖– 模型將使用SO稱為“思想鏈”來分析它們。

因此,神經網絡能夠理解模糊和質量差的圖像。他們還可以使用CANVAS功能在CHATGPT中直接在Python上啟動和執行代碼,或者在Internet上搜索有關當前事件的信息。

O3在SWE-Bench編程測試中得分69.1%,O4-Mini-68.1%。 O3米尼的指標為49.3%,克勞德3.7十四行詩-62.3%。

O3收取10百萬個輸入令牌和40美元的周末的費用為10美元。對於O4-Mini- $1.1和$4.4。

在接下來的幾周中,計劃推出O3-Pro-version O3,其中涉及更多計算資源以提供答案。它將僅用於Chatgpt Pro訂戶。

新的安全系統

OpenAI已在O3和O4-MINI模型中引入了一個新的監測系統,以識別與生物和化學威脅有關的請求。它的目的是防止提供可能鼓勵潛在危險攻擊的技巧。

該公司指出,與以前的模型相比,新模型的功能大大擴展,因此,使用非尊敬的用戶時會增加風險。

O3更熟練地回答與某些類型的生物威脅有關的問題,因此該公司創建了一個新的監測系統。它在O3和O4-Mini之上起作用,旨在檢測工業和化學風險。

Openai專家花了大約1000個小時,嫁給了“不安全”的對話。然後,模型拒絕在98.7%的案件中對風險的工業做出反應。

在生物風險領域的新OpenAI模型的比較。數據:Openai。

儘管經常改善了安全性和模型的安全性,但該公司的合作夥伴之一表示關注。

Openai很著急

Openai與該組織合作檢查其AI模型的功能及其安全評估的元R,幾乎沒有時間來測試新的神經網絡。

她在博客上報導說,與以前的旗艦模型OpenAI -O1分析相比,O3的參考實驗之一“在相對較短的時間內”通過。

根據《金融時報》的報導,AI-Startap為Tesers提供了不到一周的時間來檢查新產品的安全。

METR聲稱,基於在有限時間內收集的信息,O3具有“欺騙”或“黑客”測試的“高趨勢”,以艱難的方式最大化其得分。即使她清楚地理解行為與用戶和OpenAI的意圖不符,她也採取了極端的措施。

該組織認為O3還可以顯示其他類型的敵對或“惡意”行為。

“儘管我們不認為這特別可能,但必須注意的是 [наша] 估計的安裝將無法捕獲此類風險。總的來說,我們認為在啟動之前對機會進行測試不是足夠的風險管理策略,目前我們正在開發其他形式的評估原型,”該公司強調。

阿波羅研究還記錄了O3 O4-Mini模型的欺騙性行為。在其中一項測試中,她被禁止使用某個工具– 但是該模型仍然應用了它,認為這將有助於更好地應對任務。

“[Выводы Apollo] 結果表明,O3和O4-Mini能夠具有內在的陰謀和戰略欺騙。儘管相對無害,但對於日常用戶來說,了解陳述與模型的行為之間的差異很重要 […] 可以通過分析推理的內部痕跡來進一步評估這一點。 ” Openai指出。

編程的代理

她與新的OpenAI AI模型一起介紹了直接從終端推出的Codex Cli-A本地軟件代理。

該工具允許您在桌面上編寫和編輯代碼,並執行一些操作,例如移動文件。

“您可以從命令行獲得多模式推理的優勢,傳輸模型低分辨率的屏幕截圖或草圖,並結合在本地訪問您的代碼 [через Codex CLI]”, – 在公司中指出。

Openai想要購買帆板

同時,Openai正在談判可能收購風力衝浪程序員的流行人工智能助手。這是彭博社撰寫的。

這筆交易可能是初創公司Sam Altman的最大購買。該機構強調,它的細節尚未定義,可能會改變。

回想一下,OpenAI在4月推出了一個新的AI Model Models-GPT-4.1,GPT-4.1 Mini和GPT-4.1 Nano。他們在編程和實施說明中“做得很好”。

資訊來源:由0x資訊編譯自FORKLOG。版權歸作者Владимир Слипер所有,未經許可,不得轉載


Total
0
Shares
Related Posts