OpenAI強勁模型GPT-5發布免費使用,Altman稱邁向AGI重要一步,微軟率先接入


OpenAI於2023年8月7日發布了GPT-5,首席執行官Sam Altman稱其為“世界上最好的AI模型”,並進行了重大升級。 GPT-5在編程、數學和健康等多個領域表現卓越,其代碼測試準確率達74.9%,超越人類水平。該模型已向所有ChatGPT用戶開放,包括免費和付費版本。用戶可選擇不同的聊天個性,並且GPT-5能更準確地回答問題,降低了提供錯誤信息的概率。同時,微軟已將GPT-5整合進其產品中,進一步拓展AI應用。

今年openai最為大眾期待的產品來了。

美東時間8月7日週四,Openai宣布,AI)模型gpt-5。它是

Openai首席執行官Sam Altman在新模型發布會上高度評價gpt-5,稱它是「世界上最好的模型」,是相比此前模型的「重大升級」,並表示

OpenAi介紹,GPT-5在多項基準測試中表現出色,在編程、數學、健康等領域達到前沿水平。 GPT-5在SWE-BENCHEN經過驗證的代碼測試中得到74.9%的準確率,略超人類Claude opus 4.1。同時

從本週四當日起,gpt-5向所有chatgpt的免費用戶和訂閱plus,pro,團隊,作為默認模型使用,並於一周內在企業和

與gpt-4o一樣,gpt-5免費和付費版的區別在於用量。免費和付費版的區別在於用量。 ,pro用戶可無限使用並獲得增強版本gpt-5 pro。對於免費用戶,完整的推理功能可能需要幾天時間才能全部上線。一旦免費用戶達到gpt-5的用量限制

Openai週三還表示,將以每年,1美元的象徵性收費向美國聯邦政府機構提供CHATGPT產品。具體來說是chatgpt的企業版,其中包含強化的安全和隱私功能。

Openai剛剛官宣gpt-5,微軟就宣布,從本週四開始,將,gpt-5整合到旗下廣泛的產品組合中,包括365副copilot copilot,github,github copilot和azure ai ai ai fistry等平台,讓微軟的企業和消費者用戶能夠立即體驗到gpt-gpt-5

GPT-5 擁有編程、創意寫作、健康領域三大優勢

Openai的gpt5發佈公告在一開頭就說,gpt-5是openai 「最智能、最快速、最實用的模型,其內置的思維能力,讓每個人都能擁有專家級的智慧。」,讓每個人都能擁有專家級的智慧。 」

根據openai介紹,作為,openai的「最強大模型」,gpt-5在三個關鍵領域實現了顯著提升。

首先是編程能力。 gpt-5是openai迄今為止最強大的編碼模型,在復雜的前端生成和大型代碼庫調試方面表現突出,能夠僅憑一個提示就創建美觀響應式的網站、應用程序app 和遊戲。早期測試者註意到其在間距、排版和留白等設計選擇方面的改進。

在從github獲取現實世界編碼任務的基準測試swe-bench經過驗證,gpt-5思考後首次嘗試的準確率達74.9%,高於openai推理模型o3推理模型69.1%和gpt-4o的30.8%。

評測指出,這意味著,gpt-5的表現略勝於人類週二推出的claude opus 4.1和谷歌deepmind的gemini 2.5 pro,後兩者在SWE-SWE-BENCHEN FEAL FEAL FEAL FEAL測試的得分分別為74.5%59.6%。

不過,人類的最後考試,帶有擴展推理功能的gpt-5增強版本gpt-5 pro在使用工具的情況下得分42%44.4%的xai模型

Openai

Altman稱,gpt-5尤其擅長按需啟動整個軟件app,也就是所謂的「氛圍編碼」、即用ai根據自然語言提示生成功能代碼,從而加快開發速度。 ,從而加快開發速度。

作為實例,Openai的研究者演示了,要求gpt-5創建一款網頁app,幫助說英語的用戶學習法語,且該

研究者將相同的提示詞提交到兩個gpt-5窗口中,幾分鐘後生成了兩個不同的app。 openai的負責人稱,這些,「存在一些缺陷」,但用戶可以根據個人喜好再調整ai生成的軟件,例如更改背景或添加更多標籤頁。

在創意寫作方面,gpt-5能夠處理結構複雜的寫作任務,如無韻律的抑揚格五音步詩或自然流動的自由詩。 openai的

Openai

健康諮詢是第三個重要提升領域。

gpt-5能更積極地標記潛在健康問題,幫助用戶解析醫療結果,儘管

在名為HealthBench Hard幻覺的測試中,具備思考能力的gpt-5 1.6%。這遠低於gpt-4O和o3模型,後兩者的錯誤信息率分別為15.8%和12.9%。

Openai

幻覺可能性顯著降低幻覺可能性顯著降低

Openai稱,gpt-5,,它能更準確地回答現實世界的疑問,出現幻覺的可能性顯著降低。 ,出現幻覺的可能性顯著降低。

在對代表chatgpt生產流量的匿名提示詞啟用網絡搜索後,gpt-5響應中包含事實錯誤的可能性比gpt-4o低約45%;在思考後,gpt-5 o3 o3低約80%。下圖可見,gpt-5響應的錯誤信息率僅為4.8%,GPT-4O為20.6%,O3為22%。 22%。 22%。

Openai

Openai還表示,為gpt-5,(安全完成)。它教模型在安全範圍內盡可能給出最有幫助的答案。有時,這可能意味著部分回答用戶的問題,或者只提供高水平的回答。 ,或者只提供高水平的回答。

如果需要拒絕,經過訓練的gpt-5,並提供安全的替代方案。 ,並提供安全的替代方案。

在受控的實驗和openai的生產模型中,openai都發現這種安全補全的方法更加細緻入微,能夠更好地引導雙重用途問題,增強對模糊意圖的魯棒性,並減少不必要的過度拒絕。 ,並減少不必要的過度拒絕。 ,並減少不必要的過度拒絕。

Openai的後訓練負責人MichellePokrass表示:「gpt-5已經過訓練,能夠識別任務何時無法完成,避免猜測,並能更清晰地解釋局限性,相比之前的模型

推出四種可選的chatgpt聊天預設性格

Openai稱,Gpt-5在指令執行方面表現提升,其執行自定義指令的能力也得到了相應的提升。 ,其執行自定義指令的能力也得到了相應的提升。

(cynic)(cynic)(機器人)(聽眾)和書呆子( nerd)(nerd)都是可選的,用戶可在設置中隨時調整,用以匹配

上述四種性格最初適用於文本聊天,之後將擴展到語音聊天

Openai稱,所有這些新性格都達到或超過了我們減少諂媚行為的內部評估標準。 ,所有這些新性格都達到或超過了我們減少諂媚行為的內部評估標準。

altman盛讚歷史性突破盛讚歷史性突破盛讚歷史性突破用回gpt-4後效果相當糟

在本週四的簡報會上,Altman對gpt-5給予了極高評價,將gpt-5 agi::

「在以往歷史上任何時期,擁有像gpt-5這樣的東西都是不可想像的。」

「這是第一次感覺就像在與任何領域的專家交談。」

Altman在簡報會上甚至不惜用「踩」GPT-4抬高gpt-5::

「我嘗試過用回gpt-4,但效果相當糟糕。」

gpt-5採用統一的系統架構,配備實時路由器,能夠根據對話類型、複雜性和工具需求自動決定是快速響應還是進行深度「思考」。這消除了用戶選擇合適設置的需要,使

在經濟價值工作的內部基準測試中,使用推理模式的gpt-5在大約一半的案例中可與專家水平相當或更優,涵蓋法律、物流、銷售和工程等40多個職業。 openaivp nick turley稱:「這個模型的感覺真的很好。」:「這個模型的感覺真的很好。」

Altman比喻,使用gpt-5:「在很多新領域,人們受到想法的限制,但實際上卻沒有執行能力。」,但實際上卻沒有執行能力。 」

微軟全面整合搶占先機

微軟在gpt-5發布當日即宣布,將其整合到廣泛的產品線中。在企業級應用方面,Microsoft 365 Copilot將利用GPT-5 更好地處理複雜問題、在長對話中保持專注並理解用戶上下文。企業用戶可通過推理功能處理電子郵件、文檔和文件。

對於消費者,Microsoft Copilot的新智能模式將利用gpt-5 copilot.microsoft.com或窗口,mac,android android和ios設備上的

Openai

開發者將通過github副詞和視覺工作室代碼獲得gpt-5支持,用於編寫、測試和部署代碼。振ai foundry平台將提供所有gpt-gpt-5模型,配備

微軟ai紅隊使用嚴格的安全協議測試了gpt-5推理模型,結果顯示,該模型在惡意軟件生成、欺詐自動化等多種攻擊模式下展現出

資訊來源:由0x資訊編譯自互聯網。版權歸作者White55,火星財經所有,未經許可,不得轉載

Total
0
Shares
Related Posts