OpenAI 申請GPT-5 商標,什麼時候發布?都會帶來哪些新能力?


原文來源:AGI創新實驗室

圖片來源:由無界AI‌ 生成

8 月1 日消息,OpenAI 已經正式為“GPT-5”提交了商標申請,該商標涵蓋了以下內容:

人工生成人類語音和文本的軟件將音頻數據文件轉換為文本聲音和語音識別基於機器學習的語言和語音處理

根據GPT-5 的商標申請文件顯示,GPT-5 商標涵蓋了AI 生成語音和文本的功能,還可以將音頻文件轉換為文本,實現聲音和語音識別,並利用機器學習技術進行語言和語音處理。

這可能意味著GPT-5 將支持語音能力,將為用戶帶來更先進、更高效的語音和文本處理體驗,多模態能力進一步增強。

GPT-5 什麼時候到來?

2023 年3 月發布GPT-4 時,預計OpenAI 將在2023 年12 月發布下一代模型。 Runway 聯合創始人Siqi Chen 此前表示,我被告知GPT5 計劃於今年12 月完成訓練,Openai 預計它能夠實現通用人工智能(AGI)。這意味著我們都會激烈爭論它是否真正實現了AGI。

然而,在4 月份的MIT 活動中,當被問及OpenAI 是否正在訓練GPT-5 時,OpenAI 首席執行官Sam Altman 表示“我們不會,並且一段時間內不會”。而在今年6 月份的採訪中,OpenAI 創始人兼CEO Sam Altman 在被問及什麼推出GPT-5 時曾表示,我也很好奇,我們沒有答案,我們不會很快有GPT-5,我們必須把安全性作為很重要的一部分。

儘管如此,一些人認為OpenAI 可能會在2023 年10 月之前推出GPT-4.5,這是GPT-4 和GPT-5 之間的中間版本,就像GPT-3.5 一樣。據說GPT-4.5 最終將帶來多模態功能,即分析圖像和文本的能力。 OpenAI 早在2023 年3 月的GPT-4 開發者直播中就已經宣布並演示了GPT-4 的多模態功能。現在微軟已經在Bing Chat 中發布了GPT-4 的多模態功能。看來GPT-4 的下一個重大更新即將到來。

除此之外,在開始研究GPT-5 之前,OpenAI 目前在GPT-4 模型上還有很多工作要做。目前,GPT-4 的推理時間非常長,而且運行成本相當昂貴。 GPT-4 API 訪問仍然很難通過。此外,OpenAI 最近剛剛開放了對ChatGPT 插件和代碼解釋器的訪問,這些插件和代碼解釋器仍處於測試階段。互聯網瀏覽功能已從GPT-4 中刪除,因為它顯示來自付費網站的內容。

雖然GPT-4 非常強大,但我想OpenAI 意識到計算效率是可持續運行模型的關鍵要素之一。添加新的特性和功能,你就可以處理更大的基礎設施,同時確保所有檢查點都正常啟動並可靠運行。因此,大膽猜測一下,如果我們假設政府機構不設置監管障礙,GPT-5 很可能會在2024 年發布。

預測:GPT-5 特性和功能

減少幻覺

業界熱議的是GPT-5 將實現AGI(人工智能)。除此之外,GPT-5 應該可以減少推理時間、提高效率、減少幻覺等等。讓我們從幻覺開始,這是大多數用戶不太相信AI 模型的關鍵原因之一。

根據OpenAI 的數據,在所有九個類別的內部對抗性設計的事實評估中,GPT-4 的得分比GPT-3.5 高40%。現在,GPT-4 對不准確和不允許的內容做出響應的可能性降低了82%。在各個類別的準確度測試中,它非常接近80% 的分數。這是對抗幻覺的巨大飛躍。

現在,預計OpenAI 將在GPT-5 中將幻覺減少到10% 以下,這對於使LLM 模型值得信賴來說將是巨大的。

計算效率模型

我們已經知道GPT-4 的運行成本很高(每1 K token 0.03 美元),並且推理時間也更長。而較舊的GPT-3.5-turbo 模型比GPT-4 便宜15 倍(每1 K token 0.002 美元)。根據SemiAnalysis 最近的一份報告,GPT-4 不是一個密集模型,而是基於“專家混合”架構。這意味著GPT-4 針對不同的任務使用16 種不同的模型,擁有1.8 萬億個參數。

有瞭如此龐大的基礎設施,運行和維護GPT-4 模型的成本就變得非常昂貴。

事實上,很多新的大模型已經開始追求“小而精”,讓大模型擁有盡可能少的參數,而不是更多。

在最近對Google PaLM 2 模型的解釋中,PaLM 2 參數相當小,但性能卻很快。

多感官AI 模型

雖然GPT-4 已被宣佈為多模態AI 模型,但它僅處理兩種類型的數據,即圖像和文本。借助GPT-5,OpenAI 可能會在實現真正的多模態方面邁出一大步。它還可以處理文本、音頻、圖像、視頻、深度數據和溫度。它將能夠將來自不同模式的數據流互連起來以創建嵌入空間。

長期記憶

隨著GPT-4 的發布,OpenAI 帶來了32 K token 的最大上下文長度,每1 K token 的成本為0.06 美元。我們在幾個月內迅速看到了從標準4 K token 到32 K 的轉變。最近,Anthropic 將其Claude AI 聊天機器人的上下文窗口從9 K token 增加到了100 K token。預計GPT-5 可能會通過更大的上下文長度帶來長期記憶支持。

這有助於讓人工智能角色和朋友記住你的角色和記憶,並且可以持續多年。除此之外,你還可以在單個上下文窗口中加載書籍和文本文檔庫。由於長期記憶的支持,可能會出現各種新的人工智能應用,而GPT-5 可以使這成為可能。

你認為GPT-5 什麼時候發布,會帶來哪些顛覆性創新?

參考資料:

https://beebom.com/gpt-5/‌

資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載

Total
0
Shares
Related Posts