最近,Open AI 推出了更複雜的o1reasoning 模型版本,稱為o1 pro 模式。該聊天機器人於週四發布,售價為每月200 美元。然而,社區不確定如何解釋它。
該公司新的ChatGPT Pro 計劃提供對「o1 pro 模式」的訪問,該模式使用額外的計算能力,為與科學、數學和編碼相關的最具挑戰性的查詢提供最全面、最可靠的響應。
Open AI 前首席長Bob McGrew 認為o1 pro 模式是「智慧過剩」的一個例子,它指的是用戶(以及潛在的模型創建者)無法從任何「額外智慧」中獲取價值。這是簡單的基於文字的介面固有限制的結果。
ChatGPT 是與o1 pro 模式交互作用的唯一方法,OpenAI 的其他模型也是如此。 Bob McGrew 指出ChatGPT 並非完美無缺。他補充說,200 美元確實建立了崇高的期望。此外,ChatGPT Pro 並不是一件容易的事,它在社群媒體上的初步反應就證明了這一點。
這是新的開放式人工智慧助理的權衡方式
據報道,o1 pro 模式將成為世界上最昂貴的聊天機器人訂閱,因為每月200 美元的費用將轉化為每年2400 美元。然而,該服務還有其他好處,例如取消速率限制和無限制地存取OpenAI 的其他模型。
英國電腦科學家Simon Willison 問:“OpenAI 有沒有分享過在常規o1 中失敗但在o1-pro 中成功的具體提示示例?”
相反,失敗已經被記錄下來。數獨是o1 專業模式的一項挑戰,它受到任何人都顯而易見的視覺錯覺喜劇的阻礙。
人工智慧工程師 Tibor Blaho 在 X 上寫道,「o1 和o1-pro 都在這裡失敗了,可能仍然是因為視力限制(與數獨謎題相同)。」Tirbor Blaho 還指出,o1 和o1-pro 在視覺功能方面都失敗了。
o1 和o1-pro 都在這裡失敗了,可能仍然是因為視力限制(與數獨謎題相同)https://t.co/mAVK7WxBrq pic.twitter.com/O9boSv7ZGt
– 蒂博爾·布拉霍(@btibor91) 2024 年12 月5 日
o1-pro 代碼未能正確理解/閱讀謎題。
根據OpenAI 的內部基準測試,標準o1 在編碼和數學問題上的表現僅略優於o1 pro 模式。
為了證明o1 pro模式的一致性,OpenAI對相同的基準進行了更嚴格的評估。只有四分之四正確辨識出答案的模型才被視為解決了問題。然而,這些評估的改進並不顯著。
週四,OpenAI 執行長Sam Altman 不得不重申ChatGPT Pro 並不適合大多數人,儘管他之前聲稱OpenAI 正在朝著「成本太低而無法計量」的智慧方向發展。
他說:「大多數用戶會對o1 感到非常滿意 [ChatGPT] 加等級”
Bob McGrew表示,提高可靠性可能是o1 pro最重要的解鎖點,特別是對於醫療領域。
對成本的看法
卡內基美隆大學機器學習副教授、Amplify Partners 風險合夥人阿米特·塔爾瓦卡(Ameet Talwalkar) 表示:「對我來說,將價格提高十倍似乎是一個很大的風險,」他補充道,「我認為我們會有更好的結果。」在短短幾週內就能感受到人們對這項功能的需求。 」
加州大學洛杉磯分校的計算機科學家Guy Van den Broeck 表示:“我不知道這個價格點是否合理,也不知道昂貴的推理模型是否會成為常態。”
當o1 pro 模式被描述為解決「最困難的問題」時最有效的模式時,潛在消費者並沒有獲得大量資訊。
由於缺乏該模型據稱增強的能力的具體例子,其中包括“思考更長時間”和表現出“智能”的能力,因此很難合理化支付更多費用。
從零到Web3 Pro:您的90 天職業啟動計劃
資訊來源:由0x資訊編譯自CRYPTOPOLITAN。版權歸作者Florence Muchai所有,未經許可,不得轉載