免費使用,谷歌投資3 億美元的Anthropic 正式推出Claude 2,直接對標GPT-4


圖片來源:由無界AI 生成

微軟憑藉對OpenAI 的投資在這場 AI 變革中大殺四方,其競爭對手谷歌不甘示弱,試圖使用相同的方式來迎戰,重金押注了 OpenAI 的競爭對手生成式 AI 初創公司 Anthropic。 Anthropic 之於谷歌,就像OpenAI 之於微軟。

Anthropic本身就與 OpenAI 的淵源頗深。由於在OpenAI在發展方向上產生分歧,擔心微軟對OpenAI的首次10億美元的投資後,會使其走上更加商業化的道路,偏離初衷,彼時為OpenAI研發副總裁Dario Amodei領導的團隊選擇離開並在 2021 年成立了 Anthropic。

截至2022 年底,Anthropic 已籌集 7 億美元資金,其中 5 億美元來自 Alameda Research。谷歌的雲部門隨後投資3 億美元獲得 10% 的股份,該交易要求 Anthropic 從谷歌云購買計算資源。 2023年5月,Anthropic在Spark Capital領投的一輪融資中籌集了4.5億美元。至此,Anthropic 已經籌集了近 15 億美元資金。

今年3 月份,Anthropic 發布了一款類似ChatGPT的AI聊天機器人產品 Claude。 Claude 有 520 億個參數,最初通過 Slack 集成在封閉測試版中提供,現在用戶可以通過 Quora 的 Poe 應用程序以及其他六個聊天機器人訪問Claude。然而,Claude 的熱度明顯遠不及 ChatGPT 和最新的 GPT-4。

7月 11 日,Anthropic 推出了新版人工智能聊天機器人:Claude 2,目標直接與 GPT-4 競爭。

Anthropic表示,最新模型 Claude 2 提高了編碼、數學和推理方面的性能,可以生成更長的響應。

Claude 2具有包含 100k 個 token 的上下文窗口,是所有商用模型中最大的。 Claude 2 能夠一次性處理大約7.5萬個單詞的文本。用戶可以輸入大量數據集,並要求以備忘錄、信件或故事的形式進行總結。相比之下,ChatGPT可一次性處理3000個單詞的文本,而GPT 4則可以處理25000個單詞的文本。 Claude 2 訓練數據中心化 10 % 為非英語數據,在處理中文請求時不在話下。

Claude 2 對比 GPT-4

英偉達高級AI 科學家 Jim Fan 表示,Claude 2 比 GPT-4 更便宜,並且在推理和編碼方面比舊版強大得多。

但在標准考試中,它還沒有完全達到GPT-4,但與 Claude v1.3 相比已經快速趕上。

GRE口語考試:165 vs 169(GPT-4 獲勝) GRE寫作考試:5 vs 4(Claude 2 獲勝) GRE數學考試:154 vs 163 (GPT-4 獲勝) USMLE(美國職業醫師資格考試):~67 與 ~85 (GPT-4 獲勝) Bar(美國律師執照考試):76.5 vs 75.7(Claude 2 獲勝)

在推理基準測試中:

HumanEval編碼:71.2% vs 67%( Claude 獲勝)。值得一提的是,GPT-3.5 的得分僅為 48%。 Claude 的編碼能力得到了顯著的提高。 GSM-8K小學數學:88% 與 92% (GPT-4 獲勝)。與之前的版本相比,Claude 從 85.2%提高到 88%。 Claude 2(100K 上下文)比 GPT-4-32K 便宜 4-5 倍假設 token 長度相似,Prompt 代幣成本為 11 美元/百萬token vs 60 美元/百萬token,完成成本為 32 美元/百萬 vs 120 美元/百萬。

Claude 2的知識更新截止日期是2023年初,而GPT-4是2021年9月。所以 Claude 2 的內容要新鮮得多。
除了這些基準測試,Claude 2在編碼、數學和推理方面的進步讓人眼前一亮。

憑藉對超量文本的支持,有用戶認為Claude2 殺死了所有“chatPDF”工具——你現在可以上傳 PDF 文件,讓Claude2 幫你分析。 Claude2 目前支持同時對最多 5 個 10 MB 以內文檔同時進行總結分析。支持 pdf、text、csv 等格式。

一位用戶嘗試將特斯拉最新的第一季度財報上傳,並詢問,“特斯拉第一季度財報更新的主要內容是什麼?你能對價格做出任何預測嗎?”

Claude 2 能夠完美地回答這個問題,並有消息來源。

還有用戶上傳了谷歌最新的財報記錄,並要求其總結要點。結果比帶有代碼解釋器的ChatGPT 好得多,後者俱有 8k token 限制。

Claude 2 目前已經面向 UK 和 US 用戶免費開放使用(https://claude.ai/),有興趣的人可以科學嘗試一下,在GPT-4 需要付費訂閱的情況下,這是一個不錯的替代選擇。

資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載

Total
0
Shares
Related Posts