OpenAI員工公開指責xAI最新AI模型Grok3的基準測試結果具有誤導性

近日，OpenAI的一名員工公開指責埃隆・馬斯克旗下的xAI公司，稱其發布的最新AI模型Grok3的基準測試結果具有誤導性。對此，xAI的聯合創始人伊戈爾・巴布甚金（Igor Babushkin）則堅稱公司並無不當。 xAI的圖表顯示，Grok3的兩個版本——Grok3 Reasoning Beta和Grok3 mini Reasoning——在AIME 2025上的表現超過了OpenAI當前最強的可用模型o3-mini-high。然而，OpenAI的員工很快在X平台上指出，xAI的圖表並未包含o3-mini-high在“cons@64”條件下的AIME 2025得分。巴布甚金在X平台上辯稱，OpenAI過去也曾發布過類似的誤導性基準測試圖表。儘管這些圖表是用於比較其自身模型的表現。

OpenAI員工公開指責xAI最新AI模型Grok3的基準測試結果具有誤導性

拉丁美洲加密貨幣市場在三年內大幅上漲800％，達到270億美元

資深分析師預測Shiba INU價格將在$0.00017到$0.00032之間快速上漲

加密貨幣市場在大幣下跌時呈現混合信號

德銀：貝森特的降息觀點與美聯儲模型相悖

扎克伯格計劃再次重組Meta的人工智能業務

現在XRP錢包94%被出售，但這或許會有所不同的原因在於此

失去上漲趨勢後，比特幣攤位超過$112,000

索拉納新聞：Solana 達到100,000 TP

OpenAI員工公開指責xAI最新AI模型Grok3的基準測試結果具有誤導性

Related Posts