研究：GoogleGemini 表現不如GPT-3.5 Turbo

根據站長之家12 月20 日報道，在近期的一項研究中，來自卡內基美隆大學和BerriAI 的研究團隊對Google Gemini Pro 進行了深入的評估，並發現其在多項任務中表現不如OpenAI 的GPT-3.5 Turbo。研究團隊在LiteLLM 平台上測試了四個不同的LLM：Google Gemini Pro、OpenAI GPT-3.5 Turbo、GPT-4 Turbo 和法國新創公司Mistral 最新推出的Mixtral 8x7B。測驗內容涵蓋了STEM、人文和社會科學領域的57 個多項選擇問題，以及一些與通用推理、數學和程式設計相關的任務。研究結果顯示，在多項選擇問題的測試中，Gemini Pro 的準確度低於GPT-3.5 Turbo 和GPT-4 Turbo。 Gemini Pro 在人類性、形式邏輯、初等數學和專業醫學等領域的表現較差，其中一部分原因是Gemini 在某些問題上拒絕回答，聲稱由於安全和內容限制無法遵循。但在安全和高中微經濟學等領域，Gemini Pro 的表現略優於GPT-3.5 Turbo，但進步有限。

研究：GoogleGemini 表現不如GPT-3.5 Turbo

受PEPE啟發的Sinereum L2層Brett成功敲定70萬美元預售

今天的比特幣和以太坊：Pepeto vs Little Pepe，最佳的預售和價格預期

政策導向周期：美國通過監管政策重塑加密貨幣生態

對沖基金迎十年來最快資金流入投資者在動盪中追求回報

了解智能合約開發的七大優勢：區塊鏈技術推動創新與變革的新時代。

XRP與SUI：比較他們的功能

吸引狗狗鯨的兩種加密貨幣：Pepe Dollar 和Maxi Doge，Pepe Dollar 突出表現為最佳加密貨幣預售

投資加密貨幣：基礎面與資金流的選擇探討

研究：GoogleGemini 表現不如GPT-3.5 Turbo

Related Posts