斯坦福Hai發布了長達456頁的《2025人人工智能指數報告》,指出AI技術迅速發展,在多項基準測試中實現顯著提升。同時,AI系統生成高質量視頻和高效處理能力不斷增強,開源模型性能與閉源模型差距縮小。 2023年AI醫療設備獲得FDA批准,自動駕駛服務增多,企業在AI領域投資大幅上漲,78%組織開始使用AI。儘管對AI的樂觀情緒提升,亞洲國家的信心較高。 AI在科研中的影響力顯著,推動科學進步。 AI安全問題亦日益重要。
作者:斯坦福(Stanford Hai)
編譯:Felix,Panews
斯坦福hai近期發布了長達456 頁的《2025::
1.人工智能變得比想像的要強大得多
在新的基準測試mmmu,gpqa和swe-bench中:得分分別提高了:得分分別提高了18.8%、48.9%和67.3%。除了基準測試外,人工智能係統在生成高質量視頻方面取得重大進展,在某些情況下,llm)
注:
mmmu是一個精心設計的新型基準,專為大學水平的多學科多模態理解和推理而設,旨在評估基礎模型在廣泛任務中的專家級多模態理解能力。 ,旨在評估基礎模型在廣泛任務中的專家級多模態理解能力。
gpqa是一個具有挑戰性的數據集,包含,包含448道由不同領域專家編寫的高質量且難度極高的多項選擇題。在相應領域擁有或正在攻讀博士學位的專家,65%,而技能高超的非專家驗證者儘管平均花費時間超過30分鐘且可不受限制地訪問網絡,準確率也只有34%。
SWE-Bench 是一個用於評估大型語言模型( llm)在從github收集的真實世界軟件問題上的表現的基準。
2. 人工智能更高效、更易獲取且更經濟實惠
參數更少的小型人工智能模型的能力日益增強:在短短兩年內,參數數量減少了約,100倍,但其在大規模多任務語言理解(mmlu)60%。
開源模型與閉源模型之間的差距也在縮小,在某些基準測試中,性能差距從,8%降至僅1.7%。
此外,從,從2022年11月到2024年10月,達到gpt-3.5水平的系統的推理成本下跌了280倍以上。在硬件層面,成本每年下跌30%,而能源效率每年提高40%。
高級人工智能的門檻正在迅速降低。更不用說像deepSeek這樣的稀疏模型的開發,在專家混合(,在專家混合(,的結構下,只有相關的參數會被激活以回答用戶的查詢,使整個事情更加高效。,使整個事情更加高效。
的確,隨著規模更小但能力更強的,ai模型不斷湧現,ai模型訓練的要求降低了,成本效益高的分佈式訓練有望在未來十年成為主流。目前有一些頂尖項目正在基於不同的理論框架開展相關研究。 ,成本效益高的分佈式訓練有望在未來十年成為主流。目前有一些頂尖項目正在基於不同的理論框架開展相關研究。
3.人工智能正日益融入日常生活
2023年,FDA)批准了223款人工智能輔助醫療設備,2015年6月6日,自動駕駛汽車已不再是實驗品:waymo每週提供超過15萬次自動駕駛服務,而百度的,而百度的
4.企業在人工智能領域的投資大幅增加,推動創紀錄的投資和應用
人工智能在商業中的應用也在加速:2024年,78%的組織正在使用人工智能,55%。與此同時,越來越多的研究證實,人工智能能夠提高生產力,並有助於縮小整個勞動力隊伍中的技能差距。 ,並有助於縮小整個勞動力隊伍中的技能差距。
事實上,隨著人工智能導致客戶期望值呈指數級增長,現有解決方案會在一夜之間顯得過時,從而使現有企業失去適應的機會,產品市場匹配崩盤的情況會更頻繁地發生。 ,產品市場匹配崩盤的情況會更頻繁地發生。
5.儘管全球對人工智能的樂觀情緒上漲,但亞洲人對人工智能更為樂觀
(83%)(80%)(80%)(77%)等國家,大多數人認為人工智能產品和服務利大於弊。相比之下,在加拿大(,40%)(39%)(36%)(36%)等地,樂觀情緒仍遠低於此。 ,樂觀情緒仍遠低於此。 ,樂觀情緒仍遠低於此。
不過,這種態度正在轉變:自2022年以來,一些此前持懷疑態度的國家的樂觀情緒顯著增長,10%)(10%)(8%)(8%)(4%)。 4%)
6.人工智能在科研中的影響力日益增強,已成為推動科學進步的重要驅動力
人工智能日益增長的重要性在重大科學獎項中有所體現:兩項諾貝爾獎分別授予了在深度學習(物理學)(兩項諾貝爾獎分別授予了在深度學習(物理學)(和將其應用於蛋白質折疊(化學)方面做出貢獻的研究,而圖靈獎則表彰了在強化學習方面的開創性貢獻。
顯然,人工智能正以指數級、出乎意料的速度飛速發展,這對大多數人來說意義非凡。因此,人工智能安全也變得越來越重要。雖然人工智能讓偽造變得更容易,但密碼學則讓偽造變得更加困難。期待著那些能夠利用區塊鏈的原生屬性(可驗證性和透明性)來構建這一領域實用解決方案的加密貨幣項目。
相關閱讀:專訪a16z創始人克里斯·迪克森(Chris Dixon):人工智能與加密貨幣技術的交匯
資訊來源:由0x資訊編譯自互聯網。版權歸作者所有,未經許可,不得轉載