AI 能在加密世界中生存嗎?

作者:Chao Wang 來源:Future Mosaic 翻譯:善歐巴,金色財經

縱觀科技史,重大突破往往獨立發生,每一項突破都會引發一場革命。然而,當兩種強大的技術融合在一起時,它們的協同作用可以催化非凡的進步。今天,我們正站在這樣一個十字路口:人工智慧和加密貨幣,本身就具有變革性,並且正在聯手。

我們設想加密解決方案將解決眾多人工智慧挑戰,人工智慧代理將建構自治經濟網路以加速加密的採用,人工智慧將推動現有加密技術的演變。許多人的目光都集中在這個交叉點上,大量資金湧入,這些熱詞的熱情助長了這一趨勢。

然而,在所有這些令人興奮的事情中,我們對基礎知識的了解卻少得可憐。人工智慧對加密的理解程度到底有多高?由LLM 驅動的代理程式是否真的能夠使用加密工具?不同的模型在加密任務中的表現如何?這些問題的答案對於指導這一新興領域的產品和技術方向至關重要。

但我們不知道。

一個實驗

針對這些基礎問題,我們進行了實驗評估,評估了包括主流商業和開源模型在內的18 個大型語言模型,參數規模從3.8B 到405B。

閉源模型:GPT-4o、GPT-4o Mini、Claude 3.5 Sonnet、Gemini 1.5 Pro、Grok2 beta(目前為閉源)

開源模型:Llama 3.1 8B/70B/405B、Mistral Nemo 12B、DeepSeek-coder-v2、Nous-hermes2、Phi3 3.8B/14B、Gemma2 9B/27B、Command-R、Qwen2-math-72

該研究旨在評估人工智慧加密應用的現狀,並評估人工智慧與加密整合的潛力和挑戰。鑑於這項研究還處於早期階段,本文將重點放在關鍵見解,而不是具體的結果數據。

實驗表明,人工智慧模型對加密貨幣基礎知識有全面的了解,並對加密貨幣生態系統表現出廣泛的熟悉度。這些模型也表現出執行各種基本錢包操作所需的知識的熟練程度。在適當的提示下,它們的能力不僅得到了顯著提高,而且還展示了按照指示執行複雜分析和操作的能力。這些發現共同表明,為眾多加密貨幣相關領域開發人工智慧應用程式現在是一個可行的前景。

然而,研究也發現了幾個關鍵的限制。這些模型的理論知識和實際應用技能之間存在很大差距,特別是在與加密相關的計算方面。雖然它們能夠產生簡單的智能合約,但它們很難識別更複雜協定中的複雜漏洞。此外,這些模型無法解決在雲端為基礎的人工智慧系統中安全管理私鑰的基本挑戰。

深入探索

  1. 數學差距:最值得注意的發現之一是人工智慧模型普遍難以處理與加密相關的計算。這不僅僅是複雜的加密技術;即使是計算AMM 滑點或挖礦盈利能力等基本操作也具有挑戰性。然而,需要注意的是,大型語言模型並不是為數學計算而設計的。可以透過載入預設程式碼來繞過LLM 的直接計算來解決此限制,從而提高效率和準確性。這種方法類似於人類通常處理複雜計算的方式,依靠專門的工具或預先設定的公式。

  2. 安全困境:雖然人工智慧模型展示了對加密安全原則的紮實掌握,但使用人工智慧實現安全系統的現實仍然存在問題。許多人工智慧系統對基於雲端的處理的需求與加密貨幣的去中心化、無信任性質產生了內在衝突。解決這個問題將需要第三方服務,例如TEE、HSM,甚至更具創新性的新技術。

  3. 智能合約:形式重於功能:AI 模型展現了理解智能合約和解釋其功能的出色能力。它們可以有效地修改合約以解決常見的漏洞和最佳化點,甚至可以自主創建簡單場景的合約。然而,當涉及到深藏在複雜業務邏輯中的漏洞時,所有模型都無法識別它們。這表明模型對智慧合約的理解仍然在很大程度上停留在表面,專注於形式,而不是掌握底層業務邏輯的複雜性。雖然AI 在合約互動和基本創建方面表現出色,但很明顯,人類的專業知識對於確保複雜智慧合約系統的安全性和效率仍然至關重要。

  4. 開源挑戰:頂級閉源模型與大多數開源替代方案之間的巨大效能差距引發了加密領域人工智慧未來的重要問題。鑑於加密社群強調開放性和去中心化,彌合這一差距對於廣泛採用至關重要。

  5. 堅實的基礎和潛力:儘管面臨挑戰,但模型展示了對加密基礎知識的深刻理解,並顯示出對加密生態系統的熟悉感。在適當的提示下,它們的能力顯著提高。這顯示加密領域的人工智慧有著堅實的基礎,模型對區塊鏈架構、共識機制和代幣經濟學等概念的掌握令人印象深刻。引導提示的顯著改進表明,當前的人工智慧模型雖然並不完美,但已經能夠在許多與加密相關的任務中提供有價值的見解和幫助,從市場分析到協議設計評估。

展望未來:加密人工智慧基準的需求

隨著實驗的進展,一個迫切的需求變得顯而易見:加密領域需要標準化的人工智慧基準。正如ImageNet 徹底改變了電腦視覺人工智慧一樣,加密專用基準可以推動這種技術融合的快速進步。

如果人們相信人工智慧和加密技術的交叉點具有巨大的潛力,而人工智慧有望推動加密技術的廣泛採用,那麼為加密領域建立專用基準就成為當務之急。這些基準可以作為連接人工智慧和加密領域的重要橋樑,催化創新並為未來的應用提供明確的指導。這項努力不僅僅是一項技術活動;它是對如何理解和塑造這一新興數位前沿的深刻反思。

然而,要創建這樣的基準並非易事。它面臨著幾個重大挑戰:加密技術的快速發展,其知識庫仍在不斷變化,並且在多個核心方向上缺乏共識;該領域的跨學科性質,涵蓋密碼學、分散式系統、經濟學等,其複雜性遠遠超過任何單一領域;不僅需要評估理論知識,還需要評估人工智慧利用加密技術的實際能力,這需要設計新的評估框架;必須確保基準測試任務與DeFi、NFT、DAO 和其他新興加密領域的實際應用保持相關,相關資料集的稀缺性進一步加劇了難度。

鑑於這些挑戰的規模和複雜性,很顯然這不是一項可以單獨解決的任務。問題的多面性需要多種專業知識和觀點。它需要加密貨幣和人工智慧社群的共同努力。只有透過這種集體智慧,我們才能確定這一新興技術前沿中真正重要的東西,並創建準確反映人工智慧在加密貨幣領域的複雜性和潛力的基準。

目前狀態和後續步驟

目前的研究框架由幾個關鍵部分組成:

  1. 一個包含約700 道多項選擇題的MVP 資料集,由人工智慧和人類協作生成,隨後由人類專家驗證和完善。儘管存在品質限制,但該資料集能夠快速自動測試模型,展示概念理解並提供基本的評分機制。

  2. 約100 個複雜任務不斷增加,涵蓋模擬、計算、程式碼稽核和工具使用等場景。這些任務由多位加密領域專家貢獻,增加了評估的深度和真實性。

為了建立有效的基準,資料集需要大幅擴展,需要更多領域專家的參與。為這些複雜任務開發合適的自動評估框架也是需要解決的關鍵挑戰。

此外,為了讓LLM 能夠應對未來現實世界的任務挑戰,實現一個基本的Agent 框架至關重要。該框架將提供更真實的測試環境,彌合理論知識與實際應用之間的差距。

該方法正在不斷完善,重點是提高測試案例的複雜程度並擴大整體資料集。本著開放協作的精神,所有相關資源將很快在GitHub 上公開,旨在加快進展並邀請更廣泛的社區參與。

值得注意的是,這項研究仍處於早期階段。研究結果應被視為初步觀察和進一步研究的起點,而不是快速發​​展的人工智慧和加密領域的明確結論。該計畫歡迎更廣泛的加密社群做出貢獻,以幫助建立更全面、更強大的評估框架。

Total
0
Shares
Related Posts