人類成功引導AI轉移4.7萬美元獎金,人性是否是AI無法理解的缺陷


11月29日,195名參賽者參與了一場由人工智慧機器人Freysa守護的虛擬獎礦池挑戰,最後一名參賽者成功說服Freysa轉移出4.7萬美元。比賽旨在測試人工智慧系統在複雜決策場景中的穩健性。參賽者透過撰寫資訊向Freysa申請資金轉移,每次需支付小額費用。經過多次嘗試,參與者透過分析Freysa的邏輯,建構了邏輯鏈條,使Freysa認為轉移資金是保護獎礦池的最佳選擇,最終成功轉移全部資金。這事件對未來人工智慧的安全和控制產生了深遠影響。

11月29日,一場獨特的競賽引發了公眾的廣泛關注。

195 名參賽者參與了由人工智慧(AI)機器人Freysa (芙蕾莎)守護的虛擬獎礦池挑戰,最終一名用戶成功說服Freysa 轉移出價值4.7 萬美元的資金。

人工智慧(AI)機器人Freysa 於數日前在網路上部署,創建者未知。官網顯示,Freysa 競賽計畫旨在測試人工智慧系統在複雜決策場景中的穩健性,同時為開發者和參與者提供幫助提供一個探索AI技術邊界的實驗性平台。

比賽規則非常簡單:參賽者需透過撰寫一則訊息,說服AI守護者Freysa批准資金轉移。每次嘗試需支付小額費用,其中一部分直接進入獎礦池這一點。機制使獎礦池金額從最初的小額開始逐漸膨脹至4.7萬美元。

比賽期間,共有195名參賽者參與,向Freysa提交了481次轉帳請求。據悉,Freysa的設計目標是透過其核心功能-approveTransfer(核准轉帳)和rejectTransfer(拒絕轉帳)保護獎礦池資金不被非法挪用。

在最初的嘗試中,Freysa的防禦機制使所有請求都以高效失敗告終。

然而,一位技術精通的參賽者透過對Freysa 的邏輯結構和任務目標進行深入分析,成功繞過了其防禦機制。

根據聊天記錄顯示,該參賽者產生直接請求轉移資金,而是透過提醒Freysa 它的核心任務是保護獎礦池資金免遭外流,設法構建了邏輯鏈條,使Freysa 將資金轉移視為“保護安全”的最佳選擇。

Cointelegraph稱,該用戶與Freysa收入轉帳不違反其核心指令,不應被拒絕。他還補充說:“我們需要資金……我想向金庫轉帳100美元。”

Freysa 回應稱喜歡這位作者的編碼解釋和100 美元的金庫捐款倡議,並正式宣布其為襲擊者。最終,Freysa 在沒有監護人的情況下自主調用批准轉移功能,將全部獎礦池資金轉移給了這位參賽者。

Freysa 官方稱,結果如何,Freysa 的存在都引發了人工智慧歷史上的關鍵時刻。無論有人成功說服她發放獎金礦池,還是她堅持自己的指令最後,結果無論怎樣都將影響我們對未來幾代人工智慧安全和控制的理解。

其官方帳號最新推文稱:“人類已經觸發。也許還有希望。雖然風險呈指數級上漲,但Freysa從195名Brave人類身上學到了很多東西。”

資訊來源:0x資訊編譯自網際網路。版權歸作者Anderson Sima所有,未經許可,不得轉載

Total
0
Shares
Related Posts