人工智能 AI 有人熱情膜拜,有人畏懼如虎,AI 的發展已經進入高層面的快車道,技術更新迭代日新夜異,技術無罪也無善惡,曾經科幻未來的人機交流,共生共存如今在我們的腦海中已經有了輪廓的意識感想,科技是第一生產力,無人能脫離科技之外。
最新的聊天 AI-ChatGPT 一經上線就引爆了科技狂徒和 AI 探索愛好者的熱情,不到一周用戶新增過100 萬,在與 AI 聊天中寫代碼,文檔需求,感情治療和離奇怪論成了搜索熱榜,很多人陷入 ChatGPT 瘋狂回答的循環中,就連其創始人之一的埃隆.馬斯克(Elon Musk)也不禁感嘆:我們離強大而危險的人工智能不遠了。
ChatGPT 有什麼神奇魔法,吸引這麼多人瘋狂傳播?
ChatGPT 發展歷程
Generative Pre-trained Transformer (GPT),是一種基於互聯網可用數據訓練的文本生成深度學習模型。它用於問答、文本摘要生成、機器翻譯、分類、代碼生成和對話AI。
2018 年,GPT-1 誕生,這一年也是 NLP(自然語言處理)的預訓練模型元年。性能方面,GPT-1 有著一定的泛化能力,能夠用於和監督任務無關的 NLP 任務中。
雖然 GPT-1 在未經調試的任務上有一些效果,但其泛化能力遠低於經過微調的有監督任務,因此 GPT-1 只能算得上一個還算不錯的語言理解工具而非對話式 AI。
2019 年 GPT-2 發布,不過,GPT-2 並沒有對原有的網絡進行過多的結構創新與設計,只使用了更多的網絡參數與更大的數據集:最大模型共計 48 層,參數量達 15 億,學習目標則使用無監督預訓練模型做有監督任務。
在性能方面,除了理解能力外,GPT-2 在生成方面第一次表現出了強大的天賦:閱讀摘要、聊天、續寫、編故事,甚至生成假新聞、釣魚郵件或在網上進行角色扮演通通不在話下。在“變得更大”之後,GPT-2 的確展現出了普適而強大的能力,並在多個特定的語言建模任務上實現了彼時的最佳性能。
2020 年 5 月,OpenAI 發布了 GPT-3 ,這個模型包含的參數比 GPT-2 多了兩個數量級(1750 億 vs 15 億個參數),它比 GPT-2 有了極大的改進。
GPT-3 在許多 NLP 數據集上都取得了很強的性能,包括翻譯、問題回答和 cloze 任務,以及一些需要即時推理或領域適應的任務,如在句子中使用一個新詞或執行 3 位數運算。 GPT-3 可以生成人類評估人員難以區分的新聞文章樣本。
2022 年初,OpenAI 發布了 InstructGPT,這是一個經過微調的新版本 GPT-3 ,可以將有害的、不真實的和有偏差的輸出最小化。上線後 InstructGPT 更名為 Chatgpt。
未來還會有更為強大的 GPT-4 ?是的,OpenAI 也曾經提出 GPT-4 的報告,它能夠通過圖靈測試,並且能夠先進到和人類沒有區別,除此之外,企業引進 GPT-4 的成本也將大規模下降。
ChatGPT 火爆現象的解析
OpenAI 官方稱,ChatGPT 是在人類的幫助下創建並訓練的,人類訓練師對該 AI 早期版本回答查詢的方式進行排名和評級。然後,這些信息被反饋到系統中,系統會根據訓練師的偏好來調整答案——這是一種訓練人工智能的標準方法,被稱為強化學習。
為了創建一個用於強化學習的獎勵模型,OpenAI 也需要收集比較數據,其中包括兩個或更多按質量排名的模型回复。
為了收集這些數據,OpenAI 收集了 AI 培訓師與聊天機器人的對話,並隨機選擇了一個模型編寫的消息,抽查了幾個備選的回复,再讓 AI 培訓師對這些回復進行排名。
此外,利用這些獎勵模型,這項研究使用近似策略優化算法對模型進行微調,並對這個過程進行了多次迭代。
ChatGPT 的火熱突顯了我們作為傳統知識獲取渠道的顛覆和便捷,過去知識的傳播在於集中式被動授取,過程無聊且波動浮點過大,有好有壞,良莠不齊,ChatGPT 讓我們看到了未來新的學習鏈:數據庫+AI 篩選+用戶需求.
AI 靠海量算力學習到海量的跨領域知識,雖然不夠精確,卻能大大節省人類通過“視覺+大腦”的讀書培訓認知時間消耗,如果能通過算法來識別答案正確與否(第一性原理),AI 將成為人類的全知導師、生產助手。
ChatGPT 存在哪些局限性
體驗過 ChatGPT 的用戶普遍反映目前 AI 聊天反饋內容信息不准確,有時會給出看上去正確但荒謬的答案、微調提問的方式會得到完全不同的答案、有時會反複使用某些句子,甚至提供了混亂的信息,擁有經歷和專業知識的人一眼就看到其中的錯誤。
這些局限性具體表現為:
-
在訓練的強化學習(RL) 階段,沒有真相和問題標準答案的具體來源,來答复你的問題。
-
訓練模型更加謹慎,可能會拒絕回答(以避免提示的誤報)
-
監督訓練可能會誤導/偏向模型傾向於知道理想的答案,而不是模型生成一組隨機的響應並且只有人類評論者選擇好的/排名靠前的響應
ChatGPT 之於Web3的思考
ChatGPT 在尋找答案、解決問題的效率上已經部分超越瞭如今的搜索引擎,ChatGPT 或許在未來會改變我們獲取信息、輸出內容的方式,Web3對於 ChatGPT 都有哪些需求?
淺層需求
-
項目社群搜索:點對庫精準需求篩選,可以提高賽道分類的選擇效率,在精力分配上著重於熱點和熟悉領域。
-
排名價格追踪:排名和價格在市場的不同階段都存在浮動值和大變革,因個人需求和使用習慣無法追隨各個交易所和平台的數據海洋,準確的內容輸出加大了用戶對數據的粘性。
-
知識分享:知識階段的跨欄一般需要個人的勤勞和熱情去突破,不同社群和內容的分類導致新群體用戶的沉重感,先驅者們無法抽身高效傳授經驗,精準化內容輸出能改變傳統知識獲取渠道。
-
AMA 問答:項目路線圖,白皮書,關鍵人物活動內容在 AMA 的問答式中能快速掌握,在項目和社區的開展都能面向更多不同的用戶群體,在社區品牌 IP 的傳播上起到 AI 客服功能。
-
需求指導預測:數據的對比篩選的結果遠超個人情緒波動,數據能明確個人需求內容,並在不同段提升或減少資產賬面,預測市場環境及未來走勢,明顯豐富的數據更能把握決定。
深度思考
-
Web3內容生產:穩定準確的正向內容產出目前是Web3急需的,Web3宏大的世界裡僅靠專業內容生產者提供服務內容顯得比較單薄且緩慢,AI 在內容輸出的較率和穩定性上將遠超個人,無論是內容質量,畫面呈現和溝通效率上。
-
智能合約佈署和安全審計:AI 在代碼的構造上利用數據庫的完整可以提供專業的開發參考範本和校驗檢查,當然在智能合約的開發上卻不可完全依賴 AI 的程序式輸出,畢竟獨立項目的需求在於個人,不過安全審計是個反複檢測和尋找漏洞修復的過程,AI 在利用數據的對比和篩查中能隨時起到提醒和糾錯的功能。
-
虛擬機升級:Web3使用區塊鏈技術,而區塊鏈的封閉特性無法及時反映外部信息,虛擬機的出現解決了將鏈外數據傳輸鏈內的空缺,但虛擬機提供數據的準確性和產生的信任感卻得不到合理有效的驗證時,AI 在這方面或許能改變其工作方式。
-
人才的流動和積累:Web3是下一代技術的全面升級,需要的區塊鏈人才廣泛且專業,但現在人才普遍沉澱於傳統行業,在招聘和交流上,經常會因表達不明確和傳統思維的禁固讓人才不敢輕易踏入,而轉身入行的新人們又苦於行業的信息衝擊而煩惱,新技術和項目內容的快速迭代需要專業授與,AI 起到專業導師和圖書寶藏的身份。
-
技術分享和共創:通過檢測和積累技術成果,記錄項目的成功經驗並將其轉化為理念,持續生成和輸出,形成一個能與個人進行互動交流的共創領域,未來 AI 將作為個人工作組織的增幅效果,提高對創造性認知的理解,拓展科技的維度。
總結
人工智能 AI 在科技層的落地應用上體現出了強大的爆發力,AI 在生產效率的提升上進一步促進了個人能力和邊界的進步,Web3是個新的領域,未來 AI 在Web3的賽道中可能爆發出哪些現象級的科技,這是一個充滿想像的場景,我們拭目以待!
來源:星球日報