作者:王強,騰訊研究院資深專家、前沿科技研究中心主任
圖片來源:由無界版圖AI工俱生成
隨著人工智能大模型、量子計算、類腦智能、雲原生、數字引擎、音視頻等技術的深入發展,新技術、新模式和新業態持續湧現。針對上述領域,我們策劃了一個科普系列欄目《T-chat前沿熱點問答》,以十問十答的形式,用通俗的語言,與大家交易所最新、最熱的前沿科技話題。也歡迎大家指導,並提出感興趣的問題一起研究,持續迭代認知,共同進步。
ChatGPT作為現象級熱點,近期筆者收到了很多來自各方的諮詢,大家對於其技術、影響等內容都非常關心,於是有了寫作本文的想法,請各位專家和業界同仁不吝指正。
ChatGPT現在有多火?
2022年11月30日,ChatGPT橫空出世,在全球範圍內形成了熱烈的討論。根據Similarweb 的數據,今年1 月,平均每天約有1300 萬獨立訪客使用ChatGPT,是去年12 月份的兩倍多,累計用戶超1億,創下了互聯網最快破億應用的記錄,超過了之前TikTok 9個月破億的速度。
除了廣大用戶千奇百怪的問題,引發了社交媒體的大量傳播,ChatGPT在各領域的秀肌肉,也進一步強化了其知名度。美國幣安大學發現,ChatGPT能夠通過該校工商管理碩士MBA價格的期末考試。 《自然》雜誌1月24日宣布,將人工智能工具列為作者的論文,不能在雜誌上發表。 《自然》稱,作者身份意味著對作品負有責任,而人工智能工具無法承擔這樣的責任。據傳,ChatGPT還成功通過了谷歌的編程面試,拿到了年薪18.3萬美元的L3工程師offer。
ChatGPT背後的核心技術?
ChatGPT是生成式AI的一種形式,Gartner將其作為《2022年度重要戰略技術趨勢》的第一位。 Gartner預測,到2025年,生成式AI將占到所有生成數據的10%,但目前這個比例還不足1%。
ChatGPT背後的支撐是人工智能大模型,這個技術點,我們在去年的騰訊研究院《2022十大數字科技前沿應用趨勢》報告中做過詳細的闡述:當前的人工智能大多是針對特定的場景應用進行訓練, 生成的模型難以遷移到其他應用, 屬於“ 小模型”的範疇。整個過程不僅需要大量的手工調參, 還需要給機器餵養海量的標註數據,這拉低了人工智能的研發效率, 且成本較高。大模型通常是在無標註的大數據集上, 採用自監督學習的方法進行訓練。之後,在其他場景的應用中,開發者只需要對模型進行微調, 或採用少量數據進行二次訓練, 就可以滿足新應用場景的需要。這意味著,對大模型的改進可以讓所有的下游小模型受益, 大幅提升人工智能的適用場景和研發效率, 因此大模型成為業界重點投入的方向,Open AI、谷歌、臉書、微軟, 國內的百度、阿里、騰訊、華為和智源研究院等紛紛推出超大模型。特別是OpenAI GPT 3 大模型在翻譯、問答、內容生成等領域的不俗表現, 讓業界看到了達成通用人工智能的希望。當前ChatGPT的版本為GPT 3.5,是在GPT3之上的調優,能力進一步增強。
ChatGPT使用的核心技術之一是Transformer。這從其全稱上也能看得出來,Chat Generative Pre-trained Transformer。 Transformer技術是近幾年人工智能技術最大的亮點之一,他是Google於2017年提出的一種採用注意力機制的深度學習模型,可以按輸入數據各部分重要性的不同,而分配不同的權重。 Transformer的精度和性能上都要由於之前流行的CNN(成交量積神經網絡)、RNN(循環神經網絡)等模型,大幅提升了模型訓練的效果,讓人工智能得以在更大模型、更多數據、更強算力的基礎上進一步增強能力。此外,他還具有很強的跨模態能力,不僅在NLP(自然語言理解)領域表現優異,在語音、圖像方面也顯示出了優異的性能。
ChatGPT為什麼能成功?
ChatGPT是非常成功的一次從技術研發到工程化、再到點燃大眾熱情的經典案例。
技術創新
Open AI持續的研究中,不斷探索引入新的技術路線。這次引入的強化學習方法,很好地提升了模型的效果。在研究中,Open AI在模型訓練中,引入了人類專家。專家一方面幫助ChatGPT撰寫更符合人類習慣的回答,另一方面,也對生成的結果進行排名,通過這樣的獎勵機制,實現模型的微調優化。
組織文化
Open AI自成立之初,就致力於打造通用AI的能力,並堅定的持續投入,這是ChatGPT成功的一大關鍵因素。在這樣的願景下,吸引了一大批高水平的人才,在沒有任何商業KPI的情況下心無旁騖地開展研發工作,最終取得了重大的突破。
反饋機制
通過用戶的使用,Open AI可以獲得用戶對於模型優劣和使用體驗的反饋,從而形成了模型使用到體驗反饋的閉環,從而進一步優化模型。此外,Open AI還組織專門的反饋競賽,鼓勵用戶針對回答中的風險危害、新穎的回答建議等方面給予反饋,參賽者有機會贏取500 美元的API 積分,並可兌換相應獎品。
項目策劃
一個影響力出圈的技術,與其項目策劃密不可分。 ChatGPT的問答和多輪對話形式,很好地激發了大眾的熱情和創造力,大家基於各自感興趣的話題自由發揮,或幽默搞笑、或嚴肅認真,在朋友圈和媒體上屢屢刷屏。包括之前GPT3的推出,他寫新聞、作詩、翻譯、編代碼等能力,也是在社會上產生了熱議和討論。這種很好地與公眾互動的項目設計策略,也很值得我們學習。包括之前AlphaGo的圍棋大戰、Deepmind破解蛋白質折疊結構難題,都是很好的議題任務設置。
ChatGPT是否開源?
尚未開源,目前是以API(應用程序編程接口)調用的方式服務,目前也暫無開源計劃。
Open AI不Open,是業界很多人詬病的地方。開源是多年來軟件和互聯網產業之所以蓬勃發展的核心動力之一。開源的方式可以調動全球開發者的積極性,每個人都可以下載源代碼使用,並進行優化和在社區分享。這種用全社會的力量來創新的機制,大幅加速了技術科研攻關、產業應用的進程。
關於ChatGPT為何不開源,業界也有一些專家表示認可,因為人工智能技術至今為止還是一個黑盒,關於其內部的機制尚未可知,如果代碼開源,很難避免該技術用於一些不利於社會和人類的方面。此外,自從Open AI放棄了非盈利組織的定位,接受微軟等投資後,從商業化的角度考慮,也會採取整體模型閉源,開放應用接口的方式來推廣,同時也會開源少部分模型,豐富開發者生態。
ChatGPT免費嗎?未來能賺錢嗎?
當前,普通用戶使用ChatGPT 是免費的。
據《財富》,2022年,OpenAI公司的收入預計不足3000萬美元,淨虧損5.45億美元。而隨著ChatGPT的火爆,可能進一步增加其虧損,因為用戶每一次調用,就會讓Open AI付出更多的計算資源和帶寬成本。
當然,Open AI也開始了商業化的嘗試,2023 年2 月,OpenAI 宣布推出付費試點訂閱計劃ChatGPT Plus,定價每月20美元。付費版功能包括高峰時段免排隊、快速響應以及優先獲得新功能和改進等。
Open AI預測,隨著ChatGPT成為吸引客戶的重要工具,其收入將會快速增長,預計2023年收入2億美元,2024年收入預計超過10億美元。
此外,據報導,微軟正在洽談向OpenAI 投資約100 億美元,也讓其估值達到了290 億美元。而此前,2019年微軟曾向OpenAI投資10 億美元,為其提供了大量的資金支持和Azure雲算力支持。
ChatGPT會替代搜索引擎嗎?
短期來說,不會。長期來看,有可能通過融合,形成新型的搜索引擎。
目前的ChatGPT給出的答案參差不齊,既可以給出很多問題的簡要答案,甚至能寫一篇符合初級規劃師水平的產業規劃報告,但ChatGPT也不可避免地經常出現“一本正經的胡說八道”的情況,這使得其置信度還需進一步提升。而且ChatGPT目前的知識庫主要還是2021年9月之前的數據,缺乏新數據,這也大大限制了其提供新信息的能力。而同時,Open AI還推出了WebGPT,它可以在網絡上查找信息並提供信息來源,這將很大程度上補充ChatGPT的實時信息源,從而進一步優化答案。
在搜索引擎的邏輯下,選擇權在用戶,搜索引擎一般會給出眾多相關結果,根據用戶的點擊反饋來持續優化搜索結果。近年來,搜索引擎也一直在做結果唯一化的嘗試,比如直接在搜索框中提供唯一的答案選擇,但目前可提供唯一結果的比較有限,且無法開展多輪對話。
ChatGPT的推出,給搜索引擎廠商帶來了很大的震動,也啟發了其打造搜索新體驗的方向。谷歌兩位創始人多次召開討論會,以應對ChatGPT 可能帶來的顛覆搜索引擎業務的潛力。谷歌CEO Pichai表示,將在近期推出類似ChatGPT的基於人工智能的大型語言模型,一款由LaMDA 提供支持的對話AI服務Bard,讓用戶以“搜索伴侶”的形式使用。微軟已經在Bing搜索引擎中添加了ChatGPT 功能,並開展了小流量測試。百度也計劃在3月推出新功能,在搜索引擎中加入類似ChatGPT的對話式機器人“文心一言”。
我們也可以看看ChatGPT自己的回答:
還有哪些類似ChatGPT的模型和應用?
ChatGPT是典型的AIGC大模型,目前國內外在文本、代碼、圖像、視頻、3D等領域都湧現出相應的生成模型。
當前,ChatGPT一個有力的競爭者是Claude,他是Anthropic近期推出的生成式Al模型。 Anthropic由幾位前OpenAl的研究員在2021年創立,包括OpenAl前研究副總裁Dario Amodei、GPT-3論文一作Tom Brown等人。據《金融時報》報導,2022 年底,Google向這家初創公司投資了約3 億美元。相比ChatGPT,Anthropic 在其網站上更強調其構建“可靠、可解釋和可操縱的人工智能係統”的工作。
騰訊的混元大模型,集CV(計算機視覺)、NLP(自然語言理解)、多模態理解能力於一體,先後在MSR-VTT,MSVD等五大權威數據集榜單中登頂,實現跨模態領域的大滿貫。 2022年5月,騰訊“混元”AI大模型在CLUE(中文語言理解評測集合)總排行榜、閱讀理解、大規模知識圖譜三個榜單同時登頂,一舉打破三項紀錄。 12月,混元推出國內首個低成本、可落地的NLP萬億大模型,並再次登頂自然語言理解任務榜單CLUE。混元用千億模型熱啟動,最快僅用256卡在一天內即可完成萬億參數大模型HunYuan-NLP 1T的訓練,整體訓練成本僅為直接冷啟動訓練萬億模型的1/8。
圖片來源:紅杉資本《Generative AI: A Creative New World》
ChatGPT等大模型會讓我們實現通用人工智能嗎?
自從包含1750億參數的GPT3從2020年6月推出以來,業界對於達成通用人工智能的探討又進一步熱了起來。正如微軟CEO納德拉近日在接受華爾街日報訪談時表示,GPT 的發展不是線性的,而是指數級變化的,所以相比較GPT3,當前的GPT3.5已經展現出更強的能力。業界普遍預測,GPT4將在今年推出,並具備更強大的通用能力。
但同時,我們也需要有清晰的辨識,AI並非萬能。即無論AI如何強大,其解決的問題,也只是人類面臨所有問題的很小一部分。因為現實世界中有海量的問題並不是數學問題,也就不可能通過計算來求解。目前人工智能已經找到解決方案的問題,也只是可計算問題的一小部分。
ChatGPT可能產生哪些社會或倫理問題?
ChatGPT也面臨人工智能長期以來面臨的問題,如歧視等倫理問題,被濫用於詐騙、欺詐、政治造謠、偽造身份等安全問題,以及知識產權問題。最近,OpenAI表示,正考慮在ChatGPT中添加模型水印,即監測模型可以識別的特殊標記,以降低模型濫用的問題。
此外,針對大眾普遍擔心的失業問題,ChatGPT 在LinkedIn 上分享了一篇帖子寫道:“AI 不會取代你。一個使用AI 的人將取代你”。
ChatGPT的未來將帶來哪些變革和新機會?
ChatGPT自己的回答,已展現出其發展的一種典型路徑,即作為人類的陪伴機器人。
但更重要的,ChatGPT會成為未來人機交互的一個新入口,很可能改變現有APP的交互方式,以更為自然的對話方式,讓用戶來使用軟件和調用技能。例如,未來在文檔編輯軟件中,人們可以通過描述需求,讓軟件直接生成文字內容,或者生成一個圖形,甚至直接進行修圖等工作。在編程方面,ChatGPT這種即時編程的方式,將改變傳統的工作方式和應用交互規則,推動產業進入軟件3.0的新階段。
除此之外,ChatGPT未來還可以有多樣化的應用前景:
一是現在火熱的數字人,好看的皮囊下,則需要類似ChatGPT這樣的模型提供對話能力,才能讓數字人具備有趣的靈魂,更好地陪伴和服務人。同時,該能力也可以嵌入到機器人身體內,讓未來的人形機器人更聰明,更像人。
二是大量的開發者可以利用ChatGPT這樣的底層平台,在大模型基礎上根據不同行業和場景進行模型調優,從而創造出各類滿足用戶需求的豐富應用,從而形成對話式AI的生態。例如國外火爆的Jasper,通過在GPT3模型上的微調,可以幫助用戶撰寫營銷文案,甚至有人在上面完成了一部12 萬字的小說,IBM、Airbnb、Autodesk等大企業都是其企業用戶。普通用戶可以免費試用1萬個單詞的版本,之後可以29美元訂購2萬個單詞,或用59美元訂購生成5萬個單詞的權限。
三是在教育、醫療、廣告營銷、電子商務、市場和戰略諮詢、企業服務、編寫代碼等專業服務領域,成為更為專業的人類助手,不僅可以生成內容,還可以調用各種專業能力,甚至替代部分初級的專業工作。企業服務方面,2月8日,微軟推出了由ChatGPT 提供技術支持的高級Teams 產品, ChatGPT 可以自動幫助參會者生成會議記錄,即使沒有參加會議,智能回顧功能也能幫助用戶生成會議記錄和要點。如果有被同事在會議中提到,ChatGPT還可以給用戶提供個性化的時間線標記,以快速查看分享和討論的內容,該服務將在6 月份每月收費7 美元,然後在7 月份增加到10 美元。代碼編寫方面,近期特斯拉前任AI總監Andrej Karpathy透露,現在他80%的代碼都是由AI生成的(GitHub Copilot),而且有80%的準確率。
四是與其他模態AI工具的組合式創新,ChatGPT同文生圖、文字生成視頻、甚至未來直接生成3D模型的工具集成,可以帶來UGC內容的極大豐富,成為內容工業化的核心引擎。
未來,ChatGPT與更多的AI、雲計算等信息技術的集成創新,將創造改變生產力曲線的工具,成為經濟發展新動力。
資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載