大模型“瘦身”進手機,下一個iPhone時刻將至?


一股“端側大模型”浪潮正在湧來。華為、高通等芯片巨頭正探索將AI大模型植入端側,讓手機實現新一代物種進化。

相比ChatGPT、Midjourney等AI應用依賴雲端服務器提供服務,端側大模型主打在本地實現智能化。它的優勢在於能夠更好地保護隱私,同時讓手機能通過學習成為用戶的私人智能助手,還不必擔心雲端服務器宕機等問題。

不過,現有技術條件下,手機性能遠不足以支撐大模型運行。業內主流的技術方案是,通過剪枝、量化、蒸餾來給大模型“瘦身”,在盡可能少地減損精度的前提下,降低它所需的資源和能耗。

高通已經開始研髮用於端側大模型的芯片。這預示著,部署AI模型的手機終端正在向我們走來。

手機廠商將大模型引向移動端

AI大模型正在從雲端向智能終端狂奔。

8月4日,在2023年華為開發者大會上,華為對外發布HarmonyOS 4,相比前幾代操作系統,它最顯著的一大變化是,將AI大模型能力內置在了系統底層。華為正在拉開AI模型走向“智能終端側”的序幕。

目前,人們使用ChatGPT、Midjourney等AI應用提供的服務,基本都是通過雲端服務器來完成。以ChatGPT為例,它背後的大模型和計算資源都存儲在遠程服務器上,用戶通過與服務器實時交互,被輸入的文本經服務器處理後,獲得返迴響應。這樣的好處在於,可以確保模型的高效穩定運行,因為服務器通常配置了強大的計算資源,而且可以隨時擴展以適應高負載。

如今,新的支持邏輯出現了。華為正在嘗試將大模型引入終端,這意味著上述所有工作都能在本地完成,手機系統本身就具備了一定的AI能力,不需要接入AI雲端服務,也能實現智能化升級。

華為常務董事、終端BG CEO余承東介紹,HarmonyOS 4由華為盤古大模型提供底層支持,希望給用戶帶來智慧終端交互、高階生產力效率、個性化服務的全新AI體驗變革。

HarmonyOS 4引入了AI大模型

HarmonyOS 4的AI能力目前主要由華為智慧助手“小藝”體現。大模型接入後,小藝在語音交互的基礎上,擴展了文字、圖片和文檔等多種形式的輸入,自然語言理解能力得到提升。小藝還能根據指令,連接多種服務和場景,比如自動提取圖片文字,生成各類商業電子郵件內容或生成圖像等。

更重要的改變是,小藝具備了記憶和學習能力,隨著不斷使用,它將變得越來越懂“主人”,能夠智能給出出行、活動計劃等方案,並根據根據用戶習慣,實現個性化推薦。華為透露,小藝這些新的能力,將在8月下旬開啟公開測試體驗。

將AI大模型內置於手機系統底層,華為希望藉此全盤提升手機的智能化程度。雖然小藝的上述功能並不“高深”,但要實現起來,用戶往往需要同時調用ChatGPT、Midjourney等眾多應用才能完成。當手機本身有了AI能力後,它就像一個更全能的助手,提供全面的服務。

在HarmonyOS 4發布之前,華為其實已經嘗試過將AI大模型接入移動終端。今年3月,華為發布P60手機,其中自帶的智慧搜圖功能就是基於多模態大模型技術,通過在手機側對模型做小型化處理,實現了手機端的自然語言模型運行。

將AI模型引入端側,華為並不是頭一家。在2023世界人工智能大會上,高通展示了大模型進入端側的操作實踐,將生成式AI模型Stable Diffusion放在搭載了第二代驍龍8的手機上運行,15秒內執行了20步推理,並生成了一張512×512像素的圖像,且圖像效果與雲端處理水平相差並不明顯。

在上海MWC 2023期間,榮耀CEO趙明也表示,榮耀將在智能手機端推動部署端側大模型,以此實現多模態自然交互、精準意圖識別、複雜任務的閉環服務等體驗。

備受矚目的還有蘋果,一個月前,蘋果被曝出正在秘密研發“Apple GPT”,它是一款基於蘋果自研的Ajax框架開發的人工智能工具。儘管具體的細節尚有待披露,但業內普遍猜測,蘋果很可能在系統層加入大模型,提升提升語音助手Siri的智力,讓Siri摘掉“人工智障”的帽子。

炒作還是新革命?

手機廠商盯上大模型不稀奇,但為啥他們要走“端側”路線?畢竟,華為小藝的交互、生成能力通過雲端服務器也能提供,而且看起來成本更經濟、技術實現更容易。

把AI大模型裝進智能移動端,是炒作還是確實有其必要性?在這一問題上,無論是余承東還是趙明,都提到了兩個關鍵詞:隱私安全和個性化。

余承東強調,華為主張所有AI體驗創新和場景設計的第一原則是安全與隱私保護,打造更負責任的AI,並承諾AI生成的內容都會進行標識。

相比在雲端處理數據,智能終端側最明顯的優勢在於隱私安全。此前,ChatGPT屢次陷入數據洩露風波。今年3月,三星在內部發布了ChatGPT使用禁令,起因是半導體員工疑似因使用ChatGPT洩露了公司機密;上個月,ChatGPT背後公司OpenAI及其股東微軟被16人匿名起訴,控訴他們在未經允許的情況下使用並洩露了個人隱私數據,索賠金額高達30億美元。

當數據處理都在端側,用戶的個人數據將不會上傳至雲端服務器,大幅降低了隱私洩露風險。這也為手機AI助手真正變成生活管家提供了先決條件——只有隱私得到保障,用戶才會放心將數據交給AI去學習。

在趙明的理解中,端側AI大模型的使命就是更好地理解用戶,“知道我幾點睡覺,知道我喜歡吃什麼,能解決我的即時需求,相當於擁有洞察我需求的能力。 ”而要做到這些,就需要AI基於用戶的個人數據和習慣進行訓練,最終智能手機將有希望成為全能助手,或者說是私人機器人秘書,能夠幫助用戶解決餐飲、訂票、諮詢、娛樂、辦公等多場景的需求。

相比之下,無論是ChatGPT還是其他主流的AI應用,都是標準化產品,在不加改造的情況下很難具備私人助手的能力,它並不了解用戶,只是根據用戶的輸入指令做出相應的回應。個人手機已經是一個私有的個人智能設備,如果理解人類語言的AI模型能跑在手機上,智能化程度無疑將得到大提升。

另外,依賴雲端的應用也存在不穩定性,比如由於網絡或服務器原因,雲端的響應速度可能會變慢,甚至乾脆宕機,這在ChatGPT上已經出現多次,本地化的大模型將大大削弱對雲端的依賴,從而避免“雲卡頓”。

基於上述特點,大模型的“端側革命”展現出了潛力,甚至有希望讓進入發展瓶頸多年的手機再來一次激動人心的物種進化,就像當年大屏智能手機的出現以及iPhone發佈時刻一樣。

但大模型想在手機端發揮實力存在一個顯而易見的問題:手機芯片頂得住嗎?由於大模型動輒包含上百億、千億的參數,且需要天文級的訓練,消耗龐大的算力,現有手機芯片的性能顯然無法滿足要求。

對此,業內目前較主流的解決方案是“模型小型化”。

簡單來說,當模型網絡結構確定後,在盡可能少地降低精度的前提下,給模型“瘦身”,從而降低它所需的資源和能耗。這一過程通常有三步,將模型中對精度影響非常小的參數裁剪掉,被稱為“剪枝”;使用更低精度的數據類型進行推理,行話叫“量化”;而從復雜的模型中,提取出效果相近但更加簡單的模型,被形像地稱作“蒸餾”。最終目的,都是為了減小模型成交量。

另一方面,高通等芯片廠商,也在針對AI大模型端側部署研發專用的芯片。此前,高通5G移動平台驍龍8 Gen2首度集成的AI專用Hexagon處理器,採用了獨立的專用供電系統,支持微切片推理、INT4精度和Transformer網絡加速等,能在提供更高性能的同時,降低能耗和內存佔用。

端側大模型正在掀起新一代智能終端革命。 IDC預測,到2026年,中國市場中近50%的終端設備的處理器將帶有AI引擎技術。 AI帶給人類科技生活的又一個巨變或將出現。

資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載

Total
0
Shares
Related Posts