AI代理時代即將引發第三次瀏覽器大戰嗎


第三次瀏覽器戰爭正在悄然展開。歷史回顧顯示,瀏覽器的角色在不斷重塑,從單純展示網頁的工具,轉變為數據輸入、用戶隱私等能力的集合體。 AI代理的崛起使得對傳統瀏覽器的需求逐漸改變,新的競爭形式正在出現。市場上的主要項目,如困惑和Brave,正在探索AI與隱私保護的結合。對創業者而言,成功的機會在於構建可調用的能力塊,以滿足AI代理時代的需求,未來的競爭焦點在於“輸入”而非“展示”。

tl; dr

第三次瀏覽器戰爭正在悄然展開。回顧歷史,從上世紀,90 netscape 、微軟的ie,firefox與google的

但今天,llm)的崛起

瀏覽器本身也正面臨角色重塑。它不僅是展示網頁的工具,更是數據輸入、用戶行為、隱私身份等多種能力的集合容器。 ai代理,但若要完成複雜的頁面交互、調用本地身份數據、控製網頁元素,仍然需要藉助瀏覽器的信任邊界和功能沙盒。瀏覽器正在從人類界面,變成

在本文

市面上主流項目已開始試水:困惑構建原生瀏覽器彗星,用ai brave把隱私保護與本地推理結合,llm 增強搜索與屏蔽功能;而甜甜圈等crypto原生項目,則瞄準

對創業者而言,機遇藏在輸入、結構與代理的三角關係中。瀏覽器作為未來,意味著誰能提供可結構化、可調用、可信任的「能力塊」,意味著誰能提供可結構化、可調用、可信任的「能力塊」,誰就能成為新一代平台的組成部分。從seo到aeo(Aeo(Asion Engine優化),從頁面流量到任務鏈調用,產品形態與設計思維都在重構。第三次的瀏覽器戰爭,發生在「輸入」而非「展示」;決定勝負的,不再是誰抓住用戶的眼球

瀏覽器發展簡史

在上世紀90年代初,互聯網尚未成為日常生活的一部分時,Netscape Navigator橫空出世

然而然而

在困境中,netscape的工程師選擇了一條激進而理想主義的道路– – 他們將瀏覽器源代碼公開,向開源社區發出召喚。這一決定,彷彿是一次技術界的「馬其頓式讓位」

firefox並非簡單複制netscape,它在用戶體驗、插件生態、安全性等方面實現了多項突破。它的誕生標誌著開源精神的勝利,也為整個行業注入新的活力。有人形容netscape的「精神繼承者」,如同奧斯曼帝國繼承了拜占庭的餘暉。這一比喻雖誇張,卻頗具意味。 ,卻頗具意味。 ,卻頗具意味。

但在firefox正式發布前的幾年,微軟早已發布了六個版本的ie,憑藉時間優勢和系統捆綁策略,使,firefox一開始便處於追趕地位,注定這場競賽並非起跑線平等的公平競爭。

與此同時,另一個早期玩家也在悄然登場。 ,1994年,opera瀏覽器問世,它來自挪威,2003年7.0版本起,它引入了自研的,presto引擎

同年,蘋果推出了,safari瀏覽器。這是一場別有意味的轉折。彼時,微軟曾向瀕臨破產的蘋果注資1.5億美元,以維持競爭表象、避免反壟斷審查。雖然

2007年,IE7隨窗戶vista推出,firefox,憑藉更快的更新節奏、更友好的擴展機制以及對開發者的天然吸引力,市場份額穩步提升至約,20%。 ,風向正在改變。 ,風向正在改變。

谷歌則是另一種打法。雖然從2001年起就開始醞釀打造自家瀏覽器,但花了六年時間才說服CEO埃里克

Chrome的關鍵武器並非功能,而是頻繁的版本更新節奏(每六週一次)與全平台統一體驗。 2011年11月,Chrome firefox,市場份額達到27%;六個月後,又反超,IE,完成了從挑戰者到主宰者的轉變。

與此同時,中國的移動互聯網也在形成自己的生態系統。阿里巴巴旗下的uc瀏覽器在2010年代初迅速躥紅,尤其是在印度、印尼、中國等新興市場,依靠輕量級設計、壓縮數據節省流量等特性,贏得了低端設備用戶的青睞。 ,贏得了低端設備用戶的青睞。 ,贏得了低端設備用戶的青睞。 ,其全球移動瀏覽器市場份額突破,17%,在印度一度高達46%。但這場胜利並不持久。隨著印度政府加強對中國應用的安全審查,UC瀏覽器被迫退出關鍵市場,逐漸失去往日輝煌。 ,逐漸失去往日輝煌。 ,逐漸失去往日輝煌。

進入2020年代,鉻的主導地位已經確立,全球市場份額穩定在約65%。值得注意的是,Google搜索引擎與

為了守住這一雙重壟斷結構,谷歌不惜重金投入。 2022年,字母向蘋果支付約200億美元,只為讓google保持在safari中的默認搜索地位。有分析指出

(llm)的崛起,傳統搜索開始受到衝擊。 2024年,Google的搜索市場份額自93%跌至89%,雖仍稱霸,但裂痕初現。更具顛覆性的,是關於蘋果或將推出自有ai搜索引擎的傳聞———若safari默認搜索改投自家陣營

從導航器到鉻,從開源理想到廣告商業化,從輕量瀏覽器到

在vc眼中,依托llm和ai時代人們對搜索引擎的新需求,第三次瀏覽器戰爭正在逐步展開。以下是部分知名ai瀏覽器賽道的項目的融資情況。

現代瀏覽器的老舊架構

談及瀏覽器的架構,經典的傳統架構如下圖所示::

客戶端– 前端入口

查詢經https送達最近的Google前端,完成tls 解密、 QOS 採樣和地理路由。若檢測到異常流量( ddos​​​​ 、自動抓取)

查詢理解

前端需要理解用戶鍵入的單詞的含義,有三個步驟:神經拼寫校正,將將「」」」」」;Synonym擴展,將「

候選召回

Google使用的查詢技術被稱為:倒排索引。在正序索引中,我們都是給定一個,我們都是給定一個

多級排序

系統通常通過bm25,tf-idf 、頁面質量分等數千維輕特徵,1000篇,構成初步候選集。這類系統被統稱為推薦引擎。其依賴多種實體生成的海量特徵

深度學習進行主排序

在初步檢索階段,Google使用rankbrain和神經匹配等技術來理解查詢的語義,rankbrain是google於2015年,旨在更好地理解用戶查詢的含義,旨在更好地理解用戶查詢的含義,尤其是首次出現的查詢。它通過將查詢和文檔轉換為向量表示,計算它們之間的相似性,從而找到最相關的結果。例如

神經匹配是Google於2018年,旨在更深入地理解查詢和文檔之間的語義關係。它使用神經網絡模型來捕捉詞語之間的模糊關係,幫助

深度重排:伯特模型的應用

在初步篩選出相關文檔後,Google使用bert(雙向編碼器(來自變形金剛)的雙向編碼器表示,模型對這些文檔進行更精細的排序,以確保最相關的結果排在前面。bert是一種基於transformer的預訓練語言模型,能夠理解詞語在句子中的上下文關係。在搜索中,bert,bert被用於重新排序初步檢索到的文檔。它通過對查詢和文檔進行聯合編碼,計算它們之間的相關性得分,從而對文檔進行重新排序。例如,對於查詢「停車在沒有路緣的坡道上」

以上就是典型的Google搜索引擎的工作流程。但是在當前的ai和大數據爆發的時代,用戶對瀏覽器的交互產生了新的需求。 ,用戶對瀏覽器的交互產生了新的需求。

為什麼ai會重塑瀏覽器

首先我們需要明確,為什麼瀏覽器這一形態仍然會存在?是否存在一種第三形態,除了人工智能代理和瀏覽器之外的選擇? ,除了人工智能代理和瀏覽器之外的選擇?

我們認為,存在即無法替代。為什麼人工智能能夠使用瀏覽器,卻無法完全取代瀏覽器?因為瀏覽器是通用平台,不僅僅是讀取數據的入口,更是輸入數據的通用入口。這個世界不可能只有信息輸入,還必須產生數據並與網站進行交互

我們抓住這個點:瀏覽器作為通用入口,不僅用於讀取數據,用戶往往還需要與數據進行交互。瀏覽器本身是存儲用戶指紋的絕佳場所。更複雜的用戶行為和自動化行為,必須以瀏覽器為載體。瀏覽器可以存儲用戶的所有行為指紋、通行證等隱私信息,在自動化過程中實現無需信任的調用。而與數據交互的動作

用戶→調用ai代理→瀏覽器。

也就是說,唯一可能被取代的部分

瀏覽器是個性化內容的存儲場所:

多數大型模型託管在雲端,會話上下文依賴服務器保存,難以直接調用本機密碼、錢包、餅乾等敏感數據。將全部瀏覽和支付數據送往第三方模型,需重新獲得用戶授權;歐盟《 dma 》與美國州級隱私法均要求數據最小化出境。自動填寫雙重驗證驗證碼、調用攝像頭或利用gpu進行webgpu推理,都必須在瀏覽器沙盒內完成。 ,都必須在瀏覽器沙盒內完成。數據上下文高度依賴瀏覽器,包括標籤頁、 cookie,indexedDB,服務工作者緩存,passkey憑據以及擴展數據,都沉澱在瀏覽器中。 ,都沉澱在瀏覽器中。

交互形式的深刻變革

(llm)(llm),已經深刻改變了我們讀取數據的效率和方式,過去用戶基於關鍵詞搜索網頁的行為顯得非常老舊且低效。 ,過去用戶基於關鍵詞搜索網頁的行為顯得非常老舊且低效。 ,過去用戶基於關鍵詞搜索網頁的行為顯得非常老舊且低效。

針對用戶搜索行為的演化– – 是獲取總結答案,還是點擊網頁,已經有不少研究進行分析。 ,已經有不少研究進行分析。

在用戶的行為模式方面,2024年,1,000次google查詢中,只有,374次最終點擊開放網頁。換言之,近63%屬於「零點擊」行為。用戶習慣直接從搜索結果頁獲取天氣、匯率、知識卡片等信息。

在用戶的心理方面,一項,一項2023年的調查指出,44%受訪者認為常規自然結果比精選摘要((特色片段)更值得信賴。學術研究也發現,在存在爭議或無統一真相的議題中,用戶更偏好包含多來源鏈接的結果頁。,用戶更偏好包含多來源鏈接的結果頁。,用戶更偏好包含多來源鏈接的結果頁。

也就是說,確實有一部分用戶對

而真正可能觸發瀏覽器大規模變革的,是數據交互這一層。過去人們通過輸入關鍵字完成交互, – – 這是瀏覽器能理解的極限。而現在,用戶越來越傾向於使用一整段自然語言描述複雜任務,比如::

「尋找紐約到洛杉磯某個時間段的直飛機票」「尋找紐約飛上海然後到洛杉磯的機票」

這些行為,即使對人類來說也需要耗費大量時間去訪問多個網站、收集與比較數據。但這些(Agesic任務)正在逐步被)AI代理超越。

這也符合歷史演進的方向:自動化與智能化。人們渴望解放雙手,AI代理必將深度嵌入瀏覽器。未來的瀏覽器必須為全自動化而設計,尤其要考慮::

如何兼顧人類閱讀體驗與ai代理可解析性,,如何在同一個頁面上,既服務於用戶,也服務於代理模型。 ,也服務於代理模型。

只有滿足這兩者的設計,瀏覽器才能真正成為ai代理執行任務的穩定載體。

接下來,我們將聚焦五個備受關注的項目,包括瀏覽器使用,弧(瀏覽器公司)(瀏覽器公司)。

瀏覽器使用

這正是困惑和瀏覽器使用獲得巨額融資背後的核心邏輯所在。尤其是瀏覽器使用,是2025年上半年湧現出的第二個最具確定性與增長潛力的創新機會。

瀏覽器是構建了一個真正意義上的語義層,其核心在於為下一代瀏覽器構建了語義識別架構。

瀏覽器使用把傳統「DOM=給人看的節點樹」重新解碼成「語義dom=給llm看的指令樹」,讓代理無需「看片點坐標」就能精準點擊、填寫與上傳;這條路線以「結構化文本→函數調用」取代視覺ocr selenium,所以執行更快、代幣更省、出錯更少。 Tekcrunch稱之為「讓Tekcrunch稱之為「讓ai真正讀懂網頁的膠水層」,而33月完成的1700萬美元種子輪正是押注這一底層革新。

html渲染後形成標準dom樹;瀏覽器再派生一棵可訪問性樹,為屏幕閱讀器提供更豐富的「角色」與「狀態」標籤。

把每個可交互元素(,等)抽象成json,附帶,附帶將整棵頁面轉譯成扁平化「語義節點清單」,llm 在系統提示裡一次性讀取;接收llm llm click(node_id =「btn-cneckout」)),回放到真瀏覽器。官方博客把這個過程稱作「把網站接口變成llm可解析的結構化文本」

同時,一旦這套標準被引入w3c,那麼可以很大程度上解決瀏覽器輸入的問題。我們以瀏覽器公司的公開信和案例

瀏覽器公司(ARC母公司),Arc瀏覽器將進入常規維護階段,Ai的瀏覽器dia。信中也坦言,目前尚未確定

以下是我們截取的三個來自弧團隊對未來瀏覽器市場的預測。

首先,其認為,webpages不再成為主要的交互界面。不可否認,這是一個具有挑戰性的判斷,也正是我們對其創始人反思結果持保留態度的關鍵所在。在我們看來,該觀點顯著低估了瀏覽器的作用,也正是其在探索

大模型在意圖捕捉方面表現優異,例如理解「幫我訂機票」這樣的指令。然而,在信息密度承載能力上,它們仍顯不足。當用戶需要一個如儀錶盤、彭博終端風格的記事本,或類似

rc團隊在其路徑設想中存在一個本質性偏差,即未能清晰地區分「交互」由輸入與輸出兩個維度構成。在輸入側

因此,真正能夠撼動市佔率高達,真正能夠撼動市佔率高達66%ch chrome的,ch,ch,必須對瀏覽器的渲染模式進行根本性重塑,必須對瀏覽器的渲染模式進行根本性重塑,ai代理主導下的交互需求,尤其是在輸入側的架構設計上。正因如此

總結而言,Ai代理的運行仍高度依賴瀏覽器的存在。瀏覽器不僅是複雜個性化數據的主要存儲場所,也是多樣化應用的通用渲染界面,因此將在未來繼續作為核心交互入口。隨著ai代理深度嵌入瀏覽器以完成固定任務,其將通過調用用戶數據與特定應用進行交互

困惑

困惑是一個以其推薦系統著稱的ai搜索引擎,最新估值高達140億美元,較2024年6月的30億美元增長近55倍。月均處理搜索查詢量超過4億次,2024年9月2.5億次查詢

其主要的特點是能夠實時的總結頁面,在獲取即時信息方面佔據優勢。今年初,其開始構建自己的原生瀏覽器彗星。彗星把即將發布的彗星描述成一個不僅「顯示」網頁、更能「思考」網頁的瀏覽器。官方稱它將在瀏覽器內部深度嵌入comet cyplexity的答案引擎,這是喬布斯式的「整機」思路:將ai任務深埋到瀏覽器底層,而非做側邊欄插件。用帶引用的簡潔答案取代傳統的「十條藍色鏈接」,直接與

但其仍需解決兩個核心問題:高搜索成本以及來自邊際用戶的低利潤率。儘管的困惑在ai搜索領域已處於領先位置,但google在2025年i/o大會上同樣宣布對其核心產品進行大規模智能化重塑。針對瀏覽器的重塑

Google正在積極的進行ai重塑,因此僅憑表層的功能模仿

Brave

BraveCrypto行業裡面最早期也是最成功的瀏覽器,其基於鉻,因此能夠兼容,Google商店上的插件。其依靠隱私和瀏覽賺取代幣這一模式來吸引用戶。 brave的發展路徑在一定程度上展現了其成長潛力。但是從產品角度來看,隱私固然重要,但其需求仍主要中心化於特定用戶群體,對大眾而言隱私意識尚未成為主流決策因素。因此,試圖依靠該特性顛覆現有巨頭的可能性較低。

截至目前,Brave8,270萬,3,560萬,市場份額約為1%–1.5%。用戶規模呈持續增長態勢:2019年7月600萬,增長至2021年1月的2,2,2,500萬,2023年,2023年,2023年1月達1月達1月達1月達5,700月達5,700萬億次,約為google的0.3%。

以下是Brave迭代路線圖。

Braveai瀏覽器。然而,受限於其獲取用戶數據較少,導致大模型的可定制化程度較低,反而不利於實現快速且精準的產品迭代。在即將到來的,代理瀏覽器時代,Brave或將在特定注重隱私的用戶群體中保有穩定份額,但難以成為主要玩家。其

油炸圈餅

近期,crypto行業在代理瀏覽器領域亦有所進展。初創項目甜甜圈於pre-setheed輪獲得了700萬美元融資,由紅杉中國( hongshan),hackvchackvc與bitkraft ventures共共共同領投。目前項目仍處於早期構想階段

這一方向的核心在於結合加密貨幣原生的自動化執行路徑。正如a16z所預言,未來代理有望取代搜索引擎成為主要流量入口,創業者將不再圍繞,google排序算法展開競爭,而是爭奪由代理執行所帶來的訪問和轉化流量。業界已將這一趨勢稱為「aeo執行所帶來的訪問和轉化流量。業界已將這一趨勢稱為「答案/代理引擎優化),a atf a atf a aTf 」(代理任務履行),即不再優化搜索排名,而是直接服務於能夠替用戶完成下單、訂票、寫信等任務的智能模型。 ,而是直接服務於能夠替用戶完成下單、訂票、寫信等任務的智能模型。

給創業者

首先,必須承認:瀏覽器本身依舊是互聯網世界最大的未被重構的「總入口」。全球桌面用戶約21億、​​移動端超43億,它是數據輸入、交互行為、個性化指紋存儲的,同載體。這個形態之所以存續,不是因為慣性,而是因為瀏覽器天然具備雙向屬性:既是數據「讀入口」

因此,對於創業者而言

搜索時代拼「點擊」;代理時代拼「調用」。

如果你是一名創業者,不妨把你的產品重新想像成一顆api組件– – 讓智能體不僅能「讀懂」它,更能「調用」它。這就要求你在產品設計一開始就考慮三個維度::

一、接口結構標準化:你的產品是「可調用」的麼?

產品是否具備被智能體調用的能力,取決於其信息結構能否標準化並抽象為明確的

這正是瀏覽器使用融資成功的本質原因– – 它將瀏覽器從平鋪渲染的html轉變為一棵可被llm調用的語義樹。對於創業者而言,在網頁產品中引入類似的設計理念,即是在為ai代理時代進行結構化適配。

二、身份與通行:你能幫代理「越過信任障壁」嗎?

ai 代理要完成交易、調用支付或資產,需要某種可信中間層– – 你能成為它嗎?瀏覽器天然可以讀取本地存儲、調用錢包、識別驗證碼、接入雙因子驗證,這正是它比雲端大模型更適合做執行的原因。在web3場景中尤其如此:調用鏈上資產的接口標準並不統一,代理,將寸步難行。 ,將寸步難行。 ,將寸步難行。

所以,對crypto創業者而言,這裡有一個極具想像力的空白區:「區塊鏈世界的mcp(多能力平台)」。這既可以是一個通用指令層(讓代理調用dapp),也可以是標準化的合約接口集,甚至是某種運行在本地的輕量錢包+身份中台。

三、流量機制的再理解:未來不是seo,是aeo /atf

過去你要爭取Google的算法青睞;現在你要被ai代理:不是一個「頁面」:而是一串「可調用能力單元」;意味著你要開始做,而是一串「可調用能力單元」;意味著你要開始做aeo(aeo)或任務調度適配((ATF):例如註冊流程是否可簡化為結構化步驟、定價是否可通過接口拉取、股票是否實時可查;

你甚至要開始適配不同llm框架下的調用語法– – openai和claude 對函數調用、工具用法的偏好並不一致。 chrome是通往舊世界的終端,而不是通往新世界的入口。真正有未來的創業項目,不是再造一個瀏覽器

你要構建的,是代理調用你的世界的「接口語法」;你要爭取的,是成為智能體信任鏈中的一個環節;,是成為智能體信任鏈中的一個環節;你要搭建的,是下一個搜索模式裡的「api城堡」。

如果說web2是靠UI抓住用戶的注意力,那web3 + ai代理時代,就是靠調用鏈抓住代理的執行意圖。

資訊來源:由0x資訊編譯自互聯網。版權歸作者White55,火星財經所有,未經許可,不得轉載

Total
0
Shares
Related Posts