“互聯網要完蛋了,只有我們能救它”


原文來源:矽星人

圖片來源:由無界AI‌ 生成

你有多久沒聽到一家新創公司說自己要拯救網路了。

今天的創業者似乎要么悶聲賺錢,要么在討論用AI拯救(或者毀滅)全人類。我們每天都生活其中的互聯網,似乎早就沒人關心他的死活了。

而在Chri看起來,它就要死了。

我在聖荷西明媚的陽光下聽他這麼對我說的時候,感覺有點聳人聽聞。不過當你跟這個頭髮像獅子一樣炸向四方的德國人待久了,他那邏輯嚴謹的德國味兒英語很容易會讓你覺得,這的確是個大問題。

Chri Besenbruch是Deep Render公司的共同創辦人兼CEO,簡單來說,他的公司在做的事情,就是「用AI來把視訊檔案的大小壓縮到非常小」。

他聲稱這個演算法比業界標準編解碼器HVEC「好」多達五倍,不過他沒有具體說明用什麼標準衡量,並且可以在高通、蘋果和英偉達等現代晶片組上實時運行。所謂的「編解碼器」是指能夠編碼和解碼資料的軟體,有時也是硬件,通常用於音訊或視訊資料。

有些熟悉矽谷的人聽到這可能會恍惚,以為我在重述《矽谷》的劇本,在這部被形容為完美展現矽谷創業生態的美劇裡,一切鬧劇都因為主角開發出了驚人的壓縮演算法。

「是的,很多人跟我說過這件事。我們確實很像pied piper。」這個德國長大,本科修讀數學,又跑去瑞士讀藝術學院,再去英國學計算機的背景複雜人士,和《矽谷》裡的主角Richard一樣有濃厚的nerd氣息,但與電視劇裡荒謬的壓縮算法突破過程不同、與電視劇裡Richard缺少商業常識經常舉棋不定不同,他的創業近乎解數學題一樣嚴謹,他對公司的商業模式也想的很清楚。

在他看來,網路正在走向毀滅,這就是最大的問題。他想解決這個最大的問題,一通分析後,他們認為根本原因是老的科技不適應新的世界:

從影片流行,成為網路溝通交易所的主要形式後,我們其實進入了新的世界。一個資料規模量級越來越恐怖,不會回頭的世界。

舊技術已經不適應這個新世界。沿著老路一直做微小的創新和改進,只會走向絕路,最終是網路的大崩盤。

“我們要拯救互聯網,方法是發明新的壓縮演算法。而讓這成為可能的就是AI。”

沿著這個思路,Chri和他在英國的研究生同學一起在2018年創辦了Deep Render——他並不是那些追逐ChatGPT浪潮的新創公司。

「基本上我們和LLM關係不大,可能和擴散模型有關,但更多是未來的潛在可能。」他對我說。 “我們從第一原理出發,想明白AI適合做的和壓縮這件事的本質,最終認為完全依賴AI的方法必定是新的技術路線。”

不過,LLM帶來「焦躁」事實上幫助了它的公司。 「我們當時其實有賭的成分,因為要實現我們的目標,除了我自己有演算法,還需要軟硬體的大幅進步,我們當時做了一個預想,設想這些基礎技術都能躍進。而今天這些都發生了。」他對我說,語氣充滿興奮。

“可能我們只是很幸運而已。”

看起來很謙虛,但他沒有說的是,如果他的預想都會成真,他的公司可能會是未來幾十年人類最重要的網路科技公司之一。他們的技術會以授權形式提供給各大公司,解決網路頻寬問題的同時,他們也會成為收水電費和收稅的那類公司。

而事實上,一切已經開始變得不同。

今年以來,這家一直乏人問津的公司進入了矽谷和全球知名的投資機構的視野,在3月完成一筆融資後,Chri開始把重心轉移到矽谷,這裡有錢,也有對他們充滿興趣的大客戶。

根據他的表述,目前他們規模不大的團隊在面對來自「不能透露名字但都是很重要的大公司」的興趣和需求時,已經忙不過來了。

而他跟我透露,如果現在一切進展順利,2024年二季度,就能在一個非常知名的應用服務裡用到它的技術。

“幾千萬用戶將有機會使用它。”

而對視訊和資料壓縮需求龐大的中國市場,也開始以各種外觀出現在這個還沒去過中國的CEO的面前。

「我們有很多與中國有很強關聯的投資人朋友,在幫助中國的一些公司聯繫我們。我們已經在接觸幾家中國最大的網路公司。」他說。這些需求來得突然而迅猛,以至於他花了半天時間在跟我打聽「與中國網路公司共事是什麼樣」的基礎問題。

「看來你要拯救互聯網,沒有中國市場也是不行的。」我盡可能給這個大部分時間生活在歐洲的科技創業家講了東方的故事後,跟他半開玩笑地說。

「你說的對。」他笑著回答。不過在思考中國市場之前,他先要征服矽谷。

在美劇《矽谷》的結尾,Richard的公司在經過6年的坎坷創業後,已經估值達到80億美金,但就在產品正式發布前幾天,他們發現,這個壓縮演算法和他們開發的用來改進網路的AI互相改進,變成了一個他們也無法理解但能夠攻破一切系統的“怪物”,在權衡後他們最終決定“拯救世界”——方法是用一場華麗的出醜讓所有人不再對這個技術路線有念想。

對於一場創業來說,這並不是什麼好的結局。當我把這個話題拋給明年也要到創業第六年Chri時,他想了一會,然後只是笑著說:

“希望我們的結局更好吧。”

以下為對話實錄

Q: 簡單介紹一下你和你的公司吧

A:當然。我是Chri Besenbruch,Deep Render的CEO和共同創辦人。 Deep Render在做的事情,基本上就是在把影片檔等的大小壓縮到非常非常小。為什麼我們要做這件事,是因為現在網路上的數據在指數級的成長,90%的數據是過去兩年產生的。它們需要透過世界各地的光纖網路傳播,在如此大的規模之下,這是一個非常昂貴的基礎設施。這個世界的整個光纖基礎設施耗費了5兆。這並不讓人感到舒服,因為如果數據每兩年翻一倍,對基礎設施意味著什麼,它也需要翻倍。但這可是萬億級的翻倍。這就是個不可能的事。這是我做這事的起因。

我們的想法是,如果我們不能讓管道變得更大更快,我們就讓管道裡的數據變得更小。於是就指向了壓縮。這是我們的根基和願景。

Q: 所以你是先推導出了一個今天網路面對的最核心問題,以及想出了它的解決方法,然後用它來確定你的創業方向。

A: 對,就是這樣。因為如果沒有一個大幅提高的更好的壓縮方法,整個網路很快就要崩盤。而我愛互聯網,我想讓它繼續運作。

Q:那麼你們的技術到底有何不同,因為壓縮並不是新的東西,它存在很久了,人們甚至已經習慣並且忘了它的存在。也許你可以用傻瓜也能懂的話介紹一下你們的技術。

A: 哈哈哈,我盡力。我們需要從過去60年來看整個產業,當傳統的壓縮技術出現時,它是個巨大的突破,一切都是基於DCT(DCT代表離散餘弦變換,Discrete Cosine Transform,它將圖像分成由不同頻率組成的小塊。在量化過程中,捨棄高頻分量,剩下的低頻分量被保存下來並用於後面的圖像重建。編者註),這個讓今天的視頻壓縮技術成為可能的方法發明於1970,1980年代左右,之後它主導了這個產業。但之後這個技術每10年只有一點點進步,而且它一直是同一個技術思路。我們不能指望一個技術在同一個思路裡迭代幾百次就能實現效果的飛躍。它是很棒的技術,但只不過它的創新週期結束了或正在結束。

所以我們需要新的東西。而這個「新」就是AI。因為AI能很好地處理圖像和視頻,所以這並不是什麼難以想到的路線。於是AI技術和壓縮技術開始結合。之後有兩股浪潮,第一股發生在2017年,超分辨率出現,Magic Pony公司發明了它,他們的想法是在管道的中間保留傳統的壓縮方式,在前後各加入AI。

Deep Render不認為這是正確的做法。因為它中間保留的是我們認定已經徹底崩壞了的傳統壓縮技術。它與以前的相比沒怎麼變,而且還很難真正有用。

我們是第二波浪潮,徹底拋棄傳統壓縮技術,只是用神經網絡,這也意味著要重新發明壓縮,圍繞著機器學習技術重新發明的壓縮有最高的效果,神經網絡拿到數據,壓縮文件,送到互聯網,網路收下壓縮檔案還給你視頻。這是一個只用AI的解決方案。我們在引領這股浪潮,其實我們也是唯一這樣做的公司。

Q:所以基本上你是用AI取代了傳統技術負責的那部分,那為什麼AI可以,而且可以做得更好?

A:兩個原因。影片或影片壓縮本質上就是在檔案大小和圖片品質之間做取捨(trade- off)。你要么是非常大的文件和好看的視頻,要么是非常小的文件很爛的清晰度。所以好的壓縮就是好的取捨。在檔案大小方面,關鍵在於資料冗餘的部分(redundancy)如果你可以預測下一個像素是什麼,你就不需要傳送冗餘數據,就能節省檔案大小。這是AI能夠做更好預測的一個地方,預測的好,冗餘就可以去掉,就能接收更少資料。而AI根本上就是更強,因為它會對數據做出反應。

二是關於視訊品質。任何壓縮演算法都會在視訊輸出時帶來錯誤,這就是有損壓縮的定義定義,為了更小檔案大小而接受一些錯誤。但對人類來說,真正重要的是這些錯誤的分佈,我們對某些會更敏感,對其他可能就沒事。所以我們的AI模仿人類視覺系統,讓這些錯誤對人類來說是藏起來的。

一個很棒的例子是,人們討厭線條變得模糊,如果一個銳利的線條變得模糊人們會感覺不快,因​​為這是生物學決定的。例如當一個老虎從石頭後面開始移動,我們需要能看到它,我們會盯著它。而顏色的準確度就不一定了,如果有損失也沒人真正注意到。所以你可以色彩準確度讓渡一些但不要模糊邊緣。人們就更喜歡這樣的影片品質。

我們的想法永遠是,從第一原理入手,什麼是合理的,背後的數學原理是什麼,哪些工具可以用來解決真的問題。 AI正好是這個最適合的工具。

Q:很有意思,所以這是最基礎的思路,接下來就是執行了。作為一個五年的公司,今天的AI變革對你們有衝擊麼。

A:軟體層面我們其實一直紮根在研究圈,我們的軟體產品來自研究圈。今天的AI的變化對我們沒什麼衝擊,我從2015年當AI革命開始時就扎在這些研究圈了。

反而是硬體層面其實是更新鮮的。我們有很棒的軟體層面的壓縮技術但過去只能在雲端運作,那這就只能算是個不錯的研究課題,而不是一個產品。只有當它進入到各個終端讓千萬人能在自己的設備上用到它,才成為產品。

因此我們當初其實也做了一個對未來技術變化的質押,除了賭AI會起效果,也賭我們需要的硬體會出現,特定的AI加速硬件,比如NPU,比如蘋果高通和谷歌的各種硬件芯片會造出來。我們在2018年下了注,今天2023年我們果然有了。

要嘛是我們有很好的視野,要嘛就是運氣好。

Q:而且這些硬體大廠也在對你們產生興趣。

A:對因為他們有了這些硬件,開始找killer app。我們找到他們說,嘿,每個人都看視頻,我們這個就是你要的killer app。這個時間點也很適合。

Q:演算法之外,我們之前聊天你提到數據也是一個門檻,但顯然大公司掌握更多的數據,這會是個問題嗎。

A:很有意思的問題。 (沉思)我認為對於AI壓縮,最終會發現演算法更重要。因為我認為整個領域還不夠成熟到需要數據品質決定的階段。

Q:所以那是第二階段的問題。

A:對,現在還在第一階段,我們都不能說有了完美的演算法,我們的演算法每個月都在大幅進步,變化非常非常快。當演算法很強了,才是數據。不過我們也在增持,因為數據是回報遞減的,現在我們有一兩百萬的視頻序列數據,我們從開源可信的渠道獲得或者從視頻網站購買,在這個節點它們還挺開放的,但大家都看到ChatGPT讓這些開放度在改變,我們很幸運更早的買到了這些數據,這也是優勢但不是這個階段的真正決定性的優勢。

Q:LLM和擴散模型為你的演算法帶來新東西了嗎。

A:比較少,有一些思路有借鑒,問題是,這些模型看起來可以進入我們的流程個我們帶來提高,比如Stable Diffusion可能可以幫我提高壓縮能力,但還是取捨——比如SD10秒處理一次,而我們需要10秒處理300次,如何在實時和效果之間取捨是問題。未來它們有潛力帶來影響。

Q:如果我們從競爭的角度來看,目前你的挑戰來自哪裡?

A:演算法,然後背後是人。我們很多基礎演算法是自己研究,因為沒有太多論文可以看。最關鍵的挑戰就是組建好的團隊,因為市場上有很多人研究AI,沒那麼多人研究資訊理論,同時研究兩者的幾乎為零。所以我們需要組隊然後訓練他們,這需要很長時間,因為它們彼此關聯不大。所以你需要先訓練一批人,再讓他們帶下面的人,這是個金字塔結構。

Q:你們已經建立了這個金字塔麼。

A:我們有超過30個AI研究超級明星了。但我們為此花了很長很長的時間。

Q:所以全世界唯一的30個人都在你這裡。

A:我願意這麼說。也有一些實驗室在看這些話題,他們也有很好的人才,但目前為止在規模上,Deep Render是這個領域最大規模的組織。

Q:我看到你提到要用最近新的融資來擴展矽谷的生意和存在感。

A:對這是有點奇怪,我們是英國公司,但使用網路資源最多的公司在中國和美國。而且,歐洲確實不是一個對科技發展友善的地方。我們有很多來自美國的需求,所以進入美國順理成章,中國也是一樣。

Q:有中國客戶接觸你們麼。

A:我不能說名字,我簽了很長很長的協議所以我要小心哈哈。但我接觸這些公司,發現中國確實在頻寬上的需求比美國都更高。

Q: 你們已經在接觸客戶,如果用人們喜歡討論的PMF來判斷,你們現在到了什麼階段

A:這總是很難去定義。我會認為我們達到了PMF,因為我們拿到的需求已經處理不完了。我們真的在拒絕很多大公司,因為我們自己擁有的頻寬資源不夠了,許多公司預定我們,而我們現在只能同時處理4到5個大公司的需求。一旦這個技術再成熟一點,商業化就變得更容易了。我們已經度過了概念驗證階段。如果一切順利,2024年第二季度你能看到我們的技術被應用到一個非常知名的網路服務裡,到時候數千萬的用戶會使用它。

Q:面對瘋狂的需求,和有限的人手,以及你們自己的技術現狀,如何平衡取捨就是你這個CEO的職責了。

Q:哈哈,這就是我這份工作的挑戰之處。我要嘗試做決定。走得太快總是消耗資源,招募會帶來挑戰,我們的員工一般需要4個月訓練才能有產出。所以你說的對,這是個優化難題,當然,可能誰用AI開發個工具我願意花錢買。

Q:哈哈,在這裡也許LLM就可以參與進來了。

A:對哈哈哈。

Q:看起來一切都進展順利,你給這個生意設計的商業模式是什麼。

A:我們目前是B2B的形式,我們提供客戶產品授權,客戶可以省下很多很多錢,裡面的一部分給我們就行。這是個基於授權的商業模式。如果你看這裡的數據,其實很瘋狂,到2030年,全世界花在傳輸內容的成本會達到1250億美元。如果你想搞垮Netflix,你就用4K,24小時不停看Netflix看一個月。

Q:最好別這樣。

A:哈哈哈,但如果你能把文件大小縮小例如90%,那麼以1250億美元算,公司們可以省很多很多錢。

Q: 這就是你賺錢的機會。

A:這是一個所有人都獲利的生意。我贏了,公司贏了,用戶贏了,大網路公司贏了。沒人損失什麼。

Q:拯救網路的事呢,你的公司幫忙建造的未來的網路的樣子,你想像過麼。

Q: 當然,每天做夢都在想哈哈哈。我們的願景是讓頻寬變成沒有限制的商品,讓所有人不再擔心網速,對於每個人,可以在家享受極高質量的視頻,對於公司,可以獲得非常便宜甚至免費的互聯網資源,信息可以流動,即便是今天認為很重的數據也能自由流動。這才是網路本來該有的未來。

Q:最後這個問題,肯定很多人跟你提過了,聊到這讓我更有這種感覺,就是那個美劇《矽谷》裡的故事似乎和你們一樣。

A:對對對。這幾乎是我最喜歡的劇。但其實很有趣的是,我和我的共同創辦人直到創辦Deep Render一年半以後才知道這部劇,因為HBO在英國沒那麼火紅。但很有趣的是,我們的商業模式和我們經歷的階段,和這個劇裡的故事幾乎一樣。尤其是我們是後來才看到的,我們兩個說,等一下,這不就是跟我們一樣。

Q:你也知道這部劇最後的結局。

A:… 哈哈哈,希望我們的結局更好。

資訊來源:由0x資訊編譯自8BTC。版權所有,未經許可,不得轉載

Total
0
Shares
Related Posts