元宇宙至少需要1萬倍算力?
理想的元宇宙在算力上,比現在至少要提升多少倍?感覺一直以來都是個迷。
先說一下本文的答案,至少1萬倍(雲邊端融為一體,在IDC內,評估總算力;保守估計):
分辨率10倍x 刷新率2倍x 其他感官10倍x 並發人數50倍= 10000 倍
下面我先引述一下中文媒體此前和元宇宙算力相關的報導。為了確保真實性,我做了一些調研,後面把英文報導(含Intel官網等)也列出來。
芯東西12月16日報導,本週二,英特爾在RTC 2021上首次公開談論元宇宙話題。
英特爾公司高級副總裁兼加速計算系統和圖形事業部總經理Raja Koduri撰文稱解讀了英特爾賦能元宇宙的三層技術基石,並在接受外媒QUARTZ專訪時稱,要想實現《雪崩》和《頭號玩家》中天馬行空的體驗,需將現在的算力提升1000倍。
最早見於報導的英文網頁是2021年12月14日的Intel官網:
https://www.intel.com/content/www/us/en/newsroom/opinion/powering-metaverse.html
Truly persistent and immersive computing, at scale and accessible by billions of humans in real time, will require even more: a 1,000-times increase in computational efficiency from today’s state of the art.
翻譯:真正持久和身臨其境的計算,大規模且數十億人實時訪問,將需要更多:計算效率比當今最先進的提高1000倍。
這是英特爾第一次公開談論元宇宙。詳見:
https://valleyimallcom.b-cdn.net/intel-is-ready-to-talk-about-the-metaverse-quartz/
如果我沒弄錯的話,這也是全球第一次有IT巨頭,針對元宇宙所需算力,表明觀點:
“One foundational thing we always knew is that for what we imagined in Snow Crash, what we imagined in Ready Player One, for those experiences to be delivered, the computational infrastructure that is needed is 1000 times more than what we currently have.”
翻譯:我們一直知道的一件基本的事情是,對於我們在《雪崩》中想像的,以及我們在《頭號玩家》中想像的,為了提供這些體驗,所需要的計算基礎設施是當前的1000倍。
後續也有其他IT巨頭針對元宇宙所需算力提出自己的看法,比較遺憾的是,當我通過各種途徑,詢問倍數的推算邏輯,或者出處時,沒有得到所需。
上週,有位朋友仔細閱讀了《元宇宙十大技術》,並提到將在隨後的公開採訪想提出這個問題。我開始認真地思考,有了初步的結論。考慮並不周全,但有好過於無,期待今天的文章,能夠拋磚引玉,希望更資深的專家拿出更令人信服的說法。如下是計算公式:
n=f1(a1, a2, a3,…) x f2(b1, b2,…) x f3(c1, c2,… ) x f4() x f5() x … xg() xh() …
n表示結果,也即倍數。
f包括f1, f2, … f5, …,和g, h都代表影響倍數的變量,其中f主要指視覺、聽覺、體感、觸覺、嗅覺、味覺等感官,要達到逼真的感覺,相關的倍數。
一、視覺之分辨率和刷新率
Meta Quest 2的頭顯可提供1832 x 1920像素的分辨率,90Hz刷新率。但要達到沉浸感所需的視網膜級別的顯示效果,需要12450*6840的分辨率,也即最好在14K以上,如下圖1;且刷新率fps最好在180以上(取150~240fps中間偏低的數據)。
1832×1920是2K的分辨率。 2022年9月Pico 4頭顯剛剛發布,其單眼分辨率高達2160*2160,也大約為2K;市場上有少量高端的頭顯能達到4K分辨率,升級到14K,是一個平方的差距關係。
圖1 VR 頭顯需要多高的分辨率才能實現「視網膜」效果? (源自知乎)
我們先來看一下VR頭顯的視覺,涉及到兩個變量,a1代表因分辨率所需提高倍數,a2代表因刷新率所需提高倍數。
分辨率:a1= 14*14 /4/4 = 12.25,就按十倍計算
刷新率:a2= 180/90 = 2,也即兩倍
僅兩者就有20倍的算力需求了,也即f1=20
二、其他感覺
個人認為視覺和聽覺,即使是三維空間,也難以讓遠程的交互有身臨其境的感覺。觸覺和體感會大大增強交互的體驗,筆者在2022年春節時,體驗了PICO Neo 3,即使是手柄,當人在三維空間和他人握手時,手柄的震動帶來的觸覺的感受,也令人印象深刻。如果觸覺手套、觸感背心逐漸普及,會讓人感覺到比鄰若天涯,例如2021年6月,觸覺反饋公司bHaptics推出觸感背心bHaptics TactSuit,用戶佩戴該產品玩支持的遊戲,可體會到遊戲中角色受到的擊打感。
從視覺拓展到更多維的感官,甚至包括未來可能要普及的嗅覺、味覺,算力需求提升10倍,已經是非常保守的數據了,也即:
f2 x f3 x f4 x f5 = 10
三、多人並發
其實硬件的各個方面距離元宇宙雛形所需算力,差距都不小。我自己曾經用過一款元宇宙會議APP,大約二三十人,運行了20多分鐘後,手機就比較燙了。
Matthew Ball在其新書《元宇宙改變一切》裡提到:
《自由之火》中的大逃殺僅限50個玩家同時參與。
當《堡壘之夜》或Roblox等遊戲在更狹窄的空間,比如在虛擬演唱會現場開展社交活動時,它們會將並髮用戶減少到50個或更少。與標準遊戲模式相比,它們還限制了用戶可以做的事情。例如建築項目可能會被關閉,另外舞蹈動作的數量也會從正常的十幾個或兩個減少到只有一個預設選項。
Roblox現在起保真度相對較低的世界中支持多達200名玩家。
英偉達黃仁勳設想把“粒子物理定律、引力定律、電磁定律、電磁波(包括光)和無線電波……壓力和聲音”應用到元宇宙中。
不難感覺,如果要構建多人並發的持續共享且實時響應的元宇宙,道路還很漫長。我們假設高保真度,或者較逼真的三維遊戲,目前的並發人數為100;如果我們希望完成一個較為簡單的任務,在一個能夠容納5000人的元宇宙會議室。這就意味著需要50倍的算力提升,也即:
g=50
綜上所述,n=20 x 10 x 50=10000,也即1萬倍。
這已經是最保守的數據了,例如除了視覺以外,其他多維感官,可能帶來不止10倍的算力提升;並發人數從100到5000,可能不是線性的提升,有可能更多?假設一個場景,周杰倫要在能容納5000人的“元宇宙音樂廳”開大型演唱會,他的數字化身,突然一時興起,邀請200個粉絲的化身上台分組比賽。這時,要讓5000個人(包含周杰倫、200個粉絲、台下的觀眾的化身們)看到的景象保持基本的一致,渲染的工作量比100個人的“元宇宙音樂廳”,提升很可能不止50倍。
另外,更理想的元宇宙,是不是需要百萬、千萬,甚至上億的人並發?
還有,很可能還存在本篇文章沒有考慮到的因素,也將成為算力倍增所需考慮的變量。
元宇宙的算力給我們帶來巨大的挑戰。另外,眾所周知,近些年來,摩爾定律放緩,每年晶體管密度的提升不到3%,如下圖,一方面,算力可能會成為元宇宙迅猛發展的掣肘,但同時元宇宙也會倒逼算力提供商們,盡其所能發展相關軟硬件和算法。
當前可以看到,採用異構加速、多元融合等方式來應對。借助AI,英偉達在過去的4年內將性能提升了16倍。
需要指出的是,應用場景(元宇宙)和底層基礎設施(算力、存儲、網絡等元宇宙五大地基)是相輔相成,相互促進的;算力也是逐漸增加的,應用場景會“鞭打”算力。總算力每提升10倍,預計就有一批新的應用橫空出世。正如,通信的2G成就了短信和自由通話,3G成就了移動互聯網下的彩信和語音,4G成就了在線視頻和直播。 5G會成就什麼呢?
參考文章:
2021-12-14,Powering the Metaverse- Intel is working on the plumbing for a persistent and immersive internet.
https://www.intel.com/content/www/us/en/newsroom/opinion/powering-metaverse.html
2021-12-13,INTEL IS READY TO TALK ABOUT THE METAVERSE – QUARTZ
https://valleyimallcom.b-cdn.net/intel-is-ready-to-talk-about-the-metaverse-quartz/
2016-12-13 10:28, hillin 編輯
VR 頭顯需要多高的分辨率才能實現「視網膜」效果?刷新率要多高才能足夠真實?
https://www.zhihu.com/question/39630265/answer/2318670666