Vitalik Buterin認可將TiTok壓縮方法用於區塊鏈應用

作者:Josh O’Sullivan,CoinTelegraph;編譯:白水,金財經

以太坊聯合創始人Vitalik Buterin 已認可新的Token for Image Tokenizer (TiTok) 壓縮方法,用於其潛在的區塊鏈應用。

不要與社交媒體平台TikTok 混淆,新的TiTok 壓縮方法顯著減小了圖像大小,使其更適合儲存在區塊鏈上。

Buterin 在去中心化社交媒體平台Farcaster 上強調了TiTok 的區塊鏈潛力,稱“320 位元基本上是一個哈希值。小到足以讓每個用戶上鍊。”

這一發展可能對個人資料圖片(PFP) 和非同質化代幣(NFT) 的數位影像儲存產生重大影響。

TiTok 影像壓縮

TiTok 由位元組跳動和慕尼黑工業大學的研究人員共同開發,可以在不損失品質的情況下將影像壓縮為32 個小資料區塊(位元)。

根據TiTok 研究論文,先進的人工智慧(AI) 影像壓縮使TiTok 能夠將256×256 像素的影像壓縮為「32 個離散標記」。

TiTok 是一個一維(1D) 圖像標記化框架,它“打破了2D 標記化方法中存在的網格約束”,從而產生更靈活、更緊湊的圖像。

“因此,它可以顯著加快採樣過程(例如,比DiT-XL/2 快410 倍),同時獲得具有競爭力的生成質量。”

3TITLxzF1R2NCG47pVBG3D9bCLB5HqZPGbzTSrHX.jpeg

TikTok 研究論文展示了圖像壓縮大小的比較。來源:TikTok

機器學習影像

TiTok 利用機器學習和先進的人工智慧,使用基於變換器的模型將影像轉換為標記化表示。

該方法使用區域冗餘,這意味著它識別並使用圖像不同區域中的冗餘資訊來減少最終產品的整體資料大小。

“生成模型的最新進展凸顯了圖像標記在高解析度圖像有效合成中的重要作用。”

根據研究論文,TiTok 的「緊湊潛在表示」可以產生「比傳統技術更有效率、更有效的表示」。

z4v9XVtNlrSoNLTOxgbEunYRxvqyB8FxP7Vb8cG9.jpeg

使用TiTok 框架(c) 進行影像重建(a) 和生成(b) 的圖示。來源:TiTok

TikTok,不是TikTok

儘管名字相似,但社群媒體平台TikTok 並未獲得Buterin 的認可。

以太坊聯合創始人強調了TiTok 的區塊鏈潛力,為這種新的人工智慧驅動的圖像壓縮方法增添了可信度。

“與將圖像潛在空間視為2D 網格的現有2D VQ 模型不同,我們提供了一種更緊湊的公式來將圖像標記為1D 潛在序列。”

提出的新方法可以“用比“2D 標記器”少8 到64 倍的標記來表示圖像”,該團隊希望這項研究能夠為“更有效的圖像表示”提供啟示。

Total
0
Shares
Related Posts