比特幣支持多簽名授權使用資金:在N 個記錄好的公鑰中,必須有M 個公鑰所對應的私鑰(對同一個操作的)簽名,該筆資金才可動用。比特幣支持最多15 個公鑰的多簽名合約。
作者:阿劍
文章題目來自Bitcoiner 熊越。
比特幣的Taproot 軟分叉升級將於比特幣區塊高度709632 處(預計是2021 年11 月15 日)激活。此次升級包含了許多重要而精彩的內容,然而,在中文世界裡卻缺乏足夠的重視。本文將從技術角度簡要介紹Taproot 的升級內容,並以此體現比特幣的發展方向。
常見的說法是,Taproot 提升了比特幣的隱私性、智能合約功能性、同質性,云云。但是,要想理解Taproot 升級的內容和想像空間,我們得先了解一些比特幣。
比特幣上的智能合約
許多人不了解的是,比特幣也支持編程智能合約2,只不過其智能合約的類型與其他區塊鏈(比如以太坊)的不同。詳細解釋這種區別需要專門的一篇文章,這種區別在這篇文章裡也不重要。這裡僅僅介紹比特幣智能合約編程的幾個常見的模塊3,方便大家理解其應用場景:
-
多簽名合約。比特幣支持多簽名授權使用資金:在N 個記錄好的公鑰中,必須有M 個公鑰所對應的私鑰(對同一個操作的)簽名,該筆資金才可動用。比特幣支持最多15 個公鑰的多簽名合約。
-
時間鎖。用戶可以使用兩種類型的時間鎖來規定一筆資金的可用時段:(1)CLTV,絕對時間鎖,以具體的時間或具體的區塊高度來定義,過了這個時間才可動用;(2)CSV,相對時間鎖,比如生成該項資金的交易上鍊的1000 個區塊後,該筆資金才可動用。
-
多條件編程。即在腳本中使用“IF … ELSE …” 式的語句,為同一筆資金設定多個解鎖條件,任一條件滿足即可使用該資金。比如:“A 公鑰所對應的私鑰可解鎖,或者,在區塊高度XXXX 以後,B 公鑰所對應的私鑰可以解鎖,或者,在該交易上鍊的YYYY 個區塊以後,A、B、C 三個公鑰中任意兩個所對應的私鑰可以解鎖”
如读者可以想象的,这几个模块看起来非常简单,组合起来可能性却非常多:多签名合约定义了不同主体的权限,可以适应极为丰富的应用场景,从公司运营,到家庭金库;时间锁则规定了不同主体在不同时段的权限。而多条件则显著放大了这些权限控制的组合效果。
你甚至僅憑幾個條件,就可以做出一個支持社交恢復、帶遺產分配效果的合約:“我(A 公鑰)可以控制這筆資金;如三個月無人動用,我(B 公鑰)和四個朋友,五取其三可以一起控制這筆資金;如果一年無人動用,我的妻子可以控制這筆資金”。
但是,這些合約要實際上派上用場,兩個因素就不能忽視:效率性和隱私性。
效率性的意思是,比特幣交易的手續費是根據交易的體積來計算的,更多條件的腳本會佔用更大的空間(以字節數計),交易費也會更高。
隱私性的考量是,腳本曝光會使其他人知道某些公鑰之間是有身份關聯的,更容易分析出公鑰主人的真實身份。
在當前,比特幣的合約體現為P2SH “地址”(實際上就是一條哈希值)。其特點是,在生成合約時,腳本可以不公開,有需要的直接給腳本的哈希值支付;但是,這些資金在花費時,與這個哈希值對應的腳本就要完全公開出來放到交易中(否則無以驗證這個腳本的哈希值正是這個哈希值)。以多簽名合約為例,其他人可以直接給這個多簽名合約腳本的哈希值支付,但是,當多簽名合約的參與者要使用這些資金時,就必須把整個腳本公開3。
此外,在SegWit 升級以前,單簽名的個人錢包與合約錢包是涇渭分明的,前者是P2PKH 地址,後者是P2SH 地址,僅從地址上就可以看出來,這又是一個對隱私不利的因素。在SegWit 升級之後,支持隔離見證的個人錢包也可採取P2SH 的形式,但原生隔離見證地址(P2WPKH)和合約地址(P2WSH)仍然是涇渭分明的4。
了解了這些以後,讓我們來看看Taproot 升級的三大部分(MAST、Schnorr 簽名、Taproot)如何做得更好。
默克爾抽象語法樹(MAST)
默克爾化抽象語法樹(Merklized Abstract Syntax Trees, MAST)5 的含義是,在比特幣的腳本驗證中支持驗證默克爾證據。
默克爾樹是將多個數據元素哈希成一個哈希值的密碼學方法。其結構和哈希函數的特點決定了,可以提供一些證據(哈希值)來證明,某個數據元素參與生成了這個哈希值。如下圖所示:我們將(相鄰的)數據元素兩兩不斷哈希,最終生成一個默克爾根。
3
同理,如下圖,當我要證明紅色數據“Banana” 參與生成了紫色的哈希值(默克爾根)時,我只需提供紅色數據和三個綠色的哈希值就可以了,無需曝光實際上共同生成了默克爾根的其餘7 個元素。這就是默克爾樹和默克爾證據的作用。
Banana、Peach 和 Kumquat 的單獨 Merkle 證明
聰明的讀者一定想到了,有了這個功能,合約的編寫者就可以把多個條件劃為不同的數據元素,哈希出一個默克爾根值來;在需要以某個條件來解鎖比特幣時,只需證明這個條件在這棵默克爾樹上即可,無需公開所有其他條件。
沒錯,這正是MAST 的妙用。如下圖所示,這筆資金的解鎖條件有兩個,而編寫者把它們分割了開來,用默克爾樹抽象成了一個哈希值,在以任一個條件解鎖使用時,都不需要公開另一個。
MAST 在P2SH 的基礎上邁出了一大步,其提升效果首先體現在隱私性上:原本在P2SH 中,合約在使用時就一定要公開全部的腳本內容,不論那些內容用到沒用到,都必須公開;現在,有了MAST,用戶就只需要公開需要用到的解鎖條件,無需公開全部內容了;同時,別人也根本不知道你還有多少個條件。
其次,它還在效率上有所提升:用戶只需提供需要用到的部分腳本,及其默克爾證據,在整個腳本比較龐大時,這種體積節約的效果會非常明顯。
由此,未來的比特幣用戶可以編寫條件非常多的合約,獲得更好的控制效果而只需支付更少的手續費;甚至,可以有意包含一些垃圾條件來充實默克爾樹,獲得隱私提升的效果。
這也是本篇副標題“哈希即銀行” 的由來:比特幣的腳本實際上全部圍繞著資金的控制,實現這種控制的關鍵一環正是多條件,而有了MAST,即使是極多條件的資產管理腳本,也可以壓縮成一個哈希值,在使用時僅需暴露一部分。成本的降低可以打開非常多的可能性,等待錢包開發者去一探究竟。
Schnorr 簽名
Taproot 升級之後,比特幣將不僅支持基於橢圓曲線的密碼學簽名,還支持Schnorr 數字簽名方案6。
Schnorr 簽名的構造方法在此不提,我們僅介紹其重要屬性:簽名/密鑰聚合—— 多個私鑰的簽名,可以聚合成一個簽名,看起來彷彿是一把私鑰簽出的。簽名時,仍然是各私鑰持有者各自簽名的;驗籤時,卻彷彿這些簽名是一把對應於已知公鑰(當然就是這些參與者的公鑰聚合而成的公鑰)的私鑰簽出的。
也就是說,有了Schnorr 簽名,其他人就無法分辨一個簽名到底是單人簽出的,還是多人共同簽出的了;多簽名的解鎖條件,可以用一個聚合公鑰來替代。所有nn 的多簽名合約,都可以享受到Schnorr 簽名提供的隱私保護。其最顯然的應用就是閃電網絡通道,因為閃電網絡通道是一個2-2 的多簽名合約;此後,其他人就無法憑藉簽名的數量來分辨支付通道和個人用戶了。
至於mn 的多簽名合約,也不用擔心,別忘了我們有MAST:我們可以把所有可能解鎖的情形都化成一個分支,在使用某個分支時,所提供的簽名也只需是聚合簽名。例如,假設我們要做一個2-3 的多簽名合約,在公鑰A、B、C 中三取其二,這個多簽名合約效果等同於“要么(A、B)解鎖、要么(B、C)解鎖、要么(A、C)解鎖”,這可以理解為一個多條件的腳本,每個條件都是一個2-2 多簽名,因此也都可以用相應的聚合公鑰來定義解鎖條件(而無需以多簽名來定義)。所以,當我們需要以某種組合解鎖資金時,只需用MAST 暴露一個分支、提供一個簽名,他人依然不知道這到底是一個人,還是兩個人,還是多個人。
還沒完呢。
直根
按我們這種理解的路徑,Taproot 升級的最後一個部分就是Taproot,是其名字的由來。在提出這個概念時,Gregory Maxwell 寫道7:
在討論默克爾化腳本時,一個大家常常提起的問題是,我們能否實現一種精巧的合約,使其與最常見、最無聊的支付沒有分別。不然的話,使用這些時髦技術的輸出的匿名集,也就是另一個小眾集合而已,在實踐中沒有多大的意義。
在這裡,Maxwell 敏銳地抓住了問題的要點:比特幣的隱私保障來自於“大隱隱於市”,最好所有的資金單元(UTXO)看起來都一個樣,這樣用戶的真實身份、真實構成才最難把握。但是,在引入新的功能時,總免不了要提出新的“地址” 類型,如果使用這種功能的用戶很少,則每一個用戶暴露真實身份的可能性都會大大增加,而這一點可能導致這些新功能根本不會被使用,從而失去意義。
而且,儘管MAST 在合約的隱私性上有重大作用,但如果還像過去那樣,個人錢包是個人錢包,合約錢包是合約錢包,一目了然的話,就不能不說,這樣的隱私性仍然是有瑕疵的。
人們亟需一種辦法,來終結這種個人錢包/合約錢包的區分,為比特幣的隱私性補上點睛之筆。為此,最起碼要實現的一點是,這種帶有合約的錢包,在用戶個人日常使用中,其代價與普通的個人錢包沒有區別(經濟性)。
Taproot 就是這樣的一種辦法,它利用了密鑰聚合的特點,提出了自帶兩種使用路徑的腳本模式:一種是nn 的多簽名合約;另一種是用戶自定義的合約腳本。
沿用Maxwell 原文中的例子:
假設兩個用戶各有公鑰A、B,兩人聚合公鑰A + B = C,再生成最終公鑰P = C + H(C||S)*G,其中S 為自定義的腳本。就以這個最終公鑰P 來定義資金的解鎖條件。
假設兩個用戶都在線,他們很容易可以共同使用這筆資金,只要其中一方在簽名時在自己的私鑰裡加上H(C||S) 即可;
如果只有其中一方在線,比如S 定義了B 可以花費資金的條件,Taproot 的規則使得公鑰B 用戶可通過揭示聚合公鑰P 以及H(C||S) 並提供可以滿足S 的條件來使用資金。
這裡用的是2-2 多簽名合約,但用戶可以想到,只要密鑰聚合的技術可用,1-1 也就是單簽名同樣可以利用這種編寫腳本的辦法。重要的是:(1)儘管這是一個帶有自定義合約的資金,但在不動用合約、僅使用nn 多簽名時,其手續費成本與單簽名解鎖的資金沒有區別! (2)在nn 多簽名使用時,他人完全不知道這筆資金還可以用其他方式來解鎖使用!
這樣一來,個人用戶和合約用戶都可以統一在一種腳本模式(P2TR “地址”)下,個人用戶放心給自己的資金加上合約,無需擔心日常會付出更高的手續費代價;合約用戶與個人用戶因為使用同一種“地址” 而享受到更大的匿名集,甚至於在大部分情況下都無需暴露自己使用了合約。皆大歡喜。
總而言之,在Taproot 之後,他人將無法從地址形式上分辨一個P2TR 地址到底是個人用戶還是合約用戶;由於Schnorr 簽名的效果,當這個地址裡的資金使用單簽名來解鎖時,他人將無法分辨這到底是一個人在使用,還是n 個人一起使用,也無法知道這個地址是否還有自定義的腳本;由於MAST 的效果,當用戶使用自定義的腳本來花費資金時,只需暴露需要用到的部分腳本;他人雖然知道了這個地址有自定義的腳本,但整個腳本到底包括哪些條件,仍然是不可知的。
因此,儘管有人質疑Taproot 可能反過來給比特幣的隱私性帶來損害7,但我完全不這麼擔心。因為Taproot “地址” 在便利性、隱私性、經濟性上,都已毫無疑問是比特幣史上最佳,它完全有希望可以統一比特幣的“地址” 類型,形成比特幣有史以來最大的匿名集。
結語
對於了解一些密碼學技術的人來說,學習比特幣的開發和升級是很愉快,乃至令人眼界大開的事。在其升級中,你可以看到人們孜孜不倦地使用密碼學來不斷優化這個系統—— 得益於這個系統本身的模塊化特性,這些優化都真實可感。 Taproot 正是其中的代表。
我相信,學習比特幣(尤其是Taproot)的過程會告訴讀者,什麼才是真正的“密碼學貨幣”。
Taproot 可能是比特幣歷史上最重要的一次升級,將造就有史以來最純粹的密碼學貨幣—— 將密碼學利用到極致、最輕量、生命力最頑強的貨幣。
腳註:
比特幣升級提案Taproot 技術解讀,https://www.btcstudy.org/2021/09/29/bitcoin-taproot-a-technical-explanation/
Bitcoin Wiki·智能合約,https://en.wikipedia.org/wiki/Smart_contract
精通比特幣中譯本·第七章:高級交易和腳本,https://github.com/tianmingyun/MasterBitcoin2CN/blob/master/ch07.md
比特幣交易類型——第二部分隔離見證,https://blog.susanka.eu/types-of-bitcoin-transactions-part-ii-segwit/
什麼是比特幣默克爾化抽象語法樹,https://www.btcstudy.org/2021/09/07/what-is-a-bitcoin-merklized-abstract-syntax-tree-mast/
Schnorr 簽名如何提升比特幣,https://www.btcstudy.org/2021/09/09/how-schnorr-signatures-may-improve-bitcoin/
Taproot:隱私保護可切換腳本,https://lists.linuxfoundation.org/pipermail/bitcoin-dev/2018-January/015614.html
用大白話解釋Taproot 對隱私性的影響,https://www.btcstudy.org/2021/09/23/explain-like-im-not-a-developer-taproot-privacy/
展開全文打開碳鏈價值APP 查看更多精彩資訊