区块链起源于比特币。2008年11月中本聪的发表《比特币:一种点对点的电子现金系统》,阐述了基于 P2P 网络技术、加密技术、时间戳技术、区块链技术等的电子现金系统的构架理念,标志着比特币的诞生。两个月后比特币程序编写完成并自组网开始运用,2009年1月3日第一个序号为0的比特币创世区块诞生,2009 年1月9日出现序号为1的区块,并与序号为0的创世区块相连接形成了链,标志着区块链的诞生。比特币发展缓慢,但近几年作为比特币底层技术之一的区块链技术日益受到重视。
区块链更多可以看作一种对已有技术的应用,而非单纯的提出了一种技术。所以,在系统的学习区块链技术之前,让我们来看看区块链用到了哪些技术。
密码学
哈希
在比特币这一技术中,使用到了密码学中的两个功能,第一个功能为哈希。
首先简单介绍一下哈希,比特币使用的哈希具有三个性质:
- Collision resistance(抗碰撞性):即对于某个哈希函数H(·),输入x和输入y,如果有x≠y,则有H(x)≠H(y)
- hidding(单向不可逆):即假设有一个哈希函数H(·),给定输入x,我们可以得到哈希输出H(x),但是给定一个哈希输出H(x)和H(·),我们无法求得x是什么。也即H(x)没有泄露x的任何信息。
- Puzzle friendly:由于哈希值是不可预测的,所以如果要H(x)落在某个范围内,没有什么好的办法,只能一个一个x去尝试。这个特性使得在打包区块的时候,必须进行大量的运算(为了让hash值落于某个区间中)。
比特币使用的哈希函数是sha-256,collision resistance这一性质主要用于保证区块链每个区块的不可篡改性质;puzzle friendly这一性质主要用于工作量确认。
非对称加密
用到的第二个密码学功能为非对称加密。在每个比特币用户创建账户的时候,都会创建一个公私钥对。a在给b发送信息的时候,使用b的公钥对信息加密,b然后使用自己的私钥对信息解密。同时,在发布这样一个信息的时候,a需要使用自己的私钥对信息进行签名,这样网络中的其他节点可以使用a的公钥确认这个信息是否由a发布。
在第三方中心化系统中,账户开通依赖于第三方。但去中心化的比特币系统中,很明显不能进行“申请账户”。在比特币系统中,申请账户是用户自己来处理的,即自己创建一个公钥-私钥对。
公钥和私钥的应用保证了“签名”的应用。当在比特币网络中进行转账时,通过“签名”可以明确是由哪个账户转出的,从而防止不良分子对其他账户比特币的盗取。
在发布交易时,通过自己私钥签名,其他人可以根据公钥进行验证,从而保证该交易由自己发起。也就是说,只有拥有私钥,才能将该账户中的比特币转走。
数据结构
哈希指针
区块链是一个将各个区块串起来的链,而串联起这些区块的就是哈希指针。一个哈希指针包含两部分数据:
- 指向某一信息存储的指针
- 某一数据块的哈希值
如下图对于该节点,白色方框即为一个区块链的区块。我们可以看到有两个指针指向这个节点(实际上为一个),其中P为该节点的地址,H()为该节点的哈希值,该值与节点中内容有关。当节点(区块)中内容发生改变,该哈希值也会发生改变,从而保证了区块内容不能被篡改。
在比特币中,其最基本的数据结构便是一个个区块形成的区块链。每个区块根据自己的区块内容生成自己的哈希值,此外,每个区块(除创世纪块)都保存有前一个区块的哈希值。需要注意的是,本区块哈希生成依赖于本区块内容,而本区块内容中又包含有前一个区块的哈希值。从而保证了区块内容不被篡改。
区块的结构
在区块链中,每个区块包含两部分数据:
- Block header
- Block body
每个区块header中,包含指向前一个区块的指针,也包含一个对前一个区块的header进行哈希得到的值。
如果现在要对第i个区块的信息进行修改,就会导致这个区块的哈希值变化,这就要求i+1个区块的哈希值也发生变化,一直到最后一个区块的数据发生变化,最终导致pointer of the last block中的哈希值和最后一个区块的哈希值对不上。这就使得区块链具有不可篡改的性质。
Merkle tree
上图即为一个简单的Markle Tree,其中最下面的节点即为交易数据块。每个交易数据块各有一个哈希值,将所有叶子节点的哈希值合并放在其父节点中,而后,针对得到的一级父节点分别取哈希,又可以得到n/2个新的哈希值,通过不断迭代,即可得到图中根节点。
实际中,在区块块头中存储的是根节点的哈希值(对其再取一次哈希)。这种数据结构的优点在于:只需要记住Root Hash(根哈希值),便可以检测出对树中任何部位的修改。例如,所绘制Markle Tree中节点B发生了改变,则对应的第二层第一个节点中第二个哈希值便也会发生改变,进而根节点中第一个哈希值也会发生改变,从而导致根哈希值也发生了改变。
根据前文中我们知道,区块链分为header和body,body即为保存交易的地方,保存形式即为Merkle tree的形式。在区块链中,Merkle tree的每个叶子节点对应于一笔交易,除了叶子节点的节点储存的都是指向其左右孩子的哈希指针。根据Merkle tree的性质,只要任何叶子节点中的交易被修改,就会导致根节点的哈希值发生变化。
在每个区块header中,除了包含指向前一个区块的指针,以及一个对前一个区块的header进行哈希得到的值,还包含当前区块body的Merkle tree的根哈希。但不包含具体的交易信息。
因此如果有任何交易发生变化-》根节点哈希变化-》区块header保存的根节点哈希发生变化-》区块header的哈希发生变化。这就要求后一个区块保存的当前区块的哈希也得同步改变,而这是很难办到的。
下图即为一个完整的比特币区块的信息