28. 哈希函数: Keccak256
哈希函数(hash function)是一个密码学概念,它可以将任意长度的消息转换为一个固定长度的值,这个值也称作哈希(hash)。
solidity
最常用的哈希函数keccak256
。
Hash的性质
一个好的哈希函数应该具有以下几个特性:
- 单向性:从输入的消息到它的哈希的正向运算简单且唯一确定,而反过来非常难,只能靠暴力枚举。
- 灵敏性:输入的消息改变一点对它的哈希改变很大。
- 高效性:从输入的消息到哈希的运算高效。
- 均一性:每个哈希值被取到的概率应该基本相等。
- 抗碰撞性:
- 弱抗碰撞性:给定一个消息
x
,找到另一个消息x'
使得hash(x) = hash(x')
是困难的。 - 强抗碰撞性:找到任意
x
和x'
,使得hash(x) = hash(x')
是困难的。
- 弱抗碰撞性:给定一个消息
Hash的应用
- 生成数据唯一标识
- 加密签名
- 安全加密
Keccak256
Keccak256
函数是solidity
中最常用的哈希函数,用法非常简单:
哈希 = keccak256(数据);
Keccak256和sha3
这是一个很有趣的事情:
- sha3由keccak标准化而来,在很多场合下Keccak和SHA3是同义词,但在2015年8月SHA3最终完成标准化时,NIST调整了填充算法。所以SHA3就和keccak计算的结果不一样,这点在实际开发中要注意。
- 以太坊在开发的时候sha3还在标准化中,所以采用了keccak,所以Ethereum和Solidity智能合约代码中的SHA3是指Keccak256,而不是标准的NIST-SHA3,为了避免混淆,直接在合约代码中写成Keccak256是最清晰的。
生成数据唯一标识
我们可以利用keccak256
来生成一些数据的唯一标识。比如我们有几个不同类型的数据:uint
,string
,address
,我们可以先用abi.encodePacked
方法将他们打包编码,然后再用keccak256
来生成唯一标识:
function hash(uint _num,string memory _string,address _addr) public pure returns (bytes32) {return keccak256(abi.encodePacked(_num, _string, _addr));}
弱抗碰撞性
我们用keccak256
演示一下之前讲到的弱抗碰撞性,即给定一个消息x
,找到另一个消息x'
使得hash(x) = hash(x')
是困难的。
我们给定一个消息0xAA
,试图去找另一个消息,使得它们的哈希值相等:
// 弱抗碰撞性function weak(string memory string1)public view returns (bool){return keccak256(abi.encodePacked(string1)) == _msg;}
大家可以试个10次,看看能不能幸运的碰撞上。
强抗碰撞性
我们用keccak256
演示一下之前讲到的强抗碰撞性,即找到任意不同的x
和x'
,使得hash(x) = hash(x')
是困难的。
我们构造一个函数strong
,接收两个不同的string
参数string1
和string2
,然后判断它们的哈希是否相同:
// 强抗碰撞性function strong(string memory string1,string memory string2)public pure returns (bool){return keccak256(abi.encodePacked(string1)) == keccak256(abi.encodePacked(string2));}
大家可以试个10次,看看能不能幸运的碰撞上。
在remix上验证
- 部署合约查看唯一标识的生成结果
- 验证哈希函数的灵敏性,以及强、弱抗碰撞性
习题
单向性意味着哈希函数的正向运算易于计算且结果唯一,而逆向运算只能靠暴力枚举。
灵敏性意味着哈希函数输入的小幅改变应当对应着输出的大幅改变。
强抗碰撞性并不意味着哈希函数的任意两个输入对应的输出都不同。
对于一个哈希函数而言,强抗碰撞性比弱抗碰撞性更难满足。
如果对于某个哈希函数,我们统计大量不同字符串对应的哈希值(二进制串),发现其前 n 位全部为 0 的频率恰好约为 1/2^n,则我们认为该哈希函数具有良好的:均一性。
我们对两个非常相近的字符串 "Hello world!" 和 "Hello world." 求取 sha3-256 哈希值,其结果如下:sha3-256("Hello world!") = 0xd6ea8f9a1f22e1298e5a9506bd066f23cc56001f5d36582344a628649df53ae8sha3-256("Hello world.") = 0x28c9b96bc1e7fcda7f3356693de2a1781e25d76c468fc75b56450df4f25ca962可以看到两者的结果相差极大。这主要归功于sha3-256良好的:灵敏性
当我们下载大型文件时,有时候下载源会提供大型文件的哈希值;我们下载完成后,将本地下载好的大文件也计算其哈希值,并将两个哈希值对比:
- 如果哈希值相同,说明文件内容不同的概率几乎为0,因此可以近似认为下载过程没有出现问题
- 如果哈希值不同,说明文件内容一定不相同,可以认为下载过程一定出现了问题