28. 哈希函数: Keccak256

哈希函数(hash function)是一个密码学概念,它可以将任意长度的消息转换为一个固定长度的值,这个值也称作哈希(hash)。

solidity最常用的哈希函数keccak256

Hash的性质

一个好的哈希函数应该具有以下几个特性:

  • 单向性:从输入的消息到它的哈希的正向运算简单且唯一确定,而反过来非常难,只能靠暴力枚举。
  • 灵敏性:输入的消息改变一点对它的哈希改变很大。
  • 高效性:从输入的消息到哈希的运算高效。
  • 均一性:每个哈希值被取到的概率应该基本相等。
  • 抗碰撞性:
    • 弱抗碰撞性:给定一个消息x,找到另一个消息x'使得hash(x) = hash(x')是困难的。
    • 强抗碰撞性:找到任意xx',使得hash(x) = hash(x')是困难的。

Hash的应用

  • 生成数据唯一标识
  • 加密签名
  • 安全加密

Keccak256

Keccak256函数是solidity中最常用的哈希函数,用法非常简单:

哈希 = keccak256(数据);

Keccak256和sha3

这是一个很有趣的事情:

  1. sha3由keccak标准化而来,在很多场合下Keccak和SHA3是同义词,但在2015年8月SHA3最终完成标准化时,NIST调整了填充算法。所以SHA3就和keccak计算的结果不一样,这点在实际开发中要注意。
  2. 以太坊在开发的时候sha3还在标准化中,所以采用了keccak,所以Ethereum和Solidity智能合约代码中的SHA3是指Keccak256,而不是标准的NIST-SHA3,为了避免混淆,直接在合约代码中写成Keccak256是最清晰的。

生成数据唯一标识

我们可以利用keccak256来生成一些数据的唯一标识。比如我们有几个不同类型的数据:uintstringaddress,我们可以先用abi.encodePacked方法将他们打包编码,然后再用keccak256来生成唯一标识:

function hash(uint _num,string memory _string,address _addr) public pure returns (bytes32) {return keccak256(abi.encodePacked(_num, _string, _addr));}

弱抗碰撞性

我们用keccak256演示一下之前讲到的弱抗碰撞性,即给定一个消息x,找到另一个消息x'使得hash(x) = hash(x')是困难的。

我们给定一个消息0xAA,试图去找另一个消息,使得它们的哈希值相等:

// 弱抗碰撞性function weak(string memory string1)public view returns (bool){return keccak256(abi.encodePacked(string1)) == _msg;}

大家可以试个10次,看看能不能幸运的碰撞上。

强抗碰撞性

我们用keccak256演示一下之前讲到的强抗碰撞性,即找到任意不同的xx',使得hash(x) = hash(x')是困难的。

我们构造一个函数strong,接收两个不同的string参数string1string2,然后判断它们的哈希是否相同:

// 强抗碰撞性function strong(string memory string1,string memory string2)public pure returns (bool){return keccak256(abi.encodePacked(string1)) == keccak256(abi.encodePacked(string2));}

大家可以试个10次,看看能不能幸运的碰撞上。

在remix上验证

  • 部署合约查看唯一标识的生成结果
  • 验证哈希函数的灵敏性,以及强、弱抗碰撞性

习题

  1. 单向性意味着哈希函数的正向运算易于计算且结果唯一,而逆向运算只能靠暴力枚举。

    灵敏性意味着哈希函数输入的小幅改变应当对应着输出的大幅改变。

    强抗碰撞性并不意味着哈希函数的任意两个输入对应的输出都不同。

    对于一个哈希函数而言,强抗碰撞性比弱抗碰撞性更难满足。

  2. 如果对于某个哈希函数,我们统计大量不同字符串对应的哈希值(二进制串),发现其前 n 位全部为 0 的频率恰好约为 1/2^n,则我们认为该哈希函数具有良好的:均一性

  3. 我们对两个非常相近的字符串 "Hello world!" 和 "Hello world." 求取 sha3-256 哈希值,其结果如下:sha3-256("Hello world!") = 0xd6ea8f9a1f22e1298e5a9506bd066f23cc56001f5d36582344a628649df53ae8sha3-256("Hello world.") = 0x28c9b96bc1e7fcda7f3356693de2a1781e25d76c468fc75b56450df4f25ca962可以看到两者的结果相差极大。这主要归功于sha3-256良好的:灵敏性
  4. 当我们下载大型文件时,有时候下载源会提供大型文件的哈希值;我们下载完成后,将本地下载好的大文件也计算其哈希值,并将两个哈希值对比:

    • 如果哈希值相同,说明文件内容不同的概率几乎为0,因此可以近似认为下载过程没有出现问题
    • 如果哈希值不同,说明文件内容一定不相同,可以认为下载过程一定出现了问题