附件:选做源文件
区块链技术在图书馆中应用
哈尔滨工程大学 区块链技术课程
计算机学院 2019065316 王蕊
前 言:区块链成为技术应用的研究热点,并作为战略前沿技术被写入国家信息化规划[1],区块链的应用也从金融行业向图书馆等其他行业渗透。目前,区块链在图书馆中的应用研究涵盖了图书馆的发展、建设、管理、业务和服务等主要方面。区块链的兴起使图书馆有机会重新认识自身,对推动图书馆发展意义重大。继无纸图书馆、电子图书馆等新概念后,智慧图书馆使人们在图书馆领域又有了新的认识。
· 区块链的功能分析
1.1 区块链的功能特征
区块数据不可更改,即区块经最终确认上链之后,区块数据只能查,而不能做增、删、改等编辑操作。区块数据的不可更改是由共识机制及其实现保证的,任何人都不可更改,与其他信息系统中由角色和权限实现的数据不可更改本质不同。若处在运行的区块链系统之中,则无法控制区块链,无法修改区块数据。
区块按顺序单向一维递增。新增数据以新区块的形式追加到链尾,区块链不断增长,成为记录历史的链条。运行中的区块链具有顺序性、持续性、单向一维性、不可逆、不受控制等与时间相同的特性。不受控制的、顺序单向一维递增的区块链是一种虚拟世界中的人造时间,当不依赖现实世界而单独在虚拟世界中描述事物及活动时,须借助此类时间,从而使虚拟世界中的价值及其度量等与区块链相关联。一个区块链系统必须是时间系统,其代币才有潜力成为某种货币,而是否为时间系统取决于共识机制及其实现。
1.2区块链的控制
要控制区块链,就要控制区块链系统,利用其共识机制、分叉机制,主动采用共识攻击方法等,以重建主链方式间接达到编辑区块数据、更改和控制区块链的目的。作为时间系统的区块链系统,其参与者、开发者、社区等都无法控制区块链系统。要控制区块链系统,就要控制其赖以运行的整个底层环境,使其成为运行在局部的可控环境中的信息系统。对于全球范围内参与、运行的公有链,难以使其运行环境局部化、可控化,因此其极难被控制;对于局部范围内参与、运行的联盟链、私有链,其运行环境是局部的、可控的,因而可以被相关联盟组织、机构或个人控制。所以,公有链与许可链本质不同,公有链不受控制,不属于任何人,其持续正常运行须依赖自身的某种激励机制,激励机制的核心是代币及其价值的产生、发行和分配,而许可链能被控制,属于相关联盟组织、机构或个人,其持续正常运行可不依赖代币,而依赖于控制者、管理者。
·区块链的应用分析
区块链的应用
区块链推动互联网从“信息互联网”向“价值互联网”变迁[12],区块链系统的基本应用就是作为价值传递工具实现价值交换、流动。典型例子是实现商品交换中的价值交换
区块链系统实现线上的价值交换,而非线下的商品实际交付。利用这类工具能形成基于区块链的交互信息系统。
区块链系统的深层应用,是作为分布式自动化工具实现分布式自动化服务。区块链2.0是典型的分布式自动化工具,合约账户、智能合约及执行合约的虚拟机是其三个关键部件[13]。利用这类工具开发去中心化应用(DApp),能形成分布式自动化服务系统,进而形成不同层次和自治程度的DAC、DAO(见图2)。其中,线下的实体智能资产也可以是线上的数字智能资产。
区块链技术可以保护知识产权
2.1 助力机构知识库知识产权保护
机构知识库的知识共享基于大量科研数据, 若科研人员或学者担心自己的科研数据或学术成果被不正当使用, 担心知识产权受到侵害, 则不愿上传和分享自己的科研数据和成果。而现有的解决措施主要是制定严格的知识产权条例或事先签署授权协议书等, 对知识产权的保护力度不够。若能在技术层面解决相关问题, 则可大大增强知识产权的保护力度。通过区块链验证和数字公证可以打造一条有效的证据链。区块链上的信息一经写入无法篡改, 这也为上传科研数据的学者提供了不可篡改的数字化证明。此外, 所有的版权信息都是公开透明的, 可被查询、可被追溯、可被应用, 便于在遇到版权问题时进行查阅和举证, 以有效维权。这同时也杜绝了抄袭现象, 因为一旦出现该现象, 记录会被永久保存。
2.2 促进机构知识库数据开放与个人隐私保护
机构知识库数据获取的便捷程度与用户的使用体验和参与的积极程度具有一定的正相关性。机构知识库若一味设置权限, 对数据的开放权限加以限制, 则违背了建库的初衷,这一问题可以通过区块链技术的身份验证加以解决。如对于尤其需要注重隐私保护的电子健康档案, 基于区块链技术可设置多个电子签名授权机制权限, 使相关数据无法被非法篡改, 从而有效保证健康数据的安全保存[15]。这同样也适用于科研数据开放涉及的个人隐私保护问题。上传的科研数据或学术成果存储在区块链上, 采用哈希算法进行密封和加密生成私钥和公钥, 不仅可以进行单私钥或多私钥的设置, 而且可以添加时间和空间维度。同时, 数据的开放权限不应由图书馆决定, 而应由上传数据者依据不同数据的重要程度自行选择全部公开、全部加密或者仅向部分用户公开等。
2.3 解决机构知识库的“去中心化”问题
去中心化已成为区块链技术的一个标签, 然而没有绝对的去中心化, 应辩证地看待区块链的去中心化问题。Vitalik Buterin把去中心化分为3个层面考虑:架构层面、政治/决策层面和逻辑层面。他认为区块链在架构层面和政治/决策层面是去中心化的, 但在逻辑层面是中心化的。架构层面的去中心化, 更准确地说是分布式的, 而逻辑层面的中心化指的是global ledger, 即统一数据库, 统一记账。但决策层面并非必然去中心化, 具体取决于决策制定的规则[16]。也有学者提出非中心化的机构知识库系统[17]。对于机构知识库而言, 图书馆是辅助者、参与者, 主体应是上传数据的人与使用数据的人, 即平台用户。传统意义上图书馆在机构知识库的建设中具有协调管理、宣传推广等作用, 而区块链技术使群体自治性更为突出, 对于图书馆的管理权限有所削弱, 因而在收集资源方面图书馆应以辅助上传数据者为主, 而非完全包揽。
·融合区块链技术的科学数据监护模型的构建及功能阐述
功能需求
整体架构
3.2 应用方式及初步实现
(1)区块链被完全封闭在图书馆内,符合区块链的数据库应用模式。该区块链是典型的私有链,用于记录馆内各部门之间的交互,如图书、设备、工具等在部门之间的流转,这些交互均为馆内交互,不涉及所有权和价值转移,所以对交易速率、共识机制无特别要求,通常无须代币,只需实现区块链底层即可,用合适的区块链开源代码就能很好地实现,可选择的区块链较多。在这种应用方式中,区块链系统位于图书馆信息系统的数据层,读者不能直接访问。
(2)区块链被限制在图书馆联盟内,符合区块链的P2P应用模式。该区块链是典型的联盟链,用于记录各馆之间的交互,如馆际互借、文献传递等。由于各图书馆有联盟协议约束,对交互速率无特别要求,但涉及价值转移,所以最好有代币,从而利用合适的区块链开源代码也能方便地实现,可选择的区块链较多。在这种应用方式中,区块链系统是联系各个图书馆信息系统的纽带。
(3)区块链延展到图书馆外,符合区块链的B2C应用模式。该区块链是典型私有链的变体,形成分层区块链系统,用于记录读者与图书馆的交互,如图书借还等。这些交互影响着图书馆服务的效率和品质,所以对交易速率和共识机制要求较高,应当选择基于POS、DPOS、PBFT等共识机制或经扩容技术改进的交易速率快的区块链。因为涉及价值转移,所以必须有代币。在这种应用方式中,区块链系统可被读者直接访问,并围绕借还服务重新形成图书馆信息系统。其中,读者无权记录交易,这可以通过限制读者仅拥有轻节点和轻钱包客户端实现,图书馆拥有完全节点、钱包服务器节点、挖矿节点、路由节点等全部类型的节点,从而拥有全部权限,提供受控环境。在这种应用方式中的图书馆能被图书馆联盟替代,实现各馆的图书、阅读工具的借还,此时的区块链是典型联盟链的变体。
(4)实现图书馆后端B2B部分。此时图书馆实际为消费者角色,所以这种应用符合区块链的B2C应用模式,是典型私有链的变体。第四种应用与第三种应用的区别是:前者由C端主导实现,用于服务或资源聚集,出版商、发行商的权限被限制;后者由B端主导实现,用于服务或资源分发,读者的权限被限制。这种应用在实现时对区块链的要求和选择类似于第三种应用,而图书馆信息系统中的图书采购子系统会被区块链系统取代。这种应用中的图书馆也能被图书馆联盟替代,此时区块链是典型联盟链的变体。这种应用还有变体,即图书馆或图书馆联盟同上游企业共建共享区块链系统,形成典型的联盟链。
(5)区块链覆盖包括读者在内的整个图书产业链,且不受图书馆、图书馆联盟等控制,符合区块链的P2P应用模式,该区块链是典型的公有链。这种应用中作为文献、信息、知识中心的图书馆,由于区块链的去中心化而消失,取而代之以无中心的公有链系统,该公有链系统作为图书提供者和读者交互的平台,承载图书馆的基本职能和服务,重构了图书馆及其信息系统。在这种应用方式中,要求区块链支持快速实时交易,共识机制与第三种应用类似,并要求代币具有货币属性。这种应用的实现是技术问题,也是营销和社会问题。
总之,图书馆通常是中心化服务机构,拥有基于Web的典型的中心化、实名制信息系统。区块链的第一、二、四种应用是对图书馆中心化信息系统的部分改进,不涉及图书馆本质,只是原图书馆有所改变;第三种应用是对图书馆本质的新实现,将图书馆中心化信息系统重构为分层去中心化信息系统,原图书馆勉强保留;第五种应用也是对图书馆本质的新实现,将图书馆中心化信息系统重构为去中心化信息系统,原图书馆消失。
区块链系统是由价值驱动的去中心化的自激励信息系统,原生支持P2P或C2C商业模式,其形成、运行和发展都充分利用了技术和经济两种手段。图书馆是基于可支配文献及其出租的中心化服务机构,符合B2C商业模式。在图书馆中应用区块链就是在B2C模式中应用P2P模式,而区块链的B2C应用模式就是在P2P模式上实现的B2C模式。对图书馆而言,第三种应用的实践价值和意义最大,最值得图书馆尝试;对区块链而言,第五种应用的实践价值和意义最大,能整合整个图书产业链,直接打通图书供给和消费,系统更易形成、运转和发展。就区块链在图书馆中的应用及未来基于区块链的图书馆而言,对数字图书馆会比对实体图书馆的影响更大。当前,在图书馆行业及图书产业链之外,已有一些组织在推动数字内容交易相关的区块链项目,如LBRY、IPFS的Filecoin、YOYOW等,尝试将内容生产者、内容所有者、内容消费者等联结起来,在功能和定位上涵盖了区块链在图书馆中的第五种应用。实现区块链在图书馆中的应用,应当特别关注IPFS,IPFS是一个基于P2P的分布式版本文件系统,本身与区块链无关,可作为数字文档、数字智能资产等的理想存储。将区块链与IPFS结合,有望解决链下数据的存储、检索和传输问题,在P2P网络中形成“区块链+数字内容”的融合结构,支持并简化区块链系统的实现。
当前国内图书馆缺乏应用区块链的真正尝试,更没有主导构建公有区块链系统用以重构整个图书产业链。宏观原因在于普遍应用区块链的社会环境不成熟,构建有代币的区块链系统风险很大。中观原因在于对区块链的掌握和对图书馆的认识不足,找不准区块链与图书馆的融合点,另外应用区块链重构图书馆信息系统代价大而收益小,且缺乏推广和运营区块链系统的经验。微观原因在于区块链技术仍在快速发展,如共识机制、智能合约、扩容技术、跨链技术等,并由此造成技术更迭、淘汰及出现各种伪区块链,给技术选定带来困难,其次区块链应用中也有技术需要突破,如智能资产、检索功能、交易规制等的实现技术。数字化图书馆、数字图书馆分别是混合信息以及单纯信息系统的典型代表,区块链的三种应用模式和在图书馆中的五种应用方式,以及应用中的几个问题,都能推广到其他非金融行业和相应产业链中。