区块链技术在地学数据共享中的应用可行性分析
1.
2.
3.
Application Feasibility Analysis of Block Chain Technology in Geospatial Data Sharing
1.
2.
3.
通讯作者:
收稿日期: 2019-09-02 修回日期: 2020-06-08 网络出版日期: 2020-09-14
基金资助: |
|
Received: 2019-09-02 Revised: 2020-06-08 Online: 2020-09-14
作者简介 About authors
李亚珍(1994-),女,甘肃庆阳人,硕士研究生,主要从事地学数据共享应用研究E⁃mail:
关键词:
Keywords:
本文引用格式
李亚珍, 郭建文, 吴阿丹.
Li Yazhen, Guo Jianwen, Wu Adan.
1 引 言
2 地学数据共享现状与存在问题
2.1 地学数据共享现状
随着地学数据获取、传输、处理技术的迅猛发展,各国政府与研究机构不断加大对地学数据建设及数据共享的关注,地学数据的规模与共享水平发展迅速[5]。自20世纪60年代年起,世界各国与国际组织相继实施了一系列地学数据共享计划与项目,如1957年国际科学理事会(International Council for Science,ICSU)成立世界数据中心[6](World Data Center, WDC),2008改组后成为世界数据系统(World Data System, WDS),首次提出了科学数据开放共享的模式和具体活动方法,中国于1988年加入,成立了空间、冰川冻土、可再生资源与环境等9个学科中心;上世纪80年代美国国家航空航天局(NASA)建立地球观测系统数据及信息系统[7](Earth Observing System Data and Information System, EOSDIS),涵盖地球和环境科学主题领域的全球变化主目录(Global Change Master Directory, GCMD),是世界上最大的公共元数据库之一。2001年欧洲委员会启动欧洲空间信息基础设施[8](Infrastructure for Spatial Information in Europe, INSPIRE)建设,提出了空间信息共享的总体框架与一般规则,实现了成员国之间空间数据基础设施内容与机制的兼容,大幅提升了欧洲空间信息的共享水平;2005年多国联合成立地球观测组织[9](Group on Earth Observations, GEO),是国际上地球观测领域最大的政府间合作组织,设计实现了一个综合、协调及可持续的全球综合地球观测系统,收集大气、海洋和陆地的各种观测信息,为决策者提供从原始观测数据到信息的服务支持。2009年中国开通“科技资源共享网”,形成了包含六大领域32类资源的科技条件平台资源体系,汇集了海量科技资源信息,实现了各类资源的有效集成和提高;2018年中国科学院启动A类战略性先导科技专项“地球大数据科学工程(CASEarth)”,突破一系列技术瓶颈问题,建成多学科融合且别具特色的地球大数据云服务平台,来支撑国家宏观决策和重大科学研究发现[10-12]。
2.2 地学数据共享存在问题
(1)地学数据价值外化途径不足,大量地学数据源未能被激活。目前,地学数据共享主要依赖于国家投资建设各类地学数据中心,用户通过各地学数据中心网站提交数据需求来获取数据的方式实现。然而,调查表明,仍有大量地学数据依然存储于资料堆、档案库甚至流散于个人手中,不仅未发挥其应有的增值作用,且濒临丢失,使得大量地学数据被重复采集、重复投资[15]。地学科研工作者主要通过与数据拥有者联合申请项目、签订协议、网络获取、各大地学数据中心平台获取、熟人索取和购买等方式来获取数据,但由于很多地学数据共享平台之间缺乏互操作[16],个人之间消息沟通范围有限,使得各大数据平台、拥有地学数据的企业、个人逐渐形成新的数据“孤岛”,限制了地学数据价值外化。
(2)地学数据共享存在安全隐患。地学数据共享的安全性主要包括数据存储安全和数据流通安全。地学数据存储安全是指数据完整性、数据的备份以及恢复功能;数据流通安全是指数据在传输过程中是否具有保密保障以及数据在传输途中的安全[17]。目前,地学数据共享平台主要是分片、分区域共享,各平台之间互不关联,单节点共享,各平台数据在各平台内部进行备份,一旦数据管理人员误改或被黑客攻击,将会对数据平台造成不可估量的损失,且恢复困难。
(3)地学数据贡献者权益保障有待扩展与提升。保护知识产权就是保护创新的源动力,近年来,随着科学数据共享的不断探索与发展,地学数据作者权益保护得到了极大提升,如引入DOI(Digital Object Unique Identifier,数字对象唯一标识符)系统,为地学数据资源进行DOI注册[1];推动科学数据出版工作,激励数据生产者发布和共享数据等[18]。但是目前地学数据贡献者权益保障仍然有待扩展与提升的空间,如提升数据版权信息的存储与维护,减少人力物力投入(当前数据中心、数据出版方为避免服务器故障导致的信息系统崩溃问题,大多采用单节点多备份)、未注册未出版数据的版权保护(目前仍有大量数据未能注册DOI或进行数据出版)、普通用户之间进行地学数据共享时共享过程的记录与存储等。
3 区块链与区块链应用现状
3.1 区块链简介
区块链按照参与者以及读写权限开放程度的不同,大致可分为公有链、联盟链和私有链[21]。公有链为完全去中心化,各个节点都具有读取和写入数据权限;联盟链,又名共同体区块链,则是部分去中心化,节点由联盟内成员部署,读写权限由联盟节点控制;私有链本质上仍为中心化,参与节点只有有限的范围,数据的读取和写入由私有链所属组织控制。
3.2 区块链架构
图1
3.3 区块链应用现状
3.3.1 数据溯源
3.3.2 数据共享
3.3.3 数据安全
3.3.4 地学领域探索项目
目前,区块链技术已在地图数据共享、水资源管理、空气污染指数测量、地籍数据管理与更新以及地质资源产权保护等领域有了初步的理论探索和应用研究。如智能地图生态公链GoWithMi利用一种全新的地图基础数据结构GeoMesh将地图基础数据切分为大量离散的、小数据尺寸的GeoMesh数据,同时基于托马斯·谢林的博弈共识理论把控地图数据质量,保证用户上报数据在不经过中心化审核的前提下即可达到超过传统行业数据质量的要求,实现了普通用户之间地图数据的共享[35-36];菲律宾帕西格河修复委员会(PRRC)与科技初创公司CyPHERin合作,在河流和水下安装物联网(The Internet of Things,IoT)设备采集数据,基于区块链技术实现河水中污染物的实时监测和溯源[37];IBM公司将地下水使用数据记录在区块链平台上,对水资源的利用情况进行实时跟踪[38];Yohan等[39]基于区块技术设计出一种适用于工业物联网应用的空气污染指数测量平台,通过IoT传感器实时收集空气污染物数据,利用区块链技术对其进行加密传输至云,确保空气污染数据的真实性和防篡改性;针对目前地籍数据多版本多权限操作的问题,Abdulvahit Torun设计实现了地籍数据管理和更新的分层区块链体系结构,以土耳其为案例,将土地注册和地籍管理组织作为权威和可信节点,土地所有者对土地边界变更、交易具有批准权,利用区块链记录地籍数据,跟踪地籍数据的更新,实现地籍数据的完整、正确和一致性存储[40];姚昕等[41]针对地矿产业信息化服务的现存问题,基于区块链技术提出解决地质资料服务领域的产权、交易及共享壁垒问题的架构;张梦迪等[42]探讨了地质大数据产权保护中区块链技术的应用与优势;王亮等[43]结合传统数据库的局限性,分析了区块链技术与地学大数据管理结合的可行性。
综上所述,区块链技术在地学领域的应用虽尚处于萌发阶段,但这些在数据存储、数据共享、数据安全、数据版权等方面的应用探索经验均表明,在地学数据共享过程中引入区块链技术以解决某些共享问题具有良好的应用前景。
4 区块链技术在地学数据共享中的应用可行性分析
4.1 区块链在地学数据共享中的应用可行性分析
地学数据应用研究是国家大数据战略的组成部分,与地球科学面临的数据共享问题息息相关,因此,如何进一步提升地学数据共享水平是目前促进地学研究的关键一步。区块链采用全分布式存储,利用非对称密码学算法对数据进行加密,通过时间戳技术为待共享数据和共享过程增加时间维度,各节点保留相同且完整的待共享数据和共享过程记录,因此,较之于传统的中心化共享网络,区块链具有非常好的可溯源性和非常高的防篡改性,并能够避免单一节点故障导致整个共享网络瘫痪的问题。由此可见,引入区块链技术,是推动当前地学数据共享发展的新机遇。为扩充地学数据价值外化途径,激活更多地学数据参与共享,提升数据安全保障,以技术手段维护地学数据贡献者权益,将区块链技术与地学数据共享结合,目前主要有两种模式:一种是区块链+地学数据实体的共享模式;一种是区块链+地学数据衍生数据(如地学数据元数据、地学数据共享操作记录和地学数据版权信息等数据)的共享模式。
4.1.1 区块链+地学数据实体
与其他领域的待共享数据相比,地学数据具有时间性、空间性、海量性和多源异构等特点[44],且具有专业特殊性,如高分辨率的遥感数据、大比例尺地形图数据等具有非常高的涉密级别。
区块链+地学数据实体的共享模式,能够大幅提升地学数据实体的存储安全和流通安全,为地学数据贡献者提供跨数据中心的溯源机制,将用户需遵守的地学数据共享的法规条例和数据的访问权限以代码形式表述,使地学数据共享能够完全自动执行,无法从外界干预,降低地学数据共享过程中人力资源投入。
但是,区块链上数据公开透明,各节点能够自由访问链上数据,对于数据的确认具有延迟性,当待共享数据为较大地学数据(如遥感影像数据)时,过长的数据传输时间、加密时间以及节点间共识时间势必会严重降低区块链系统的处理性能,并且各节点完全备份数据实体对于存储资源的需求将是巨大的挑战。同时,如何保证“涉密数据不上网,上网数据不涉密”是两者结合的难点,区块链存储的公开透明性可能对地学数据共享造成极大的风险,甚至危害国家利益。虽然目前已有区块链应用融合了数据切片、加密、去重和恢复等技术,可将较大、敏感性数据切片、加密、去重后存储[45],但由于地学数据与普通数据的差异性,在数据恢复过程中,如何保证地学数据的完整性将面临严峻考验。
4.1.2 区块链+地学数据衍生数据
地学数据衍生数据主要包含地学数据元数据、地学数据共享过程记录等数据,与地学数据实体相比,地学数据衍生数据存储量较小,结构相对简单,基于区块链进行共享时耗费时间、存储成本较少。
区块链+地学数据衍生数据的共享模式能够通过去中心化的设计、点对点的对等网络为不同参与角色(如科研人员、科研机构、国家政府机构、学术出版机构、领域/学科数据中心等)之间的数据共享提供媒介[46],消融数据共享壁垒,使用交叉验证机制和去中心化验证机制对用户的点滴贡献确权并以此建立激励机制,促进更多的地学数据拥有者参与共享,减少数据重复投资、提高数据使用效率。并可对地学数据进行版权注册和认证,确定并记录地学数据作者、操作记录和流通路径,为用户提供经过区块链上成员共识认可的地学数据共享操作记录和数据转载路线,让地学数据作者能够实时了解地学数据的共享访问情况,实现对地学数据共享过程的溯源。为每一个特定时间点的存在提供证明,无论是版权注册的时间点,还是每一次数据交易的时间点。同时,当地学数据真实作者的权益受到侵害时,能够及时追溯数据的恶意传播源头。
综上所述,区块链技术+地学数据实体结合的共享模式虽然具有不少优势,但可行性面临诸多局限,与之相比,区块链+地学数据衍生数据的共享模式是目前技术条件下可行性更好的模式。
4.2 应用场景探讨
区块链与地学数据共享的融合需根据应用场景的不同,以及区块链的优缺点选择不同的区块链应用模式。基于对当前技术条件下区块链与地学数据共享领域的特点及需求情况分析,对可能的应用场景进行如下的初步探讨。
4.2.1 基于区块链技术实现研究者个人之间的地学数据共享
个人之间的地学数据共享往往由于缺乏可靠的共享中介而受到抑制。可采用以下基于区块链技术途径为实现个人之间的地学数据共享提供解决方案:基于区块链构建地学数据共享公有链平台,搭建个人之间的数据流通渠道,将数据共享的参与者划分为数据提供者、数据需求者以及利益驱动者。数据提供者将所拥有地学数据的描述信息、作者信息、位置信息以及获取方式等提交至区块链,通过合适的激励机制促使利益驱动者对数据提供者所提交的数据进行打包、验证并存储,数据需求者通过区块链平台查询所需数据的信息以及获取途径。
4.2.2 基于区块链技术实现地学数据中心之间的元数据共享
地学数据中心之间的元数据共享能够使得地学数据中心尽快发现地学数据在某些领域的缺失和不足。可采取的方案为:基于区块链技术构建地学数据中心之间的元数据共享联盟链,将地学数据的元数据进行链上存储,基于区块链的共识机制保证各地学数据中心所存储地学数据元数据的一致性,实现地学数据中心之间的元数据共享。
4.2.3 基于区块链技术实现地学数据溯源
利用区块链技术记录地学数据中心认证的数据版权信息和地学数据共享操作记录,能够让数据贡献者更好地把控数据的流向以及数据的共享状态。可采取的方案为:联合各地学数据中心建立地学数据共享联盟链,将各数据中心数据库中存储的数据共享操作日志信息以及数据的版权信息利用区块链进行存储,为用户提供经联盟成员认证的具有极高可信度的数据共享使用记录。
随着未来相关应用研究的不断深入,相信会在地学数据共享领域中发展出更多更好的区块链应用模式。
4.3 区块链技术在地学数据共享中的应用挑战
虽然区块链技术在地学数据共享中具有广阔的应用前景,但作为近年来的新兴技术,区块链与地学数据共享结合仍面临各种挑战。
(1)面对区块链技术带来的技术变革,如何做好不同领域地学数据衍生数据分类、设计地学数据衍生数据的存储模式,是区块链技术与地学数据共享结合的难点。
(2)目前区块链技术尚处于发展阶段,在很多领域的应用仍未得到充分验证,其性能、运营维护成本、功能完备性等许多方面还有待完善。目前开源的区块链系统高并发能力普遍不高,其中,共识算法和账本结构是制约其性能的重要方面,所有的交易都只能被按顺序处理,因此,区块链高并发交易性能有待持续优化和提升。在数据存储能力方面,由于区块链上的数据只能追加而不能移除,数据只增不减,随着时间推移,区块链系统对数据存储大小的需要也在持续增长,更为有效的数据存储方式有待探索。
因此,拟通过区块链技术与地学数据共享结合以促进地学数据开放局面的应用尝试,需要综合考虑区块链技术的特点、局限性,以及地学领域的待共享数据特点,积极挖掘区块链技术在地学数据共享中的可应用场景,准确把握地学数据共享目前的应用需求,加大对区块链技术的研究与探索,寻求区块链技术与地学数据共享的最佳结合点。
5 结 语
当前地学数据共享应用中仍存在一些问题,如地学数据价值外化途径不充足,大量地学数据源未能激活、数据安全存在隐患、地学数据贡献者的权益保障有待扩展和提升等。在地学数据共享应用中引入区块链技术,能够为个人之间的地学数据共享提供可靠中介,扩充地学数据价值外化途径,追踪地学数据的共享过程,对数据的元数据、版权信息、共享过程记录等进行不可篡改性存储,并通过去中心化、多节点完整备份数据避免单节点故障导致系统崩溃的问题,减少单节点人力和物力投入。
区块链去中心化、不可篡改、可溯源、透明的技术特点,使得其可以被应用在众多领域,但同样也因其自身特性所限,其交易并发能力、数据存储能力、功能完备性等方面还有待提升和完善,这也使其在诸多应用方面受到限制,尤其是在地学数据共享应用领域。
在当前技术条件下,地学数据实体因海量、多源异构等特点,难以直接存储在区块链上,因而实体数据与区块链相结合的应用模式可行性很差;而区块链与地学数据衍生数据的结合则具有很好的应用前景,例如基于区块链技术实现研究者个人之间的地学数据共享、地学数据中心之间的元数据共享、地学数据溯源等等。
综上所述,目前区块链技术尚有很大的发展空间,需要根据具体的应用目的,找到区块链技术与地学数据共享的契合点,综合考虑区块链的技术优势与应用局限性,对症下药,选择合适的区块链技术架构,才能更好地实现技术与应用的融合,发挥出区块链技术的特长,从而推动地学数据共享应用水平的提升。
参考文献
. Scientific Data Publication: An Review and Framework
[J].
科学数据出版现状及其体系框架
[J].
Overall Framework of Scientific Data Sharing Project
[J].
科学数据共享工程的总体框架
[J].
Decentralized Networks: The Future Internet
[J].
“Bitcoin: A Peer-to-Peer Electronic Cash System” White Paper
[J/OL]. ,
Scientific Data Integration Method based on Geodata Ontology
[J].
地学数据本体支持下的科学数据集成方法
[J].
Reform and Prospect Analysis of World Data Center
[J].
世界数据中心(WDC)回顾、变革与展望
[J].
Earth Observing System (EOS) Data and Information System (EOSDIS) — Evolution Update and Future
[C]∥
The Enlightenment of Infrastructure for Spatial Information in the European Community (IN⁃SPIRE) on Chinese Geological Informatization
[J].
欧盟空间信息基础设施建设(INSPIRE): 兼议对中国地学信息化的启示
[J].
Review of Geospatial Data Systems’ Support of Global Change Studies
[J].
Years
[J].
迎接科学数据库发展的新阶段——中国科学院科学数据库发展20年的回顾与思考
[J].
China Science and Technology Resources Sharing Network Opened in Beijing
[J].
中国科技资源共享网在京开通
[J].
Geographical Science in China
[J].诸云强
论地球数据科学与共享
[J].
The Fourth Paradigm: Data-Intensive Scientific Discovery
[J].
Progress and Challenges of Large Scientific Data Integration and Sharing
[J].
科学大数据集成共享进展及面临的挑战
[J].
Investigation and Analysis of the Present Situation of Scientific Data Sharing in China
[J].路鹏
我国科学数据共享现状的调查与分析
[J].
Research for Sharing Development Status, Problems and Solution of Geo-Data
[J].
地学数据共享发展现状、问题、对策研究
[J].
He Jianbang. Technological and Standard Issues in the Geographic Information Sharing: A General Comment and the Requirement
[J].
地理信息共享中标准与技术问题的一般性评论及其需求
[J].
. Collaborative Publishing of Scientific Data: Model and Implementation
[J].
科学数据联合出版模式与内容研究
[J].
杨保华. 区块链原理、设计与应用
[M].
From Digital Money to Credit Society
[M].长铗
从数字货币到信用社会
[M].
A Next Generation Intelligent Contract and Decentralized Application Platform
[EB/OL]. Nov.2019.
Overview of Block Chain Technology
[J].
区块链技术综述
[J].
White Paper on China's Block Chain Industry in 2018
[R/OL]. ,
2018年中国区块链产业白皮书
[R/OL]. ,
Beijing East Block Chain Technology White Paper
[R/OL].,
京东区块链技术白皮书
[R/OL]. ,
Device Democracy: Saving the Future of the Internet of Things
[R/OL]. Aug.2019.
Baidu Blockchain White Paper
[R/OL]. ,
百度区块链白皮书
[R/OL].
Big Data Exchange based on Information Chain
[J].
大数据交换信息链
[J].
Build a Big Data base Platform for Smart City based on Block Chain
[J].梁佳庆
以区块链为基础打造智慧城市大数据基础平台
[J].
Research and Implementation of Large Data Sharing Model and Key Mechanisms based on Block Chain
[D].
基于区块链的大数据共享模型与关键机制研究与实现
[D].
Block Chain-based Security Sharing of Big Data in E-Government
[J].
基于区块链的电子政务大数据安全共享研究
[J].
Research on Data Management and Control Mechanism in Data Sharing Scenarios
[D].
数据共享场景中数据管控机制研究
[D].
Mapping the World based on Block Chain
[R/OL]. ,
基于区块链绘图全世界
[R/OL], ,
Philippines Uses Blockchain Technology to Save Polluted Rivers
[EB/OL]. ,
菲律宾利用区块链技术拯救污染河流
[EB/OL]. ,
IBM Blockchain Assists Groundwater Pilot in Drought-prone California
[EB/OL]. Feb.2019, Aug.2019.
A Novel Architecture of Air Pollution Measurement Platform Using 5G and Blockchain for Industrial IoT Applications
[J].
Hierarchical Blockchain Architecture for a Relaxed Hegemony on Cadastre Data Management and Update: A Case Study for Turkey
[C]∥
Application of Block Chain Technology in Geological and Mineral Industry Informatization
[D].
区块链技术在地矿产业信息化中的应用研究
[D].
A Discussion of Blockchain Application in the Intellectual Property Protection of Geological Big Data
[J].
区块链技术在地质大数据知识产权保护中的应用探讨
[J].
Data Management of University of Geosciences based on Block Chain
[J].
基于区块链的地学大数据管理
[J].
Development, Release and Sharing of Geoscience Data Products
[J].廖顺宝
地学数据产品的开发、发布与共享
[J].
White Paper of YottaChain: Redefining Block Chain Storage
[R/OL]. ,
YottaChain白皮书:重定义区块链存储
[R/OL]. ,
/
〈 |
|
〉 |
