基于系统动力学的开放公共数据价值实现的作用机制研究
作者: 田强 刘岩 于丽静 李金华[摘要]开放公共数据不仅有利于构建数字化法治政府,而且有助于释放数据要素对民众、企业、科研院校等不同利益相关主体的重要价值。基于系统动力学方法对开放公共数据,通过数据流通促进其价值实现的作用机制展开深入研究,重点分析了公共数据的价值实现渠道、价值实现路径与价值实现保障。通过对不同情境下公共数据价值实现过程的仿真模拟发现:政府部门应构建统一、高效、便捷的公共数据开放平台作为其价值实现渠道,并利用平台向社会提供数据资源。公共数据的价值实现路径包括提升民众满意度、构建数字化政府、提高企业数字化能力等,该过程需要不同类型的数据服务商的深度参与。此外,提升数据主体的数据感知力与数据素养,培育良好的数据文化,制定政策法规、加强组织管理等是公共数据价值实现的重要保障。最后根据模拟仿真结果,提出促进公共数据价值实现的建议举措。
[关键词]公共数据;数字化治理能力;数据素养;数据挖掘;数商
一、 引言与文献综述
2019年10月31日,十九届四中全会审议通过的《中共中央关于坚持和完善中国特色社会主义制度、推进国家治理体系和治理能力现代化若干重大问题的决定》首次将数据列为生产要素1。2020年3月30日,《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》提出加快培育数据要素市场,推进政府数据开放共享2。开放政府数据、实现数据价值是政府部门、科研院校、企业、社会组织和公众等多元主体以互利协作为基础,通过利用政府开放数据资源进行增值性开发,使政府数据开放的目标和价值得以现实化的过程和结果[1]。事实上,政府数据不等同于公共数据。公共数据是国家机关、事业单位,经依法授权具有管理公共事务职能的组织,以及供水、供电、供气、公共交通等提供公共服务的组织,在履行公共管理和服务职责过程中收集和产生的数据3。公共数据对外开放为民众、企业、科研机构等不同利益相关主体创造巨大价值,如推动企业数字化转型以促进企业创新[2],促进普通民众与知识工作者的知识创造[3],以及降低城市内区域发展水平差距、促进区域协调发展等[4]。此外,公共数据开放囊括构建统一的政府信息公开处理平台以打破信息壁垒,实现跨部门的数据共享[5]。
目前,学界有关公共数据对外开放的研究尚不全面,多数研究以政府数据开放为研究主题。如针对政府数据开放过程中的数据安全与价值实现的保障机制[6,7],以及政府数据开放过程中价值实现的关键影响因素[1,3,8]。数据、平台、技术成为数字经济时代的基本要素[9],但现有研究成果存在以下不足:其一,未能明晰平台开放数据对公众、企业等不同主体的价值实现路径;其二,未能解释原始数据与数据产品之间的关系;其三,未能从数据挖掘技术视角探究创造数据价值的关键因素。本文为弥补以上研究不足,利用系统动力学模型模拟政府构建公共数据开放平台并利用该平台开放公共数据,通过模拟不同情境下公共数据的价值实现过程,探究公共数据的价值实现渠道、价值实现路径与价值实现保障,为有关部门开放公共数据、释放数据价值提供理论参考。
二、 公共数据对外开放的前提条件
通过梳理相关文献并结合发布的政策文件,本文将公共数据对外开放的前提条件确定为:第一,公共数据的持有权归属政府,因政府占有公共数据的存储载体或实际控制公共数据的访问与处理权限[10]。第二,公共数据的经营权、加工使用权分别归属于数据开放平台、数据服务商。根据《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称《数据二十条》),建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制1。结合北京、上海等地的数据开放情况,政府、数据服务商、平台分别享有上述三种权利。第三,借助数据服务商的深度参与实现数据的匿名化和产品化。根据《数据二十条》,数据商是激发数据要素市场活力的关键角色,主要扮演技术方案提供者、交易合规保荐者和数据价值发现者的角色[11]。根据《全国数商产业发展报告(2022)》,数商包括数据资源集成商、数据加工服务商、数据分析技术服务商等15类[12]。数据的发布可能会导致私人信息泄露[13],但数据加工服务商利用隐私计算、区块链等技术对公共数据可进行匿名化处理以避免隐私泄露,同时利用各类算法模型将数据转化为数据产品,实现“原始数据不出域、数据可用不可见”[11]。
三、 系统动力学模型构建
1. 系统边界与基本假设
系统动力学是一门研究信息反馈系统的科学,适用于研究复杂系统的结构和行为之间的动态关系[9]。公共数据开放受到数据、利益相关者和环境等因素的影响,各因素的相互联系和作用构成了一个生态系统,其特征符合多重非线性信息反馈系统的特点[1],适合采用系统动力学分析方法。
系统行为主要由内部因素决定,模型成功的关键在于合理规划系统边界[1]。本文将公共数据开放系统分为数据资源开放子系统和数据资源价值实现子系统,前者包括无偿与有偿开放的数据资源,后者包括数据资源提升公众满意度、提升政府的数字化治理能力、提高企业的数字化能力、辅助科研院校提升科研成果应用价值以及推动其他组织及个人发展等。基本假设包括:第一,公共数据需借助公共数据开放平台实现数据流通。第二,平台开放数据不包括涉密数据或不符合开放条件的数据。第三,公共数据开放需借助数商的数据挖掘,一是借助数据脱敏对公共数据的某些特定信息进行模糊化处理,防止泄露个人信息、企业经营核心信息、危害国家安全的信息[14];二是利用数据挖掘技术开发数据产品、充分发挥数据价值[15]。特别是利用基于区块链的联邦学习等技术,实现数据的可溯源、不可篡改和加密保护[16]。第四,公共数据实现价值增值时政府部门释放数据价值的意愿会增强,继而将提高公共数据采集率以增加公共数据开放量。
2. 因果关系分析
因果反馈关系分析是系统动力学的重要组成部分[6]。本文利用系统动力学对公共数据价值实现过程进行因果关系分析,借助Vensim PLE软件可构建图1。图1中公共数据借助开放平台对外流通,平台开放数据资源包括原始数据和经过脱敏处理后的数据集以及以“数据应用”形式出现的数据产品。公共数据开放存在泄露公众隐私或商业机密、行政机密等风险,这些风险会降低政府部门释放数据价值的意愿,不利于公共数据的开放及价值实现。图1中主要存在以下反馈回路:
第一,公共数据与公众满意度的因果反馈回路。公共数据→+平台开放数据资源→+公众数据资源获取量→+公众满意度→+数据综合应用价值→+政府部门释放数据价值意愿→+公共数据采集率→+公共数据。此回路反映公共数据增加则平台可开放数据资源增加,公众数据资源获取量增加,由此保障民众的知情权、监督权与参与权,提升政府透明度,从而有助于提升公众满意度。此外,公众数据资源获取量还受到公众数据感知力、平台宣传推广效果以及数商数据挖掘能力、数据混合附合融合程度的影响。其中数商数据挖掘能力代表数商对数据的加工处理程度,数据混合附合融合程度则代表数商加工处理的数据集来自单一部门或多部门。
第二,公共数据与政府数字化治理能力的因果反馈回路。公共数据→+平台开放数据资源→-政府部门间信息壁垒→-政府数字化治理能力→+数据综合应用价值→+政府部门释放数据价值意愿→+公共数据采集率→+公共数据。此回路反映公共数据增加并通过政府部门内部的协同共享,减少跨部门的信息壁垒,提升政府数字化治理能力。该过程同样需要数商的技术加持,因此受到数商数据挖掘能力、数据混合复合融合程度的影响,此外还受到政府部门统筹协调及政府数据素养、政府数据文化的影响。
第三,公共数据与企业数字化能力的因果反馈回路。公共数据→+平台开放数据资源(平台有偿开放数据产品)→+企业利用数据资源→+企业数字化能力→+数据综合应用价值→+政府部门释放数据价值意愿→+公共数据采集率→+公共数据。此回路反映无偿开放的数据资源与有偿开放的数据产品对企业数字化能力的正向影响,该过程还受到企业数据感知力、数据素养与创新能力的影响。企业数字化能力是企业通过利用新一代数字与智能技术,以数据为核心,调动企业内外部资源,推动企业研发设计、生产制造、采购物流、管理决策等环节的数字化变革,从而提高企业绩效的能力[17]。
第四,公共数据与科研成果应用价值的因果反馈回路。公共数据→+平台开放数据资源(平台有偿开放数据产品)→+科研院校利用数据资源→+科研成果→+科研成果应用价值→+数据综合应用价值→+政府部门释放数据价值意愿→+公共数据采集率→+公共数据。此回路反映无偿开放的数据资源与有偿开放的数据产品对科研成果及其应用价值的正向影响,该过程还受到科研院校数据感知力、科研素养及科研成果落地转化率的影响。
第五,公共数据与其他组织及个人发展的因果反馈回路。公共数据→+平台开放数据资源(平台有偿开放数据产品)→+其他组织及个人利用数据资源→+其他组织及个人发展→+数据综合应用价值→+政府部门释放数据价值意愿→+公共数据采集率→+公共数据。此回路反映无偿开放的数据资源与有偿开放的数据产品对其他组织及个人发展的正向影响,该过程还受到其他组织及个人数据感知力与数据素养的影响。其他组织是除政府、公众、企业、科研院校以外的合法组织机构,此外个人也可通过合法合规方式有偿获取数据资源。
第六,平台开放数据资源与平台服务能力的因果反馈回路。①平台有偿开放数据资源→+平台有偿利用数据资源→+平台获利→+平台服务能力→+平台有偿开放数据资源。②平台有偿开放数据资源→+平台有偿利用数据资源→+平台获利→+平台服务能力→+平台开放数据资源→+公众数据资源获取量→+公众满意度→+数据综合应用价值→+政府部门释放数据价值意愿→+公共数据采集率→+公共数据→+平台有偿开放数据资源(平台开放数据资源)。③平台有偿开放数据资源→+平台有偿利用数据资源→+平台获利→+平台服务能力→+平台开放数据资源→-政府部门间信息壁垒→-政府数字化治理能力→+数据综合应用价值→+政府部门释放数据价值意愿→+公共数据采集率→+公共数据→+平台有偿开放数据资源(平台开放数据资源)。上述三条回路均为正反馈回路,回路①反映有偿开放的数据资源促使平台获利增加,由此平台对用于提升自身服务能力的投资建设增加,如数据存储能力扩展、数据查询速度提升、吸纳更多数据服务商等,使平台能够支撑更多公共数据的对外开放。回路②与回路③分别反映平台利用有偿开放的数据产品增强平台获利能力,扩大无偿开放的数据资源以提升公众满意度及政府数字化治理能力。
需补充说明的是,公众、企业、科研院校、其他组织及个人利用公共数据开放平台能够获取有价值的数据资源,在很大程度上受其自身数据感知力的影响,即对数据资源价值量及如何实现价值的感知程度。此外,数据素养是指上述利益相关主体获取、整理、归纳和总结数据并在此基础上推断结论的能力[18],其中政府数据素养是政府及公务员在进行公共事物管理或提供公共服务过程中进行数据处理、数据共享、数据流转和数据分析的能力,政府数据文化则是政府及公务员关于政府开放数据事务的理念及其指导下的行为准则[19]。
3. 系统动力学流图
在梳理完重要变量间的因果关系后,利用Vensim PLE软件构建开放公共数据价值实现的系统动力学模型,如图2所示。
图2中共有3个水平变量和6个速率变量,其余均为辅助变量或常量。系统动力学擅长处理周期性、长期性、数据不足及某些参数或关系难以量化的问题[20-22],此时依然可以以反馈环为基础开展研究[23],这是由于多重反馈环的存在使系统对于大多数参数是不敏感的[24-25]。当前公共数据开放存在明显的数据不足问题,但在合理范围内设定参数仍具有研究意义。本文主要变量的性质、意义、公式、赋值等情况如下:
公共数据存量=INTEG(公共数据增加量-公共数据失效量),水平变量,代表政府所掌握的公共数据,初始值为100000。
平台开放数据资源=INTEG(平台开放数据资源增加量-平台开放数据资源失效量),水平变量,代表公共数据开放平台中无偿开放的数据资源,初始值为60000。
平台有偿开放数据产品=INTEG(数据产品增量-数据产品失效量),水平变量,代表公共数据开放平台中有偿开放的数据产品,初始值为0。因数据产品不同于现有的已开放的公共数据资源,尤其需要经过数商加工处理,故将其初始值设定为0。