中国大数据发展报告
中国大数据发展报告
第一章 全球数字竞争力指数的理论体系与测算方法
2019年,以人工智能、物联网、大数据为代表的新一代信息技术持续保持迅猛发展势头,新应用新业态不断涌现。人类社会正在进入以数字化生产力为主要标志的全新历史阶段,新一轮科技革命和产业变革正在重构全球政治版图、重塑全球经济结构。与此同时,前沿技术的快速发展带来的安全问题日益凸显,传统网络信息安全威胁与新型数据安全挑战愈发严峻,全球大数据发展面临新的挑战。
一、全球经济社会数字化转型新时代
(一)5G商用正式启动,新一代信息基础设施支撑能力显著增强
2019年是5G商用元年,全球多个国家或地区的运营商都在积极推进5G商用部署。截至2019年6月底,全球5G用户已达到203万,已有94个国家共280家运营商开展了5G测试和试验,韩国、美国、瑞士、意大利、英国、阿联酋、西班牙和科威特均已开始提供5G商用服务。中国于2019年6月正式发放5G牌照,运营商开始大规模建设5G网络,首批试点城市将实现5G覆盖,陆续向公众放号。
5G、物联网的建设稳步推进,推动整个数字基础设施更新升级,为全球数字化转型提供基础支撑。5G设备连接密度将比4G提升10~100倍,达到每平方公里数百万个,传感器的大量存在为物联网提供了可能,智慧水务、智慧停车、智慧安防等相关领域将由此受益;5G低延迟和超高速率等特性可支持全部形式的车跟万物的连接(V2X),为车辆自动驾驶提供安全性和可靠性的保障。此外,8K视频传输及AR/VR与5G增强移动宽带结合,将提供更好的画质、更短的时延,优化沉浸式体验。
(二)数字经济实力日益分化,国际规则制定权竞争凸显
当前世界经济正处在动能转换的重要时期,数字经济成为推动经济和社会持续转型的强大驱动力。各国数字经济占GDP比重均呈上升态势,拉动GDP增长作用显著。数字经济已经成为各国提升国际竞争力的重要抓手,加快释放数字技术带来的红利成为各国的共同选择。
与此同时,不同国家或地区在网络普及、信息基础设施建设、技术创新、安全风险防范等方面的发展极不平衡,国际数字鸿沟问题突出,影响和限制了世界各国尤其是发展中国家和不发达国家的数字化转型。数字经济的经济地理没有显示出传统的南北鸿沟,美国和中国发展相对超前,新兴市场国家数字经济虽然取得一定发展,但政策法规相对滞后、传统产业与新技术的“认知壁垒”等问题仍未得到有效解决。
目前,世界主要国家积极通过双边及区域自由贸易协定来推动数字经济发展,其中有部分国家就此达成一致,并意图逐渐将其推广为多边国际规则。例如,日欧经济伙伴关系协定中将电子商务和跨境数据流动作为专门部分进行规定,美墨加协议(USMCA)中制定详细的“数字贸易”规则。据统计,世界范围内约有70个自由贸易协定(FTA)涉及数字贸易规则,双边带动多边趋势明显。但在国际层面制定统一的数字经济通用规则还需要进一步的努力和探索,新兴市场国家在话语权和规则制定权上仍处于劣势。印度、越南等发展中国家虽积极参与世界贸易组织(WTO)有关电子商务的谈判,却由于立场分歧和利益竞争等原因,在数字经济国际规则制定中处于较为被动的地位。
(三)数字政府建设机制逐步健全,建设模式更加开放
随着政府数字化转型推进,传统政府治理中的多头管理、职能交叉、权责不一、效率不高等弊端日益凸显,迫切需要加强政府部门间、层级间的统筹协作,建立跨部门统筹协调机制,提升专业管理和协作能力。在加强统筹协调的基础上,各国政府普遍采取设立专门的数据管理与协调机构、加强专业化协作等措施,积极推进政府内部跨层级、跨部门、跨地域的数字化协同。瑞典成立数字政府管理局,其职能包括组织与实施政府数字化工作,推进各类政务系统、政务数据库的建设和应用。美国政府专门成立“数字政府研究中心”,以期提高数字政府质量。澳大利亚设立维多利亚数据洞察中心,收集整理公共服务数据,与其他政府部门和机构合作开展数据分析项目、推动澳大利亚和各国政府间的数据使用合作。此外,澳大利亚数字化转型局发起了数字化生活社区行动,通过在线论坛、定期会面等线上线下相结合的方式,推动社区公共问题解决。
政企数字政府相关合作进一步深化。企业在技术、资本等方面具有巨大优势,当前越来越多的企业参与数字政府的建设、管理和运行,日益成为推动数字政府发展的重要力量。例如,美国印第安纳州政府采用“建设—经营—转让”(Build-Operate-Transfer,BOT)方式构建网络综合服务系统,即系统前期由企业出资开发和更新运营,并对系统服务收取1%服务费用。若干年后,系统免费转为政府所有。英国广泛采用“建设—拥有—经营”(Build-Own-Operate,BOO)方式来建设政务云,由企业建设和维护云基础设施,政府仅购买其所需的服务,大幅降低了政府的投入和运营成本。
政府依托网络社交媒体和平台,与企业、社会组织等合作提供公共服务,在扩展服务渠道的同时,丰富服务形式,更好地满足社会公众和企业日益增长的信息和服务需求。《2018年联合国电子政务调查报告》显示,使用社交媒体发布信息、提供服务的国家从2016年的152个增加到2018年的177个。美国、欧盟等国家或地区通过与社交媒体或数字支付平台合作,提供生活缴费、信息查询类公共服务。中国的支付宝、微信等网络平台,整合提供社会保险、交通、医疗、环保等大量政务服务和公共服务事项。截至2019年6月,仅支付宝就开通了442项城市的政府服务。
(四)网络战成为新型威慑手段,全球数字空间军事化态势愈演愈烈
当前,大国战略博弈背景下的地缘政治因素日益复杂,网络空间的国际竞争不断加剧。世界各国把网络空间作为国家战略重点和竞争高地,加紧网络安全战略布局,强化网络国防力量建设。同时,网络空间军备竞赛的加剧,致使全球网络空间军事化态势愈演愈烈,世界和平受到新的挑战。
网络空间战略密集出台更新传统战争规则。美国出台《国家网络战略》等多部国家网络相关政策法规,提出使用数字武器保护国家的规定,不断巩固其在数字网络空间的竞争优势。2018年12月,日本政府发布未来十年国防建设的纲领性文件新版《防卫计划大纲》,首次提出“跨域防卫”的国防理念,增强太空、网络等领域的多域联合防卫力量,重点强调加强网络作战快速响应能力及反击能力。2019年1月,法国国防部发布进攻型网络作战条令,将传统军事作战与网络作战结合,通过为传统军事行动提供网络作战支持,实现军事行动目的。
大规模网络军队建设加大战争风险。从全球来看,已有100多个国家成立了网络战部队,国家间网络战风险加大,对网络空间战略稳定构成较大威胁。美国将网络司令部升为一级作战司令部,下属的133支网络任务部队已具备作战能力,同时海陆空等多兵种也不断加强网络国防力量建设。2019年4月,美国陆军成立集网络攻击、情报和打击等于一体的新多域作战部队。日本新版《防卫计划大纲》提出,将扩充网络防卫部队编制,新设网络部队。9月,法国总统签署《2019~2025年军事规划法案》,规定法国政府到2025年将增加上千名网络作战人员,以提高网络作战能力。2019年以来,美欧多国密集开展“军刀卫士19”“网络夺旗191”“网络闪电2019”“2019网络X-Game”“Blue OLex 2019”“水星训练”“锁盾2019”等一系列网络实战演习,参与规模不断扩大、演习领域更加广泛、模拟环境更加复杂。[1]
二、全球数字竞争力评估的理论模型
随着数字化技术的广泛应用和发展,数字资源的开发和利用能力成为全球各国或地区重要的竞争力,综合性、系统性的相关指数测评研究需求持续增长。
(一)数字竞争力评估现状
目前,各国已充分认识到数字化的重要性与必要性,相关权威机构从经济、社会、技术等角度开展了丰富的探索和研究。国际电信联盟较早开展信息技术发展相关测度,自1995年开始发布ICT发展指数,专业性较强;2001年,联合国开始对电子政务发展进行测度,并得到广泛认可;2002年,世界经济论坛开启网络准备度的测算,并提出相关环境、应用和影响测评;欧盟委员会2014年开始测算数字经济发展程度,发布数字经济与社会指数;中国信息通信研究院、赛迪顾问、上海社科院也开展了数字经济指数和数字经济竞争力指数的测评,相关结果被广泛应用。此外,埃森哲、思科等企业也纷纷开展数字社会相关指数测量(见表1)。[2]
表1 全球数字竞争力相关指数
序号 | 发布方 | 指数 |
1 | 国际电信联盟 | ICT发展指数 |
2 | 世界经济论坛 | 网络就绪指数(NRI) |
3 | 中国统计局 | 中国信息化发展指数 |
4 | 欧盟委员会 | 数字经济与社会指数(DESI) |
5 | 经济与合作发展组织 | 全球知识竞争力指数 |
6 | 埃森哲 | 数字化密度指数 |
7 | 哈佛商业评论 | 数字进化指数 |
8 | 国际数据公司 | 全球信息社会指数 |
9 | 思科 | 全球云指数 |
10 | 联合国 | 电子政务指数 |
11 | 联合国 | 全球网络安全指数 |
12 | 罗兰贝格 | 全球智慧城市战略指数 |
13 | 华为 | 全球联接指数 |
14 | 英国开放基金会 | 全球开放数据指数 |
15 | 上海社会科学院 | 全球信息社会发展报告 |
16 | 中国经济信息社 | 全球智能制造发展指数 |
(二)数据价值链理论与模型
数字竞争力评估基于国家或地区数字化发展的价值,评价国家或地区在数字化发展过程中产生的竞争优势以及凭此优势带动其他领域发展的能力。构建数字竞争力指标体系,首先要从数据价值链理论与模型入手,深入研究其内涵,明确数字竞争力的关键因素。
价值链理论是由“竞争战略之父”迈克尔·波特在《竞争优势》一书中提出的,经过不断的发展和应用,已形成相应的管理方法体系。随着全球数字化发展,价值链理论的重心不断转移。北京国际城市发展研究院2017年首次在《大数据蓝皮书:中国大数据发展报告No.1》中提出“数据价值链模型”,将价值链从物理世界延伸到数字网络世界、从线性拓展至网络结构。在此基础上,课题组进一步深化模型理论,提出基于数据价值实现与数字竞争力优势的多维网状结构——“数据价值链竞争模型”(见图1)。该模型包括要素层、价值层、竞争力三个维度。
图1 数据价值链竞争模型
从要素维度来看,数据资源成为驱动经济社会发展的关键要素,成为继土地、资本、劳动力、技术、知识之外的又一核心生产要素。同时,数据与技术、劳动力等其他生产要素的融合发展,推动全要素数字化,为现代化社会经济体系注入新动力。
从价值创造来看,数据价值创造由数据基本价值和数据增值两方面构成。基本价值活动主要包括数据生命周期全过程,如数据采集、数据传输、数据存储、数据分析和数据应用;增值活动主要通过数据流引领技术流、知识流、物资流、人才流,优化资源配置,在各节点的价值增值过程中又会产生更多的新数据,而这些相互关联的价值活动便构成了价值链。同时,催生包含基于政府的全治理链、基于商业的全产业链和基于社会的全服务链的多元价值体系,[1]最终体现为大数据的政用、商用和民用价值。
从竞争优势上看,衡量社会经济产出的生产函数将数据资源纳入其中,即Y=F(A,D,K,L,T)。数据的集聚和流通减弱了传统要素有限供给对社会经济增长的制约,同时,数据推动价值链各个环节的优势资源转换,实现技术、知识、劳动力、土地等资源优化配置,最终为整个经济环境和经济活动带来系统性变化,形成由数字创新、数字安全、数字经济、数字治理、数字服务等关键因素共同作用的竞争优势体系。
(三)数字竞争力的关键因素
数据价值创造和价值传递通过现代信息网络、数字化基础设施、数字平台等载体,最终形成数字竞争优势体系,这些优势相互关联和支撑,其中数字创新和数字安全是基础保障,数字经济、数字治理和数字服务为核心优势。
1.数字创新
大数据、人工智能等新一代信息技术飞速发展,数字创新驱动引领作用日益凸显,数字创新成为数字社会发展进步的重要动力,有力地推动了数字经济、数字治理和数字服务的融合发展。数字化创新下衍生而来的新应用、新产品、新业态层出不穷,各项技术深度融合成为新的发展方向,极大提升创新发展的效率,另外,数字基础设施和数据已成为全球基础性、战略性资源。网络设施向新一代信息基础设施转型升级,更有力地支持数字基础向万物智联发展和延伸。
2.数字经济
数字经济作为推动经济发展的新动能,不断孕育出电子商务、共享经济、科技金融等新模式、新业态。以分享经济的发展成效为例,近年来,以Uber、Airbnb、摩拜为代表的分享经济业态成为热点,从欧美向全球上百个国家迅速扩展,以中国为代表的新兴市场逐渐成为分享经济增长的新动力。全球超过2/3的消费者愿意分享或租赁个人资产。较早的一份资料显示,截至2017年底,全球估值在100亿美元以上的16家“独角兽”企业中,分享经济企业占50%以上。
3.数字治理
以数字引领政府治理的核心是通过推进政府数字化、智慧化转型,助力建设人民满意的服务型政府。构建一体化数据资源体系,整合打通社会运行各方面数据资源,推进面向社会民生重点领域的智慧化应用,聚焦人民群众生产生活和办事创业中的难点、痛点、堵点问题,进一步深化“放管服”改革,推动现代治理体系建设向跨层级、跨地域、跨领域协同管理、协同服务、协同监管的纵深方向发展,切实增强人民群众获得感和满意度。
4.数字服务
数字服务竞争力彰显了数字技术在促进经济发展、科技进步之外,对人民生活最本质的影响。一国数字化能否实现可持续发展,关键在于信息化和网络技术能否为广大人民群众的生活带来切实的便利,因此数字服务竞争力的评估至关重要。数字技术深度融入新时代的生活方式,商业数字化改变销售模式,企业逐步打开网络销售与在线服务的新局面;电子商务改变个人生活模式,网购商品范围的不断扩大使得数字生活成为主流。此外,数字产业与基础教育、医疗等产业的融合速度明显提升,给人民的衣食住行带来极大的便利。
5.数字安全
数字安全是数字化发展的基础保障。近年来,数字安全事件呈持续高发态势,破坏力越来越强,并蔓延到政治、经济、文化、社会等各个领域。木马和僵尸网络攻击事件居高不下,恶意程序数量稳中有降,勒索病毒猖獗,高级持续性攻击活跃。同时,数据泄露的总损失、人均损失和规模均呈逐年上涨的趋势。《2018年数据泄露损失研究》显示,2018年度单条攻击记录的数据泄露成本平均达到148美元,而被攻击目标通常需要196天的时间才能发现、需用69天来处理,有48%的数据泄露事件是由恶意攻击或犯罪类攻击所造成的。
三、全球数字竞争力指标体系构建
全球数字竞争力指标体系包括理论框架和可操作性指标两部分,理论框架是根据全球数字竞争力评估的理论模型得出的理论评估方向;在理论框架基础上,根据测量对象独特性和数据可获取性,调整形成了适合G20国家和全球重要城市比较的具体可操作性指标。
(一)全球数字竞争力指数理论框架
全球数字竞争力指数理论框架包括数字创新指数、数字经济指数、数字治理指数、数字服务指数、数字安全指数5个一级指标(见图2)。
图2 全球数字竞争力指数理论框架
1.数字创新指数
数字创新指数意在探究数字化领域的创新情况,从创新产出与投入、数字基础设施三个方面进行考察。第一,创新投入包括人才与费用等投入,人才投入衡量了国家或地区在智能化、网络化领域以及数字融合领域的人才储备,创新支出衡量了国家或地区在创新研究上的资源利用情况,尤其是通过创新支出的GDP占比可以反映国家或地区对科技创新的重视程度。第二,数字化产出推动信息技术与科学研究的创新融合成果落地,包括专利、期刊、商标、技术出口等多个方面,从成果价值来衡量一国创新成就的水平;第三,在基础设施和智能设备的基础上,数据驱动的互联网技术能够将云计算、大数据等充分应用于各个产业,重塑产业模式、整合技术创新,积极推动产业互联网等新兴业态的发展。数字基础设施情况主要体现在网络设施、终端设备及互联网普及率等方面。
2.数字经济指数
随着新一代信息技术与经济环境、经济活动的不断融合和发展,原有经济发展模式不断受到冲击,并由此推动经济转型,催生新业态和新经济模式。数字经济指数主要衡量数字产业化和产业数字化。数字产业化,是信息通信技术创新与经济活动的集合带来的数字化转型之路。而产业数字化,是指数字经济与传统产业持续融合,强调了基础产业加入数字技术后带来的产能增加与效率提升。一国或地区数字经济的发展情况可以从数字产业、数字金融、数字贸易三个方面来描述。其中,数字产业指标重在评价数字经济基础发展部分,包括信息产业等的发展状况;数字化不仅颠覆了传统的支付方式,也推动了传统贸易的转型,数字金融、数字贸易是传统经济领域数字化转型发展的代表。
3.数字治理指数
数字技术全面向现代社会渗透,政府作为现代社会运行中的重要参与主体,数字化深刻改变着政府的运作方式和创新模式。数字治理指数主要从治理环境、电子政务、管理成效三个方面进行评估。治理环境包括政府数据开放共享水平和数字政府战略规划两个方面,分别设置全球开放数据指数和数字政府战略规划数量两个指标。电子政务指标下设政务使用电子参与度指数、在线政府指数两个指标,共同度量数字政务体系的完善程度。管理成效由政府效能指数和政府话语权指数构成。
4.数字服务指数
数字技术深度融入新时代的生活方式,数字服务指数衡量一国或地区社会生活水平中信息技术的影响范围与有效程度。数字化从企业、个人、社会等三个层次服务民生。其中,企业服务由企业数字化应用程度衡量;个人服务由个人数字产品和智能家居使用情况共同测度;社会服务是对数字服务民生整体情况的评价,由在线出行、共享住宿等信息社会服务普及程度共同评定。
5.数字安全指数
数字安全指数作为评定国家数字竞争力重要的一级指标,分别从网络安全、设备安全和技术安全三个方面来评估。网络安全方面,国际电信联盟进行全球网络安全指数调查,围绕全球网络安全相关法律、技术、组织、能力建设和合作情况展开全球网络安全情况调查;设备安全指标用每百人拥有的安全互联网服务器数量来衡量,比较的是一国或地区国民平均能够接触到的互联网设施规模;技术安全指标采用一国或地区掌握的信息技术和通信技术来共同衡量一国在维护数字安全方面所具有的能力。
(二)全球数字竞争力指数可操作性指标
1.G20国家数字竞争力评价可操作指标体系
涵盖世界主要经济体的二十国集团(G20)代表着全球数字化发展的前沿,G20国家数字竞争力评价体现了全球主要经济体的数字化发展情况和数字化竞争优势。
表2 G20国家数字竞争力评价可操作性指标
要素层 | 指标层 | 代表指标 |
数字创新 | 人才支撑 | R&D研究人员数量 |
研发支出 | 研发支出占比 | |
专利水平 | 专利申请数量 | |
科研水平 | 科技期刊文章数量 | |
技术产出 | 高科技出口额 | |
网络设施 | 每位互联网用户的国际带宽/LTE、WiMAX覆盖比例 | |
终端设备 | 移动终端用户数 | |
互联网普及率 | 使用互联网的人口占比 | |
数字经济 | 数字产业化 | ICT增加值的GDP占比 |
数字支付 | 数字支付交易额 | |
众筹融资 | 众筹业务交易额 | |
金融电子化 | 数字汇款额 | |
电子商务 | B2C电子商务指数/电子商务市场收入额 | |
数字跨境贸易 | 信息和通信技术产品/服务出口占比 | |
数字治理 | 数据开放共享 | 全球开放数据指数 |
电子参与 | 电子参与度指数 | |
在线服务 | 在线服务指数 | |
政府效率 | 政府效能指数 | |
政府影响力 | 政府话语权指数 | |
数字服务 | 数字化产品 | 电子产品市场额 |
智能家居 | 智能家居市场额 | |
在线出行 | 在线出行收入 | |
社会信息化 | 信息社会指数 | |
数字安全 | 网络安全 | 全球网络安全指数 |
2.全球重要城市数字竞争力评价可操作性指标体系
数字网络空间已经成为城市发展的新领域,数字化为城市发展转型提供新的抓手,也是城市竞争重要的着力点。有必要对全球重要城市的数字竞争力进行评估与分析,为全球城市数字化发展寻找精准切入点提供有益借鉴。
表3 全球重要城市数字竞争力评价可操作性指标
要素层 | 指标层 | 代表指标 |
数字创新 | 人才支撑 | 大学指数 |
科研水平 | 科技文章数量 | |
研发投入 | 研发投入额 | |
数字经济 | 经济竞争力 | 福布斯全球2000强企业占比 |
金融科技发展 | 金融科技使用者占比 | |
数字贸易环境 | 所在地的数字跨境贸易水平 | |
数字治理 | 数据开放共享 | 全球重要城市开放数据指数 |
电子政务 | 电子参与地方在线服务指数 | |
数字服务 | 企业数字化 | 全球信息科技企业TOP 200市值 |
智慧城市 | 智慧城市指数 | |
数字社会 | 社交网络使用率 | |
数字安全 | 数字安全 | 数字安全指数 |
(三)全球数字竞争力指数的数据处理与指标测算
1.数据采集
全球数字竞争力指标体系的数据主要来源于以下三方面:一是官方数据库,包括国际电联数据库、联合国数据库、世界银行数据库等公开数据;二是权威数据报告,如《“开放数据晴雨表”全球报告》《联合国电子政务调查报告》《智慧城市指数报告》等;三是权威研究机构发布的行业数据,如Statista数据、浙大AIF司南研究室与杭州摩西信息科技的金融科技城市数据等。
2.指标无量纲化
全球数字竞争力指数由统计指标、调查指标和合成指标三类构成,需要对指标数据进行无量纲化,使数据具有可比性。为消除各指标间的量纲关系,课题组先对缺失数据进行补充处理,再进行极值无量纲化处理。记各评估指标的原始值为Xi,无量纲化后的值为f(Xi),Xmax为最大值,Xmin为最小值。数值指标的处理如下[1]:
3.确定权重与指数测算
全球数字竞争力指数权重确认采用的方法是德尔菲法,即专家评分法。由专家组依据各项评价指标的重要性程度赋予相应的权数。
全球数字竞争力指数计算采用加权平均法,国家或地区的全球数字竞争力Z(Xn)计算公式为:
Z(Xn)=f(X1)×W1+f(X2)×W2+…+f(Xn)×Wn
其中,f(Xn)为第n项指标得分;Wn为n项指标权重。
四、全球数字竞争力指数的特点
(一)结构体系性
全球数字竞争力指数测度理论体系以数据价值链竞争模型为依据,梳理各要素的含义、定位及内在逻辑体系,构建全球数字竞争力指数的理论框架,确保指标体系的系统性和稳健性。多个维度体系化指标测算,全面完整地反映全球数字竞争力的实际情况,不仅使数字竞争力评价体系更加完备,避免遗漏重要指标,而且调节各要素对数字竞争力总指数的影响力,避免某个具体方面对整体产生过大影响。
(二)指标操作性
构建评价指标体系的最终目的是投入实际应用,因此必须保证评价指标所对应的数据易于采集和量化计算。全球数字竞争力指标体系以理论框架各要素切入,明确各项指标概念和实际计量标准。同时,根据评估对象的实际情况和特点,充分考虑现有数据的可获得性和数据来源的可靠性,尽可能保证指标可采集、可量化和可对比,以便于后续数据收集和计算。
(三)数据代表性
在保证全球数字竞争力指标体系科学、全面的同时,要考虑数据的代表性。一方面,指标体系构建不宜过于烦琐和冗长,需要适当简化指标体系,删除对于评估结果影响很小以及重复测度的指标。另一方面,全球数字竞争力指数理论框架细化至国家和城市层面的数据具有一定的难度和挑战,在理论指标全集无法完全实现的情况下,全球数字竞争力指标需要确保数据的代表性。选取具有典型性的评估对象(G20和重要城市)以确保评价结果具有指导性和借鉴性;同时,需要从烦琐的数据来源中提取可以准确反映评估对象状态的典型指标数据,提高数据的质量。
第二章 中国大数据发展趋势与大数据发展指数研究
2019年,全球主要经济体高度重视以大数据为代表的新一代信息技术在经济、社会和安全等方面的地位和作用,关注其对当前和未来国家核心竞争力与国际政治格局的关键影响。大国间尤其中美之间战略竞争态势更趋激烈,围绕大数据以及相关领域的国家战略布局、产业发展创新和制度建设不断迈向新高度。
一、2019年大数据发展的态势与特征
2019年以来,全球大数据战略、产业、贸易、规则等方面呈现新态势。
(一)国家层面的数据战略布局与竞争持续深入
近年来,各个国家相继出台国家数据战略,力图搭建国家层面的数据治理方案,探索数据开放使用和数据安全的平衡之道。
为了进一步释放数据潜力,推动数据共享,美国在现有立法政策的基础之上,率先制定了国家数据战略。2019年6月,美国白宫行政管理和预算办公室(OMB)发布了《第一年联邦数据战略行动计划》草案,向社会公开征求意见。2019年12月,在充分吸收公众意见的基础上,OMB发布了上述草案的最终版本——《联邦数据战略与2020年行动计划》。以2020年为起始,联邦数据战略描述了美国联邦政府未来十年的数据愿景,并初步确定了各政府机构在2020年需要采取的关键行动。该战略的突出特点在于,美国对数据的关注由技术转向资产,“将数据作为战略资源开发”成为核心目标,其中更是着重提到了金融数据和地理信息数据的标准统一问题。
2019年3月,英国政府发布《解锁数字竞赛》报告。该报告对英国的数字时代建设进行审查时发现,英国数字市场建设面临体制和规则落后、科技巨头垄断和新规则亟须建立的局面。报告建议,英国建立专门的数字市场部门,统筹数字市场相关的战略、制度和法律等方面的建设,以为公民提供更多的选择和创新机会。
2019年10月,中国共产党十九届四中全会提出,健全劳动、资本、土地、知识、技术、管理、数据等生产要素由市场评价贡献、按贡献决定报酬的机制。这是首次将数据与资本、土地、知识、技术和管理并列作为可参与分配的生产要素,体现出对数据在国民经济运行中的作用的认识和理解的进一步深入。
这些国家的数据战略侧重点有所不同,但是相同的是对数据的重视程度继续提升,营造数据驱动的文化氛围,在国家层面逐步形成强大的数据治理能力,充分利用数据为公民、企业和其他组织提供相应的服务,这将对整个国家经济和安全产生深远影响。
(二)先进制造业成为大数据与实体经济深度融合的核心领域
如果说过去时间里,大数据的主要作用是面向个人提供社交、购物、教育、娱乐等服务,那么未来大数据的主战场将是面向各行业,特别是先进制造业领域。当前,新一轮工业革命正在拉开帷幕,在全球范围内各国正在积极布局(见表1)。
2019年2月,德国发布《国家工业战略2030》(National Industrial Strategy 2030),其在时间上承接《德国高技术战略2025》。该战略指出,聚焦机械与装备制造业、光学与医学仪器制造、增材制造等关键行业领域;通过加大国家投入,打造德国的头部企业,保持德国工业的全球竞争力;到2030年,德国工业附加价值占GDP比重提高至25%,占欧盟国家比重提高至20%。几乎与此同时,2019年2月19日,法德经济部长签署《法德关于21世纪欧洲工业政策的宣言》,呼吁制定更加雄心勃勃的欧洲工业战略,明确2030年目标,认为未来的欧洲工业战略应围绕三大支柱建立,同时提出14项实施建议。
如果说,德国代表着工匠模式,在产业链纵向升级方面做到了精益求精和极致化,那么,美国则代表着价值链掌控模式,在重振制造业发展过程中更加重视产业横向升级。2008年国际金融危机之后,美国提出“再工业化”战略,聚焦包括先进制造业在内的前沿领域,推动3D打印、传感器等新技术在各领域的深入应用。同时,美国的市场型创新主体也层出不穷,涌现了谷歌、苹果、特斯拉、亚马逊等大量高科技公司。2019年2月7日,美国白宫网站发布了《美国主导未来产业》,这是一项描绘美国未来产业的发展战略,重点提及了人工智能、5G、量子信息和先进制造等关键技术。该文件是一个纲领性的指导文件,在此基础上美国白宫科技和政策办公室(Office of Science and Technology Policy)陆续出台具体行动计划。
而我国正处于由数量和规模扩张向质量和效益提升转变的关键期,作为制造大国和互联网大国,我国推动工业互联网创新发展,努力形成竞争新优势。2019年11月,国家发改委牵头十五部门联合印发了《关于推动先进制造业和现代服务业深度融合发展的实施意见》,提出了先进制造业与现代服务业融合发展的目标、模式和路径,明确了面向2025年的发展目标,梳理出10种创新业态和发展模式以及10条重点行业领域融合的路径。同月,工业和信息化部印发《“5G+工业互联网”512工程推进方案》,其中“512”是指,未来三年将打造5个产业公共服务平台,在10个重点行业进行内网建设改造,在20个以上典型工业应用场景形成样板工程,最终促成5G与工业互联网融合发展的态势。
表1 全球先进制造业发展战略格局
国家 | 制造业发展战略 | 代表企业 |
美国 | 工业互联网联盟 | GE、波音、IBM、英特尔、思科等 |
德国 | 工业4.0、德国2030 | SAP、西门子、博世等 |
法国 | 新工业战略 | 施耐德电气 |
日本 | 工业价值链促进会 | 三菱、东芝、日立、索尼、富士等 |
韩国 | 互联网+工业 | 三星、ETRI |
中国 | 工业互联网、制造强国战略 | 华为、海尔等 |
资料来源:华夏幸福产业研究院。 |
(三)以5G为代表的数字基础设施建设成为博弈焦点
2019年,韩国、美国、瑞士、英国、意大利、西班牙、德国和中国等国通信运营商陆续推出5G服务,拉开5G商用序幕。2019年,全球已有109个国家的328家运营商开始进行5G方面的投资,27个国家的50家运营商已完成5G基础设施的初步建设。世界主要经济体持续颁布5G扶持政策和规划。美国发布《美国无线通信领导力研发优先事项》《新兴技术及其对非联邦频谱需求的预期影响》两份5G技术报告,推动制定长期的国家频谱战略。欧盟发布《5G挑战、部署进展及竞争格局》,为提高欧洲5G竞争力提出建议。韩国公布《5G应用战略推进计划》,通过减税等措施刺激5G部署。
同时,基于5G技术的数据安全竞争日益激烈。2019年,美国国防部发布《国防部数字现代化战略》,计划组建5G技术专项办公室,以确保美国在网络空间领域的领先地位。法国发布《网络战略》,将开发和部署网络攻击武器,并将拟定新法律,强化对5G网络设施的监管。日本将5G定为国家战略,并在《2020财年防卫预算》中提出将优先提升太空、网络和电磁频谱作战能力,培育网络防御人才,以应对网络攻击。韩国发布《国家网络安全战略》,制定“5G+战略”,以建立网络安全产业发展基础,提高网络攻击应对能力。
(四)数字贸易规则制定开始进入加速阶段
当前,在新一代信息技术助推下的国际贸易正呈现高度数字化的特征,对世界各国产生了巨大影响。一方面,数字贸易更加便捷、高效,提高了全球经济运行效率,在更大范围内释放数字红利。另一方面,数字贸易加剧了全球市场竞争,互联网马太效应通过数字贸易影响着世界经济各个领域。数字贸易成为各国竞争的焦点。
2019年前后,全球数字贸易领域的数字税成为一大焦点。从2018年10月开始,英国、西班牙、法国等国家相继提出对在当地运营的全球性大型科技企业按照2%~3%的比例征收数字税。进入2020年,全球范围开征数字税的国家还在增加。意大利、奥地利、捷克、新西兰和印度等国家都开始对全球互联网巨头征收数字税,税率区间在3%~7%。从全球范围看,谷歌、亚马逊、Facebook等公司是开征数字税后的主要受损者。2019年年中开始,美国的贸易部门基于相关国家的数字税征收情况采取了针对性的措施。欧盟和美国之间围绕数字税进入新一轮博弈之中。
除了数字税之外,跨境数据流动监管是另一个焦点。2019年5月,《欧盟非个人数据自由流动条例》正式生效,同步还出台了关于该条例的实施指南。条例针对欧盟国家在非个人数据流动监管方面做出规定,提出了“自由流动、规则透明、公共安全保留”的基本原则。条例及指南的实施,标志着欧盟在推进数字单一市场构建方面迈出了实质性的一步,这对其他国家或地区在数据流通和保护方面产生了重要影响和示范作用。
围绕数字税和跨境数据流动监管等重点议题,基于全球数字贸易快速发展的形势,急需制定高标准的新规则。2019年1月,世界贸易组织的76个成员在瑞士达沃斯举行的电子商务非正式部长级会议上签署《关于电子商务的联合声明》,中国、美国、日本、欧盟、俄罗斯、巴西等国家或地区共同确认在WTO现有框架基础上,启动数字贸易相关议题谈判。
(五)数据合规性方面的重视程度越来越高
2019年5月25日,旨在保护欧盟公民的个人数据安全、对企业的数据处理提出了严格要求的《通用数据保护条例》(GDPR)实施满一周年。GDPR正式实施之后,引起了全球各国政府的高度重视,并带动一系列相关法律法规的出台。
2019年4月17日,欧洲议会和理事会通过第2019/881号条例(EU),主要内容涉及欧盟网络安全局(ENISA)以及信息和通信技术网络安全认证和废除条例(EU)。旧版网络安全法案(No.526/2013)被取代,欧盟新版《网络安全法》于2019年6月27日正式施行。欧盟新版《网络安全法》是欧盟继《通用数据保护条例》(GDPR)之后又一项重磅数据法律方面的顶层设计,也是欧盟后续出台的《电子隐私条例》《电子证据条例》的制度起点,必将在全球产生广泛的影响。
2020年1月1日,美国《加利福尼亚消费者隐私法案》(CCPA)正式生效,这是最具典型意义的州隐私立法,被称为最严厉、最全面的个人隐私保护法案。法案强调企业和组织在收集使用消费者信息时的责任,对于过去的通过平台收集利用用户信息进行精准营销的商业模式产生了比较大的影响。
2019年,中国发布了《数据安全管理办法(征求意见稿)》,明确了收集、处理、使用个人信息数据以及对其进行有效监管的相关规定。同时,还有其他三项关于数据安全的管理办法相继发布征求意见稿,其中,《儿童个人信息网络保护规定》已正式公布,并于10月1日开始施行。
此外,各国政府强化对科技公司和数据平台的管控,打击网络虚假信息和网络恐怖主义。2019年4月英国政府发布《网络危害白皮书》,首次将政府对社交媒体公司的监管内容具体化,坚决遏制谣言、极端言论、恐怖袭击和网络霸凌等信息和视频的传播。美国发布《保护美国人免受在线审查》行政令,要求联邦通信委员会审查Facebook、推特等社交媒体,以规范社交媒体删除及限制用户内容的行为。加拿大出台《数字宪章》,保护公民在线权益,防范破坏选举和民主制度的网络威胁和虚假信息。新加坡提出《在线虚假信息与操纵规避法案》,授权政府可要求社交媒体公司、新闻机构或个人删除不良内容。澳大利亚出台法律明确,对未能迅速移除暴力内容的社交媒体可处以巨额罚款。日本拟在2020年修改电信企业法,加强对苹果、亚马逊等海外科技巨头的监管。法国、德国、新西兰、日本和印度等18国政府机构和Facebook、亚马逊、谷歌等8家科技公司签署协议,共同打击网络恐怖主义。
二、大数据发展评估与数据价值链模型优化
大数据发展评估的目的在于引起大数据研究者和实践者对目前国内外大数据领域正在发生的关键性变化的关注。从原来的以技术和应用为主向战略布局、产业创新、治理变革、规则竞争、价值发现等转变,而这些变化必然会对区域竞争格局和形态产生重大影响。
(一)大数据的价值本质
正在进行的第四代技术变革,实质上是数字世界与现实世界更加紧密融合的运算模式。作为其中代表的大数据,其价值本质上表现为提供了认识世界的全新思维和手段。通过综合运用感知、计算、建模等技术,在足够的算法和算力的支撑下,对现实世界数字化,构造出与现实世界拥有相同特征和规律的映射数据集合。对这个映射数据集合的观察、分析和预测,将在一定程度上有助于对相应现实世界的认识和理解。
从功能视角来看,大数据的价值主要包括描述、诊断、预测、决策四个递增层次。其中,描述是对物理实体的数字化感知和记录;诊断是通过对事物历史数据的汇集和发掘,找到相应的问题和原因;预测是基于历史数据和相关因素,描绘趋势、预测未来;决策是综合运用描述、诊断、预测等功能对行为进行指导。
同时,数字世界不仅仅是现实世界的镜像,也要接受现实世界的实时信息,更要反过来实时驱动现实世界,进而实现物理空间与数字空间的交互映射。应该说,大数据为人类提供了认识世界、探索世界和改造世界的新思维、新视角和新手段。
(二)数据价值链模型
随着大数据的持续发展和对其认识的持续深入,数据价值链模型所涉及的内容不断丰富,而建立在该模型之上的大数据发展指数也在同步完善。中国共产党十九届四中全会首次提出“健全劳动、资本、土地、知识、技术、管理、数据等生产要素由市场评价贡献、按贡献决定报酬的机制,这是中央首次在公开场合提出数据可作为生产要素按贡献参与分配。数据作为生产要素,其作用愈发为各界所重视,同时,也标志着我国正式进入数据红利大规模释放的时代。
数据在代表现实世界和数字世界的现实域和数字域之间流动,通过描述、诊断、预测与决策等价值发现和创造,对价值链各环节涉及的要素流进行价值增值,形成包含基于政府的全治理链、基于市场的全产业链和基于社会的全服务链的多元价值体系,体现为大数据政用、商用和民用价值,进而推动数字政府、数字经济和数字社会建设(见图1)。
图1 数据价值链模型
三、大数据发展指数的测评重点与体系调整
(一)测评重点与理论体系
基于数据价值链模型的总体构想,大数据发展指数设计思路确定为大数据政用、大数据商用和大数据民用三个方面,进而根据对大数据发展形势的综合认识,形成大数据发展指数的基本框架。
大数据政用发展聚焦数字政府建设领域,从政府数据资源汇集、政务基础设施建设等政府自身数据应用情况,以及通过政策手段引导区域大数据发展等角度进行评价。
大数据商用发展聚焦数字经济建设领域,重点针对数字产业化、产业数字化和数字基础支撑能力建设方面的情况进行评估,通过对数据引领的各类要素的优化配置,实现更高效率的人才、技术支撑,资金和物质流动,以及与其他产业的融合发展。
大数据民用发展聚焦数字社会建设领域,包括基于大数据应用的以政府为主体提供的公共服务、以社会组织和商业企业为主体提供的涉民服务。通过完善信息基础设施、提升公共服务领域的大数据应用能力、降低数字资源使用门槛等,提高公共服务产品供给能力和供给质量。
大数据发展指标体系在构建过程中,还适当考虑了大数据领域的最新进展,包括:地区层面数据治理整体布局与体系设计问题;数字产业领域各界对于工业互联网的关注;区域信息基础设施建设中5G相关项目建设与应用;区域对外大数据合作交流与数字贸易进程推进;数据安全、数据流通中的合规性举措与制度建设进程。
在此基础上考虑区域大数据发展统计指标的可获得性和数据质量,建立由3个要素层和26个指标层组成的大数据发展指数理论指标体系(见表2)。
(二)省域评价体系与市域评价体系的指标调整
从2017年开始进行大数据发展指数测评以来,每年的指标体系都会遵循动态性和稳定性平衡的原则,基于当年的大数据发展重点与基础性指标的变化予以相应调整。
大数据发展指数主要开展面向31个省、自治区、直辖市的省域测评和面向36个大中城市的市域测评。由于省域层面和市域层面大数据发展的内在机理与代表指标的不同,在具体的指标体系设置上,在保持总体评价结构确定的同时也做了差异化处理,进而形成了侧重于总体情况与规模性指标的省域大数据发展评价可操作指标体系(见表3)和侧重于领域进展和项目应用的市域大数据发展评价可操作指标体系(见表4)。
表2 大数据发展指数理论指标体系
要素层 | 指标层 | 指标含义 |
政用指数 | 发展关注度 | 反映地区大数据发展受关注的程度 |
政策力度 | 反映地方推进大数据发展的积极性 | |
试点创新 | 反映地区大数据发展在国家战略中的地位 | |
在线政务 | 反映政府在线服务水平 | |
数据统筹 | 反映地区对于数据进行总体统筹的制度建设、机构设置和落实情况 | |
数据标准 | 反映区域数据标准化工作进展 | |
数据开放 | 反映数据开放程度及开放的公平性 | |
商用指数 | 人才基础 | 反映大数据发展的人才支撑 |
产业规模 | 反映大数据相关产业发展情况 | |
应用惠及度 | 反映地区大数据应用惠及的程度 | |
商业普及 | 反映地区企业数据化水平 | |
营商环境 | 反映地区对新兴产业投资的吸引力 | |
网络安全 | 反映大数据运行保障能力 | |
科技投入 | 反映大数据发展的科研支撑 | |
吸纳就业 | 反映大数据发展潜力和持久力 | |
创业创新 | 反映地区创业创新活力 | |
工业融合 | 反映大数据与工业融合程度 | |
商业融合 | 反映大数据与商业融合程度 | |
数据流通 | 反映地区数据交易规模和规范程度 | |
数字贸易 | 反映地区数字贸易规模 | |
民用指数 | 终端普及 | 反映个人数据采集的便利化 |
网络基础 | 反映网络信息基础设施的建设情况 | |
5G网络 | 反映地区5G网络覆盖率 | |
服务通达度 | 反映政府利用大数据提供公共服务的能力 | |
数字技能 | 反映居民数字素养 | |
消费能力 | 反映公众对信息消费的承受能力 |
表3 省域大数据发展评价可操作指标体系
要素层 | 指标层 | 具体指标 |
政用指数 | 社会关注度 | “大数据”热度 |
政策力度 | 大数据相关政策发布数 | |
试点创新 | 是否有大数据综合试验区 | |
区域影响力 | 是否举办国家级大数据相关会议 | |
数据开放 | 是否上线数据开放平台 | |
商用指数 | 产业规模 | 软件和信息技术服务收入占GDP比重 |
应用惠及度 | App应用的网民占全国网民的比重 | |
商业普及度 | 每百家企业拥有网站数 | |
科技投入 | 规模以上工业企业R&D经费占GDP的比重 | |
创业创新 | 高新企业新产品销售收入 | |
工业融合 | 工业互联网企业数占全国比重 | |
商业融合 | 有电子商务交易活动企业占全国比重 | |
民用指数 | 终端普及率 | 移动电话普及率 |
网络基础 | 人均移动互联网接入流量数 | |
服务通达度 | 是否上线政务服务App | |
数字技能 | 人口平均受教育年限 | |
消费能力 | 居民交通通信支出占总消费支出的比例 |
和上年相比,省域大数据发展评价可操作指标体系进行了微调,部分修改内容为:政用指数删掉了“在线服务”,增加了“区域影响”;商用指数删除了“人才基础”和“网络安全”。
表4 市域大数据发展评价可操作指标体系
要素层 | 指标层 | 具体指标 |
政用指数 | 社会关注度 | “大数据”热度 |
政策力度 | 大数据相关政策发布数 | |
数据开放 | 是否上线数据开放平台 | |
在线政务 | 政务服务能力 | |
数字政府 | 数字政府服务能力 | |
商用指数 | 人才基础 | 信息传输、计算机服务和软件业从业人员 |
产业规模 | 电信业务总量 | |
营商环境 | 城市营商环境 | |
吸纳就业 | 高附加值行业就业情况区位熵值 | |
创业创新 | 双创指数 | |
工业融合 | 工业互联网企业数 | |
民用指数 | 终端普及率 | 人均移动电话数 |
网络基础 | 互联网宽带接入率 | |
服务通达度 | 智慧城市影响力 | |
移动支付 | 移动支付发展指数 |
和上年相比,市域大数据发展评价可操作指标体系删除了两个指标,增加了一个指标。其中部分修改内容为:政用指数删掉了“示范项目”,增加了“数字政府”;商用指数删除了“网络安全”。
四、 2020年中国大数据发展趋势与展望
(一)信息消费提质升级趋势加快
信息消费已经渗透到衣、食、住、行、娱各个层面,是网络消费的重要表现形式。在2020年的新冠肺炎疫情期间,居家隔离带动了在线娱乐、在线教育、在线办公、远程医疗等新模式新业态的发展。线上线下融合的全场景信息消费比例持续提升,逐步拓展了网络消费新空间。随着疫情得到有力控制,经济社会生产恢复正常,教育、医疗、办公等庞大的在线化市场需求将吸引大量社会资本涌入,有望催生出像微信、滴滴等一样的超级应用。同时,2019年我国GDP达到99.1万亿元,接近100万亿元人民币;按平均汇率折算,人均GDP达到了10276美元,突破了10000美元大关。根据国际上已有实践与理论研究,人均GDP达到10000美元左右,消费结构会发生重大转变,从生存型转向发展型、从数量型转向享受型。消费能力的提升带动消费层次从“有”加速向“好”、从实物向服务转变的趋势日益明显,智能化、信息化、体验式消费成为新趋势。信息技术创新迭代与新型消费需求迸发相互叠加,产生巨大的聚合和倍增效应,进一步释放“信息+消费”潜力,是中国经济稳定运行的有效方式。
(二)工业互联网建设进入高速发展新阶段
2017年以来,《关于深化“互联网+先进制造业”发展工业互联网的指导意见》《工业互联网发展行动计划(2018~2020年)》《工业互联网综合标准化体系建设指南》等相继出台,工业互联网创新发展政策环境不断完善,带动各方面建设取得积极进展。初步形成以五大国家顶级节点为核心、二级节点加快布局的标识解析体系。2019年三季度末,全国除5个国家顶级节点外,二级节点已建立21个,同时实现了超过1亿个的标识注册量。工业互联网平台供给能力不断提升,截至2019年年中,形成超过50万家的平台数量,其中重点平台的平均工业设备连接数近60万台。工业互联网成为备受关注的领域,但在一定程度上存在“政热企冷”的情况,在企业设备和数据连接方面,政府表现得更为积极,而企业由于各种原因和限制条件,接受程度还较低。此次新冠肺炎疫情的发生也许会在某种程度上助推部分传统企业数字化改造提升,通过引进生产设备、进行自动化升级,改革用工模式、建设人机混线工作环境,提升管理效率、提高工人技能等,推动产业数字化转型从而实现跨越式发展。
(三)“一带一路”沿线国家数据合作机制逐渐形成
在全球贸易领域,以传统贸易为主体形成的贸易便利化、非歧视待遇的贸易规则已经相当完善,而当前面对数字贸易,以跨境数据流动、数字关税、知识产权保护等为主要内容的新一代贸易规则正在逐渐形成。当下以及未来的一段时间里,围绕跨境数据流动与本地化监管、数字税征收的平台化和属地化等的争议,将成为国家间在数字贸易领域的博弈焦点。在国际数字贸易规则重构的关键时期,各国均在争取规则制定的主导权。其中一个重要的动向就是通过国际协议、自贸区协议等机制建立由主要经济体主导的“朋友圈”。当前,“一带一路”建设进行得如火如荼,参与其中的国家或地区也越来越多。在区域合作的框架下,中国将积极推动数字丝绸之路建设,强化大数据领域的国际合作,完善互利共赢的跨国数据合作机制,与沿线国家共享数字红利,积极促进数字经济背景下人类命运共同体的构建。
(四)治理科技在政府治理领域应用更广泛
治理科技是由新一代信息技术驱动的治理创新,是国家治理体系和治理能力现代化的重要内容和基础支撑,是科技强国和现代化强国的重要标志。近几年,政府治理一直是治理科技发挥重要价值的主战场,开始应用于经济发展决策分析、智慧社会治理、主动预见式公共服务等方面。然而,就效果和深度而言,当前治理科技应用尚处于初级阶段。此次新冠肺炎疫情是在互联网高度发达、“人人互联”的背景下发生的,广大网民和网络媒体每天24小时关注疫情动向,防疫物资供应、防疫物资调配等均在公众视野下,政府应急能力、治理能力全面接受社会舆论监督。未来,强化治理科技应用,利用大数据手段完善政府治理体系、提升政府治理能力的需求将更加凸显。
(五)数权立法工作亟待提上国家立法议程
随着对数据价值的认识逐渐加深,越来越多的国家和区域,围绕数据开放、个人信息和数据安全等数据治理要素开展法制建设。然而,我国的数据治理体系远未形成,数权的法律地位尚未明确,成为制约大数据发展的重要瓶颈。如果仅仅是立足现有法律框架和体系的修补和拓展,则容易造成系统性和一致性缺失。大数据治理须从数权确认的源头入手,予以全面、系统化考虑。中国共产党十九届四中全会《中共中央关于坚持和完善中国特色社会主义制度 推进国家治理体系和治理能力现代化若干重大问题的决定》提出,将“数据”作为生产要素之一,参与分配。数据的财产性在生产要素层面、审计层面的确立,也会推动数据在产生阶段就开始进一步严格确权。这一重大理论突破有望推动数权法等相关立法工作的进程加速,明晰数据的法定权益,促进数据共享开放以及多领域数据的融合应用。
(六)个人信息和数据保护的综合立法时代即将来临
我国围绕个人信息和数据保护出台了一系列法律文件,如《侵权责任法》《电子签名法》《居民身份证法(2011修正)》《关于加强网络信息保护的决定》《中华人民共和国网络安全法》等,在推动大数据发展方面发挥巨大作用。但不可否认的是,从法律体系方面来看,我国的数据安全法律法规仍不够完善,存在缺乏综合性统一法律、缺乏法律细节解释、保护与发展协调不够等问题。如何从更加体系化和一致性的角度出发,制订专门的数据安全法、个人信息保护法是必要的。2018年,十三届全国人大常委会立法规划中的“条件比较成熟、任期内拟提请审议的法律草案”包括《个人信息保护法》《数据安全法》两部。2019年,《数据安全管理办法》《个人信息出境安全评估办法》相继对外发布征求意见稿,并完成相关程序。这一切都意味着,我国个人信息和数据保护的综合立法时代即将来临。
(七)大数据与区块链深度融合构筑数字社会信任基础
中央政治局第十八次集体学习提出,加快区块链和大数据等深度融合,推动集成创新和融合应用。基于共识机制和智能合约等多种技术的区块链,作为一项影响深远的集成创新,提供了一种在存在诸多安全和稳定隐患的互联网中进行信息与价值传递交换的可信通道,开创了一种在不可信、不可靠、不可控的竞争环境中低成本建立信任的新型计算范式和协作模式。大数据和区块链在技术和应用方面具有很好的互补性,一方面区块链可以在一定程度上解决数据确权难、数据孤岛严重、数据垄断等“先天病”,另一方面隐私计算技术等大数据技术也反过来促进了区块链技术的进步。伴随着主权区块链等技术的创新升级形态的出现,区块链的应用方向和领域不断拓展,将与大数据、人工智能等技术深度融合,成为未来数字社会的重要基石。
(八)中国大数据技术生态亟须完善
近年来,大数据的各环节技术进步明显,但技术体系尚不完善。需要注意的是,我国在大数据技术领域存在“空心化”和“低端化”的迹象,特别是在基础理论、核心硬件和算法开发等方面,仍明显落后于世界领先国家。同时,我国对大数据技术生态方面的自主性、影响力和控制力较弱。在大数据相关工具和系统方面,主要依赖国外开源社区。在大数据时代,软件开源和硬件开放已成为不可逆的趋势,掌控开源生态,已成为国际产业竞争的焦点。国内有识之士建议,国家在开源相关政策法规和开源基金会制度建立方面应给予支持,引导市场主体成为中国大数据技术生态中的核心力量,一方面对国外开源社区积极融入、争取话语权,另一方面打造以国内力量为核心的自主可控开源生态,逐渐成长壮大。
(九)大数据龙头企业马太效应愈加明显
中国计算机学会(CCF)大数据专家委员会从2013年开始每年都要进行大数据发展趋势单项调研,对于“我国大数据发展的最主要推动者来自于?”这一问题,2015年的答案包括大型互联网公司、政府机构、国内大学和科研院所、公共服务机构和创业企业,而到了2020年,同样的问题但答案只剩下大型互联网公司和政府机构。总体看来,市场份额向大数据龙头企业的汇集趋势明显。阿里、腾讯、百度、华为、京东、浪潮、联想等大型公司从2013年前后就开始积极布局大数据市场,一方面充分利用自身积累的数据形成规模优势,另一方面围绕产业链各个环节,通过资本运作和业务联系不断拓展发展空间,初步形成了贯穿大数据产业链的业务闭环。目前这些大型公司已经在基础支撑、数据服务、联合应用、运营服务等多个方面形成综合优势,市场占有率不断提升,进一步挤压了独立大数据厂商的市场空间。
(十)大数据行业人才结构性缺口依然较大
从2016年起,国内高校开始增设“数据科学与大数据技术”专业,意味着国家为培养大数据人才加快布局。截至2019年年中,教育部正式批复的各类院校中,474所本科院校设立“数据科学与大数据技术”专业、30所本科院校设立“大数据管理与应用”专业、399所高职院校设立“大数据技术与应用”专业。然而,由于学科建设的周期与行业快速更新之间的差距,在大数据人才供给总量爆发式增长的同时,人才结构性缺口较大的情况依然存在。猎聘发布的相关调查报告显示,中国人工智能人才缺口超过500万,大数据人才缺口高达150万。
第三章 中国大数据法治进展与大数据法治指数构建
随着科学技术的发展,各类信息化的手段已经逐渐融入人们生活的方方面面,在现代社会生活中会产生各种各样的数据,海量的数据汇聚催生了大数据时代的到来。在大数据时代,利用数据的跨界、融合、开放、共享可以创造更多的价值,让人们看到改变未来的新力量。但同时,开放数据和数据流动又带来了很多风险,因此,数据保护日益受到人们的重视,而国家法治是数据保护的基石。近年来,发达国家不断探索大数据法治发展路径。美国在个人隐私保护、网络数据安全、国家数据安全等方面颁布了一系列相关法案,如《加利福尼亚州消费者隐私法案》《上市公司网络安全披露指南》《澄清域外合法使用数据法》等,其中2018年通过的《加利福尼亚州消费者隐私法案》被认为是美国当前最严格的消费者数据隐私保护立法。欧洲发达国家从数据立法、个人信息、互联网安全等角度,纷纷制定了一系列重要法律,如英国的《数据保护法案》、德国的《联邦数据保护法》、法国的《数字共和国法案》、欧盟的《一般数据保护条例》和《非个人数据自由流动条例》。大数据法治的发展成为大数据研究中的重要议题。而我国的大数据法治环境一直处于探索阶段,研究我国大数据法治状态,不仅有利于护航大数据的进一步发展,也是我国完善社会主义法治体系的有力支撑。
一、中国大数据法治的发展进程
(一)中国数据和信息保护立法现状
数据和信息是相辅相成的,数据在一定条件下可转化为信息,两者的关系,从宏观上看并无实质意义,但可从微观上予以区分。例如,数据保护重点是保护当事人的数据免受侵害,是为了保护个人以数据形式存在的个人信息,而非个人全部信息。对于数据安全的立法在我国往往以信息安全的形式体现,从计算机普及开始,早在1994年我国就制定了《中华人民共和国计算机信息系统安全保护条例》,这是我国第一部信息保护条例。从此以后,随着网络技术的不断进步,有关网络安全保护、网络信息服务、网络社会管理的各类法律条文相继出台(见表1、表2)。但从表1和表2中可以看出,从内容上,我国法律法规的内容倾向于互联网管理、个人信息保护、网络安全或与网络密切相关的其他领域方面,如《中华人民共和国电子商务法》,这类法律多数通过规范行业行为来达到保护信息安全的目的。
表1 我国信息保护法律法规(1994~2012年)
年份 | 法律法规 | 效力级别* | 备注 |
1994 | 《中华人民共和国计算机信息系统安全保护条例》 | 行政法规 | 2011年修订,现行有效 |
1996 | 《中华人民共和国计算机信息网络国际联网管理暂行规定》 | 行政法规 | 1997年修正,现行有效 |
1997 | 《计算机信息网络国际联网安全保护管理办法》 | 行政法规 | 2011年修订,现行有效 |
2000 | 《全国人民代表大会常务委员会关于维护互联网安全的决定》 | 法律 | 2000年12月28日第九届全国人民代表大会常务委员会第十九次会议通过 |
《中华人民共和国电信条例》 | 行政法规 | 2014年第一次修订,2016年第二次修订,现行有效 | |
《互联网信息服务管理办法》 | 行政法规 | 2011年修订,现行有效 | |
2001 | 《外商投资电信企业管理规定》 | 行政法规 | 2008年第一次修订,2016年第二次修订,现行有效 |
《计算机软件保护条例》 | 行政法规 | 2011年第一次修订,2013年第二次修订,现行有效 | |
2002 | 《互联网上网服务营业场所管理条例》 | 行政法规 | 2011年第一次修订,2016年第二次修订,2019年修正,现行有效 |
2004 | 《中华人民共和国电子签名法》 | 法律 | 2015年第一次修正,2019年第二次修正,现行有效 |
《互联网等信息网络传播视听节目管理办法》 | 部门规章 | 已被修订 | |
2006 | 《信息网络传播权保护条例》 | 行政法规 | 2013年修订,现行有效 |
2007 | 《互联网视听节目服务管理规定》 | 部门规章 | 已被修订 |
2009 | 《外国机构在中国境内提供金融信息服务管理规定》 | 部门规章 | 现行有效 |
2011 | 《互联网文化管理暂行规定》 | 部门规章 | 2017年修订,现行有效 |
《规范互联网信息服务市场秩序若干规定》 | 部门规章 | 现行有效 | |
2012 | 《全国人民代表大会常务委员会关于加强网络信息保护的决定》 | 法律 | 2012年12月28日第十一届全国人大常务委员会第三十次会议通过 |
注:“*”行政法规的效力仅次于宪法和法律,高于部门规章和地方性法规。 |
表2 我国信息保护法律法规(2013~2019年)
年份 | 法律法规 | 效力级别* | 备注 |
2013 | 《电信和互联网用户个人信息保护规定》 | 部门规章 | 现行有效 |
《信息安全技术公共及商用服务信息系统个人信息保护指南》 | — | 我国首个个人信息保护国家标准 | |
2014 | 《国务院关于授权国家互联网信息办公室负责互联网信息内容管理工作的通知》 | 国务院规范性文件 | 现行有效 |
《网络交易管理办法》 | 部门规章 | 现行有效 | |
2016 | 《中华人民共和国网络安全法》 | 法律 | 现行有效 |
《网络出版服务管理规定》 | 部门规章 | 现行有效 | |
2017 | 《互联网信息内容管理行政执法程序规定》 | 部门规章 | 现行有效 |
《互联网新闻信息服务管理规定》 | 部门规章 | 现行有效 | |
《互联网域名管理办法》 | 部门规章 | 现行有效 | |
2018 | 《中华人民共和国电子商务法》 | 法律 | 现行有效 |
2019 | 《中华人民共和国密码法》 | 法律 | 2020年1月1日施行 |
《儿童个人信息网络保护规定》 | 部门规章 | 现行有效 | |
《区块链信息服务管理规定》 | 部门规章 | 现行有效 | |
《网络信息内容生态治理规定》 | 部门规章 | 2020年3月1日施行 | |
注:“*”行政法规的效力仅次于宪法和法律,高于部门规章和地方性法规。 | |||
资料来源:北大法宝,法律法规数据库,度小法百度搜索。 |
此外,从表2可以发现,2016~2019年,国家出台的法律、行政法规和部门规章中,进一步强调了信息安全的细分领域,包括新闻、商务、儿童信息安全等,这是我国信息安全保护深层次发展的具体体现。同时,我们也看到,虽然我国尚未出台一部专门明确数据保护的法规,但是,关于大数据领域中区块链信息服务管理、网络信息内容生态治理等方面已经制定相关规章,进一步推动了我国大数据法治体系的建设。
(二)大数据给我国法治环境带来的挑战
目前,大数据发展给我国法治环境带来如下挑战:首先,公民个人信息和数据的法律保护被提到了十分重要的位置,但缺少专门的个人信息保护法。在大数据快速发展同时,个人数据信息被数据管理者滥用的违法现象突出,有关个人信息泄露、非法收集、占用、出售等情况十分常见。在我国,对公民信息和个人数据的保护是从刑法开始的。2009年《中华人民共和国刑法修正案(七)》第二百五十三条、第二百八十五条分别对侵犯个人信息、非法侵入计算机系统等违法行为增加了法律约束,2015年《中华人民共和国刑法修正案(九)》第二百五十三条之一中,对侵犯公民信息主体由特殊主体修改为一般主体,并加强了惩罚措施。同时,《中华人民共和国民法通则》《中华人民共和国侵权责任法》也在个人信息保护方面提供相应的法律保护基础。可见,我国对于个人信息保护十分重视,但暂未出台专门的法律对其进行保护和规范。其次,数据交易的日益频繁对我国大数据法治提出了更高的要求。关于数据交易,涉及数据权属和个人隐私数据的搜集以及保护问题,国外法律实践是在数据搜集过程中执行相应的规定和限制条件,并设立相应的数据保护权利和义务,我国在数据交易领域还需要更多的理论研究和实践支撑。另外,跨境数据的流动加速,与其他国家分享和交易数据日益频繁,对于跨境数据资源管理和保障,我国尚缺少应对机制。
(三)大数据立法工作进入新发展阶段
我国大数据立法工作虽尚未形成完整体系,但也在稳步推进。在数据立法方面,还有很多需要探索和研究的未知事物。同时,也可以看到,无论从现有法治基础,还是政协委员频繁提议,大数据法治建设都已成为大势所趋。个人信息保护方面,2017年5月8日,最高人民法院和最高人民检察院联合发布了《关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》,为公民个人信息保护提供更为精准的法律依据。2019年10月1日实施的《儿童个人信息网络保护规定》,是对儿童网络信息保护单独立法,而不仅仅散落在其他法律中,这标志着我国对网络信息安全的重视和相关立法的探索。大数据领域方面,国务院从2015~2016年发布了3部以大数据为关键词的国务院规范性文件,分别是《国务院关于印发促进大数据发展行动纲要的通知》(国发〔2015〕50号)、《国务院办公厅关于运用大数据加强对市场主体服务和监管的若干意见》(国办发〔2015〕51号)、《国务院办公厅关于促进和规范健康医疗大数据应用发展的指导意见》(国办发〔2016〕47号),从行政角度推动了我国大数据产业的发展,加快了大数据立法的步伐。据统计,[1]四年来,以大数据为关键词的部门规章达到60余篇,涉及大数据跨领域合作、大数据创新发展、大数据安全保护等多个方面。随着全国人大常委会第四十四次委员长会议结束,2020年我国的立法预先工作已经完成,其中提到,加强重要领域立法,加快制定监察官法、个人信息保护法、数据安全法、乡村振兴促进法、社会救助法、法律援助法等,这是信息安全和数据安全立法的一个强烈信号。未来,随着大数据应用的不断深入,我国大数据法治建设将进入新的发展阶段。
(四)大数据法治指数是大数据法治发展评估的必要手段
以“法治”为核心来对我国大数据发展的状况进行研究,是因为我国大数据发展正面临着法治关口。判断我国大数据法治发展阶段,仅依靠国家立法和相关政策梳理是远远不够的,需要对我国大数据法治进行评估。传统意义上的法治评估,可以理解为法治的评估或评估法治,这就牵扯出了两个概念:“法治”和“评估”。“法治”这一词条在《牛津法律指南》中特别声明,“一个无比重要的,在内容上却未曾被界定甚至是不可能被界定的概念”,因此,“法治”是迄今为止业界也没有完全适用的“评估对象”的概念。法治指数是法治的量化评估体系,“指的是在理论和实践的结合意义上建立并运用以对一个国家、地区或者社会的法治状况进行描述和评估的一系列相对比较客观量化的标准”[2]。狭义上说,中国大数据的法治,指的是在我国大数据产业发展过程中起到规范作用的法律法规和行政规范,以及数据信息保护相关的立法计划和调研项目所形成的适用于我国大数据发展的法治环境。广义上说,中国大数据法治,不仅指的是大数据涉及的法律法规,还包括中国法治改革中大数据的应用发展程度,包括法院信息化改革、智慧司法建设等。大数据的法治评估强调的是对大数据的法律化治理和大数据在法治中的应用层面等方面的系统性定量或定性评价。
二、大数据法治指数的构建思路
研究大数据法治指数,通过对大数据法治概念的理论分析、概念拆解、概念赋值、数据收集、数据量化以及趋势分析,得到一个相对客观并且具有可比性的大数据法治发展现状评估。结合我国大数据法治的现状和形成,本文采用数据立法、数字司法和数权保护三个维度对大数据法治进行评估。
(一)数据立法前瞻性的研究
大数据是基于海量数据的集合,并且时刻处于流动变化中,从传递数据到交换价值再到共享秩序,互联网经历着从信息互联网到价值互联网的演进过程。数据在各种连接中流动,表现状态的无边界很多时候让我们对数据流不可确权、不可定价、不可追溯、不可监管。在数据开放、数据流动和数据应用过程中,数据安全失防、数据利用失衡以及数据规则失序等问题,影响了大数据价值挖掘,对数据安全和个人信息安全也造成了困扰。因此,强化数据安全治理,加强数据立法等数据约束性机制建设,需要从多个角度进行完善。而这种规则的建立,不仅要在技术层面上,更要在制度层面上。在我国的法治体系中,数据立法面临着数据权属确定等一些问题,如“所有权”中占有权和处分权在数据领域中的适用性问题等。因此,在平衡数据安全和数据流动价值的基础上,加强数据主体权利的保护及对数据控制者、处理者义务的法律界定,是我国数权立法面临的首要和迫切问题。[1]
(二)数字司法便捷性的研究
数字司法,是司法工作与大数据、人工智能、物联网等技术手段的深度融合,是司法体制改革的重要内容。党的十八大以来,我国司法系统不断推动信息化、数字化、网络化建设,“智慧法院”“智慧检务”建设工作已经列入了国家信息化发展战略。中国数字司法建设取得了令人瞩目的成绩,不仅法院系统内部完成了从下至上的数据汇聚,而且逐步实现吸收系统外的数据,法院实现了从简单数据处理到复杂报告分析的飞跃。[2]在司法领域,分析案件时应用大数据技术,能从大量的案件中总结出各类案件的规律,基于规律对案件进行识别和发现,既可做出相应的预判,也可通过案例比对减少错判、误判的情况发生。另外,采用数据模型算法,可以寻找到不同案件之间的关联性,在寻找案件线索时,这种关联性有助于案件的快速解决,大幅提高办案和审判的效率。大数据打破了司法领域的内部数据壁垒,形成数据资源共享,司法数据的公开也使得司法系统与社会行业之间相互联系,提升了司法活动的协作性,推动司法模式的改革,便于数据资源一体化发展。
(三)数权保护泛在性的研究
数据收集、分析和使用等活动在过去是小范围的、可控的,对社会影响较小,但随着互联网、大数据、云计算等的快速发展,一方面改变了社会的管理模式,另一方面给社会生活尤其是信息安全带来前所未有的威胁。数权保护具有泛在性,在大数据时代信息安全问题无时无刻不存在,其中信息涵盖了身份信息、财产情况、社交状况甚至网页浏览记录等,数据收集者基于对个人信息的搜索,如位置信息、网页浏览偏好、信用信息、兴趣爱好等,只要样本数据量足够,就能获得个人的生活情况、财务情况、消费情况、社交和健康情况等,进而获得相应的利益。同时,信息的传播和存储功能,已经让人们失去了选择的权利,网络数字技术让网络上的一切活动,无论是个人还是企业各项活动,都被永久记录在网络上不被删除,留下的数据有时候并不被数据生产者所掌握。我国的数权保护尚缺乏系统性法律法规,多散落于现有法律条款之中。随着数据时代的发展,平衡数据保护和共享的问题已成为数权保护的重要议题。
三、大数据法治指数研究的评估维度
由上述分析可知,大数据法治指数考虑从数据立法、数字司法和数权保护三个维度进行评估。首先,数据立法方面,主要考虑地方政府出台的相关政府规章和规范性文件,这些文件规范了当地大数据领域的各类问题,是构建我国大数据法治体系的基石;其次,数字司法方面,考虑司法信息化建设中互联网法院和智慧检务建设情况;最后,数权保护方面,从社会层面选取法律援助相关信息,以及政府和社会对数据安全、信息安全的关注度。在此三个维度基础上,大数据法治指数又从以下几个方面进行研究。
(一)立法活跃度
立法活跃度是用来表现我国在大数据相关领域立法的频率和关注度,并以此来预测我国以及各省级单位大数据法治的现有状况和未来立法趋势。现有地方性法规数量以及人大常委会立法计划是我国法律法规动态的重要体现。在我国的立法释义中,地方性法规是指法定的地方国家权力机关依照法定的权限,在不同宪法、法律和行政法规不相抵触的前提下,制定和颁布的在本行政区域范围内实施的规范性文件。地方性法规的内容涉及了地方政治、经济、文化、卫生、民政、资源和环境保护等社会生活各个方面,是宪法和法律在地方贯彻落实的重要体现。人大常委会立法计划主要是指拥有立法权的地方人大及其常委会根据本地经济社会发展情况,将立法与当地实际紧密结合,为地方改革发展提供法制保障的前瞻性计划。
(二)省级政府文件导向性
省级政府文件导向性是预估某地区在某一领域政策导向的重要指标。通过对地方政府规章和行政规范性文件的数量和导向研究,粗略地判断政府施政的重点。地方政府规章是指由省、自治区、直辖市和较大的市的人民政府根据法律和法规,按照法律规定的程序,所制定的普遍适用于本行政区域的规定、办法、细则、规则等规范性文件的总称,是法律、法规的补充形式。行政规范性文件是指除国务院的行政法规、决定、命令以及部门规章和地方政府规章外,由行政机关或者经法律、法规授权的具有管理公共事务职能的组织依照法定权限、程序制定并公开发布,涉及公民、法人和其他组织权利义务,具有普遍约束力,在一定期限内反复适用的公文。地方政府规章和行政规范性文件均是政府公信力的直接体现,既是落实国家相关政策法律法规的载体,又是政府发挥职能作用、指导本区域改革发展的灯塔。
(三)市级政府文件导向性
市级政府文件导向性主要指某一省会城市落实该省某一领域政策的制定导向。市级政府文件相对于省级层面,更具开拓性,易形成试点示范。在省级层面上,政策更具方向性和指导性,而在市级层面上,政策会更加聚焦和具体,因此,在关于大数据的深度发展应用以及对于数据立法和数权保护上的拓展和创新,市级层面更可能进行探索和尝试。同时,省会城市容易成为地方政府公共信息资源开放的试点城市,各类相应政策更容易在省会城市制定和实施。比如,贵阳市政府围绕大数据发展,制定了一系列政策文件,如《贵阳市政府数据共享开放条例》《贵阳市政府数据资源管理办法》等等,在各地政府数据开放规定中具有较强的典型性。
(四)线上法院普及率
线上法院普及率既是法院现代化和信息化建设的主要体现,也是人民法院深化司法改革的重要内容之一。自2013年以来,[1]中国法院积极推进审判流程、庭审公开、裁判文书、执行信息等各类平台建设,先后建立中国审判流程信息公开网、中国裁判文书网、中国庭审公开网、中国执行信息公开网,司法公开透明度大幅提升。人民法院内部实现了四级法院专网全覆盖,先后建成以互联互通为主要特征的人民法院信息化2.0版和以数据为中心的人民法院信息化3.0版,智慧法院初步建成。[2]互联网法院的出现是互联网司法进程中具有里程碑意义的事件,开辟了互联网时代司法发展的全新路径。2018年《最高人民法院关于互联网法院审理案件若干问题的规定》提出,互联网法院采取在线方式审理案件,实现了诉讼环节线上完成,如案件受理、送达、调解等,基本实现网上案件网上审理、网上纠纷网上判决。但互联网法院作为集中管辖互联网案件的基层人民法院,目前只在杭州、北京、广州三地部署了相应的试点,从全国范围来看,更多地方法院在互联网审判机制和科技审判庭建设上仍需探索。
(五)智慧检务创新性
智慧检务是依托大数据、云计算、移动互联网、人工智能等信息技术,提高检察机关的办公、办案、服务、决策的智能化水平,推进检察工作现代化的一种全新检务运营模式。2016年12月15日国务院印发的《“十三五”国家信息化规划》提出,实施“科技强检”战略,积极打造“智慧检务”。智慧检务作为中国检察信息化建设的重点任务,已经取得了初步成果,地方各级检察机关信息化、智慧化水平显著提升,全国检察机关统一业务应用系统2.0版完成试点部署。由《法制日报》主办的“全国政府智能化建设创新案例”评选活动对智慧法院、智慧检务、智慧司法等领域的创新案例和创新成果进行了梳理和评选,是各地智慧检务发展的一个体现,也是我国智慧检务进程的一个缩影。
(六)公安微博影响力
公安微博是公安政务新媒体矩阵建设的重要环节,是大数据时代下公安政务与媒体融合发展的新方式。《第44次中国互联网络发展状况统计报告》显示,我国297个地级行政区政府已开通“两微一端”[3]等新媒体传播渠道,截至2019年6月,我国网络新闻用户规模达6.86亿,在互联网时代,微博成为网络信息传播的重要宣传窗口。2018年12月,《国务院办公厅关于推进政务新媒体健康有序发展的意见》提出,要积极运用政务新媒体传播党和政府声音,做大做强正面宣传,巩固拓展主流舆论阵地。公安微博在其中发挥了强大的作用,微博不仅成为警务信息发布平台,还成为舆情处置及构建和谐警民关系的重要阵地。在《2018年度人民日报政务指数微博影响力报告》中,公安部新闻中心、公安部治安管理官方微博“中国警方在线”以传播力、服务力、互动力、认同度四项总分第一,获得了全国二十大中央机构微博影响力第一名。根据公安微博账号发布微博频率和关注人数,对各地方公安厅微博影响力进行系统评估,成为数字司法实践的评价指标之一。
(七)司法判例案例
司法判例作为司法审判的最终结果,不仅能体现法律实施的具体效果,而且能显示司法与社会的互动关系。司法判例案例内容涉及广泛,通过对判例拓展性、延伸性的研究,可以回应司法与媒体、民意及经济、政治、科技等外部要素之间的关系。[1]在大数据时代,备受关注的问题就是信息安全问题。在互联网技术时代,个人信息内涵逐渐丰富,除传统隐私权意义中个人尊严和自由的表征,还具备商业价值和公共管理价值,[2]由个人信息泄露而引发的案件时有发生。对个人信息司法案例发生省份和发生案例占比的分析,可以从侧面反映出该地区对个人信息保护的重视程度,以及当地法院对个人信息侵权案件审判倾向,进一步反映我国司法对待个人信息侵权行为的法律约束。
(八)国家政策落实率
目前我国关于大数据领域的法治建设主要偏重于个人信息安全保护和数据交易、共享的安全保护方面。在国家层面上,2018~2019年两年,国家制定了互联网相关领域法律4部,包括《电子商务法》《密码法》《电子签名法(2019年修正)》《反不正当竞争法(2019年修正)》;行政法规3部,包括《国务院关于在线政务服务的若干规定》《政府信息公开条例(2019年修订)》《互联网上网服务经营场所管理条例(修订)》;部门规章2部,即《儿童个人信息网络保护规定》《区块链信息服务管理规定》。在省级层面,落实个人信息保护或数据安全相关的地方性法规或行政规章数量一定程度上反映了地方对数据安全保护的重视程度。
(九)法律服务专业性
法律服务专业性主要针对各地律师协会中专业委员会相关专业设置情况进行分析。律师协会是律师的自律性组织,各省、自治区、直辖市可设立地方律师协会,律师协会专业委员会是根据律师业务的发展,开展行业业务调研和业务预测,并进行专业领域的划分,从相关专业角度,就国家立法、司法活动及社会事务提出意见和建议。因此,分析每一个省律师协会专业委员会中互联网或大数据专业设置情况,可以反映该省大数据领域法律活动的频率,以及当地大数据产业的发展状况。
四、大数据法治指数的构成与测算方法
(一)大数据法治指数的构成
大数据法治指数理论体系是基于现有数据立法、数字司法和数权保护三个维度进行评估。数据立法指标由立法活跃度、省级政府文件导向性、市级政府文件导向性3个二级指标组成,数字司法指标由线上法院普及率、智慧检务创新性、公安微博影响力3个二级指标组成,数权保护指标由司法判例案例、国家政策落实率、法律服务专业性3个二级指标构成(见表3)。
表3 大数据法治指数理论指标体系
一级指标 | 二级指标 | 三级指标 | 指标含义 |
数据立法 | 立法活跃度 | 立法相关性 | 反映地区大数据相关的地方性法规情况 |
立法趋势性 | 反映地方大数据相关立法的趋势 | ||
省级政府文件导向性 | 省级政策导向性 | 反映某一阶段内省级政府规章文件制定导向(与大数据、信息保护相关) | |
省级规范导向性 | 反映某一阶段内省级政府规范性文件制定导向(与大数据、信息保护相关) | ||
市级政府文件导向性 | 市级政策导向性 | 反映某一阶段内省会城市政府规章文件制定导向(与大数据、信息保护相关) | |
市级规范导向性 | 反映某一阶段内省会城市规范性文件制定导向(与大数据、信息保护相关) | ||
数字司法 | 线上法院普及率 | 互联网法院 | 反映人民法院信息化程度 |
线上审判 | 反映法院庭审信息化程度 | ||
智慧检务创新性 | 试点城市 | 反映国内智慧检务发展状态 | |
系统创新性 | 反映智慧检务系统在全国进展程度 | ||
公安微博影响力 | 公安微博普及率 | 反映公安微博维护程度 | |
公安微博关注度 | 反映公安微博受网民关注程度 | ||
数权保护 | 司法判例案例 | 个人信息案例发生率 | 反映各地区司法方面个人信息受到关注的情况 |
国家政策落实率 | 个人信息保护政策落实率 | 反映地方落实国家个人信息保护相关政策的情况 | |
数据安全政策落实率 | 反映地方落实国家数据安全相关政策的情况 | ||
法律服务专业性 | 法律咨询数据领域相关度 | 反映社会层面对大数据领域法治关注状况 |
(二)大数据法治指数的指标选取
1.数据立法指标
数据立法指标选取立法活跃度、省级政府文件导向性、市级政府文件导向性3个二级指标。其中,立法活跃度选取了立法相关性和立法趋势性2个三级指标。立法相关性反映了当地现有法规在大数据领域的基础,立法趋势性是指大数据领域相关的法律法规在当地立法计划中的比重,包括地方性法规数量和人大立法计划中涉及大数据领域的计划法规和调研项目。省级和市级政府文件导向性是当地政府数据治理中最直接的指导方针,也反映了不同层级政府对数据产业的支持力度和管理理念。省级政府文件导向性选取了省级政策导向性和省级规范导向性2个三级指标,市级政府文件导向性选取了市级政策导向性和市级规范导向性2个三级指标,主要对2016年以来各级政府法律法规和行政规章数量进行统计研究。
2.数字司法指标
数字司法指标分别从公、检、法三个角度,选取了线上法院普及率、智慧检务创新性和公安微博影响力3个二级指标。其中,线上法院普及率是地方法院信息化程度的具体反映,主要从互联网法院和线上审判2个三级指标来判定。互联网法院指现有互联网法院的数量,线上审判是一个复合型指标,从互联网审判庭的完善度和科技审判庭占比两个方面进行复合。智慧检务创新性是反映当地检察机关智慧检务建设情况的一个指标,主要从试点城市和系统创新性2个指标来反映,并以智慧检务领域具有代表性的创新案例来反映智慧检务创新性。公安微博影响力是反映公安部门在微博上的活跃程度,通过公安微博的建设情况和网民对公安微博的关注度进行研究。
3.数权保护指标
数权保护指标立足于政策、司法和社会组织三个角度选取了国家政策落实率、司法判例案例和法律服务专业性3个二级指标。其中,国家政策落实率是指地方依据国家已有法律法规而制定的相关法规和政策文件的数量,反映地方在个人信息和数据安全领域方面的落实情况。司法判例案例是指当地发生个人信息刑事案件统计情况,以个人信息案例发生率来表示,反映地方个人信息案例的分布和案例占比情况。法律服务专业性主要是从社会组织的角度,通过对律师协会专业委员会数量进行统计,反映在法律服务领域个人信息和数据安全的占比情况。
(三)数据获得与指数计算
1.数据获得
大数据法治指数的测评过程主要分为数据搜集、统计计算和结果分析。其中,数据搜集对指数评估起着决定性的作用。数据搜集分为数据识别、数据判断和数据筛选。收集数据的来源要以权威性、准确性、原始性为导向,数据来源主要分为三类:一是政府或社会机构官方网站,包括人大网、各地方政府门户网站、各省级律协门户网站等;二是各类专业数据库,包括北大法宝数据库、中国审判案例数据库、法律法规数据库等;三是权威机构发布的行业数据,如中国互联网络信息中心数据、互联网法律白皮书、中国法院互联网司法白皮书等。
2.数据计算
大数据法治指数主要是一个综合统计指数。在计算过程中,由于各项指标对大数据法治的影响程度有差异,为了正确评估大数据法治发展总体水平,需要为各项指标设定权重。大数据法治指数指标体系的权重根据不同指标的作用或影响程度而定,采用专家意见法进行判断。指数计算以加权平均的方法计算评价值。
第四章 2019年中国大数据法治指数分析报告
一、总体情况评估
中国大数据法治发展评估是根据国家官方数据以及权威机构数据库进行数据搜集,运用统计的办法,从数据立法、数字司法和数权保护三个维度对我国31个省(自治区、直辖市)进行综合评估,最终得出各省2019年大数据法治指数。
(一)总体排名
从大数据法治指数评估的结果来看,排名前五的省份分别是浙江、贵州、广东、北京和安徽,其中排名第一的浙江省总分57.03,远超全国平均分,排名前五的省份除贵州、安徽外,其余均为东部省份。在整体情况上,全国省域大数据法治指数平均值为25.50。有13个省份总体得分超过平均值,所占比例为41.9%,其中,浙江、贵州、广东、北京、安徽、福建、山东、上海、江苏、湖北列前十名,平均分为40.31,而排名后十的省份平均分仅为11.75,前者是后者的近4倍(见表1)。
表1 2019年各省份大数据法治指数评价结果
省份 | 总指数 | 排名 | 数据立法 | 排名 | 数字司法 | 排名 | 数权保护 | 排名 |
浙江 | 57.03 | 1 | 17.35 | 3 | 17.06 | 3 | 22.61 | 1 |
贵州 | 46.09 | 2 | 25.68 | 1 | 9.24 | 11 | 11.17 | 12 |
广东 | 45.27 | 3 | 8.91 | 9 | 21.52 | 2 | 14.84 | 4 |
北京 | 43.62 | 4 | 8.14 | 11 | 23.88 | 1 | 11.59 | 10 |
安徽 | 42.18 | 5 | 14.85 | 5 | 10.01 | 8 | 17.32 | 2 |
福建 | 38.22 | 6 | 25.00 | 2 | 4.09 | 24 | 9.13 | 17 |
山东 | 34.44 | 7 | 13.16 | 6 | 7.86 | 16 | 13.42 | 9 |
上海 | 33.40 | 8 | 7.50 | 13 | 11.91 | 6 | 14.00 | 6 |
江苏 | 31.45 | 9 | 4.00 | 25 | 12.98 | 5 | 14.47 | 5 |
湖北 | 31.38 | 10 | 9.10 | 8 | 8.67 | 14 | 13.61 | 8 |
重庆 | 31.33 | 11 | 12.64 | 7 | 9.39 | 10 | 9.30 | 16 |
天津 | 27.15 | 12 | 4.00 | 26 | 14.96 | 4 | 8.18 | 20 |
海南 | 26.69 | 13 | 15.21 | 4 | 7.98 | 15 | 3.50 | 25 |
河南 | 25.42 | 14 | 2.86 | 29 | 8.90 | 12 | 13.66 | 7 |
陕西 | 25.35 | 15 | 5.23 | 22 | 11.03 | 7 | 9.09 | 18 |
辽宁 | 25.05 | 16 | 3.05 | 28 | 7.00 | 18 | 15.00 | 3 |
云南 | 23.47 | 17 | 7.75 | 12 | 9.70 | 9 | 6.02 | 22 |
江西 | 23.45 | 18 | 7.45 | 14 | 5.00 | 20 | 11.00 | 13 |
甘肃 | 22.41 | 19 | 8.30 | 10 | 3.53 | 25 | 10.57 | 14 |
河北 | 20.04 | 20 | 5.53 | 19 | 6.35 | 19 | 8.17 | 21 |
四川 | 19.69 | 21 | 7.39 | 15 | 7.80 | 17 | 4.50 | 23 |
内蒙古 | 18.46 | 22 | 6.78 | 17 | 8.68 | 13 | 3.01 | 26 |
吉林 | 18.27 | 23 | 4.32 | 24 | 4.43 | 21 | 9.52 | 15 |
山西 | 17.72 | 24 | 7.07 | 16 | 1.73 | 28 | 8.92 | 19 |
湖南 | 16.64 | 25 | 1.20 | 30 | 4.25 | 22 | 11.19 | 11 |
广西 | 10.77 | 26 | 5.25 | 20 | 4.10 | 23 | 1.43 | 29 |
黑龙江 | 10.35 | 27 | 4.00 | 27 | 1.99 | 26 | 4.36 | 24 |
宁夏 | 8.85 | 28 | 4.87 | 23 | 1.97 | 27 | 2.00 | 27 |
青海 | 8.09 | 29 | 5.25 | 21 | 0.91 | 30 | 1.92 | 28 |
新疆 | 6.49 | 30 | 5.75 | 18 | 0.53 | 31 | 0.21 | 31 |
西藏 | 1.82 | 31 | 0.01 | 31 | 1.56 | 29 | 0.26 | 30 |
平均值 | 25.50 | 8.31 | 8.03 | 9.16 |
在分指标排名上,浙江、广东两省的三项分指标均处于全国前列,而贵州省数据立法指数排名第一,北京数字司法指数排名第一。宁夏、青海、新疆和西藏三项指标排名均较为靠后,故大数据法治发展水平较低。相对差距指数[1]是指最低水平与最高水平之间的相对差距,数值范围为0~1,当计算数值越大时,表明对比项的差距越大,相对差距指数主要用来反映二者之间的相差程度。从相对差距指数[2]分析,最大相对差距指数为0.97(即得分最低的比最高的落后97%),表明大数据法治发展中较好省份和较弱省份的差距较大(见图1)。
图1 大数据法治指数得分情况
(二)各区域大数据法治水平差异较大,东部地区大数据法治水平表现较为突出
从四大区域[3]大数据法治指数平均分来看(见图2),东部地区大数据法治指数平均分为35.73,大幅领先于其他三个地区,且高于全国平均值;中部地区平均得分为26.13,与全国平均值相近,而西部地区和东北地区的得分分别为18.57和17.89,较全国平均值分别低6.93分和7.61分。整体上,东部地区的大数据法治建设水平较为突出,西部地区和东北地区有待加强。
图2 2019年各地区大数据法治指数平均值对比情况
从东部地区各省份大数据法治指数得分情况来看(见图3),东部地区不仅有北京、广东、浙江等大数据法治得分较高的地方带动,而且地区内部大数据法治得分情况普遍较好,10个省份中有7个省份得分超过30,有9个省份得分高于全国均值,东部地区内部平均值为35.73,领先于全国平均水平。其中浙江省作为大数据产业发展较早的省份,2016年《浙江省促进大数据发展实施计划》(浙政发〔2016〕6号)提出“建设数据强省,助力经济社会转型升级,推动政府治理和公共服务能力现代化”。在大数据法治建设方面,为深入实施数字经济“一号工程”,构建以数字经济为核心、新经济为引领的现代化经济体系,在2020年浙江的立法计划中提出初次审议制定数字经济促进条例。
图3 东部地区大数据法治指数与全国平均值对比情况
从中部地区大数据法治指数发展情况来看(见图4),中部地区发展最好的省份是安徽省,其次是湖北省,两个省份带动了中部地区整体发展水平,除湖南和山西以外,其余省份大数据法治建设处于中等水平,并且各省份之间发展水平相对均衡。从整体上看,中部地区大数据法治指数平均得分为26.13,与全国平均值接近,中部地区发展水平与全国平均水平相当。从表1中可以看出,安徽省在数权保护方面得分较高,排名仅次于浙江省。安徽省在数权保护方面做了很多努力,2018年,安徽省印发了《安徽省涉企信息归集应用实施办法(试行)》,以文件的形式规范了信息归集的范围、信息目录、归集路径和信息质量,并且对信息共享、风险评估和信用评价共享、平台安全管理等方面进行了详细的规定,不仅有利于打破“信息孤岛”解决信息分散化、区域化、碎片化的问题,还有利于促进部门由独立监管向协同监管转变。
图4 中部地区大数据法治指数与全国平均值对比情况
从西部地区大数据法治指数发展情况来看(见图5),西部地区内部大数据法治得分差异较大,最高分达46.09,最低分只有1.82。得分超过全国平均值的只有贵州和重庆,陕西、四川、内蒙古、云南和甘肃处于中等发展水平,除此之外,其他的省份得分均较低,不超过10分的有4个,因此,西部地区大数据法治指数平均得分只有18.57,整体得分情况表现欠佳。在西部地区内部,西南地区[1]的大数据法治指数得分较西北地区[2]高,但是西北地区中甘肃省表现较好。2018年甘肃省发布的《关于促进移动互联网健康有序快速发展的实施意见》提出,提升网络安全保障水平,落实网络安全法规政策,建立健全网络安全工作责任制等,这类政策文件的出台,为甘肃省信息保护和数据安全提供了保障。
图5 西部地区大数据法治指数与全国平均值对比情况
从东北地区大数据法治指数发展情况来看(见图6),东北地区以辽宁最高、吉林其次、黑龙江最低的得分情况呈现阶梯状。从整体来看,三个省份的平均得分为17.89,低于全国平均水平,整体发展虽然欠佳,但是内部得分较为均衡,差异性较西部地区小。
图6 东北地区大数据法治指数与全国平均值对比情况
(三)大数据法治指数与我国GDP(2018年)整体上呈现正相关
从大数据法治指数与GDP(2018年)对比分析来看(见图7),大数据法治指数的发展趋势与GDP发展的趋势曲线整体相符,说明经济发展与大数据法治建设有着一定的关联性。从整体发展趋势上,GDP较高的省份,大数据法治指数得分较高,GDP与大数据法治指数得分呈现正相关关系,说明经济发展水平在一定程度上影响了大数据法治的发展,如北京、天津、江苏、浙江、广东等地,这些GDP高的地区,大数据法治指数得分较高。分析其原因,一方面,经济较好的地区大数据的应用和发展较好,如北京市2018年的大数据发展指数得分以74.11[3]领先全国,也由此推动了大数据法治的建设;另一方面,经济较好的地区当地政府拥有更多的资源投入大数据法治建设,如广东省2018年建成全省统一的网上中介服务超市,一体化的广东政务服务网全新上线。除此之外,可以看出贵州、海南两个省份GDP虽然相对较低,但大数据法治指数得分较高,这说明除了经济因素的影响外,还有其他因素对大数据法治指数造成了影响。
图7 大数据法治指数与GDP(2018年)对比情况
(四)大数据法治受大数据发展影响明显,总体上呈现正相关
大数据发展指数是基于价值链理论,通过对政用指数、商用指数和民用指数进行统计和分析,从而得出评估大数据发展态势的指标。通过比较大数据发展指数和大数据法治指数的得分情况,可以分析大数据发展对大数据法治建设的影响。从对比分析的情况来看(见图8),大数据法治指数与大数据发展指数趋势相符,大数据发展指数得分较高的省份,大数据法治指数得分较高,如北京、浙江、广东、贵州等地,两个指数呈现出发展趋势一致性,这也解释了虽然有的地区经济发展水平较为落后,但由于大数据领域有较多的探索,大数据法治程度明显较好。其中代表性的省份有贵州和海南。贵州省在大数据应用探索上一直走在全国前列,已出台多部法规和政策。贵州在大数据发展中取得很多成果,2015~2019年已成功举办五届中国国际大数据产业博览会,该博览会于2017年正式升级为国家级展会活动。与此同时,在大数据融合方面,贵州成为“大数据+扶贫”应用领域的典范,2019年数博会期间,在全国“大数据+扶贫”十大应用案例发布会上,贵州有两例“大数据+扶贫”案例上榜。此外,贵州在医疗领域、政务服务方面均取得了成绩,这造就了贵州大数据法治发展的沃土。另外,具有典型性的是海南省,2019年11月1日《海南省大数据开发应用条例》正式实施,继贵州、天津之后,海南成为全国第三个出台大数据方面地方性法规的省份。该条例突出了大数据开发、应用和产业促进以及区块链等新技术的应用,并强化数据安全保护,重点突出个人信息保护。同时,较为系统性地对可以交易的数据类型、数据交易基本原则、数据交易市场相关规范、鼓励和引导数据交易主体在依法设立的大数据交易平台进行数据交易等做出规定,在国内数据交易规则制定方面做了先行探索。海南省在大数据法治方面取得的成绩与其大数据发展程度是密切相关的。近年来,海南省政府积极推动大数据及人工智能产业发展,规划将海南打造为数据岛、数字岛、智慧岛、智能岛,并建设“智慧型健康海南”“生态大数据”等一批大数据项目,这为海南大数据法治发展奠定了牢固的基础。
图8 2019年大数据法治指数与大数据发展指数对比情况
二、分指数得分评价
在大数据法治的三个分指数中(见表2),数权保护指数得分较高,平均值为9.16,其他两个指数得分较低,数据立法指数平均值为8.31,数字司法指数平均值为8.03。可以看出,数据立法和数字司法发展步伐均有待加快。从区域看,东部地区数据立法、数字司法和数权保护三个方面均处于全国前列,其中数字司法表现最好;西部地区三个方面表现相对均衡;中部地区数权保护方面表现最好,数据立法和数字司法还需进一步加强;东北地区与中部地区得分情况相似,但整体比中部地区表现欠佳(见图9)。
表2 2019年数据立法、数字司法、数权保护指数得分情况
一级指标 | 权重(%) | 最高得分 | 最低得分 | 平均分 |
数据立法 | 40 | 25.68 | 0.01 | 8.31 |
数字司法 | 30 | 23.88 | 0.53 | 8.03 |
数权保护 | 30 | 22.61 | 0.21 | 9.16 |
图9 四大区域数据立法、数字司法、数权保护指数均值情况
三、数据立法指数评价结果分析
(一)数据立法指数总体概况
如表3所示,从各省份数据立法指数得分情况来看,排名前五位的省份分别是贵州、福建、浙江、海南和安徽,全国数据立法指数平均值为8.31,其中有9个省份的数据立法指数高于均值,占比为29.03%。在大数据法治指数排名前十中,有7个省份同时进入了数据立法指数的前十。整体上,该项指数的得分情况相对较弱(见图10)。得分较高的省份有贵州和福建,分别为25.68和25.00,西藏排名较靠后,从立法规划上,西藏近三年来涉及数据、信息等相关的立法项目或调研项目较少,在规章制度建设方面,关于大数据发展相关政策较少。
数据立法指标中,贵州和福建分别排在第一和第二,两省立法活跃度、省级政府文件导向性和市级政府文件导向性三项指标均有不错的成绩。贵州省一直走在国内大数据先行先试的前列,无论是贵州省还是省会城市贵阳均先后出台了多条法律法规和政策规章,如《贵州省人民政府关于促进大数据云计算人工智能创新发展加快建设数字贵州的意见》《贵阳市大数据安全管理条例》等,在大数据共享、开放、安全等不同领域制定法律效力性规范,2019年8月1日,贵州省第十三届人民代表大会常务委员会第十一次会议通过了《贵州省大数据安全保障条例》,进一步促进和保障贵州大数据应用和持续健康发展,促进贵州大数据战略行动向纵深推进。福建省自2016年印发《福建省促进大数据发展实施方案(2016~2020年)》以来,强化顶层设计,地方行政立法先行先试,针对大数据在发展过程中面临的新情况、新问题,探索出台相应规范性文件。两省在法律规范和政策文件上的积极推进,是大数据法治建设能够处于领先地位的关键性因素。
表3 2019年省域数据立法指数排名情况
数据立法指数排名 | 省份 | 数据立法指数 | 大数据法治指数排名 |
1 | 贵州 | 25.68 | 2 |
2 | 福建 | 25.00 | 6 |
3 | 浙江 | 17.35 | 1 |
4 | 海南 | 15.21 | 13 |
5 | 安徽 | 14.85 | 5 |
6 | 山东 | 13.16 | 7 |
7 | 重庆 | 12.64 | 11 |
8 | 湖北 | 9.10 | 10 |
9 | 广东 | 8.91 | 3 |
10 | 甘肃 | 8.30 | 19 |
11 | 北京 | 8.14 | 4 |
12 | 云南 | 7.75 | 17 |
13 | 上海 | 7.50 | 8 |
14 | 江西 | 7.45 | 18 |
15 | 四川 | 7.39 | 21 |
16 | 山西 | 7.07 | 24 |
17 | 内蒙古 | 6.78 | 22 |
18 | 新疆 | 5.75 | 30 |
19 | 河北 | 5.53 | 20 |
20 | 广西 | 5.25 | 26 |
21 | 青海 | 5.25 | 29 |
22 | 陕西 | 5.23 | 15 |
23 | 宁夏 | 4.87 | 28 |
24 | 吉林 | 4.32 | 23 |
25 | 江苏 | 4.00 | 9 |
26 | 天津 | 4.00 | 12 |
27 | 黑龙江 | 4.00 | 27 |
28 | 辽宁 | 3.05 | 16 |
29 | 河南 | 2.86 | 14 |
30 | 湖南 | 1.20 | 25 |
31 | 西藏 | 0.01 | 31 |
平均值 | 8.31 |
图10 2019年各省份数据立法指数得分与全国均值比较
(二)政府对大数据重视程度明显增强
从图11可以看出,数据立法指数3个二级指标中,省级政府文件导向性指数的得分占比最高为50.95%,立法活跃度指数次之,为33.00%,市级政府文件导向性占比最低为16.06%。
图11 数据立法指数中二级指标得分比重
从图11中分析可知,在数据立法指数中,省级政府文件导向性有较高的得分。随着大数据在政府信息平台建设、医疗卫生、交通运输等各方面应用程度的加深,各省份根据法律、国务院颁布的行政法规和相关部门规章,结合本地实际,制定了政府数据资源共享条例、信息化促进条例、公共数据管理办法等地方性法规和政府规章。仅在2018~2019年就出台了多部政府规章和规范性文件,如浙江省出台《浙江省政府信息公开暂行办法(2019修正)》、安徽省出台《安徽省人民政府关于印发支持数字经济发展若干政策的通知》、山东省出台《山东省人民政府办公厅关于印发山东省支持数字经济发展的意见的通知》、湖北省出台《湖北省人民政府关于推进数字政府建设的指导意见》等。这些行政法规和政府规章在一定程度上促进了政府部门的数据资源对接与共享,规范了个人信用数据采集、使用,对信息在流动和共享过程中的安全保护以及个人信息隐私安全进行了合法规范,保障了公民信息的知情权、隐私权,也体现了政府对于数据安全保护的信心和决心。
四 数字司法指数评价结果分析
(一)数字司法指数总体概况
如表4和图12所示,2019年数字司法指数排名前五的省份分别是北京、广东、浙江、天津、江苏,其中北京、广东、浙江在大数据法治总指数排名中处于前五名。数字司法指数的全国平均值是8.03,共有14个省份高于平均值,所占比例为45.16%,得分较高的省份是北京和广东,分别为23.88和21.52;得分较低的省份是青海和新疆,分别为0.91和0.53。在大数据法治指数排名前十位的省份中,有6个省份进入数字司法指数排名的前十位。
表4 2019年省域数字司法指数排名情况
数字司法指数排名 | 省份 | 数字司法指数 | 大数据法治指数排名 |
1 | 北京 | 23.88 | 4 |
2 | 广东 | 21.52 | 3 |
3 | 浙江 | 17.06 | 1 |
4 | 天津 | 14.96 | 12 |
5 | 江苏 | 12.98 | 9 |
6 | 上海 | 11.91 | 8 |
7 | 陕西 | 11.03 | 15 |
8 | 安徽 | 10.01 | 5 |
9 | 云南 | 9.70 | 17 |
10 | 重庆 | 9.39 | 11 |
11 | 贵州 | 9.24 | 2 |
12 | 河南 | 8.90 | 14 |
13 | 内蒙古 | 8.68 | 22 |
14 | 湖北 | 8.67 | 10 |
15 | 海南 | 7.98 | 13 |
16 | 山东 | 7.86 | 7 |
17 | 四川 | 7.80 | 21 |
18 | 辽宁 | 7.00 | 16 |
19 | 河北 | 6.35 | 20 |
20 | 江西 | 5.00 | 18 |
21 | 吉林 | 4.43 | 23 |
22 | 湖南 | 4.25 | 25 |
23 | 广西 | 4.10 | 26 |
24 | 福建 | 4.09 | 6 |
25 | 甘肃 | 3.53 | 19 |
26 | 黑龙江 | 1.99 | 27 |
27 | 宁夏 | 1.97 | 28 |
28 | 山西 | 1.73 | 24 |
29 | 西藏 | 1.56 | 31 |
30 | 青海 | 0.91 | 29 |
31 | 新疆 | 0.53 | 30 |
平均值 | 8.03 |
图12 2019年省域数字司法指数得分与全国均值比较
数字司法指数中线上法院普及率、智慧检务创新性和公安微博影响力3个二级指标在数字司法指标中的占比分别为27.84%、36.14%、36.02%,3个指标的得分表现较为均衡(见图13)。
图13 数字司法指数中二级指标得分比重
图14 各区域数字司法指数中二级指标平均值得分情况
如图14所示,从各区域得分情况来看,东部地区的线上法院普及率和智慧检务创新性2项指标表现远优于其他地区,这得益于北京市、广东省广州市和浙江省杭州市成为全国互联网法院试点城市,同时,上海市长宁区人民法院、天津市滨海新区人民法院、广东省深圳市福田区人民法院、江苏省镇江经济开发区人民法院等均设立了互联网合议庭或审判团队,除此之外东部多个省份在互联网法院和智慧检务方面表现突出。智慧检务创新性方面,西部地区处于中等发展水平,中部地区和东北地区表现欠佳。在全国智慧检务十大典型案例方面,2018年和2019年两年均获该项荣誉的省份有江苏、浙江、山东、四川;在全国十大智慧司法案例方面,2018年和2019年两年均获该项荣誉的省份有内蒙古、江苏、湖北、云南和陕西。可以看出,东部和西部地区在智慧司法和智慧检务案例中的获奖省份数量均占有不小的比例。在公安微博影响力方面,中部地区平均分最高,其次是东部地区、东北地区,西部地区的公安微博影响力最小,西部地区公安微博影响力受到了创办时间和更新频率的影响,如西藏公安厅官方微博2019年8月23日正式开通,青海、新疆、宁夏的微博更新频率相对于其他省份偏低。
(二)数字司法水平基本随着地方政务大数据的发展而变化
图15 各省域2019年数字司法指数与政用指数对比情况
大数据政用指数是从评价政府推动大数据发展和政府大数据应用的角度评估政府对大数据发展的推动作用的指数。对于数字司法来说,政用指数一定程度上体现数字司法的发展状况。如图15所示,从全国范围上看,数字司法指数变化趋势与政用指数的变化趋势相符,如北京、天津、广东等大部分地区,数字司法指数得分较高的同时,政用指数得分也较高,但也有例外,贵州、甘肃和宁夏等的政用指数得分相对较高,但是数字司法指数得分较低,它们均是经济水平相对落后的地区,由于政府对大数据产业和政策关注程度高,政用指数处于较好的水平,呈现发展不均衡的现象。
五 数权保护指数评价结果分析
(一)数权保护指数基本概况
如表5所示,2019年数权保护排名前五的省份分别是浙江、安徽、辽宁、广东、江苏,并且除辽宁外,其他4个省份在大数据法治总指数中排名前十。数权保护的平均值为9.16,有16个省份高于平均值,在所有省份中占比51.6%。在大数据法治总指数排名前十的省份中,有7个省份进入数权保护指数排名前十。从图16可以看出,数权保护指数的整体得分情况较好,超过2/3的省份得分在均值附近或高于平均值,仅有1/3的省份得分低于平均值。浙江省是数权保护指数得分最高的省份,为22.61,超出平均值13.45;得分最低的是新疆,为0.21,低于平均值8.95。
表5 2019年省域数权保护指数排名情况
数权保护指数排名 | 省份 | 数权保护指数 | 大数据法治指数排名 |
1 | 浙江 | 22.61 | 1 |
2 | 安徽 | 17.32 | 5 |
3 | 辽宁 | 15.00 | 16 |
4 | 广东 | 14.84 | 3 |
5 | 江苏 | 14.47 | 9 |
6 | 上海 | 14.00 | 8 |
7 | 河南 | 13.66 | 14 |
8 | 湖北 | 13.61 | 10 |
9 | 山东 | 13.42 | 7 |
10 | 北京 | 11.59 | 4 |
11 | 湖南 | 11.19 | 25 |
12 | 贵州 | 11.17 | 2 |
13 | 江西 | 11.00 | 18 |
14 | 甘肃 | 10.57 | 19 |
15 | 吉林 | 9.52 | 23 |
16 | 重庆 | 9.30 | 11 |
17 | 福建 | 9.13 | 6 |
18 | 陕西 | 9.09 | 15 |
19 | 山西 | 8.92 | 24 |
20 | 天津 | 8.18 | 12 |
21 | 河北 | 8.17 | 20 |
22 | 云南 | 6.02 | 17 |
23 | 四川 | 4.50 | 21 |
24 | 黑龙江 | 4.36 | 27 |
25 | 海南 | 3.50 | 13 |
26 | 内蒙古 | 3.01 | 22 |
27 | 宁夏 | 2.00 | 28 |
28 | 青海 | 1.92 | 29 |
29 | 广西 | 1.43 | 26 |
30 | 西藏 | 0.26 | 31 |
31 | 新疆 | 0.21 | 30 |
平均值 | 9.16 |
图16 2019年省域数权保护指数得分与全国均值比较
从图17可知,在数权保护指数中,司法判例案例、国家政策落实率、法律服务专业性的得分占比分别为16.79%、47.29%、35.92%。其中,国家政策落实率占比最高,得分情况相对于其他两项指数的得分情况好。
图17 数权保护指数中二级指标得分比重
(二)个人信息安全和数据保护法治环境明显改善
从图18和图19中可以看出各区域数权保护得分情况,数权保护发展较好的区域为东部地区、中部地区,平均值分别为11.99和12.62,且整体发展较为均衡,东北地区平均值为9.63,而相比之下,西部地区整体发展欠佳且内部得分不均衡。从各区域二级指标平均值得分情况分析,如图20所示,司法判例案例平均值较高的是东部地区,其他三个区域较低。此外,从国家政策落实率来看,四个区域平均值得分均较高,从全国范围内看,各区域关于个人信息保护和数据安全方面的政策落实情况较好。从法律服务专业性来看,中部地区的平均值最高,东部和东北地区次之,在有关大数据法律服务专业性方面各地均表现良好。这说明在从司法、政策、社会法律服务环境上,大数据个人信息安全、数据保护环境明显优化。
图18 各区域数权保护平均值与全国平均值对比情况
图19 各区域数权保护得分情况
图20 各地区数权保护指数中二级指标平均得分情况
(三)大数据发展指数与数权保护的相关性
省域大数据的发展对数权保护有较大的影响,大数据发展较好的区域,政府和社会参与度均较高,对于数据安全、数权保护的探索较多,因此,通过对比2018年和2019年大数据发展指数与数权保护指数变化趋势,寻找大数据发展与数权保护发展的规律。从整体上看(见图21),大数据发展指数得分较高的省份,数权保护指数得分较高,二者趋势相关。其中,表现较好的有长三角[1]地区的江苏、浙江、上海等地,大数据发展指数和数权保护指数表现均较为突出。京津冀地区[2]大数据发展指数得分均处于全国前列,但是数权保护指数得分却低于长三角地区和广东。西部地区中,贵州的大数据发展指数与数权保护指数得分呈现正相关,说明大数据的发展在一定程度上推动了数权保护的进程。
图21 各地区数权保护指数与大数据发展指数(2018年和2019年)对比情况
六、对策建议
(一)加强理论研究,构筑数据立法框架
通过对31个省份数据立法指数测评发现,全国数据立法已经具有一定的基础,部分省份表现较优,如贵州、福建、浙江、海南等,对于这些省份,应在已有的法治条件下,加强对数据权利的理论研究,通过研究数据的所有权、采集权、存储权、隐私权、使用权、知情权等基本权利,加快制定数据资源权益和数据产权相关法律规章。数据立法表现相对欠佳的省份,随着政府数据不断的开放、共享、开发和应用,社会治理不断精准,应从本地实际出发加快在大数据领域地方法律法规的探索和研究。从国家的角度,现有法律权利体系是基于现实空间建构的一种权利体系,这种权益体系以人为中心,随外界事物的变化而变化,而数据权利是基于虚拟空间产生的、现有法律体系无法调整的一项权利,因此,加快推动国家数据资源和数据产权上位法的制定,修改现有大数据相关的法律,通过上位法的制定,更加有效地指导地方法律法规的制定工作,为大数据的发展保驾护航。
(二)总结推广经验,提升数字司法进程
在数字司法指数测评过程中发现,我国除东部地区以外,其他三个地区数字司法水平较低。东部地区多为我国经济发达地区,在法院信息化建设、司法便民程度方面创新较多。对于这些地区,一方面应继续推动数字司法向深层次发展,不断提升系统智能化水平、数据准确度,推动数字司法向智慧化发展;另一方面,要善于总结和推广数字司法建设经验,如北京法院的“立体化线上立案系统”,北上广、长三角、京津冀地区法院之间跨域立案机制,浙江宁波的“移动微法院”等,通过对典型事例和优秀做法进行总结,形成可复制可借鉴的数字司法发展经验。对于数字司法发展水平较低的地区,一方面要善于向数字司法发展较好的地区借鉴学习,降低自身数字司法发展的时间和经济成本,减少不必要的试错过程,加强与先进地区的沟通交流,取长补短;另一方面,充分利用最高人民法院和最高人民检察院的统筹优势及资源优势,寻找自身建设的特点和亮点,推动当地数字司法的快速发展。
(三)加快补齐短板,奠定数权保护基石
从数权保护的测评结果发现,数权保护指数相对于数据立法、数字司法指数表现较好,除西部地区以外,东部、中部和东北地区的数据保护发展水平均较高。数权保护较好的地区,要进一步完善适用于本地的数据安全、信息安全方面的政策法规,继续深化政府大数据共享平台建设,增强人民群众数据保护、信息保护意识。而西部地区由于青海、宁夏、西藏、新疆等地的经济欠发达,大数据发展程度相对较低,在个人信息安全和数据保护方面表现相对欠佳。对于西部地区,要加强大数据发展,积极探索数据资源开放共享、工业发展、产业集聚等方面的应用,努力盘活资源,激发创业创新活力,为大数据法治提供成长的土壤。一方面,政府要强化发展理念,构筑数据生态,实现产业和政府转型升级;另一方面,要做好舆论引导,即正确引导广大人民群众通过互联网积极、有序参与社会治理,提升其个人信息安全保护意识,为数据法治社会的建设奠定牢固的基石。
(四)构建多角度治理体系,营造大数据法治氛围
通过分析和对比数据立法、数字司法和数权保护指数得分情况,对我国大数据法治情况形成一个较为初步的评估,我国大数据法治建设格局基本形成,但整体呈现发展不均衡。针对我国大数据法治建设,要持续加强信息安全和数据保护,从制度维度上,完善相关的法律法规并制定相应的监管文件,从技术维度上,加强数据加密和访问控制、数据安全评估和分级保护等技术研发,从技术源头上减少数据泄露、窃取等安全问题的发生。个人数据的数量越大、种类越多,蕴含的战略价值和经济价值就越大,因此,要合理规范数据资源的使用,加强数据资源的有效收集、存储和挖掘,加强对数据流通和数据交易的管理监督,制定相应的规范和制度,最大化发挥大数据应有的价值。在评估过程中可以看到,目前,政府在不断推动数据的开放和共享,无论是国家还是地方,在大数据立法理论探索、政策制定以及政府数据开放和共享、政务服务数字化、司法建设信息化等方面都做出了很多努力,政府要善于从这些实践中总结经验,营造具有实操性的大数据法治环境,为大数据在政府科学决策、社会精准治理以及大数据产业发展等方面奠定坚实的法治基础。
第五章 大数据安全态势分析与大数据安全指数研究
一、大数据安全态势分析
(一)大数据安全的全球新形势
1.国际网络安全政策体系逐渐完善
如表1所示,2019年,为夯实网络安全基础,美国、欧盟等积极出台相关网络安全政策,国际网络安全政策体系逐渐完善。同时,欧盟将构建由26个成员国的160余家网络安全相关企业、高校以及研究机构组成的欧洲网络安全专业分析网络。
表1 2019年国际网络安全政策出台情况
序号 | 国家或地区 | 出台时间 | 政策 | 主要内容 |
1 | 欧盟 | 2019年3月 | 《欧盟网络安全法案》 | 首次明确提出欧盟网络安全认证计划,为各成员国开发具有互操作性的网络安全产品提供便利 |
2 | 美国 | 2019年4月 | 《州网络弹性法案》 | 支持各州加强网络安全产品和服务采购,并为各州解决网络安全问题提供资金支持 |
3 | 美国 | 2019年6月 | 《物联网设备安全改进法案》 | 旨在基于政府的购买力推动物联网安全市场的发展 |
资料来源:中国信息通信研究院:《中国网络安全产业白皮书(2019年)》,2019年9月18日。 |
2.全球网络安全产业规模持续增长
2019年,全球网络安全产业规模预计增长至1216.68亿美元,相较于2018年1119.88亿美元的产业规模,网络安全产业规模呈现稳定增长的态势。[1]如图1所示,在区域分布上,以美国、加拿大为主的北美地区网络安全产业规模占比最大,排第二的是以英国、德国、芬兰等为主的西欧地区,排第三的是日本、澳大利亚等亚太地区,中东、东欧、拉丁美洲等其他地区网络安全产业规模全球占比为7%。[2]
图1 全球各区域网络安全产业规模占比情况
3.网络安全人才培养力度不断加大
美国发布全新网络安全人才计划,从机制、竞赛、激励等方面完善网络安全人才的培养体系。例如,美国制定相关政策法规推进网络人才的培养,并将4所高校纳入“CyberCorps:服务奖学金”(SFS)计划,以更好地推动网络安全科研和人才培养。英国国家网络安全中心将网络安全技能作为重点培养方向,于2018年新建两个网络教育试点中心。新加坡政府推出网络安全生态孵化计划,致力于为网络安全初创企业提供培训服务。
(二)大数据安全的中国新进展
1.网络安全领域法律法规密集出台
当前,我国网络安全领域相关立法工作正在持续推进,法律法规支撑能力不断强化。2019年,关于数据安全、信息基础设施安全、电信安全等相关的立法工作已纳入立法计划,并有序推进。同时,自2019年5月以来,相继完成数据安全管理、儿童个人信息安全、网络关键设备安全、个人信息出境安全等方面的法律法规起草工作,进入征求意见环节。2019年7月2日,国家四部门联合发布《云计算服务安全评估办法》,进一步强化了隐私保护。
2.网络安全产业规模保持稳定增长
我国网络安全产业规模增速自2016年以来一直较为平稳,网络安全产业规模一直保持稳定增长状态。据统计,截至2019年11月底,有23家网络安全企业在中国上市,在网络安全领域进行投资布局的创投机构有100多家。[3]在营收规模方面,2018年10家网络安全企业营收规模平均为15.69亿元,与2017年相比,增长10.69%,企业营收规模总体呈稳定增长态势。在净利润方面,2018年10家上市网络企业平均净利润较2017年增长6.67%,企业净利润增速总体放缓,但仍远高于国际水平。在研发投入方面,2018年10家上市网络安全企业平均研发投入较2017年增长了25.2%,企业研发投入力度持续加大。[4]
3.安全产业生态环境得到持续优化
多地网络安全产业园区加快建设。其中,北京国家网络安全产业园已有超过30家网络安全企业入驻或确定意向。天津滨海信息安全产业园一期工程即将竣工,目前,已汇集多家国家级中心及省部级中心,13家网络安全企业确认入园意向。2018年9月,国家网安基地已签约落户项目41个,注册企业75家,协议投资3262亿元,在建项目总投资达2000亿元。[5]网络安全研究能力不断提升。2019年4月,中国信通院联合中国移动等多家企业成立“物联网安全创新实验室”,促进物联网安全创新技术、产品孵化和能力提升;7月,联合腾讯安全成立“产业互联网安全实验室”,围绕人工智能、区块链、云计算等领域开展务实合作。
4.网络安全国际合作力度不断增强
交流协作载体不断丰富。2019年8月,金砖国家未来网络研究院中国分院在深圳揭牌。该院将重点在新型网络体系架构、新一代移动通信、网络与信息安全等领域开展国际合作。360与以色列签署了战略合作协议,成立中以网络安全科技创新中心。技术共享合作向纵深发展。中国网安与卡巴斯基签署战略合作备忘录,在工控安全、威胁情报、安全培训等方面深化合作。奇安信与以色列Cyberbit公司达成战略合作意向,双方将通过整合各自的技术优势和产业资源,为国内政企客户和高等院校深度定制网络空间安全人才培养和网络攻防靶场解决方案。投资并购活动有序展开。华为收购以色列数据库安全公司HexaTier、基于软件的系统设计和芯片设计公司Toga Networks。
5.安全产业人才队伍培养持续强化
网络安全人才培养政策已被提升至国家战略高度。2017年6月,《中华人民共和国网络安全法》出台,明确提出倡导企业、高等学校以及职业学校等积极推进网络安全相关教育和培训。此外,2018年2月教育部印发的《2018年教育信息化和网络安全工作要点》中,第24条明确提出:“加强网络安全学科专业建设,推进新工科研究和实践,探索网络安全人才培养新思路、新体制和新机制,建设世界一流网络安全学院,增设一批网络安全相关国家级实验教学示范中心。”[1]2019年5月新出台的网络安全等级保护2.0标准也对安全管理人员的能力素质和职责提出了更高的要求。这些法规标准的出台彰显了国家对于网络安全人才培养的重视。
(三)大数据安全的地方新实践
1.首创制定数据安全保障体系规划的“杭州样本”
为保障大数据产业健康发展,杭州市先行先试制定国内首个数据安全规划,并于2017年12月19日顺利通过专家评审。该规划主要从建立数据分类分级标准、个人信息保护、数据出境安全、数据共享安全、数据安全管理机构等方面进行规范,进而对杭州市政务数据进行保护。此次规划的亮点在于首次根据数据各生命周期的特点,设定相应专业职能岗位。杭州数据安全规划加强了对个人隐私的保护,也为进一步加强数据安全保护打下了坚实的基础。
2.率先推出大数据安全地方立法的“贵阳实践”
在大数据安全地方立法方面,贵阳市先行先试,于2018年10月1日起正式施行全国首部大数据安全管理地方性法规《贵阳市大数据安全管理条例》(以下简称《条例》)。《条例》的发布是贵阳市继2017年出台全国首部政府数据共享开放地方性法规《贵阳市政府数据共享开放条例》后,对大数据安全领域内的又一创新性立法探索,同时也是大数据地方立法的最新成果。《条例》共6章37条,涉及大数据安全管理的适用范围和相关概念以及遵循的原则、政府部门职责分工、数据安全保障、监测预警与应急处置、监督检查和法律责任等方面。与现有更侧重于对网络系统功能、网络载体等方面的保护,对数据采集、存储、挖掘、传输、交易、应用等环节缺乏相应法律体系支撑的法律法规相比,《条例》在数据安全监管和数据保护方面做出了创新性探索。
3.规划引领助推安全产业集聚发展的“南通方案”
2019年11月1日,长三角首个网络安全产业园落户南通市崇川区。《崇川区长三角网络安全产业发展规划》制定了长三角网络安全产业园“11421”的发展战略和“53511”的发展目标。其中,“11421”发展战略包括“一园、一院、四中心、两基地、一基金”。“一园”即指“长三角网络安全产业园”,并搭建起包括安全技术研究、创新、测试、应用、推广在内的完整体系。在要素保障方面,也建设了相应的企业和人才集聚平台,以及设立产业发展基金,进而保障网络安全产业的发展。而“53511”的发展目标则是,通过五年发展,大力引进优质企业、研究机构、技术中心等落户长三角网络安全产业园,形成具有一定产业规模的产业园区,南通市长三角网络安全产业园产业生态链基本形成,打造长三角网络安全产业高地。
二、大数据发展面临的安全挑战
(一)大数据技术和平台安全挑战
第一,传统措施无法适配当前安全需要。传统的安全保护措施是基于边界进行保护,当前,随着大数据更加复杂的底层结构、更加开放的分布式计算等,大数据应用的系统界线变得更加模糊,原有的保护措施已无法满足当下的保护需求。同时,大数据系统表现为系统的系统(System of System),分布式计算安全问题也将变得更加突出。第二,平台安全隐患增多。越来越多的大数据应用均采用开源平台及技术,数据处理功能也倾向于大容量、高速率,而原生的安全特性,在整体安全规划方面考虑不足,甚至没有良好的安全实现。随着物联网技术的快速发展,当前设备连接和数据规模都达到了前所未有的高度,而在越来越多的新终端安全防护上,现有的安全防护体系尚不成熟,有效的安全手段还不多,急需建立更好的安全保护机制。第三,应用访问控制愈加困难。数据的开放共享意味着会有更多的用户可以访问数据,大量的用户以及复杂的共享应用环境,导致大数据系统需要更准确地识别和鉴别用户身份,传统的基于集中数据存储的用户身份鉴别难以满足安全需求。
(二)数据安全和个人信息保护挑战
第一,数据安全技术要求更高。在开放的网络化社会,分布式的系统部署、开放的网络环境等都使得大数据在保密性、完整性、可用性等方面面临更大的挑战。第二,个人信息泄露风险加剧。随着人工智能、数据挖掘等技术的成熟,强大的关联分析使得个人信息的泄露变得更加容易。当代社会,对个人信息的保护变成对直接数据和关联信息进行保护,这种综合保护需求也带来了巨大的挑战。第三,数据真实性保障更困难。在当前的万物互联时代,数据采集者要收集的信息太多,甚至很多数据是经过多次转手之后收集到的。收集者无法验证到手的数据是否是原始数据,甚至无法确认数据是否被篡改、伪造,为此依赖于大数据进行的应用,很可能得到错误的结果。
(三)国家社会安全和法规标准挑战
第一,大数据安全影响国家安全。实践证明,数据已成为一种生产力,是一个国家最重要的竞争力体现,但随着网络世界的开放化,以及边界的模糊化,数据安全越来越威胁到国家安全,没有大数据安全,也就无法做到真正意义上的国家安全。第二,社会治理面临大数据挑战。大数据在社会治理中,已成为提升政府治理能力的有效工具,但是,从我国信息化发展的现实情况看,要全面实现政府数据的公开共享仍需努力。掌握大量数据的各级政务部门,由于大数据安全措施不到位,数据无法实现共享开放。第三,大数据安全法规标准尚需完善。标准是法规制度的支撑,肩负着规范市场客体和技术的重要职能。除了在立法层面要明确数据保护方面的法规外,还应制定相应的数据采集、储存、处理、推送和应用等方面的标准规范。通过制定符合实际的大数据应用和安全标准,有效促进大数据安全应用,从而既能引导、规范、促进大数据的发展,又确保了数据开放共享、个人信息保护需求和安全保障需求之间的平衡。
三、大数据安全理论研究
(一)大数据安全的定义
大数据安全的定义随着信息技术的发展而变化。计算机时代,信息的完整性、保密性和有效性是公众关注的重点。互联网时代,数据安全的重点则聚焦在网络信息目标的真实性、可依赖性、可控性。大数据时代,数据自身安全以及数据保护的安全成为关注的重点。[1]由此,大数据安全应运而生。综合当前对大数据安全的定义,得出大数据安全主要有两类:第一类是数据自身安全,主要是指运用先进密码算法对数据进行加密,进而主动保护数据;第二类是数据保护的安全。如表2所示,主要指构建包括系统层面、数据层面和服务层面的大数据安全框架。
表2 大数据安全框架
层面 | 具体内涵 |
系统层面 | 保障数据安全和大数据正常应用需要通过系统、全局地构建安全防护体系,保障大数据系统正确、安全可靠的运行,防止大数据被泄密、篡改或滥用。主流大数据系统是由通用的云计算、云存储、数据采集终端、应用软件、网络通信等组成,保障大数据系统中各组成部分的安全是保障大数据安全的重要前提 |
数据层面 | 大数据应用涉及采集、传输、存储、处理、交换、销毁等各个环节,每个环节都面临不同的安全威胁,需要采取不同的安全防护措施,确保数据在各个环节的保密性、完整性、可用性,并且要采取分级分类、去标识化、脱敏等方法保护用户个人信息安全 |
服务层面 | 大数据应用在各行业蓬勃发展,为用户提供数据驱动的信息技术服务,因此,需要在服务层面加强大数据的安全运营管理、风险管理,做好数据资产保护工作,确保大数据服务安全可靠,从而充分挖掘大数据的价值,提高生产效率,同时防范各种安全隐患 |
(二)大数据安全的主要内容
从不同角度划分数据安全的主要内容,可以分为以下几个层面:第一,在技术层面,数据安全包含数据操作系统安全、数据库设备安全、访问控制等。第二,在层次结构上,如表3所示,主要包括实体安全、系统安全、信息安全、制度安全和战略安全。[2]
表3 数据安全在层次结构上的主要内容
安全层次 | 内涵 |
实体安全 | 又称物理安全,是指保护计算机硬件设备、网络设施、存储介质及其他免遭天灾人祸的措施及其过程。具体包括数据环境安全、数据设备安全等 |
系统安全 | 是指保护计算机网络系统、操作系统及数据库安全。包括数据库运行安全、数据存储安全、数据传输安全、计算机系统安全等 |
信息安全 | 是指计算机存储介质上存放的数据及网络中传输的信息安全保护。包括数据处理的机密性和数据传输过程中的完整性 |
制度安全 | 是指数据自主可控并能够防范风险,数据安全管理制度可以依据“风险限定”制定 |
战略安全 | 是指从国家和国际的全局高度筹划和指导维护国家数据安全利益的方略。包括国家制定的数据安全战略、规划文件,以及研究性成果、军工科研项目等 |
资料来源:连玉明:《大数据蓝皮书:中国大数据发展报告No.1》,社会科学文献出版社,2017。 |
四、大数据安全指数的指标体系构建
(一)指标体系构建的思路
针对大数据安全威胁和挑战,需构建相应的大数据安全指数以反映某一时期大数据安全变动程度。如图2所示,本文主要从以下四个方面对大数据安全指标体系进行初步探析与构建。
图2 大数据安全指数评估的四个维度
1.大数据安全制度维度分析
大数据安全制度是对大数据安全的制度环境进行评价,主要包括政策规范和顶层设计等战略层面的文件出台情况。在国家安全政策的宏观背景下,从战略层面推动大数据安全相关制度管理、技术防护、安全运营及过程管理等工作的开展。
2.大数据安全设施维度分析
大数据安全设施是对硬件条件进行客观评价,主要是指为完成大数据安全保障的使命、功能和任务等,包括所提供的技术基础设施、工具等,以此评价大数据安全基础设施完备度与服务安全情况。
3.大数据安全能力维度分析
大数据安全能力是对大数据安全软件层面进行评价。大数据安全能力是指保障大数据安全所使用的技术支撑、平台支撑及人才支撑等内容,主要评价大数据在出现危险、事故、侵害后的安全恢复能力,以及对安全事件发生的预见性、预警和相应能力等。
4.大数据安全生态维度分析
大数据安全生态是对大数据社会环境进行评价。聚焦大数据安全的全生命周期的最终体现,包括完整的数据安全产业体系、灵活的对外交流合作机制、鲜明的社会及个人数据安全意识等,反映某一特定区域的数据安全建设成效。
(二)大数据安全指标体系
大数据安全指标体系由安全制度、安全设施、安全能力、安全生态4个一级指标、12个二级指标、19个三级指标组成(见表4),主要对直辖市、省会城市和计划单列市36个大中城市(不含港澳台)的大数据安全情况进行评价。
1.安全制度指标选择
安全制度指标选取安全立法、政策规范、标准评估3个二级指标进行评价。安全立法指地方数据立法,主要反映围绕数据的采集、存储、流通、应用等方面的法律支撑能力;政策规范是以地方制定出台的大数据相关政策为评价基础,反映地方对数据安全发展的支持力度;标准评估指地方参与制定以及自主制定的数据标准,反映政企之间、行业之间、企业之间的数据流通度。
表4 大数据安全指标体系
一级指标 | 二级指标 | 三级指标 | 指标类型 |
安全制度 | 安全立法 | 安全立法数量 | 数量指标 |
政策规范 | 政策规范数量 | 数量指标 | |
标准评估 | 标准评估数量 | 数量指标 | |
安全设施 | 数据节点稳定度 | 工业互联网标识解析顶级节点、二级节点数量 | 数量指标 |
灾备设施完备度 | 灾备中心数量 | 数量指标 | |
网络安全程度 | 企业网络安全指数 | 综合指标 | |
政府网络安全指数 | 综合指标 | ||
安全能力 | 技术研发突破 | 网络安全上市企业数量 | 数量指标 |
大数据安全研究发展中心数量 | 数量指标 | ||
国家网络安全试点示范项目数量 | 数量指标 | ||
政府数据开放平台 | 政府数据开放平台数 | 数量指标 | |
攻防演练 | 攻防实战演练次数 | 数量指标 | |
大数据安全靶场数量 | 数量指标 | ||
安全生态 | 产业体系 | IDC企业数量 | 数量指标 |
网络安全产业园区数量 | 数量指标 | ||
合作机制 | 合作办院(基地)/合作项目数量 | 数量指标 | |
对外交流 | 数量指标 | ||
文化建设 | 安全培训/安全知识宣教 | 数量指标 | |
个人网络安全指数 | 综合指标 |
2.安全设施指标选择
安全设施指标选取数据节点稳定度、灾备设施完备度、网络安全程度3个二级指标进行评价。数据节点稳定度以工业互联网标识解析顶级节点、二级节点数量为评价指标,主要反映地方工业互联网安全程度;灾备设施完备度较好可以确保企业业务连续性,减少因灾难造成的损失,以地方灾备中心数量为重要衡量标准;网络安全程度包括政府网络安全指数和企业网络安全指数,反映地方政府和企业安全设施的完善程度。
3.安全能力指标选择
安全能力指标选取技术研发突破、政府数据开放平台、攻防演练3个二级指标进行评价。技术研发突破包括网络安全上市企业数量、大数据安全研究发展中心数量以及国家网络安全试点示范项目数量,以此综合反映地方数据安全技术的研发和自主创新能力;政府数据开放平台是数据标准、数据安全管理的综合体现,以此为评价标准反映地方保障数据共享、数据流通的能力;攻防演练包括攻防实战演练次数和大数据安全靶场数量,反映地方应对安全事件的应急处理能力、人才队伍建设情况等。
4.安全生态指标选择
安全生态指标选取产业体系、合作机制、文化建设3个二级指标进行评价。产业体系以IDC企业数量、网络安全产业园区数量为评价基础,综合反映地方安全产业集聚发展程度以及产业链条的完善程度;合作机制包括合作办院(基地)/合作项目数量、对外交流情况,反映地方对外交流机制的完善情况;文化建设是用以政府为主导的安全培训/安全知识宣教、个人网络安全指数反映社会意识层面的数据安全认知情况。
(三)大数据安全指数数据处理和测算方法
在数据收集方面,为保证用于测评大数据安全指数的数据质量,数据主要来源于国家官方发布的统计数据,如国家和地方统计局等,以及国内权威研究机构发布的相关文件等,如中国电子信息产业发展研究院、中国信息通信研究院等,此外,还有通过互联网抓取的相关数据等。
在数据处理方面,为消除数据间的量纲关系,采用标准差对数据进行无量纲化,并根据专家意见法判定各指标的作用及影响程度,进而确定指标权重,最后通过加权平均的方法得到评价值。
综上,i地区大数据安全指数计算公式为:
Μi=f(X1)×W1+f(X2)×W2+…+f(Xn)×Wn
式中,Μi表示i地区大数据安全指数综合评价值,f(Xn)代表i地区第n项评分,Wn表示i地区第n项指标的权数,其中n为指标的项数,i为地区的个数。