我国地方大数据政策的扩散模式与转移特征研究
丁文姚, 张自力, 余国先, 韩毅
西南大学计算机与信息科学学院,重庆 400715
摘要:为揭示我国地方大数据政策的发展趋势与内容关联性,基于政策扩散与政策转移理论,采用内容分析法、社会网络分析方法,探索我国各省市68条地方大数据政策的时空扩散模式与内容转移特征。研究发现:我国地方大数据政策发布与参照的时间扩散模式均符合政策扩散一般规律,时间扩散曲线呈S型;政策参照扩散模式为目前中国常见的“中央—地方扩散”与自上而下层级参照扩散模式;此外,地方大数据政策对重要国家政策内容的继承性较高,不同区域政策内容的创新各具特色。
关键词: 地方政策 ; 大数据政策 ; 政策参照 ; 政策扩散 ; 政策转移
论文引用格式:
丁文姚, 张自力, 余国先, 韩毅. 我国地方大数据政策的扩散模式与转移特征研究. 大数据[J], 2019, 5(3):76-95
DING W Y, ZHANG Z L, YU G X, HAN Y.Research on the diffusion models and transfer characteristic of local big data policy in China. Big Data Research[J], 2019, 5(3): 76-95图片
1 引言
2011年6月,麦肯锡咨询公司在《大数据:下一个创新、竞争和生产力的前沿》研究报告中提出“大数据时代已经到来”,从此引爆全球大数据发展的浪潮。近年来,我国大数据产业市场规模保持高速增长,不仅影响了大众的生活方式,也为社会、经济发展创造了无限价值。2015年8月,国务院印发《促进大数据发展行动纲要》,首次明确提出建设数据强国,并系统部署了我国大数据的发展工作。2015年10月,十八届五中全会提出“实施国家大数据战略”,自此,大数据成为国家发展战略。随着相关国家政策的落地,国家发展和改革委员会、工业和信息化部等政府部门均颁发了与大数据发展相关的方案,全国各地政府及相关部门也纷纷推出了大数据发展规划与相关政策文件。 政策扩散是我国公共政策活动的重要特征。在实践中,政策的扩散和转移是政策发布与推行活动的普遍现象,中央政府、地方政府部门间的政策文件扩散活动随着政策数量的日益增加而日趋频繁,进而促进了政策内容主题的相互转移;在研究领域,针对政策扩散和转移,从历时或跨区域、跨领域的角度研究政策知识内容、政策模式对关联领域的影响,是政策比较研究的重要研究方法。目前,已有研究从政策扩散或政策转移视角,对我国国民经济和社会信息化规划政策、科技成果转化政策、政务中心制度、地方政府信息公开制度等政策的发展过程进行考察分析,揭示了不同类型政策的发展特征。为了解我国大数据政策的发展趋势,掌握不同层级、不同区域地方大数据政策内容的关联性,本文基于政策扩散和政策转移理论,探究我国地方大数据政策的时空扩散模式与内容转移特征,旨在为我国大数据政策的未来发展与推行提供一定的理论支持。
2 研究现状
政策扩散与政策转移理论在国内外已积累了较为丰富的研究基础,下面首先梳理政策扩散与政策转移的理论概念内涵与相关研究应用现状,并对目前我国大数据政策相关研究的研究内容与研究方法进行简要总结,再在此基础上分析政策扩散与政策转移用于大数据政策分析研究的可行性与意义。
2.1 政策扩散
政策扩散是政策创新扩散的简称,通常是指一项政策方案从一个部门或地区传输到另一个部门或地区,并被新政策主体采纳和推行的过程。1969年,Walker指出美国各州公共政策并非完全渐进的,而是存在跳跃性创新的,且创新往往会被邻近州效仿;Brown L A等人总结出政策创新扩散过程的3条经验性规律,即在时间维度上呈现S形曲线、在空间维度上表现为邻近效应、在区域内出现领导者—追随者层级效应;Berry F S提出了4种基本的政策扩散模型,分别为全国互动模型、区域扩散模型、领导—跟进模型和垂直影响模型,这4种传播模型体现了政策创新的时空扩散效应。国内政策扩散研究始于2004年,尤其是随着格雷的《竞争、效仿与政策创新》在中国发表后,相关研究日益增多。在理论研究方面,陈芳对政策扩散、政策转移和政策趋同三者的概念、模型、机制进行了比较研究;王浦劬、赖先进提炼了中国公共政策扩散的4种基本模式,分别为自上而下的层级扩散模式、自下而上的政策采纳和推广模式、区域和部门之间的扩散模式、政策先进地区向政策跟进地区的扩散模式,同时发现了5种公共政策扩散机制,分别是学习、竞争、模仿、行政指令推行和社会建构。另外,在基于政策扩散理论的实证研究方面,杨静文分析了政务中心制度在地市级政府中的扩散进程,验证了其政策扩散的S型曲线;张玮、王洪涛等人分别考察了我国暂住证制度与地方政府信息公开制度的政策时空扩散变化过程;张剑等人通过政策参照网络和政策内容关键词时序变化,从强度、广度、速度与方向4个维度研究了中国科技成果转化政策扩散的过程和特点。
2.2 政策转移
政策转移的经典定义是由Dolowitz和Marsh提出的。政策转移是指存在于与某一时间与空间的政策、行政安排和制度相关的内容被用于另一时间与空间的政策、行政安排和制度设计的过程。根据转移的程度,政策转移可分为复制、效仿、混合、启发4种类型。任何政策转移都是转移过程和内容的结合,分析框架主要包括:谁在转移、转移了什么、发生在哪儿、转移程度如何、转移如何展现等。在定性研究方面,魏淑艳对我国建国初期经济领域政策转移的源头选择、政策转移的前导、政策转移的发生历程进行了研究;牛红亮等人从目标、内容、特点、管理体制、信息环境等方面对中国、美国、日本的信息政策进行了比较研究。在量化研究方面,程瑨等人梳理了示范区2006—2015年123条科技人才政策的转移情况;裴雷等人通过政策文本主题的一致性,测算了435条国民经济和社会信息化规划政策扩散中的主题继承与主题创新、主题跃迁与主题衰退情况;施茜等人基于知识扩散和政策转移的思想量化分析了江苏省、浙江省信息化政策实践与信息化政策研究的一致性和相关关系。 综上,政策扩散关注政策的交互过程,主要以政策文件为单位,从政策发布和政策参照两个视角研究其时空扩散模式;而政策转移关注政策的内容关联,主要以政策文本字词为单位测算内容主题的继承与创新,两者结合相得益彰,为政策分析提供了有意义的研究视角。 自大数据政策在我国各地区推行以来,周京艳等人从政策工具视角,对18条国家级大数据政策进行了内容分析,并讨论了现有政策的合理性;张会平等人通过关键词共现关系,分析了我国189条政务大数据政策的推进过程、热点领域和价值取向。总体来说,目前对大数据政策的扩散和转移的研究数量较少且较为宏观,缺乏对地方大数据政策发展过程的探究。基于此,本文以我国各地区主要的地方大数据政策文本为研究对象,聚焦其交互扩散过程与内容转移情况,旨在揭示我国地方大数据政策的扩散分布特征和不同地区政策转移内容的差异与联系。
3 数据与方法
本节对数据收集与研究方法进行说明。在数据收集方面,笔者主要阐述数据收集的来源与原则;在研究方法设计方面,主要阐述政策扩散分析的维度与分析方法设计、政策转移的测算算法设计两方面内容。
3.1 数据收集
为掌握我国地方大数据政策的扩散模式与转移现状,笔者主要通过网络抽样法,采取重点抽样的数据收集方式,从互联网平台收集我国除香港、澳门和台湾外的31个一级行政区(省、自治区和直辖市)以及各省会城市或重要城市公开发布的与“大数据”专题相关的政策文件文本。由于我国各地区发布的地方大数据相关政策较多且分布不均,在通过互联网抽样收集政策文本时,遵循以下4点原则。
(1)代表性
本文主要以我国31个一级行政区及其省会城市为单位,优先收集各地区公开发布的省级大数据政策与相应省会城市的市级大数据政策,根据情况抽样收集部分重要城市的大数据政策。
(2)真实可靠性
为保证政策数据的信度,主要以各地区政府官方网站的政策发布通知为基础,收集经官方公开发布、真实可靠的地方大数据政策。
(3)针对性
为保证政策数据的效度,一方面,针对性收集标题包含“大数据”并以大数据发展为主题内容的各省、市级政策文件;另一方面,对于同地区发布的不同版本的相似政策或具有不同侧重专题的大数据政策,主要以内容的成熟性和全面性进行政策抽样,优先收集版本较成熟、内容较全面的地方大数据政策。
(4)内容完整性
为满足政策文本内容分析的需要,优先收集可获取政策全文的大数据政策,主要通过线上政策信息公开平台、百度文库等互联网页面收集大数据政策文本数据,并对各平台提供的政策文本内容进行比较,选择内容真实完整的大数据政策。
基于以上政策数据收集原则,本文共获取68条我国各省、市级地方大数据政策文本,政策样本来源分布见表1。
3.2 研究方法设计
3.2.1 政策扩散分析
笔者从政策发布与参照两方面考察我国地方大数据政策的时空扩散情况。在政策发布扩散方面,以我国各地区大数据政策的累积量时空分布揭示政策发布的时间、空间扩散趋势模式;在政策参照扩散方面,由于政策之间的参照与文献引用类似,对于参照的政策文本,以书名号的方式将被参照的政策法规名称列出,采用内容分析法对政策文本中提及的参照关系进行识别和编码。在此基础上,首先统计分析政策参照的时空扩散分布与整体趋势,其次使用Gephi社会网络分析软件构建政策参照扩散的地理可视化网络,以探索政策参照扩散网络的空间扩散特征,进而识别参照扩散网络处于核心地位的政策节点,并分析其在参照网络中的影响作用。
3.2.2 政策转移测算
政策转移聚焦政策交互扩散过程中政策内容主题的继承与创新。本文假设政策内容中高频出现的概念词能够较大程度地反映该政策的关键主题,通过ROSTCM词频分析软件和人工筛选提取政策文本关键词,并计算词频,再以具有参照关系的政策内容的高频概念词对应情况测算其政策转移程度。
为衡量政策转移程度,裴雷等人基于知识扩散和政策转移思想提出“采纳一致算法”,并进行测算。受此启发,根据大数据政策文本实际情况,为尽量减小政策文本内容字数对政策主题概念词数量的影响,本文提出基于高频词分布的政策转移比率Th-fw,并利用其测算政策内容间的继承程度。
假定施加参照的政策与被参照政策内容中的概念个数分别为N1、N2,以词频为标准进行排序,分别从两个概念集中选取排序前N的高频概念,其共有的政策概念个数为n,则基于高频词分布的政策转移比率Th-fw为:
Th-fw=n/N ✖100% (1)
根据式(1),Th-fw值越高,则参照关系中的政策转移效应越强,即政策继承程度越高,政策创新程度越低。但Th-fw仅能从数值上推测政策转移的程度,无法揭示政策继承与创新的具体内容,为此笔者进一步使用VOSviewer工具对政策间的共有关键词进行聚类分析,用关键词网络图谱与关键词密度图谱呈现政策继承共有关键词的类团分布与联系;而政策创新主题的揭示主要结合各地区大数据政策的非共有高频词分布情况,采用内容分析方法进行具体处理。
4 我国地方大数据政策的扩散模式及主要特征
本文从政策发布与政策参照两个方面,并结合时间与空间两个维度对我国68条地方大数据政策的扩散情况展开分析,主要揭示我国地方大数据政策的扩散模式与主要特征。一方面,通过分析我国68条地方大数据政策在各地区的累积量分布情况,掌握政策发布的时空扩散特征;另一方面,根据政策文本间的参照关系,揭示我国地方大数据政策在时间、地理空间和行政区级别3个方面的参照扩散特征。
4.1 地方大数据政策发布扩散模式
4.1.1 政策发布时间扩散特征
笔者基于收集的68条地方大数据政策,以各地区大数据政策发布年份为横轴、以某年政策发布累积量为纵轴做折线图,考察我国地方大数据政策发布的时间扩散趋势,结果如图1所示。
图1 地方大数据政策发布累积量时间扩散
从图1可以看出,我国地方大数据政策时间扩散效应较为明显,扩散曲线大致呈S型分布,符合政策创新扩散的一般规律。从时间发展历程来看,政策发布扩散主要经历3个阶段。
(1)第一阶段:扩散缓慢起步期(2013—2015年)
2013—2015年,仅有少数省份开始出台与大数据相关的政策,至2015年共发布5条大数据政策,较早出台地方大数据政策的省市为重庆市与湖北省武汉市。该时间段,地方大数据政策的制定发布处于萌芽发展期,未表现出明显的扩散趋势。
(2)第二阶段:快速扩散期(2016—2017年)
2016年是大数据政策扩散的重要分界点。在2015年国家出台《促进大数据发展行动纲要》等一系列重要大数据发展战略政策后,2016—2017年大数据政策的发布在全国范围内迅速扩散,2016年与2017年分别有27条、28条地方大数据政策出台,至2018年初共出台60条地方大数据政策。这一阶段,扩散趋势与政策扩散理论中的“地方政府的政策扩散受中央政府影响,中央政府可以通过强制或激励推进政策扩散”现象较为契合。
(3)第三阶段:扩散趋缓期(2018年后)
经过迅速蔓延的扩散阶段后,全国大多数地区已出台地方大数据发展政策,2018年后,我国地方大数据政策发布扩散速度减缓,发布数量明显减少,全国仅出台8条地方大数据政策,主要分布于内蒙古自治区、山西省和四川省。
4.1.2 政策发布空间扩散特征 68条省、市级地方大数据政策的发布地区分布见表2。从空间分布来看,较早发布大数据政策的一级行政区分别为重庆市、河北省、湖北省、辽宁省、青海省。至2016年底,我国大部分一级行政区发布了较为成熟的大数据政策,至2017年底,本文研究的31个一级行政区均发布了大数据的相关政策。
从表2的数据可以看到,至2018年底,大多数一级行政区至少发布了2条大数据政策,江苏省发布的大数据政策达到了7条。
以上分析表明,2016年大数据政策在各一级行政区的空间扩散呈现明显的“突增覆盖”现象,这主要是受国家大数据政策的垂直影响;同时,地方大数据政策的发布扩散有一定的邻近效应,在我国华东地区、中南地区一级行政区的扩散时间靠前、扩散数量较多,而在西南地区、西北地区的扩散时间较为滞后、扩散数量较少。
4.2 地方大数据政策参照扩散模式
笔者对68条政策样本文本内容进行政策参照关系识别与编码。经数据整理与统计发现,其中9条政策无政策参照关系,59条政策具有政策参照关系;参照关系共145条,涉及政策共135条(其中59条为收集的各地大数据政策,76条为识别的被参照政策)。
4.2.1 政策参照时间扩散特征
地方大数据政策发布与参照时间扩散趋势如图2所示。从图2可以看出,大数据政策参照扩散主要表现为前期缓慢扩散、中期快速扩散、后期扩散减缓的趋势,呈现典型的S曲线扩散特征。通过对地方大数据发布与参照时间扩散趋势的比较分析发现,二者的扩散发展阶段基本对应且保持较为同步的扩散趋势。2013—2015年为政策发布与政策参照的扩散缓慢期, 2013—2014年几乎没有政策参照关系的出现,2015年仅出现两条政策参照关系;随着2016年大数据政策发布的快速扩散, 2016—2017年政策参照关系分布逐渐密集,政策参照扩散速度呈直线增长,2016年与2017年政策参照频次分别为58次、64次,其增长幅度明显高于政策的发布扩散速度;2018年后,政策发布扩散与参考扩散速度均降低,但政策参照扩散增长率仍略高于政策发布扩散的增长率。
图2 地方大数据政策发布与参照时间扩散趋势
为进一步探究政策参照扩散的时间对应关系,将施加参照的政策与被参照政策的发布时间一一对应,交叉统计结果如图3所示。分析图3可以发现:2013年、2014年各地大数据政策没有对其他相关政策的参照关系;2015年起开始出现对同年政策的参照关系;2016年共有58次参照关系,对2015年政策的参照频次最多,其次为同年政策参照;2017年参照关系最多,共有64次,主要对2016年政策进行参照,其次是对同年与2015年政策的参照;2018年有21次参照关系,对2016年政策的参照次数较多,其次是对2017年与同年政策的参照,对2015年政策的参照次数很少。以上政策参照扩散的时间对应情况表明,各地大数据政策主要参照较近年份的其他政策,当年政策对前一年和同年政策的参照频次较高,对发布时间越靠前的政策的参照频次越低;另外,各地方大数据政策对2015年与2016年的政策参照频次较高,这在一定程度上表明了2015与2016年政策在各地方大数据政策的制定过程中发挥了较大的作用。
图3 政策参照时间扩散分布(横坐标的上部为被参照政策发布年份,下部为施加参照的政策发布年份)
4.2.2 政策参照空间扩散特征
(1)政策参照地理扩散网络
以政策参照关系为基础,分别将被参照政策和对应的地方大数据政策作为政策扩散的“源头”和“目标”,通过Gephi社会网络分析软件绘制拥有135个节点与145条边的政策参照扩散网络。
从政策参照扩散网络图谱发现,我国地方大数据政策扩散网络中最大的节点位于北京市,即中央政策在政策参照扩散网络中占最大权重,说明各地方大数据政策对中央政策的参照频次最多,表明中央政策对地方政策有决定性影响且中央政策能够被较好地贯彻执行;另外,政策参照扩散网络在地理位置上的分布主要呈现中央向全国各省、市的大范围放射状扩散,较符合目前中国常见的“中央—地方”政策扩散模式,同时,在小范围内存在少许“省级—市级”或“市级—市级”的政策扩散现象。
(2)政策参照行政区级别扩散
根据《中华人民共和国宪法》,我国现行的行政区划分为省级行政区(省、自治区、直辖市、特别行政区)、地级行政区(地级市、自治州等)、县级行政区(市辖区、县等)、乡级行政区(镇、乡等)。基于此,本文对政策发布机构级别进行归类,例如省、自治区、直辖市的人民政府为一级行政区机构,地级市人民政府为二级行政区机构,县级人民政府为三级行政区机构。
以政策发布机构的行政区级别为划分标准,我国地方大数据政策的行政区级别扩散分布见表3。59条地方大数据政策中,有31条政策来自一级行政区,27条政策来自二级行政区,1条政策来自三级行政区,总体来看,来自一级行政区与二级行政区的大数据政策数量较为平均,两者参照政策的平均频次均为2.48,说明政策的参照扩散在不同级别行政区之间普遍存在。
从图4可以发现,一级行政区政府机关发布的大数据政策主要参照国家政策(占比75%),其次参照同级行政区的政策(占比24%),还存在1%是对下级行政区的政策参考;二级行政区主要参照国家政策(占比57%),对一级行政区与同级行政区的政策参照较为平均(分别占比22%、21%);三级行政区主要参照上级行政区的政策,对国家、一级及二级行政区政策的参照量较为平均,不存在对同级行政区的政策的参照。
图4 各级行政区大数据政策参照扩散分布
以上表明,我国不同级别行政区大数据政策间参照扩散紧密,不同级别大数据政策的参照扩散分布较为一致,下级行政区主要参照上级行政区和国家级别的政策,呈现“自上而下的层级扩散模式”,符合目前中国较为常见的公共政策扩散模式,即上级政府制定的政策通过政策落实和政策执行等方式,迅速扩散到下级政府及相关部门的政策扩散模式,具有一定的行政指令性特征。同时,存在同级别行政区政策的交互扩散现象,结合政策参照地理扩散特征,我国地方大数据政策在同级别行政区的扩散特征主要为地区内部同部门或跨部门的政策参照。
4.2.3 重要被参照政策的扩散特征
被参照政策是政策参照网络的重要部分,被参照政策参照频次分布如图5所示。从图5可以发现,被参照政策的扩散呈现较明显的“长尾效应”,即有且只有排序第一的政策在政策扩散中占据主要优势,拥有38条参照关系;共有15条(约19%)政策的参照频次大于1次;仅被参照一次的政策约占81%。
图5 被参照政策参照频次分布
参照频次大于1次的15条参照政策列表见表4。从表4可以发现,参照频次较高的政策主要来源于国家行政机关发布的政策,尤其是国务院发布的《国务院关于印发促进大数据发展行动纲要的通知》(以下简称《通知》),参照频次达38次。
由于参照频次较小的政策在政策扩散网络中的影响力较弱,故选取参照频次排序前三,即参照频次分别为38次、7次、5次的被参照政策,从时间与空间维度分别测算分析其在参照扩散网络中的影响力,测算指标定义见表5。
首先,被参照政策的时间扩散趋势以时间扩散强度进行衡量,政策在某年被参照的频次越大,表明当年该政策的扩散强度越高。4条重要被参照政策的时间扩散强度时序变化如图6所示。逐年来看,4条国家政策均在其发布的后一年里获得了最大扩散强度,之后便逐年下降;时间扩散影响力较为突出的是2015年发布的《通知》,作为被参照频次最高的政策,其不仅在扩散强度上具有最大优势,而且相较其他国家政策而言,其被参照的持续性更强。
图6 被参照政策时间扩散强度趋势
其次,通过被参照政策的地区扩散分布进程的可视化显示其空间扩散广度与方向。从图谱可以看出,《通知》自2015年发布后,其扩散范围较广,2016—2018年全国范围内绝大部分一级行政区的大数据政策对该政策进行了参照,在地区间呈现较为明显的邻近扩散模式,扩散方向主要为由北到南,从邻近区域扩散覆盖至全国范围;我国对该政策参照频次较高的地区较为聚集,大致分布在南部、西北部和东部,江苏省的参照频次最高,为4次,广东省为3次,四川省、陕西省、内蒙古自治区、湖南省、河南省、广西壮族自治区、甘肃省、福建省均为2次,其他省份均为1次。相比之下,《工业和信息化部关于印发大数据产业发展规划(2016—2020年)的通知》《国务院办公厅关于运用大数据加强对市场主体服务和监管的若干意见》《国务院关于促进云计算创新发展培育信息产业新业态的意见》3条国家政策的扩散范围较小,在全国范围内的扩散也不均匀。
5 我国地方大数据政策的转移特征
政策转移聚焦政策交互扩散过程中政策的内容关联,包括政策主题的继承与创新两个方面。本文以不同地区政策内容的词频分布与基于高频词分布的政策转移比率Th-fw测算结果为基础,揭示各地方大数据政策对被参照政策内容主题概念的继承与创新程度。
地方大数据政策的空间参照扩散特征表明,各地方大数据政策对中央政策的参照较为集中。鉴于其他政策的扩散强度较弱,扩散广度较局限,以扩散强度与广度最大的《国务院关于印发促进大数据发展行动纲要的通知》为代表,探究以传统六大地理分区标准划分的我国华北、华东、东北、西北、西南、中南6个不同地理区域大数据政策对国家政策的政策转移情况。
对不同区域政策内容关键词的提取主要经过了3个步骤:首先去除文本中的引言、背景描述、发文机关、接受单位、发布时间等无关字段;其次,运用ROSTCM工具对政策文本进行分词,为保证关键词的有效性,根据《国务院公文主题词表》词汇和大数据相关关键词(“大数据”“云计算”“人工智能”等)增加分词词表词汇,并在过滤词表中添加与关键内容关联不强和无意义的语词、形容词、动词等;最后,在软件分词的基础上,进一步手工筛选、合并关键词。经多次反复处理,获得政策内容的词频统计结果。
经高频词分布一致率计算,基于前200和前50高频词的我国各区域大数据政策的政策转移比率Th-fw见表6、表7。
数据表明,全国六大地理行政区中,参照《通知》的地方大数据政策与《通知》政策内容概念的重合一致率较高,各区域政策文本排序前200高频词对比后的政策转移比率Th-f结果均达65%以上,多数在70%以上。进一步对比排序前50的关键高频词发现,大部分区域的政策转移比率Th-fw为90%以上,最高达98%。由此可以推测,各区域地方大数据政策对《通知》的政策转移程度较高,继承性较强。从基于前200高频词的政策转移比率数据来看,整体上中南地区政策转移程度较高,其次依次是华东、东北、华北、西南、西北。
Th-fw测算数据表明,大多数地方大数据政策较大程度继承了《通知》内容中的关键概念,但仅能从数值高低推测各地政策转移程度,无法揭示具体的政策转移内容。为掌握各区域大数据政策的政策继承与创新主题概念的分布情况,需结合各区域大数据政策与中央政策内容中共有与非共有概念关键词的分布进行进一步分析。
5.1 政策继承主题分布
政策继承主题表现为各区域大数据政策内容与《通知》的共有概念词。由于各区域大数据政策与《通知》的概念词重合率均较高,《通知》的高频关键词分布即可大致反映政策继承主题的主要内容。
以ROSTCM词频分析软件对《通知》内容进行关键词共现分析,并使用VOSviewer社会网络分析工具绘制《通知》的高频关键词网络可视化图谱与高频关键词密度可视化图谱。高频关键词密度可视化图谱呈现了政策内容中不同关键词的重要性程度,一个关键词出现的频次越高,并且与其联系的关键词频次越高,则该区域的颜色越靠近红色,表明该关键词占越大的权重。从图7可以看出,“大数据”“数据”“服务”是政策文本中的核心内容,围绕核心关键词,主要强调的内容为“数据资源基础”“服务应用”“社会数据共享”“政府数据开放”“公共数据建设”“技术应用”等。
图7 《国务院关于印发促进大数据发展行动纲要的通知》高频关键词密度可视化图谱
另外,VOSviewer利用不同类别中所有个体间欧几里得权重距离之和最小的聚类算法对关键词进行聚类,高频关键词网络可视化图谱使用不同颜色区分不同关键词类团,同一类团内关键词的相似性较高,不同类团之间相似性低。根据政策关键词同质性的差异和词频密度高低的不同,图8标引了6个主题聚类,代表政策继承的6个主题。
图8 《国务院关于印发促进大数据发展行动纲要的通知》高频关键词网络可视化图谱
● 强调大数据的创新应用:具体包括“大数据”“保障”“创新”等关键词,主要内容为鼓励大数据驱动创新应用与建设大数据保障工程。
● 创造大数据应用环境:具体包括“服务”“企业”“市场”“平台”等关键词,主要内容为鼓励企业开展大数据服务、建设大数据市场化交易与数据资源平台。
● 推进公共大数据融合:具体包括“公共”“共享”“政府”“社会”等关键词,主要内容为加强公共信息资源采集与管理、加强政府数据与社会数据的整合、鼓励政务数据向社会适度共享与开放。
● 布局国家大数据平台:具体包括“国家”“开放”“数据”“采集”等关键词,主要内容为鼓励政府部门对信息进行集中采集、加强各领域数据资源的共享开放、加快国家政务信息化工程建设。
● 利用大数据提升质量安全能力:具体包括“质量”“安全”等关键词,主要内容为完善大数据的监管应用,通过大数据提高安全治理服务的质量与能力。
● 促进大数据技术发展:具体包括“基础”“技术”等关键词,主要内容为加强大数据技术的基础研究、技术产品研发和核心技术攻关,推进大数据技术的应用。
5.2 政策创新主题分布
政策继承程度通过政策间高频关键词的重合情况进行衡量,政策创新则表现为不同政策内容中非重合关键词的分布。
由于参照《通知》的政策主要为各地区发布的省级政策或省会城市政策,本文假设这些政策在一定程度上反映了各省市关键的大数据产业发展战略,则政策内容高频词代表了该地区大数据政策的核心主题。基于此,结合各地区大数据政策与《通知》内容的非共有高频词的分布情况,分析各地区大数据政策的创新主题。为便于理解,以下将非共有高频词称为政策创新高频词。
抽取各区域政策内容前200的高频词为政策创新高频词,结合文本内容对政策创新高频词的实际意义进行确认,经筛选保留具有分析价值的词。
华北、华东、东北、西北、西南、中南6个区域大数据政策的政策创新高频词分布见表8。统计表明,各区域大数据政策之间的政策创新高频词具有一定的联系和差异:不同区域具有相同的政策创新高频词,表明这些区域政策创新主题有一定的相似之处;仅在一个区域大数据政策中出现的政策创新高频词体现了该区域大数据政策突出强调或具有特色的主题。
“优势”“引进”“挖掘”“改革”“应急”“基地”是全国各区域大数据政策文本中共同具有的政策创新高频词,这些关键词的具体内涵是全国各区域基于中央大数据政策在自身大数据产业发展战略制定中普遍关注的方面。
这些政策创新高频词在各区域大数据政策中的内涵较为一致,6个共有创新主题内容主要如下。
● 优势:融入地区自身具备的优势,如地理位置、人才资源、产业发展等方面,形成地区特色的大数据能力优势。
● 引进:积极引进国内外大数据龙头企业、大数据高端人才和团队、大数据项目与资源、大数据基础设施和高新技术等。
● 挖掘:研发数据挖掘技术,加强各平台动态大数据的分析,为社会治理、用户服务、产业发展等方面的决策提供坚实基础。
● 改革:依托大数据资源与技术促进教育、医疗、商业、制造业、政府、公共服务的制度改革,打造供给侧结构性改革新模式。
● 应急:打造大数据应急管理应用,实现应急响应一体化,提高环境应急、网络安全应急、公共安全应急的处置能力和水平。
● 基地:积极培育建设大数据产业与应用基地,如互联网应用创新基地、技术研发基地、人才培训基地、数据中心基地等。
此外,“物流”“环保”“通信”“资产”“计算”“药品”“精准扶贫”“感知”“人工智能”“高端”“丝绸之路”是至少两个区域共同具有的政策创新高频词。
“物流”“环保”“通信”“资产”“计算”被超过3个区域的大数据政策强调。其中,“物流”“环保”“通信”的分布更广,说明大数据应用于物流、环保以及通信技术的发展是较多地区强调的方面。
从“药品”“精准扶贫”“感知”“人工智能”“高端”“丝绸之路”的分布区域可以推测,相关创新主题与区域本身有一定的相关性。如在中南区域、西北区域、华北区域的大数据政策中强调,“运用大数据推动精准扶贫脱贫,加强精准扶贫大数据分析与深度应用”;“感知”“人工智能”“高端”聚焦大数据高新技术的深入发展,主要体现在我国经济与技术发展较为领先的华东区域、华北区域的大数据政策中,强调“融合大数据建设物联网智能化感知、网络安全态势感知、用户数据感知系统”“大力推动人工智能与实体经济深度融合、建设人工智能大数据产业、加强人工智能应用技术与创新研发”“培养数据领域高端专业人才、推动生产性服务业高端化发展、加强高端技术的研发、培育高端高效的智能经济”;“丝绸之路”作为具有特殊性的地理位置概念词,西南区域与华北区域的大数据政策强调“依托新丝绸之路发展物流大数据、建设丝绸之路数据港、打造数字丝绸之路”,由此表现出大数据应用融合地理位置优势的发展特色性。
根据仅在一个区域大数据政策中高频出现的政策创新词,能够推测不同区域大数据发展战略中突出强调或具有特色的方面。值得说明的是,本文以各区域大数据政策中排序前200的高频词分布区分不同区域政策创新关键词,只在某个区域出现的政策创新高频词并不表示该关键词在其他区域大数据政策中不存在,仅说明该词不在其他区域大数据政策排序前200的高频词范围内。因此,仅在一个区域大数据政策出现的政策创新高频词表明其为该区域较具特色的政策创新主题。分布在6个地理区域的特色政策创新高频词及其具体内容见表9。
6 结束语
本文基于公共政策的发布扩散和参照扩散现象,采用社会网络分析方法和内容分析法对我国68条地方大数据政策的时空扩散趋势和政策内容转移情况进行实证分析。
在政策时间扩散方面,我国地方大数据政策发布和参照的时间扩散均符合政策扩散的一般规律,扩散曲线呈现“S曲线”,具有明显的扩散效应;发布扩散与参照扩散趋势较为同步,主要经历扩散缓慢期、快速扩散期、扩散平稳期3个阶段,总体上政策参照扩散速度高于发布扩散速度;由于大数据是近年兴起的产业,我国各地大数据政策的参照关系时间跨度不长,各地大数据政策主要参照较近年份的其他政策,当年发布的大数据政策对前一年和同年政策的参照频次较高,对发布时间越靠前的政策参照频次越低;目前,地方大数据政策总体上对2015年与2016年的政策参照频次较高,主要原因在于2015—2016年重要国家级政策与各地一级行政区大数据政策纷纷出台,为后续相关政策的制定起到了重要的作用。
在政策空间扩散方面,大数据政策在我国各地区的发布扩散进程主要受国家政策的垂直影响,2016—2017年地方大数据政策呈大范围迅速扩散的趋势,至2018年全国31个一级行政区均已覆盖;发布扩散过程有一定的邻近效应,主要体现在我国华东地区和中南地区省份的政策发布时间普遍靠前、数量较多,而西南地区和西北地区的政策发布时间较为滞后、数量较少;地方大数据政策的参照扩散在地理位置分布上符合目前中国较为常见的“中央—地方”政策扩散模式,在地区行政级别上主要呈现“省级—市级”自上而下的层级扩散模式,具有一定的行政指令性特征,同时也存在少部分“省级—省级”和“市级—市级”的同级别行政区内同部门或跨部门的政策参照扩散现象。
68条地方大数据政策参照关系的参照来源政策分布情况表明,被参照频次较高的政策主要来源于国家行政机关发布的政策,被参照政策的分布呈现“长尾效应”,排序第一的《通知》占据绝对扩散优势,仅被参照过一次的政策约占81%;相较其他被参照的国家政策而言,《通知》时间扩散强度较大,2016—2018年全国范围内绝大部分一级行政区的大数据政策对该政策进行了参照,同时其空间扩散较广,扩散方向主要由北到南,从邻近区域扩散覆盖至全国范围。
在政策转移方面,我国各区域大数据政策对国家政策《通知》内容的转移程度均较高,说明中央政策在我国各地的推行落实情况较好,政策的关键概念在各地区得到了较好的继承,整体上中南地区的政策继承程度最高,其次依次是华东地区、东北地区、华北地区、西南地区、西北地区。基于国家政策的继承,各区域的大数据政策也表现出了一定的政策创新:不同区域大数据政策的政策创新主题具有一定的相似性,不同区域大数据政策也具有体现其发展战略差异性的创新主题。
大数据能够普遍应用于公共、社会各领域的服务与管理工作,在信息时代具有不容小觑的潜在价值。目前我国各地大数据政策扩散方式主要是由上至下的层级扩散,跨地区的政策扩散交互不足,地区内不同行政部门之间的政策扩散交互较少,因此需要进一步加强大数据政策的扩散深度与广度,加强发展水平较弱地区向发展水平较好地区进行政策内容的学习转移、促进不同地区大数据政策的交互扩散以及促进不同部门、不同主题的大数据政策交互扩散。
本文通过抽样分析我国68条地方大数据政策,总体描述了我国地方大数据政策的时空扩散特征和内容转移情况,但仍存在一定局限性。首先,在政策数据收集方面,采用网络收集方法对我国各地区地方大数据政策进行重点抽样形成的68条政策数据样本集较为有限,在一定程度上造成了研究结论的局限性;另外,本文使用基于高频词分布的政策转移比率Th-fw测算地方大数据政策与被参照国家政策的内容转移程度,对不同地区的政策继承与创新情况具有一定的评估作用,然而,政策样本集关键词的抽取对测算结果影响较大,由此可能对分析结果造成一定的误差。因此,笔者后续研究需要扩大政策样本,以更充足全面地分析完善本文研究结论,此外,后续还可进一步提高政策文本的分词精度,改进政策转移计算方法,从而提升政策转移的评测研究水平。
查看更多关于我国地方大数据政策的扩散模式与转移特征研究的详细内容...