当前位置:首页 > 复旦智库 >

复旦智库:2021上半年中国地方政府数据开放报告(指标体系与省域标杆)

  • 2021年07月23日
  • 50 金币

1 001 001 引言 001 ■ 评估方法 004 ■ 数林概貌 014 ■ 数林标杆 020 附录 022 002 引言 001 引言 “中国开放数林指数”是我国首个专注于评估政府数据开放水平的专业 指数,由复旦大学数字与移动治理实验室制作出品。开放数据,蔚然成林, “开放数林”意喻我国政府数据开放利用的生态体系,一棵棵地方开放“数 木”由最初的丛然并生、成荫如盖,直至枝繁叶茂、花开结果,终将成长 为一片繁盛多样、枝杈相连、持续循环的中国“开放数林”。 “中国开放数林指数”自 2017 年 5 月首次发布以来,每半年发布一次, 定期对我国地方政府数据开放水平进行综合评价,精心测量各地“开放数木” 的繁茂程度和果实价值,助推我国政府数据开放生态体系的建设与发展。 2018 年以来,“中国开放数林指数”为国家互联网信息办公室信息化发展 局监测我国公共信息资源开放情况提供数据支撑。 002 2021 年起,指数制作方将原来的“省级”指数调整为“省域”指数, 从而将省作为一个“区域”,而不仅仅是一个“层级”来进行评测,并发布《中 国地方政府数据开放报告——指标体系与省域标杆》(以下简称《报告》)。 003 评估方法 004 一、 评估方法 1.1 评估对象:从“省级”到“省域” 随着中国开放数林的不断生长,今年的评估方法和指标体系又作出了 新的调整。2021 年起,中国开放数林指数将原来的评估对象“省级”调整 为“省域”,主要出于以下考量: 原来的评估对象“省级”更多将省作为一个“层级”来进行评测,“省 级”主要是指“省本级”,包括省直属部门和机构。然而,省和自治区不 仅仅是一个层级,更是一个“区域”,省和自治区政府在数据开放工作上 的职责不仅限于省本级,还包括对省内下辖地市的赋能、规范和协调作用, 例如制定省级法规和标准,统筹推进省内下辖地市开放优质数据集,促进 省市平台间的互联互通,组织全省性的数据利用促进活动等。因此,从本 期《报告》开始,开放数林指数将把“省域”(含省和自治区)作为一个 整体来进行评估,并注重省市两级在数据开放上的协同性和互通性。 根据公开报道,以及使用“数据+开放”“数据+公开”“公共+数 据”“政务+数据”“政府+数据”“地名+数据”“地名+政府数据”“地 名+开放数据”等关键词进行搜索,发现了截至 2021 年 4 月我国已上线的 地方政府数据开放平台,并从中筛选出符合以下条件的平台: 1、原则上平台域名中需出现 gov.cn,作为确定其为政府官方数据开 放平台的依据。 2、平台由行政级别为地级以上的地方政府建设和运营(不包括港澳台)。 005 3、开放形式为开设专门、统一的地方数据开放平台,或是在政府官网 上开设专门栏目进行集中开放,由条线部门建设的开放数据平台不在评估 范围内。 本次评估中,共发现符合以上条件的省域 18 个,具体省域、省本级平 台名称和平台链接如表 1 所示。2021 年上半年《报告》从全国选择了省级 及下辖地市基本都已上线了数据开放平台的省域作为标杆对象进行评估, 以供其他省域对标借鉴。截至 2021 年 4 月,我国共有广东省、广西壮族自 治区、山东省、四川省与浙江省五个省域符合以上标准。 ■ 表 1 评估范围(按拼音首字母排序) 006 1.2 评估指标体系 1.2.1 评估指标体系构成 开放数林指数邀请国内外政界、学术界、产业界七十余位专家共同参 与,组成“中国开放数林指数”评估专家委员会,以体现跨界、多学科、 第三方的专业视角。专家委员会基于数据开放的基本理念和原则,借鉴国 际数据开放评估指标体系的经验,立足我国政府数据开放的政策要求与地 方实践,构建起一个系统、科学、可操作的地方政府数据开放评估指标体系, 并为每项指标分配了权重(见图 1)。 ■ 图 1 开放数林指数评估指标体系的构建方法 007 评估指标体系共包括准备度、平台层、数据层、利用层四个维度及下属 多级指标(见图 2): 准备度是“数根”,是数据开放的基础,包括法规政策效力与内容、标 准规范、组织与领导等三个一级指标。 平台层是“数干”,是数据开放的枢纽,包括平台关系、发现预览、数 据获取、成果提交展示、互动反馈、用户体验等六个一级指标。 数据层是“数叶”,是数据开放的核心,包括数据数量、数据质量、数 据规范、开放范围等四个一级指标。 利用层是“数果”,是数据开放的成效,包括利用促进、利用多样性、 有效成果数量、成果质量等四个一级指标。 008 ■ 图 2 2021 中国开放数林指数评估指标体系(省域) 009 利用层 数据层 平台层 准备度 010 1.2.2 评估指标主要调整内容 ■ 整体:省域评估指标体系将准备度权重设为 20%,并更强调省级政 府对下辖地市数据开放工作的赋能、规范和协调作用。指标体系将数据层 权重设为 38%,利用层权重设为 22%,以强调政府数据不仅应向社会开放, 还需要在开放之后被社会充分利用。最后,将平台层的权重设为 20%,以 体现平台作为数据供需对接枢纽的作用。 ■准备度:提高了“标准规范”的权重,以鼓励由省级政府制定全省 统一的数据标准和平台标准;新增了对标准规范等级的评估,细化了对标 准规范内容的评估;新增了相应指标以强调建立跨部门统筹管理机制、明 确数据开放主管部门的职责、以及制定详细的当年度数据开放工作计划与 任务部署的重要性。 ■平台层:新增“平台关系”指标,对“省域整体性”和“区域协同 性”进行评估,以鼓励省域内的平台既能实现互联互通,又能保持地市特色, 并促成平台间的跨区域协同;取消或降低了部分功能设置类指标,以更加 突出平台帮助用户有效获取和利用数据的核心作用;在“互动反馈”下新 增“权益申诉”指标,以体现对公众和第三方权益保护的重视;在“用户 体验”下新增“账号互通性”指标,以鼓励实现省域内用户账号体系的互通。 ■数据层:在统计省域有效数据集总数、数据容量和优质数据集数量时, 将省内下辖地市所开放的数据集也折算记入省域总分,以反映省级政府对 下辖地市数据开放工作的赋能效果。在数据数量下新增“单个数据集平均 容量”指标,以引导各省既要提升数据总容量,也要提升单个数据集容量; 在数据质量下新增“高整合度数据集”指标,以鼓励省级政府整合省域内 各地市内容相同或相近的数据集,以减少数据碎片化;同时,还在数据质 011 量下新增“优质数据集持续供给”指标,以强调优质数据集的持续供给, 防止供给中断;在数据规范下新增“数据项一致性”指标,以强调内容相 同的数据集在数据项上的一致性。 ■利用层:新增了相应指标以强调省域内多个近似比赛之间的协同, 以及在举办大赛之外组织常态化、多样化、专门性的利用促进活动的重要性; 在有效成果的评价中,将省内下辖地市产出的有效利用成果也计入省域有 效成果数量;除评价有效成果数量外,新增“成果有效率”和“优质成果” 指标,以评估利用开放数据开发的成果是否真正有效和有用;新增“创新 方案质量”指标,以评测各地开放数据比赛产出成果的质量。 1.3 数据采集与分析方法 准备度评估主要对相关法律法规、政策、年度计划与工作方案、标准 规范、新闻报道等资料进行了描述性统计分析和文本分析。搜索方法主要 包括以下两种:一是在搜索引擎以关键词检索相关法规与政策文本、标准 规范、年度工作计划、地方党政领导讲话的新闻报道以及数据开放主管部 门的信息;二是在地方政府门户网站以及政府数据开放平台上通过人工观 察和关键词检索采集数据。数据采集截止时间为 2021 年 5 月。 平台层评估主要采用人工观察法对各地方政府数据平台上各项功能进 行观测并做描述性统计分析,数据采集截止时间为 2021 年 5 月。同时,还 对平台的回复时效和回复质量进行了评估,回复情况采集截止时间为 2021 年 5 月。 数据层评估主要通过机器自动抓取和处理各地公共数据开放平台上开 放的数据,结合人工观察采集相关信息,然后对数据进行了描述性统计分析、 012 交叉分析、文本分析和空间分析。数据采集截止时间为 2021 年 5 月,对“动 态更新”这一指标的评测时段为 2021 年 1 月至 2021 年 5 月。 利用层评估主要对各地公共数据开放平台上展示的利用成果进行了人 工观察和测试,对 2019 年以来各地开展的开放数据创新利用比赛信息进行 了网络检索,并对采集到的数据进行了描述性统计分析。数据采集截止时 间为 2021 年 5 月。 此外,为确保采集信息准确,避免遗漏,部分指标采取报告制作方自 主采集和向各地征集相结合的方式。各地征集结果经过报告制作方验证后 纳入数据范围。 1.4 指数计算方法 指数制作方基于各地在各项评估指标上的实际表现从低到高按照 0-5 分共 6 档分值进行评分,其中 5 分为最高分,相应数据缺失或完全不符合 标准则分值为 0。对于连续型统计数值类数据则使用极差归一法将各地统计 数据结果换算为 0-5 分之间的数值作为该项得分。 各地平台在准备度、平台层、数据层、利用层四个维度上的指数总分 等于每个单项指标的分值乘以相应权重所得到的加权总和。最终,各地开 放数林指数等于准备度指数、平台层指数、数据层指数、利用层指数乘以 相应权重的加权平均分。省域开放数林指数计算公式如下: 省域开放数林指数 013 数林概貌 014 二、数林概貌 截至 2021 年 4 月底,我国已有 174 个省级和城市的地方政府上线了 数据开放平台,其中省级平台 18 个(含省和自治区,不包括直辖市和港澳台), 城市平台 156 个(含直辖市、副省级与地级行政区)。与 2020 年下半年相比, 新增 32 个地方平台,其中包含 1 个省级平台和 31 个城市平台。 如图 3 所示,全国地级及以上政府数据开放平台数量增长显著,从 2017 年的 20 个到 2021 上半年的 174 个," 开放数据,蔚然成林 " 的愿景 已初步实现。 ■ 图 3 历年地级及以上平台数量增长情况 015 目前,我国 64.29% 的省级(不含直辖市)政府已上线了政府数据开 放平台。如图 4 所示,自 2015 年浙江省上线了我国第一个省级(不含直辖市) 平台以来,省级平台数量逐年增长,目前已达到 18 个。 ■ 图 4 历年省级(不含直辖市)平台上线情况 016 截至 2021 年 4 月,全国各地上线的省级(不含直辖市)政府数据开 放平台的地区分布如图 5 所示,颜色越深,代表平台上线时间越早,整体 上呈现出从东南部地区向中西部地区不断延伸扩散的趋势。 ■ 图 5 省级(不含直辖市)平台上线时间的地理空间分布 017 截至 2021 年 4 月,全国省域数据开放平台的整体上线情况如图 6 所示, 省域数据开放平台包括省(自治区)本级和省内下辖地市的平台,图中颜 色越深,代表该省域数据开放平台的整体上线程度越高。目前,只有广东省、 广西壮族自治区、山东省、四川省与浙江省的省(自治区)本级和下辖绝 大部分地市都已上线了数据开放平台(图中显示为全境深绿色或基本深绿 色的省域)。同时,安徽省内已有相当部分的下辖地市上线了数据开放平台, 但省本级平台尚未上线;而福建省、河北省、河南省、湖南省和陕西省虽 已上线了省本级平台,但省内绝大多数地市却尚未上线平台。从整体上看, 东南沿海省域的政府数据平台已经基本相连成片。然而,目前全国仍有吉林、 辽宁和云南 3 个省的省本级和下辖地市均未上线数据开放平台(图中显示 为全境灰色的省域)。 ■ 图 6 省域平台整体上线情况地理空间分布 018 图 7 是省域数据容量前十的地方,反映了省域有效数据集总数和数据 容量之间的关系。山东省的省域数据容量和省域有效数据集总数最高,浙 江省和广东省的省域数据容量仅次于山东省,其次是贵州省、四川省等地。 数据容量更能反映一个省域的数据开放总量,从图中可见,虽然有些省域 的数据集总数并不大,但数据容量却远高于其他省域;而有些省域的数据 集总数虽然较大,但数据容量相对于其他省域却并不占优势。 ■ 图 7 省域数据容量和有效数据集总数(前十名) 019 数林标杆 020 三、数林标杆 2021 上半年全国开放数林标杆省域的指数分值、排名和等级如表 2 所 示。在这五个标杆省域中,浙江省的综合表现最优,进入第一等级“五棵树”; 山东省表现优异,进入第二等级“四棵树”,其次是四川省、广东省和广 西壮族自治区。 ■ 表 2 中国开放数林标杆省域(前五名) 021 附录 022 指数制作方 指数制作团队 郑磊、刘新萍、张忻璐、吕文增、华蕊、张宏、侯铖铖 观察员 蔡伊南、常媛媛、董万怡梦、段晓耀、冯妍、管莹、胡海琛、黄思雅、 嵇江夏、姜怀舒、蒋佳钰、景宇欣、李佳欣、李慧瑜、李行行、 卢一鸣、莫涛、王芮、王艳梅、王野然、尉苇、吴海珍、肖姝阳、 徐丹丹、叶晴琳、于丹、余芊蓉、朱钰谦 报告校对组 纪昌秀、王翔、毛天慧、韩笑、马李滨 023 评估专家委员会 024 联合发布方 支持单位 合作单位 冥睿(上海)信息科技有限公司 中山大学数字治理研究中心 晴禾(南京)文化有限公司 汇纳科技股份有限公司 复旦发展研究院

  • 关注微信

猜你喜欢