广东省数字政务协会
首页 >简讯 >复旦大学教授郑磊:数据开放应开放底层的数据
  • 复旦大学教授郑磊:数据开放应开放底层的数据
  • 2016年12月01日 09:29 发布人:

热门下载(点击标题即可阅读)

☞【下载】2015中国数据分析师行业峰会精彩PPT下载(共计21个文件)


导 · 读

11月26日,以政务数据利用与数据交易为主题的大数据高峰论坛在中国(南京)软件谷举行。

作为2016首届南京大数据产业年会暨大数据发展高峰论坛的重要活动之一,本次论坛邀请了中国工程院院士倪光南、中国工程院院士沈昌祥、江苏省经信委副主任龚怀进、复旦大学教授郑磊、中国科学院百人计划研究员陈曙东、前Intel美国研究院资深科学家、天数科技CTO胡世亮、大数据发展促进委员会常务副主任委员魏凯、贵阳大数据交易所执行副总裁朱国辉、中关村大数据产业联盟秘书长赵国栋、南京市信息中心主任何军、南京天数科技CEO李云鹏、TalkingData政府事业部总经理尚勇、亚信数据LDP云平台总经理何鸿凌13位知名学者、专家、大数据企业领军人物,通过演讲、对话等形式,针对大数据电子政务应用、大数据安全、政务数据开放、数据交易等话题进行深度交流与研讨。

复旦大学教授郑磊在论坛上做了《数据开放的原则与标准》的主题演讲。

以下为演讲正文+原文PPT......



1

演讲正文


   数据共享和开放是目前大数据发展的重点话题,主要涉及的是政府部门掌握的政务数据。今年的数博会上,李克强总理提到,我国80%以上的数据掌握在政府手上,除非涉及到国家安全、商业秘密或个人隐私,都应向社会开放。到底怎样才是标准的数据开放呢?



复旦大学教授  郑磊


   我们发现武汉的开放数据平台上面有大量所谓统计报告、图表,比如1到11月份的工业经济运行情况。这种文件的格式不是机器可读的,文件中出现的是基于原始数据做出来的统计结果或产品,并非标准的数据开放。

而在上海政府服务网,我们看到有这样一些停车场数据——全市共有2173个停车场,其中杨浦区和黄浦区各有多少个。这些数据只让我们看到了结果,并不能拿去进行开发利用,也不是数据开放。

   此外,还有些地方政府提供了数据查询服务,你可以单条查询数据,但后台的数据集不能看见也不能拿走;有些地方把数据做成可视化或APP应用,这些都不是数据开放。

真正的数据开放看起来没有可视化或者各种应用那么“炫”,在形式上只是一个数据集,横向有字段,纵向有条目。也就是说,数据开放,要开放底层的数据,而不仅仅提供根据数据分析出来的结果或开发出来的产品。从技术上而言,数据开放就是要以机器可读的标准格式开放数据,使数据可以被机器直接抓取和调用;同时,还要在法律上允许数据利用者进行商业和非商业利用,因为这些信息已经不涉及到国家安全、商业秘密和个人隐私了。

    为什么做到以上这些才叫数据开放?因为政府在履行行政职能的过程当中,采集和储存了大量数据,这些数据如果没有涉及到国家安全商业机密个人隐私,就应该回报给社会,让数据能够被充分地开发利用、产生价值。开放数据可以推动大众创业、万众创新,实现政府和社会合作共创,推动经济增长社会发展,加快产业升级,实现科学决策,提升公共服务和政府治理水平。

值得一提的是,数据开放要实现非歧视性。这个数据如果可以开放给A公司,那应当也可以开放给B公司;如果可以开放给BAT,就也可以开放给中小企业——只有这样,才能真正促进社会充分利用这些数据,让企业去比谁可以把数据开放利用得更好,而不是比谁更有资源、更有关系。

    当然,数据开放根据敏感度的不同也分三个层次。有一些数据比较敏感,不适合向全社会开放,可以只开放给一些特定的组织或结构,比如说科研机构,这叫第一个层次——定向开放。有些数据可以向更大一些的范围开放,比如说开放给政府内部不同的部门,这叫第二个层次——内部共享。有些数据不涉及到敏感问题,就可以向全社会开放,任何人都可以拿走进行开放利用,这是第三个层次——真正的数据开放。


2

原文PPT

点击图片查看高清大图