EN

关于我们

药促会简介 资质证书 协会章程 机构设置 医药创新科学委员会 协会领导 第十一届理事名单 第十一届监事名单 专业委员会 国际组织成员 IFPMA ICH 工作组专家 人才招聘 联系我们
nature:中国公共数据的限制影响科学进步
当前位置首页关于我们
 

来源:生物谷    2015-5-4


201554日讯,在大数据时代,我们看到了生物信息学数据库的发展,数据共享以及技术资源获取的提升。这一"开放性科学"的潮流过去一直在帮助中国的科学家在世界的舞台上竞争。然而,中国社会对于公共数据获取及共享的限制正在不断增强,这一问题如果不解决,将会拖慢科学研究与创新的速度。

中国科学家获取高质量的群体数据一直以来都是很难的,而最近变得愈发艰难。许多公共数据掌握在政府部门的手中,一些部门强化了该数据的垄断权,导致研究者们难以获取。这主要影响了人类学家与社会学家的工作,然而也波及到了其它领域,比如环境科学以及公共健康等(主要由于这些数据可能属于政治敏感内容)。在许多会议上经常可以听到科学家门对这一现状的不满,比如在针对空气污染问题上科学家们简直是"巧妇难为无米之炊"

另外即使有一部分数据得到了最终的发表,这些数据的质量也十分低,主要原因是数据采集过程不够科学。代表性的例子是中国的GDP。通过比较,我们可以发现国家给出的官方数字与将31个省份(不含港澳台)的GDP累加得到的值是有较大差异的。位于北京的国家统计局也承认不同省份对于GDP的计算方法存在不同。

公共数据的共享已经转变为盈利模式,这在某些情况下可能对数据分析者是有帮助的。比如统计中国的道路车辆的污染情况。在正确的方式下,应该需要对每一种类型的有证车辆的数量,堵车情况,引擎的参数以及油箱的规格做详细的记录。研究人员连基本的车辆拥有者信息都无法得到,更别提以上的数据,因此他们的统计只能是粗糙的。讽刺的是,生产商们可以通过"特殊"的方式从政府部门得到客观的竞争者的销售数据,而代价则是研究者们难以付出的。

在这样的背景下,也就难怪中国的研究团队不愿意发表他们的数据。数据的所有权代表着一项遥不可及的资本,也是科学家们在学术界竞争力的根本保障。许多研究团队都曾被邀请提供一些自然与社会方面的分析报告,然而科学家们出于对自身数据的保护不愿公开。一方面数据的收集与整理需要花费大量的人力物力成本,另一方面,如果数据保密,他们就可以放心的利用这些数据发表论文。反过来讲,如果获取数据的门槛降低了,每位科学家也都会公开自己的数据进行交流,毕竟这样的效果最佳。

公共数据的获取途径的开放与质量的提高能够促进政府事务的透明性。尽管进展缓慢,目前也有一些正面的例子。比较著名的就是空气污染数据的全面开放,这是去年在强大的公众舆论压力下环境部门不得不做出的决策。在此之前,每天仅有简要的数据公布。如今, 这些数据能够每小时进行更新,而且能够中国范围内的所有机构获取。这些数据能够使健康部门向公众释放预警信息,使教育部门调整上课安排,以及使交通部门调整车辆行使措施。而其中最重要的作用是使得公众对于环境问题更加警觉。

这些限制并不只是针对于产生于国内的信息,我们科学家获取国外外学术资源的渠道也受到了限制。一些信息管理机构为了过滤他们认为"有害"的信息设置重重关卡。Zheng Wan教授指出当今国内获取学术文献几乎被完全阻断。以前他经常选择使用谷歌学术进行文献资料的搜索,因为它整合了书籍,文章,专利以及技术报告等不同形式的数据。而如今他只能逐个搜索现在还能用的数据库,因此十分不便。

    安全网络对于国家的安保工作确实十分重要,但是好的数据是科学与经济发展的基石。资源共享与公共数据开放能够加固经济与社会的发展。在中国,要想解决这一矛盾需要系统的进行调研,之后我们就能建立起一个高效的数据管理平台。