EN
产业资讯 政策法规 研发追踪 医改专题
真实世界研究的基石——国内外真实世界数据库纵览
产业资讯 RWE智谷 2021-04-22 9291



大数据治理与应用于医疗行业的价值

随着大数据技术在医疗行业的深度融合,合理的数据治理与应用将给医疗体系搭建、医疗机构运作、临床研发、诊断治疗等多方面带来变革性的改善[1]。

医疗大数据现状概览:

数据内容——各类人群的基线信息、营养状况、疾病、用药、实验室检查及医疗保险索赔数据[2];

应用场景——临床决策支持、健康及慢病管理、支付和定价等;

服务对象——居民、医疗服务机构、科研机构、医疗保险机构、公共健康管理部门等[3]。

本文就国内外有代表性的医疗大数据库进行简介。

2

国外医疗大数据库[4,5]

支付方数据库

国外的支付方数据库主要分为三类:商业保险为主导的数据库、国家医疗保险为主导的数据库以及混合型数据库。

美国是典型的以商保为主导的国家,政府支持的医保项目主要是Medicare(老年人)和Medicaid(贫困、儿童、特殊残障人士等)。商保数据由各个商保公司管理。如美国最大的健康保险公司UnitedHealthcare,和美国最大的医疗集团Kaiser Permanente。以Kaiser医疗集团为例,其数据量覆盖了超过1200万会员的医疗和支付数据。美国最大的非盈利保险组织BCBS(Blue Cross Blue Shield)覆盖了长达10年超过2亿条的医疗记录。通过BCBS的数据库已经产出了近4000篇论文。

英国和日本是典型的以国家医疗保险为主导的国家,医保的支付方数据均采取统一收集的方式。日本全国医保数据库NDB(National Insurance Claims Database)是基于医疗保险理赔和特定健康检查和指导建立的理赔数据库,截止2018年累计登记的医疗保险索赔数量为153亿。英国的NHS(National Health Service)是全国性的卫生服务数据库,主要包括社区用药数据、健康咨询数据、医院内用药数据、疾病注册数据、实验室检查数据、癌症数据及医院疾病编码数据等。英国政府也有意向在未来将这些数据公开给社会使用。

德国是典型的混合型医疗保险的国家,有多个法定的医疗保险和不同的商业健康险,但是由于支付方数据比较分散,通常难以得到大样本群体的信息。

临床数据库

美国的eMRGE(Electronic Medical Records and Genomics),欧洲的EHR4CR(Electronic Health Records for Clinical Research),以及英国的CPRD(Clinical Practice Research Datalink)是三个国外较成熟的临床数据库。

eMRGE由美国NIH(National Institutes of Health)于2007年发起,整合了电子疾病记录(EMR)和基因组学的数据,主要用来支持经济效益和健康效益评估研究。

EHR4CR包含了欧洲35家医疗机构,5个国家,10家企业的EHR数据,其核心功能是患者招募的精准筛选及定位。

从患者基本人口学、临床症状、用药、医疗咨询、转院、疫苗接种、辅助检查、治疗处方和手术等临床维度进行登记,能追踪约三十年的临床数据。

其他数据库

其他数据库主要包括以研究为目的所建立的各种登记注册的队列或研究数据库,例如美国开展较早的NHANES(National Health and Nutrition Examination Survey)成人和儿童健康营养状态的登记数据库,和SEER(Surveillance, Epidemiology, and End Results)大型肿瘤登记注册数据库,瑞典2018年建立的包括患者基本信息、用药、死因、癌症、电子疾病记录及百余种疾病的全国质量登记注册数据库。

3

中国医疗大数据库情况

国家人口健康科学数据中心

国家人口健康科学数据中心(National Population Health Data Center)是国家科技部和财政部认定的国家科学数据中心。经过17年的发展,集成了涉及基础医学、临床医学、药学、公共卫生、中医药学、人口与生殖健康等多方面的科学数据资源。2019年12月底,国家人口健康科学数据中心数据仓储(Population Health Data Archive, PHDA)开展国际认证工作,正式被re3data.org和FAIRsharing数据仓储目录认证并收录。

中国慢性病前瞻性研究

中国慢性病前瞻性研究项目(China Kadoorie Biobank,CKB)是北京大学、中国医学科学院与英国牛津大学联合开展的慢性病国际合作研究项目。该项目旨在通过建立中国健康人群队列和基于血液标本的基础健康数据库,从遗传、环境和生活方式等多个层次和水平深入研究危害中国人群健康的各类重大慢性病的主要致病/保护性因素、发病机理及流行规律和趋势。截止至2020年,CKB已经支持了70余篇文章的发表、3部专著的出版和5部技术或管理规范的建立。

中国健康与养老追踪调查

中国健康与养老追踪调查(China Health and Retirement Longitudinal Study, CHARLS)由北京大学国家发展研究院牵头,据其官网记载,旨在收集中国45岁及以上中老年人个人和家庭层面的数据,用以分析我国人口老龄化问题。CHARLS全国基线调查于2011年开展,采用多阶段抽样的方法,覆盖了全国150个县级单位和450个村级单位的约1.7万人。每2到3年,研究者会对样本人群进行一次随访调查,并在一年后将数据对学术界公开。

中国老年健康影响因素跟踪调查

中国老年健康影响因素跟踪调查(Chinese Longitudinal Healthy Longevity Survey, CLHLS)(1998-2018)由北京大学健康老龄与发展研究中心/国家发展研究院组织,是国内全国范围最早、持续时间最长的社会科学调查。CLHLS覆盖了23个省份,主要搜集老人死亡年月、死因、死前健康与生活自理能力等信息,旨在更好地理解影响人类健康长寿的社会、行为、环境与生物学因素,为科学研究、老龄工作与卫生健康政策信息依据填补空白。截止至2020年3月,CLHLS已经支持了近千篇国内外文章的发表、17本专著和58篇政策咨询报告

随着国家对临床研究的重视,各地医疗机构或医联体都在建立电子化数据平台,并进一步建立疾病数据库。

我国癌症中心建立的国家肿瘤随访登记数据库纳入了全国200多个登记处的肿瘤资料,并且每年向全球肿瘤登记中心提供我国肿瘤的发病情况;汕头大学医学院第一附属医院以近10年来的全量病种数据为基础,根据医院各科室的临床科研需求和行业建设标准,建设了涵盖101个专病病种的科研平台;北京医院经国家卫生计生委批准设立国家老年医学中心,构建覆盖全国的老年病大数据平台,辅助医疗机构和临床医生更好的诊断和治疗,并为重大老年疾病防控决策提供科学依据。

4

我国医疗大数据库建设与应用的挑战

目前我国大数据智能平台面临着多种挑战,从技术角度上存在如数据整合和储存、数据的挖掘利用、信息的合规应用与共享和隐私保护等问题,而在实施过程中的挑战包括标准化难以实施,信息孤岛等问题[6]。基于医疗产业的实际情况,医疗大数据库在我国的建设与应用主要面临三大挑战:

信息不足和孤岛

相比于欧美,我国医疗大数据库在基因、用药模式和医疗保险索赔等方面仍存在数据信息不足的情况。此外,医疗服务机构,政府部门以及医疗公司掌握的医疗数据库往往没有建立数据共享机制,造成了医疗数据信息孤岛现象[7]。

缺乏统一医学术语体系

医疗信息系统的爆炸式增长使得临床术语出现很多变化,给数据交换带来障碍。一些普遍被采纳的国际医学术语体系尚未被统一翻译并纳入到我国临床实际应用中[8];同时,我国大多数医疗机构目前采用不同的技术架构和数据标准,并且不同的医疗机构间没有数据交换的系统性需求。虽然我国已有一些区域医疗数据平台和试点,但仍处于建设和应用的初级阶段,针对数据结构、数据标准和数据传输协议方面的改进仍需要大量工作。

缺乏完善的管理系统和专业人才队伍

中国目前医疗服务模式和医疗体系尚不够完善;医疗监管部门尚未出台相关的规定和研究标准,行业缺乏规范化与指导;医务人员的信息意识普遍缺乏,医疗机构缺乏懂医学、懂技术的健康信息技术人才, 这些也都给大数据的应用带来了挑战。

在中国,医疗大数据备受医疗卫生和监管决策部门的重视,随着数据质量和数据可及性的不断提高,可应用的场景必将与日俱增。

    


您可能感兴趣
跨国药企碰瓷失败,百济神州专利保卫战大捷
跨国药企碰瓷失败,百济神州专利保卫战大捷
产业资讯 医药投资部落 2025-05-02 135
第十批国采全面落地,下一批启动在即
第十批国采全面落地,下一批启动在即
产业资讯 赛柏蓝 2025-05-02 137
横跨肺癌、血液瘤,Biotech龙头爆发在即
横跨肺癌、血液瘤,Biotech龙头爆发在即
产业资讯 瞪羚社 2025-05-01 218