2020年07月14日 星期二
生物统计学迎来发展新机遇
□ 周晓华

    近年来,传染病的传播机制愈加复杂,研究者们综合利用数学和统计模型,基于多种数据信息对传染病的发生和发展机制进行精确地建模分析。

    比如,2013年暴发的非洲埃博拉疫情中,研究者基于病毒基因数据进行建模分析,揭示了病毒跨地理区域传播的机制。2016年美洲寨卡病毒疫情中,研究者基于地理信息和病毒基因信息,准确地定位了寨卡病毒的发源地,并揭示了病毒在地理分布上的规律。在慢性传播的艾滋病疫情中,研究者利用带有空间网络结构的病毒扩散模型,阐明了HIV-1病毒在全球范围内的时空传播关系。

    随着人们在医学、制药学等领域研究的不断深入,越来越多的科学问题需要以量化研究依据作为支撑。生物、医学等学科由实验科学走向实用科学时都离不开统计学。随着互联网时代的到来,大数据的盛行,生物统计学正日益广泛地应用于医学科学研究中,为医学研究提供了手段和方法,是医学研究不可分割的部分。

    研究者们基于数学和统计模型的研究结果,提出了一些阻止疾病传播的新举措。比如,研究者发现西非葬礼成埃博拉“超级传播事件”,集中精力隔离最严重的埃博拉病例将大幅度降低传染。另一项研究使用实时航空公司大数据预测出对特定旅行者进行筛查,能够最有效地防止埃博拉病毒在海外扩散。

    综合利用数学和统计模型,基于多种数据信息来进行定量化、科学化地防控,是人类与传染病作斗争的重要武器。2004年开始,病毒基因数据在传染病建模中的作用逐渐显现。研究者通过分析不同感染个体体内病毒基因的差异性,构建病毒发育树,并由此来推断感染发生的时间等关键信息。

    进入21世纪,特别是随着互联网技术和基因测序技术的发展,互联网搜索大数据、病毒基因大数据和地理信息大数据等都被用来进行数学和统计建模,此阶段的建模方法也从简单的群体模型进入到细致的网络化模型。

    生物统计学属于统计学的一个分支,是一门结合统计学、概率论、数学和计算的方法,对生物医学数据进行分析,测量、控制和解释不确定性的一门科,其研究目的是科学地设计试验,并对所得试验数据进行分析,达到减少试验次数、缩短试验周期、迅速找到最优化的试验方案或数学模型。可以说,几乎所有医学和公共卫生领域研究者的新发现都需要统计思想和原则的指导,离不开生物统计学。目前,国外生物统计学科发展迅速,且影响深远。国际上的知名医学院、公共卫生学院的生物统计学均为重点学科,实力雄厚。《新英格兰杂志》亦将生物统计学的贡献列为近500年医学领域排位第四的里程碑式重大事件。运用大数据加强与医疗技术、产品、服务和群众健康需求对接,有助于促进健康产业发展,释放健康消费潜力。由于健康医疗大数据主要包括医疗机构的诊疗数据、医疗费用数据、公共卫生与疾病监测数据、自我健康管理数据、网络数据等,因此具有数据量大、数据类型和结构复杂等特点,这使得生物统计学研究也面临着海量数据、非随机数据及极小样本数据等挑战。

    相较于国外,国内生物统计学科作为一门独立的学科而言,其规模和学术地位仍显不足,这一问题日益突出:我国的生物统计学在学科体系中尚没有明确的位置。生物统计学在中国一直以来都被称为“卫生统计学”,隶属于预防医学,教学着重于统计方法学在公共卫生领域的应用。目前我国培养出来的卫生统计学人才较偏重于应用,缺乏统计方法学的研究及数学背景,在新的统计方法研究上较难赶上国际生物统计学的水平。

    医学研究需要大量生物统计人员的参与,而目前专业的生物统计学人才缺乏,因此限制了国内医学研究的发展。

    为促进国内生物统计学科的发展,缩小与国外先进国家的差距,在北大医学部医学和公共卫生研究的基础上,结合数学科学学院、北京国际数学研究中心在数学和统计理论方法研究上的优势,由北大校本部和医学部共同建立了一个跨学部、跨院系、新体制的生物统计系,并任命周晓华教授为首届系主任,以助力北大“双一流”建设,探索生物统计方法学在转化医学、精准医学、大数据研究等领域的应用。

    在这次新冠疫情当中,如何科学、高效地控制疫情发展是疫情暴发期亟待解决的现实问题,我国生物统计学者积极科研攻关,综合利用流行病学数据、病毒基因数据、交通流量数据等各种信息,从数学模型和统计模型相结合的角度对本次新型冠状病毒肺炎疫情的发生和发展过程进行深入研究,力图阐明新型冠状病毒的疾病流行特点和规律,为防控新型冠状病毒肺炎疫情提供以数据为基础的定量化决策建议,在相关研究中也取得了不少成果。

    (作者系北京大学讲席教授)

京ICP备06005116