①传染病预警技术研究团队就多源数据在预警中的应用进行讨论。 ②不同数据在传染病监测预警中的应用示意图。 |
【深瞳工作室出品】
采写:本报记者 张佳星
策划:刘 恕 李 坤
传染病大流行会不会再次发生?世界卫生组织(WHO)给出的答案是:会。
在多个国际会议上,WHO就“X疾病”暴发的可能性发出警告。
“X疾病”并非当下真实存在的特定疾病。根据WHO的解释,“X疾病”指一种未知的病原体引发严重国际大流行的可能性。它有机会在任何时间、由多种来源触发,恐会夺去数百万人的生命。
“从理论上说,病毒在不同种属间传播过程中可能发生变异,从而出现有害的跨种传播。”中国医学科学院北京协和医学院群医学及公共卫生学院执行院长杨维中告诉科技日报记者,尽管不知道会是哪种病毒最终“突破种属屏障”进入人群,但病毒不断变异就有可能掀起全球传染病大流行。
“X疾病”犹如暗夜幽灵,让预测变得难上加难。然而,在人类与病毒的较量中,监测预警并非束手无策。
“在视频计数、条码溯源、雷达感应等前沿技术已经普及的今天,不再需要通过在蚊帐里数蚊子进行蚊媒监测了。”中国医学科学院北京协和医学院群医学及公共卫生学院副院长冯录召说,在大数据、云计算、人工智能等技术的加持下,疾病监测手段走向了智能化、精准化。
中国医学科学院于2021年启动了传染病智慧化多点触发预警技术研究,致力于解决多源异构数据获取、数据标准化、智慧化模型技术研发、平台集成等问题。
“到2030年,我国将建成多点触发、反应快速、科学高效的传染病监测预警体系。”杨维中介绍,今年8月,国家疾控局等9个部门联合印发了《关于建立健全智慧化多点触发传染病监测预警体系的指导意见》,旨在通过数智赋能,提升对新发突发传染病、群体性不明原因疾病等的预警灵敏性和准确性。
单点到多点,多渠道发现传染病风险和苗头
2022年底的新冠病毒感染者猛增,居家治疗居多,原有的传染病监测系统几近失灵。
“我们必须弄清楚究竟有多少人感染,什么时候出现峰值,这些信息是政府决策的重要参考。”杨维中说,当时接到国家疾控局的任务,他们团队开始使用网上的数据。
在传统的疫情监测分析中,基础数据主要来自医疗机构。多年前,时任中国疾病预防控制中心副主任的杨维中领导过传统传染病监测预警系统建设。2003年SARS疫情之后,我国新发突发传染病监测体系逐步构建起来。体系依托门急诊、住院、检测等哨点监测数据和各级各类医疗机构法定报告传染病情况,由疾控部门进行汇总和研判。
“那时的预警系统只能用‘单点’数据,即患者到医院就诊后的数据,而且只反映法定报告中的30多种传染病,并不包含未知的新发传染病。”杨维中说,“当单一来源的数据无法精确反映疫情变化时,启发我们要善于利用‘多点’数据。”
杨维中说的“多点”数据包括网络搜索热词及增量、药品购买情况、互联网医院咨询情况等各类能够间接反映疫情情况的数据。基于它们,团队利用前期研发模型,对疫情走势和规模作出了重要研判。
例如,基于百度指数数据,团队利用人工智能深度学习技术,预估了各地未来新冠感染病例数的变化趋势和峰值,后来的比对结果显示,预估曲线与实际情况吻合。基于新浪微博的问卷调查,他们研判,新冠再感染患者以上呼吸道症状为主且症状较轻,这与实际状况再次相符。
“能够纳入的‘多点’数据还有很多,比如学生缺课、职工缺勤、物流运输等情况。”杨维中说,越来越多的实践证明,基于多渠道监测数据的分析研判,能够更早发现传染病风险和苗头。
中国工程院院士、中国医学科学院院长、北京协和医学院校长王辰指出,传染病防控的关键在于及早发现、及时预警和迅速隔离救治,把疫情控制在局部是成本最小、效率最高的防控方式。
如何做到“及早”与“准确”兼得?王辰概括为三个关键要点,一是科学选择多类多渠道预警信息参数;二是基于大数据的精准预警模型分析方法;三是基于以上两点构建完整的监测预警信息采集体系与分析平台,由此实现从日常监测到应急响应的全过程管理。
被动变主动,前置软件自动获取异常信号
“多渠道监测手段在不断发展,原来的主渠道如果继续采用传统人工填报的模式,是远远不能适应新形势的。”中国疾病预防控制中心信息中心副主任彭志行表示,必须顺势做出转变。“这不是对2003年建立的网络系统推倒重来,而是对该系统进行一次重大的技术重构。”他说。
传统的医疗机构病例报告仍旧是传染病疫情风险评估和预判的最重要依据。在以往的报告流程中,医生通过填写传染病报告卡、到所属医疗机构防保科的报告终端手工录入信息等方式上报传染病。整个过程依赖临床医生的主动诊断和报告意识。其弊端显而易见,信息采集只能被动等待,且相对滞后、准确性不高。
与其被动等待,不如主动出击。新冠疫情发生后,传染病预警要“变被动为主动”已成业界共识。
去年底,国务院办公厅发布的《关于推动疾病预防控制事业高质量发展的指导意见》明确提出,推动医疗机构的信息系统与传染病监测系统数据交换,建立健全传染病诊断、病原体检测等数据自动获取机制。
多部门随后逐步明晰实施时间表。
国家疾控局等十部门在今年5月发布的《全国疾病预防控制行动方案(2024—2025年)》中要求,二级及以上医疗机构部署实施国家传染病智能监测预警前置软件,一数一源、一处采集,多级实时共享应用。
据介绍,在天津、湖北、安徽等地已开始布置实施国家传染病智能监测预警前置软件。10月30日,天津市第一中心医院、天津市儿童医院等4家试点医疗机构前置软件监测数据达标,前置软件正式切换应用。
“在医疗机构部署前置软件,不仅能实现数据采集自动化,还能通过数据共享,实现智能监测。”天津市疾控中心信息所所长刘军介绍,前置软件的数据自动采集功能大大减少了医务人员的重复劳动。前置软件与医院信息管理系统数据的联调共享,省去了人工上报的二次录入环节,也省去了传染病确诊病例转诊到专科医院后的信息再录入。
近期登革热感染人数增加,呈现地域性高发态势。刘军介绍,如果患者在当地医院就诊后再进行跨省就医,安装了前置软件的系统会自动弹窗,提醒医生关注病例,并显示患者就医路径。
相关专家表示,疾控信息化与传统电子政务不同,后者是多级交换,数据层层交换可能带来信息的衰减和阻断;而疾控信息化则通过前置软件,将医疗机构源头采集的传染病数据入库,实现实时共享。
国家疾控局副局长孙阳指出,目前我国正在推进前置软件部署,未来要在监测点位和项目上不断“扩面、增效、提质”,特别是加强污水监测等新型监测手段。
“污水监测的优势在新冠疫情期间就展现出来了。”杨维中介绍,污水监测数据人为干预少,且具有脱敏性,能够提示社区、城市的病毒踪迹,便于长期监测,不仅可提供阳性位点陡增之类的清晰佐证,也能在技术上持续增加病原体检测类别。
在主动抓取模式下,公共卫生相关数据和异常信号的获取正在朝着“零时间差”的目标迈进。
单部门到跨部门,联手捕捉病毒“蛛丝马迹”
病原体的传播没有国界,更不囿于部门条块限制。
“比如,卫生部门可能通过病例监测感知一个自然疫源疾病,而农业部门可能在动物疫病中已经获得异常信号。”中国疾病预防控制中心卫生应急中心副主任向妮娟提出了一个新的可能性:如果说在不同部门的监测系统里展现的是病原体各阶段的“照片”,那么建立一个连续数据系统,就可以“视频化”描述病毒变化和趋势。
跨部门的连续数据分析之于疫情预警,犹如卫星云图之于天气预报。但后者的数据来源单一,前者则非常多元——气象气候数据与传染病暴发存在关联,由气象部门掌握;水鸟、旱獭、地鼠等野生动物是病毒的天然宿主,它们的种群变化等情况与病毒的变异相关,林草部门更熟悉这类数据;病毒在饲养的鸡鸭、猪牛身上繁殖,发生变异甚至跨种传播,农业部门掌握的数据则非常关键。还有海关部门的病例输入数据,教育部门的因病请假数据,互联网检索、寻医购药、社交平台数据等都能够“映射”病毒传播的踪影,但这些数据“遗珠”散落各处。
多部门联合发布的政策文件强调,完善部门联动机制,协同开展传染病监测工作。
然而,跨部门数据融合并非数据的简单集合。北京市疾病预防控制中心研究员王全意表示,不同部门收集数据的意图各异,形成的数据内容和呈现形式往往不同,很难做到“拿来就能用”。
重庆市疾病预防控制中心主任医师漆莉也表示,重庆很早就整合了多部门力量,开展“疫智防控”的探索,但收集上来的数据千差万别,面临核心指标选择、数据标准化等难题。
“这几年,重庆以传染病综合风险指数为抓手,开展了模型建立和数据挖掘工作。我们希望数据给出的传染病风险指数等级像寒潮、大风的各级预警一样明晰。”漆莉坦言,在提高数据灵敏度和特异性、减少人工判读占比等方面还需攻克多个难关。
“解决数据质量参差不齐的问题必须依靠技术创新。”杨维中打比方说,成功的预警系统就好比一个健康人的肠胃,不能只吃精米白面,要能消化各类五谷杂粮。不同部门的数据来了要经过筛选、分类和标准化等处理才能用于预警模型中。
“为了提升传染病预警系统的准确性,截至目前,我们开发了5个软件和系统,形成了5项标准和专利,并承担了10项相关项目任务。”杨维中说,中国医学科学院团队通过科学研究把数据融合需要的处理方法、构建模型等基础元件搭建起来,未来将放在开放平台上供应用单位选用。可通过模块组合承担不同监测预警任务,助力跨部门融合和捕捉“X疾病”的踪迹。
“我们希望集成数据、模型、信息技术等,先形成一个样板,以实现传染病的预警、高峰、快速进展期等阶段的‘可视化’。”杨维中介绍,中国医学科学院已经与湖南湘潭等地达成合作协议,依托当地相关数据开展智能化传染病监测预警平台建设。
杨维中坦言,当前仍旧是与“X疾病”开展系统性较量的初期,仍需要各学科领域融合交叉创新,在预警效果优化、疾病发生发展中不断打磨数据、算法和模型,在探索和实践中使科技成果从“好看”变“好用”。