您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[腾景数研]:腾景宏观快报:大数据疫情观察:中心城市率先迎来峰值——基于腾景AI高频模拟和预测 - 发现报告
当前位置:首页/宏观策略/报告详情/

腾景宏观快报:大数据疫情观察:中心城市率先迎来峰值——基于腾景AI高频模拟和预测

2022-12-16吴卫、赵宕涵腾景数研北***
腾景宏观快报:大数据疫情观察:中心城市率先迎来峰值——基于腾景AI高频模拟和预测

腾景宏观快报 大数据疫情观察:中心城市率先迎来峰值 ——基于腾景AI高频模拟和预测腾景高频和宏观研究团队 相关报告 《腾景宏观快报:美国11月CPI同比继续加速回落,或为7.3%》2022-12-03 《腾景宏观快报:类通缩状态下,大规模消费刺激或将成为2023年实现5%左右潜在增长水平的关键》2022-11-29 《腾景宏观快报:利用美国电价修正美国CPI高频模拟误差》2022-11-18 联系我们 010-65185898|+86 15210925572 IR@TJRESEARCH.CN http://www.tjresearch.cn 北京市朝阳区朝阳门外大街乙6号朝外SOHO-A座29层 本期要点: 一、人们尚未完全摆脱对奥密克戎的“恐惧” •2022年11月经济数据表现低于预期,工业增加值、服务业生产指数、社会消费品零售总额、固定资产投资额相继走低,这也和腾景AI高频预测(模拟)的方向一致,但我们的模型还是低估了本次疫情对经济的冲击。钟南山院士从这些年防疫经验总结以及科学模型的研判,预计明年三月中上旬,国内疫情进入相对平稳阶段。 •结合日本、越南等国家放开后的发展路径,社会大众在放开初期可能会有一定的“恐慌”情绪,这一情况在国内有所显现。但是我们看到,疫情放开之后,亚洲地区如日本、越南、中国台湾经济增速有明显改善,人们最终克服了“恐惧”。最终每个国家都要经历一个阵痛期,好在病毒的致病性、致死率在下降。展望未来,我们的经济复苏进程取决于抗疫的背水一战如何收场?目前没有退路,长期非常态化的经济社会秩序和疫情管控措施,其实也是有代价的,而且代价可能更大。只有尽可能地为有基础病的老人、儿童等弱势群体准备好“救生衣”趟过这股洪流,克服“恐惧”,战胜“恐惧”本身,才能赢得最后的胜利。 图:2022年11月腾景AI经济预测高频预测结果 数据来源:腾景宏观高频模拟和预测库 图:2022年12月15日经济数据公布后,各机构(包括腾景AI经济预测)的准确率 注:黄色为机构/研究员之间的数值精度评比,紫色为腾景AI与市场预期的数值精度评比 数据来源:Wind、腾景宏观高频模拟和预测库 •虽然有“二十条”到“新十条”的逐渐放开,但是发烧、咳嗽人数直线上升,打开微信朋友圈、抖音,从微观感知上,似乎疫情已经迅速登顶。但作者团队所在的北京,也是目前国内疫情扩散最严重的城市之一,从新增疫情确诊人数统计来看并没有快速上升,微观上的寒冷与宏观上的滞后促成了我们使用大数据来研判疫情感染曲线的“偏度”和“峰度”。 二、互联网搜索指数 •从微观感知上,互联网搜索指数刻画了所有接入互联网的疫情参与程度,除了无症状感染者之外,绝大多数的阳性患者在病程初期会出现发烧,病程后期会出现咳嗽等症状。我们通过互联网搜索平台对“发烧”、“咳嗽”、“咽喉痛”的搜索来验证疫情是否达到顶峰。 •使用互联网搜索指数预测流感或者新冠疫情的发病情况其实不乏先例。ShuhuiGuo,FanFang等(2021)使用微博帖子改进谷歌流感趋势对COVID-19的估计。Ma,S.,Yang,S.(2022)在美国使用互联网搜索信息进行COVID-19预测,预测结果发表在美国《自然》杂志。 图:GoogleTrends领先香港新增确诊一周 数据来源:GoogleTrends、国家卫健委 图:头条关键词“发烧”于2022年12月13日见顶 数据来源:巨量算数 图:百度搜索指数“发烧”于2022年12月12日见顶 数据来源:百度搜索指数 图:互联网搜索与城市人口感染逻辑关系 三、前期研究:基于SIR和SEIR模型 1、SIR模型 •SIR模型是一种经典的传染病模型,用于预测传染病传播的情况。它基于人口统计学的原理,将总人口分为三个状态:易感者(S)、感染者(I)和康复者(R)。该模型假设人们之间的联系是随机的,并用数学方程来描述传染病的传播。 •SIR模型有助于预测传染病的流行情况,从而帮助政府和公共卫生机构制定有效的防控措施。它还可以帮助评估不同控制措施的效果,为决策提供参考。不过,SIR模型也有一定的局限性,例如忽略了人口之间的社会关系和行为因素等。因此,在使用SIR模型时,应该结合其他信息和工具,进行综合分析和评估。 •兰州大学新冠肺炎疫情全球预测系统是世界首个全球疫情预测系统,由兰州大学西部生态安全协同创新中心主任黄建平及其团队研发,于2020年5月25日首次发布。该系统基于SIR模型的方法进行疫情预测。COVID-19大流行全球预测系统(GPCP)的第二版使用了更复杂的SEIR模型。 •该预测模型是一个结合了全球真实流行病数据、气象因素和隔离措施的改良流行病SIR模型。假定在暴发期间不同地区的总人口保持不变;COVID-19只是通过人与人之间的传染扩散;个体之间没有免疫力差异。每个国家的总人口被分成三种类型:易感人群S,感染人群I,治愈和死亡人群R。SIR感染疾病模型使用以下方程描述: •其中r是和感染人群接触的人数;β是感染率;μ是退出率。 •基于上面定义的经典SIR模型,兰大的预测团队发展了一个包含温度、湿度、城市人口密度和对COVID-19感染的控制强度的新模型。模型定义如下: •该团队发现环境温度和大气中NO(2)含量是预测新冠疫情的两个重要指标。新冠疫情传播的最佳温度是5-15℃,全球70%新冠肺炎确诊病例出现在气温5℃-15℃之间(见前期研究成果)。另外,利用卫星观测的NO(2)含量能很好的反映各国政府防控和限制措施的实施效果。大气中NO(2)含量反映了汽车尾气和工业排放情况,当NO(2)显著减少时,说明交通量大量放缓,人际交流显著减少,14天后疫情会显著减少(见前期研究成果)。 •为了引入温度,湿度和政府管控措施,作者假定: •其中F(1)(T(2m))和F(2)(RH(2m))分别是局地温度,相对湿度与每日新增确诊人数的函数关系;NO(2)是局地NO(2)浓度的变化率,反映了隔离措施的强度。严格的隔离措施有助于增加社交距离和减少感染概率。 2、改进后的SEIR模型 •SEIR模型是SIR模型的扩展,用于更精细地描述传染病的传播情况。这种动态模型允许人员在称为间隔的组之间移动,并且每个间隔依次影响另一个间隔。 •SEIR模型定义了六种人群:易感者(S),不易感者(P),潜在感染者(E,处在潜伏期的感染者),传染者(I,尚未隔离的感染者),隔离者(Q,已确诊且已被隔离的感染者),康复者和死亡者(R)。这六种人群的总和始终等于总人口(N)。 该模型基于以下假设: •1、总人口应始终等于易感人群(S)、暴露人群(E)、保护人群 (P)、感染人群(I)、隔离人群(Q)、死亡人群(D)和康复人群 (R)的人口之和; •2、各地区总人口不变; •3、新冠仅通过人与人之间传播; •4、所有人具有相同的免疫力。 •该模型由以下6个方程式组成: •在第二个版本的模型中,作者考虑了社区解封时间。以解封当天的新增病例数(dQc)做为标志,当某日的新增确诊病例数低于dQc时,地方政府可以开始解除封锁。模型中社区解封时间和市民自我隔离等因素的考虑,使得预测更加准确。 四、哪些城市可能已经达到峰值 •传染病的传播有两类反馈机制:第一类是正反馈机制,可以由病毒的传染指数和社会的防疫程度共同决定,“新10条”之后可以看到各地的“发烧”指数陆续上升,北京上升峰值是历年平均的十倍左右,保定上升峰值在6倍左右,这一数据在“巨量算数”里更高。由于搜索指数和微观感知较为一致,我们以北京、保定达峰为锚定,预估各地方感染达峰时间点。第二类是负反馈机制,因疫情高发,居民主动减少出行、社交等接触性活动,这会在一定程度上降低疫情蔓延,压平疫情传染曲线的峰值。 图:北京“发烧”搜索指数 注:按照历年均值为100处理。下同。 数据来源:百度搜索指数、腾景测算 •各中心城市除北京外,基本上搜索指数处于上行态势,值得注意的是,石家庄市在12月份高其他所有城市一截,说明其放开程度领先于全国其他城市,这与我们新闻上的感知一致。 图:国内部分城市“发烧”搜索指数 数据来源:百度搜索指数、腾景测算 图:河北省“发烧”搜索指数,保定可能已经见顶 数据来源:百度搜索指数、腾景测算 •基于“发烧”搜索指数,我们可以观察全国各地的感染强度,“发烧”的搜索量相较于历年均值的差异(归一化)。 各省市近期感染强度 数据来源:百度搜索指数、腾景测算 注:颜色越红,进程越快。省内城市在同一张图可以比较,跨省城市颜色不可比。数据以2022年12月1日~12月14日百度指数的平均值测算。 全国“发烧”搜索指数 数据来源:百度搜索指数、腾景测算 安徽“发烧”搜索指数 数据来源:百度搜索指数、腾景测算 福建“发烧”搜索指数 数据来源:百度搜索指数、腾景测算 广东“发烧”搜索指数 数据来源:百度搜索指数、腾景测算 广西“发烧”搜索指数 数据来源:百度搜索指数、腾景测算 河北“发烧”搜索指数 数据来源:百度搜索指数、腾景测算 河南“发烧”搜索指数 数据来源:百度搜索指数、腾景测算 湖北“发烧”搜索指数 数据来源:百度搜索指数、腾景测算 湖南“发烧”搜索指数 数据来源:百度搜索指数、腾景测算 江苏“发烧”搜索指数 数据来源:百度搜索指数、腾景测算 山东“发烧”搜索指数 数据来源:百度搜索指数、腾景测算 山西“发烧”搜索指数 数据来源:百度搜索指数、腾景测算 浙江“发烧”搜索指数 数据来源:百度搜索指数、腾景测算 五、未来疫情走势分析 搜索本身行为属于流量,对应新增确诊人数大致没有问题。但是不同城市人与人的互动关系并不一致,大城市人与人在经济上的互动更为频繁,地铁等通勤工具加速了病毒的传播。这里需要引入3个假设: •1、首先定义当前每日发烧搜索量/历年均值,代表每日新增疫情强度; •2、城市的人与人交互的频率类似; •3、在单日新增高点未到来之前,大致呈单调递增,当前进程同样重要。 分短期、中长期来看。首当其冲的是一线、新一线、二线等人员流动密集的大中型城市将直面第一波冲击,最明显的是疫情数字会强烈反弹。目前看,北京、石家庄等一线城市似乎已经度过了疫情放开以来的“至暗”时刻,也未造成大规模的医疗挤兑的情况。 •但是不排除春节期间返乡人员的大规模流动将奥密克戎病毒带回医疗条件更差的农村地区。因此,我们认为在春节前后人口流出较多的县级城市和农村地区可能会迎来疫情的首轮冲击。考虑到农村地区有基础病的老人、儿童等群体可能抵抗力较弱,医疗条件有限,因此做好县级城市和农村地区的医药供应至关重要,建议可以由县医院、乡村卫生站未雨绸缪,为当地居民发放阳性之后的必备的“医药包”。 •我们初步推算,北京、成都等城市近期可能已经逐渐达峰,后续达峰的顺序为:武汉>昆明>沈阳>重庆>天津>西安>郑州>济南 表:国内部分城市“发烧”的搜索量 注:数据截止到2022年12月14日 数据来源:百度搜索指数、腾景测算 (本文执笔:吴卫、赵宕涵) 注释 ❑腾景AI经济预测 北京腾景大数据应用科技研究院,简称“腾景数研”,是适应数字时代特点和要求,旨在推动宏观和产业经济研究方法变革、推动数字技术与实体经济深度融合的民办非企业新型研究机构,为中国发展研究基金会“博智宏观论坛”提供学术研究和数据支持。研究院学术委员会由目前中国学术研究水准和社会影响力居前的经济学家和有关方面负责人组成,为研究院的研究工作提供指导。 腾景AI经济预测运用近年来快速发展的机器学习特别是深度学习等人工智能前沿技术,与实时化、动态化的投入产出体系深度融合,在一系列关键技术攻关的基础上,对重要的经济金融指标进行高频模拟和预测,形成了在国内外具有开拓性、领先性、实用性的产品体系。 ❑高频模拟 所谓高频模拟,就是在搜集加工大量相关数据的基础上,依托经典机器学习和深度学习模型,把月度指标日度化,使通常一个多月后才公布的指标,当日或近日就能呈现出来,比如,月初的CPI指标,过去要到一个半月后才公