背景:最近,在疫苗接种率相对较高的地区,已经报告了大量的每日CoVID-19例阳性病例。因此,助推器疫苗接种已成为必要。此外,尚未深入讨论由不同变体和相关因素引起的感染。具有较大的变异性和不同的共同因素,很难使用常规数学模型来预测Covid-19的发生率。方法:基于长期短期记忆的机器学习被应用于预测新每日阳性病例(DPC),严重病例,住院病例和死亡的时间序列。从以色列等疫苗接种率高的地区获得的数据与日本其他地区的当前数据混合在一起,以考虑疫苗接种的潜在影响。还考虑了症状感染提供的保护,从疫苗接种的人口效力以及病毒变异的减弱保护,比率和感染性的降低。为了代表公共行为的变化,分析还包括通过社交媒体进行的公共流动性和通过社交媒体的互动。研究结果:比较特拉维夫,以色列观察到的新DPC,表征疫苗接种效果的参数和免受感染的减弱保护; 5个月后第二剂量的疫苗接种效率和三角变体感染后两周后的第三剂量分别为0.24和0.95。使用有关疫苗接种效果的提取参数,复制了日本三个县的新病例。
translated by 谷歌翻译
随着Covid-19影响每个国家的全球和改变日常生活,预测疾病的传播的能力比任何先前的流行病更重要。常规的疾病 - 展开建模方法,隔间模型,基于对病毒的扩散的时空均匀性的假设,这可能导致预测到欠低,特别是在高空间分辨率下。本文采用替代技术 - 时空机器学习方法。我们提出了Covid-LSTM,一种基于长期短期内存深度学习架构的数据驱动模型,用于预测Covid-19在美国县级的发病率。我们使用每周数量的新阳性案例作为时间输入,以及来自Facebook运动和连通数据集的手工工程空间特征,以捕捉时间和空间的疾病的传播。 Covid-LSTM在我们的17周的评估期间优于Covid-19预测集线器集合模型(CovidHub-Ensemble),使其首先比一个或多个预测期更准确的模型。在4周的预测地平线上,我们的型号平均每县平均50例比CovidHub-Ensemble更准确。我们强调,在Covid-19之前,在Covid-19之前的数据驱动预测的未充分利用疾病传播的预测可能是由于以前疾病缺乏足够的数据,除了最近的时尚预测方法的机器学习方法的进步。我们讨论了更广泛的数据驱动预测的障碍,以及将来将使用更多的基于学习的模型。
translated by 谷歌翻译
在撰写本文时,Covid-19(2019年冠状病毒病)已扩散到220多个国家和地区。爆发后,大流行的严肃性使人们在社交媒体上更加活跃,尤其是在Twitter和Weibo等微博平台上。现在,大流行特定的话语一直在这些平台上持续数月。先前的研究证实了这种社会产生的对话对危机事件的情境意识的贡献。案件的早期预测对于当局估算应对病毒的生长所需的资源要求至关重要。因此,这项研究试图将公共话语纳入预测模型的设计中,特别针对正在进行的波浪的陡峭山路区域。我们提出了一种基于情感的主题方法,用于设计与公开可用的Covid-19相关Twitter对话中的多个时间序列。作为用例,我们对澳大利亚Covid-19的日常案例和该国境内产生的Twitter对话实施了拟议的方法。实验结果:(i)显示了Granger导致每日COVID-19确认案例的潜在社交媒体变量的存在,并且(ii)确认这些变量为预测模型提供了其他预测能力。此外,结果表明,用于建模的社交媒体变量包含了48.83--51.38%的RMSE比基线模型的改善。我们还向公众发布了大型Covid-19特定地理标记的全球推文数据集Megocov,预计该量表的地理标记数据将有助于通过其他空间和时间上下文理解大流行的对话动态。
translated by 谷歌翻译
COVID-19的大流行提出了对多个领域决策者的流行预测的重要性,从公共卫生到整个经济。虽然预测流行进展经常被概念化为类似于天气预测,但是它具有一些关键的差异,并且仍然是一项非平凡的任务。疾病的传播受到人类行为,病原体动态,天气和环境条件的多种混杂因素的影响。由于政府公共卫生和资助机构的倡议,捕获以前无法观察到的方面的丰富数据来源的可用性增加了研究的兴趣。这尤其是在“以数据为中心”的解决方案上进行的一系列工作,这些解决方案通过利用非传统数据源以及AI和机器学习的最新创新来增强我们的预测能力的潜力。这项调查研究了各种数据驱动的方法论和实践进步,并介绍了一个概念框架来导航它们。首先,我们列举了与流行病预测相关的大量流行病学数据集和新的数据流,捕获了各种因素,例如有症状的在线调查,零售和商业,流动性,基因组学数据等。接下来,我们将讨论关注最近基于数据驱动的统计和深度学习方法的方法和建模范式,以及将机械模型知识域知识与统计方法的有效性和灵活性相结合的新型混合模型类别。我们还讨论了这些预测系统的现实部署中出现的经验和挑战,包括预测信息。最后,我们重点介绍了整个预测管道中发现的一些挑战和开放问题。
translated by 谷歌翻译
背景:COVID-19患者的早期检测和隔离对于成功实施缓解策略并最终遏制疾病扩散至关重要。由于在每个国家 /地区进行的每日共同测试数量有限,因此模拟COVID-19的扩散以及目前每种缓解策略的潜在影响仍然是管理医疗保健系统和指导决策者的最有效方法之一。方法:我们介绍了Covidhunter,这是一种灵活而准确的Covid-19爆发模拟模型,该模型评估了应用于区域的当前缓解措施,并提供有关即将进行的缓解措施的强度的建议。 Covidhunter的关键思想是通过模拟考虑到外部因素的影响,例如环境条件(例如气候,温度,湿度,湿度)和缓解措施。结果:使用瑞士作为案例研究,Covidhunter估计,如果政策制定者放宽30天的缓解措施50%,那么医院病床的日常容量和每日死亡人数平均每天的死亡人数平均增加了5.1倍,则会增加5.1倍谁可能会占用ICU床和呼吸机一段时间。与现有模型不同,Covidhunter模型可以准确监视,并预测COVID-19造成的病例,住院和死亡人数。我们的模型可以灵活地配置,并且可以易于修改,以在不同的环境条件和缓解措施下对不同方案进行建模。可用性:我们在https://github.com/cmu-safari/covidhunter上发布了covidhunter实现的源代码,并展示如何在任何情况下灵活配置我们的模型,并轻松地将其扩展为不同的度量和条件。
translated by 谷歌翻译
共同检测和隔离Covid-19患者对于成功实施缓解策略并最终遏制疾病扩散至关重要。由于在每个国家 /地区进行的每日共同测试数量有限,因此模拟COVID-19的扩散以及目前每种缓解策略的潜在影响仍然是管理医疗保健系统和指导决策者的最有效方法之一。我们介绍了Covidhunter,这是一种灵活而准确的Covid-19爆发模拟模型,评估了当前适用于该地区的缓解措施,可预测Covid-19统计数据(每日案件,住院和死亡人数),并就何种建议提供建议。力量即将进行的缓解措施应该是。 Covidhunter的关键思想是通过模拟考虑到外部因素的影响,例如环境条件(例如气候,温度,湿度,湿度),关注的不同变体,疫苗接种率和缓解措施。 Covidhunter以瑞士为案例研究,估计我们正在经历一场致命的新浪潮,该浪潮将于2022年1月26日达到顶峰,这与我们2020年2月的浪潮非常相似。决策者只有一个选择是为了增加30天的当前缓解措施的强度。与现有模型不同,Covidhunter模型可以准确监视,并预测COVID-19造成的病例,住院和死亡人数。我们的模型可以灵活地进行配置,并且可以易于修改,以在不同的环境条件和缓解措施下对不同方案进行建模。我们在https://github.com/cmu-safari/covidhunter上发布了covidhunter实现的源代码。
translated by 谷歌翻译
目前,Covid-19的发展使研究人员可以收集2年内积累的数据集并将其用于预测分析。反过来,这可以评估更复杂的预测模型的效率潜力,包括具有不同预测范围的神经网络。在本文中,我们介绍了基于两个国家的区域数据:美国和俄罗斯的区域数据,对不同类型的方法进行了一致的比较研究结果。我们使用了众所周知的统计方法(例如,指数平滑),一种“明天”方法,以及一套经过来自各个地区数据的经典机器学习模型。与他们一起,考虑了基于长期记忆(LSTM)层的神经网络模型,这些培训样本的培训样本汇总了来自两个国家 /地区的所有地区:美国和俄罗斯。根据MAPE度量,使用交叉验证进行效率评估。结果表明,对于以确认的每日案例数量大幅增加的复杂时期,最佳结果是由在两国所有地区训练的LSTM模型显示的,显示平均平均绝对百分比误差(MAPE)为18%在俄罗斯为30%,37%,31%,41%,50%的预测范围为14、28和42天。
translated by 谷歌翻译
Covid-19的反复暴发对全球社会产生了持久的影响,该社会呼吁使用具有早期可用性的各种数据来预测大流行波。现有的预测模型可以预测使用移动性数据的第一次爆发浪潮可能不适用于多波预测,因为美国和日本的证据表明,不同波浪之间的流动性模式在感染情况下与波动表现出不同的关系。因此,为了预测多波大流行,我们提出了一个基于社会意识的图形神经网络(SAB-GNN),它考虑了与症状相关的Web搜索频率的衰减,以捕获多个波浪中公共意识的变化。我们的模型结合了GNN和LSTM,以建模城市地区之间的复杂关系,跨区域的移动性模式,Web搜索历史记录和未来的Covid-19感染。我们训练我们的模型,从2020年4月至2021年5月,在雅虎日本公司根据严格的隐私保护规则中收集的四个大流行浪潮中,使用其移动性和Web搜索数据来预测东京地区的未来大流行爆发。结果证明了我们的模型优于最先进的基线,例如ST-GNN,MPNN和GraphLSTM。尽管我们的模型在计算上并不昂贵(只有3层和10个隐藏的神经元),但提出的模型使公共机构能够预料并为将来的大流行爆发做准备。
translated by 谷歌翻译
当今世界受到新颖的冠状病毒(Covid-19)的严重影响。使用医疗套件来识别受影响的人非常慢。接下来会发生什么,没人知道。世界正面临不稳定的问题,不知道在不久的将来会发生什么。本文试图使用LSTM(长期记忆)对冠状病毒恢复病例进行预后。这项工作利用了258个地区的数据,其纬度和经度以及403天的死亡人数范围为22-01-2020至27-02-2021。具体而言,被称为LSTM的先进基于深度学习的算法对为时间序列数据(TSD)分析提取高度必不可少的特征产生了极大的影响。有很多方法已经用于分析传播预测。本文的主要任务最终在分析使用基于LSTM深度学习的体系结构分析冠状病毒在全球恢复案例中的传播。
translated by 谷歌翻译
在整个2019年冠状病毒疾病(COVID-19)大流行中,决策者依靠预测模型来确定和实施非药物干预措施(NPI)。在构建预测模型时,需要从包括开发人员,分析师和测试人员在内的各种利益相关者进行不断更新的数据集,以提供精确的预测。在这里,我们报告了可扩展管道的设计,该管道可作为数据同步,以支持国际自上而下的时空时空观察和covid-19的预测模型,名为Where2test,用于德国,捷克西亚和波兰。我们已经使用PostgreSQL构建了一个操作数据存储(ODS),以连续合并多个数据源的数据集,执行协作工作,促进高性能数据分析和跟踪更改。 ODS不仅是为了存储来自德国,捷克和波兰的COVID-19数据,而且还存储了其他领域。元数据的模式采用维数事实模型,能够同步这些区域的各种数据结构,并且可以扩展到整个世界。接下来,使用批处理,转移和负载(ETL)作业填充ODS。随后创建了SQL查询,以减少为用户预处理数据的需求。然后,数据不仅可以支持使用版本控制的Arima-Holt模型和其他分析来预测,以支持决策制定,还可以风险计算器和优化应用程序。数据同步以每天的间隔运行,该间隔显示在https://www.where2test.de上。
translated by 谷歌翻译
在这项工作中,我们评估了人口模型和机器学习模型的合奏,以预测COVID-19大流行的不久的将来的演变,并在西班牙有特殊的用例。我们仅依靠开放和公共数据集,将发生率,疫苗接种,人类流动性和天气数据融合来喂养我们的机器学习模型(随机森林,梯度增强,K-Nearest邻居和内核岭回归)。我们使用发病率数据来调整经典人群模型(Gompertz,Logistic,Richards,Bertalanffy),以便能够更好地捕获数据的趋势。然后,我们整合了这两个模型家族,以获得更强大,更准确的预测。此外,我们已经观察到,当我们添加新功能(疫苗,移动性,气候条件)时,使用机器学习模型获得的预测有所改善,使用Shapley添加说明值分析了每个功能的重要性。就像在任何其他建模工作中一样,数据和预测质量都有多个局限性,因此必须从关键的角度看待它们,如我们在文本中所讨论的那样。我们的工作得出的结论是,这些模型的合奏使用可以改善单个预测(仅使用机器学习模型或仅使用人口模型),并且在由于缺乏相关数据而无法使用隔室模型的情况下,可以谨慎地应用。
translated by 谷歌翻译
在清晨预测交通动态时,传统交通预测方法的有效性通常非常有限。原因是在清晨通勤期间交通可能会彻底分解,这个分解的时间和持续时间大幅度从日常生活中变化。清晨的交通预测是通知午餐的交通管理至关重要,但他们通常会提前预测,特别是在午夜预测。在本文中,我们建议将Twitter消息作为探测方法,了解在前一天晚上/午夜的人们工作和休息模式的影响到下一天的早晨交通。该模型在匹兹堡的高速公路网络上进行了测试,作为实验。由此产生的关系令人惊讶地简单且强大。我们发现,一般来说,早些时候的人休息如推文所示,即第二天早上就越拥挤的道路就越多。之前的大事发生了大事,由更高或更低的Tweet情绪表示,比正常,通常意味着在第二天早上的旅行需求较低。此外,人们在前一天晚上和清晨的鸣叫活动与早晨高峰时段的拥堵有统计学相关。我们利用这种关系来构建一个预测框架,预测早晨的通勤充血使用5时或早晨午夜提取的人的推特型材。匹兹堡研究支持我们的框架可以精确预测早晨拥塞,特别是对于具有大型日常充血变异的道路瓶颈上游的一些道路段。我们的方法在没有Twitter消息功能的情况下大大差异,可以从提供管理洞察力的推文配置文件中学习有意义的需求表示。
translated by 谷歌翻译
第一个已知的冠状病毒疾病2019(Covid-19)于2019年12月确定。它在全球范围内传播,导致许多国家的持续流行,强加的限制和成本。在此期间预测新案例和死亡人数可能是预测未来所需成本和设施的有用步骤。本研究的目的是预测未来100天内的新案例和死亡率,三天和七天。预测每一个天(而不是每天的动机)是调查计算成本降低和仍然实现合理性能的可能性。可以在时间序列的实时预测中遇到这样的场景。六种不同的深入学习方法是对来自世卫组织网站采用的数据进行检查。三种方法是LSTM,卷积LSTM和GRU。然后考虑对每种方法考虑双向延伸,以预测澳大利亚和伊朗国家的新案例和新死亡率。这项研究是新颖的,因为它对上述三个深度学习方法及其双向延伸进行了全面评估,以对Covid-19新案例和新的死亡率时间序列进行预测。据我们所知,这是Bi-Gru和Bi-conv-LSTM模型首次用于Covid-19新案例和新的死亡时间序列的预测。该方法的评估以图形和弗里德曼统计测试的形式提出。结果表明双向模型的误差比其他模型较低。提出了几个错误评估度量来比较所有模型,最后,确定双向方法的优越性。该研究对于针对Covid-19的组织有用,并确定其长期计划。
translated by 谷歌翻译
2019年底,最新的新型冠状病毒SARS-COV-2成为了一项显着的急性呼吸系统疾病,已成为全球大流行病。由于国家和市政当局的高社会经济差异,巴西等国家难以处理病毒。因此,本研究提出了一种使用不同机器学习的新方法,以及应用于巴西Covid-19数据的深度学习算法。首先,使用聚类算法来识别具有相似社会阶乘行为的县,而Benford的定律用于检查数据操作。基于这些结果,我们能够根据群集正确地模拟Sarima模型以预测新的每日情况。无监督的机器学习技术优化了定义Sarima模型参数的过程。此框架也很有用来在所谓的第二波期间提出限制方案。我们已经使用了来自巴西最有人口的S \〜Ao Paulo State的645个县。然而,这种方法可以用于其他州或国家。本文展示了机器学习,深度学习,数据挖掘和统计数据的不同技术可以一起使用,以在处理大流行数据时产生重要结果。虽然结果不能专门用于评估和影响政策决策,但它们提供了已使用的无效措施的替代方案。
translated by 谷歌翻译
背景:Coronavirus,Covid-19首次于2020年在美国检测到。为了抑制3月中旬的疾病的传播,不同的国家发出了强制性宿舍(SAH)订单。这些非药物干预措施是根据先前经验的授权,例如1918年流感流行病。因此,我们决定研究限制对减少Covid-19传输的流动性的影响。方法:我们设计了一项生态时间序列,我们的曝光变量作为马里兰州的移动模式,于2020年3月2020年3月和我们的结果变量与同一时期的Covid-19住院治疗。我们建立了极端梯度升压(XGBoost)集合机器学习模型,并以马里兰不同地区的流动体积回归滞后的Covid-19住院治疗。结果:我们发现Covid-19住院时间增加18%,当流动性增加了5倍,同样在流动性进一步增加了十因素时增加了43%。结论:我们的研究结果表明了流动性与Covid-19例的发生率之间的正线性关系。这些发现与其他研究表明的其他研究是一致的,这表明了移动性限制的益处。尽管需要更详细的方法来精确地了解移动性限制的益处和限制,作为对Covid-19流行的反应的一部分。
translated by 谷歌翻译
Pandemic(epidemic) modeling, aiming at disease spreading analysis, has always been a popular research topic especially following the outbreak of COVID-19 in 2019. Some representative models including SIR-based deep learning prediction models have shown satisfactory performance. However, one major drawback for them is that they fall short in their long-term predictive ability. Although graph convolutional networks (GCN) also perform well, their edge representations do not contain complete information and it can lead to biases. Another drawback is that they usually use input features which they are unable to predict. Hence, those models are unable to predict further future. We propose a model that can propagate predictions further into the future and it has better edge representations. In particular, we model the pandemic as a spatial-temporal graph whose edges represent the transition of infections and are learned by our model. We use a two-stream framework that contains GCN and recursive structures (GRU) with an attention mechanism. Our model enables mobility analysis that provides an effective toolbox for public health researchers and policy makers to predict how different lock-down strategies that actively control mobility can influence the spread of pandemics. Experiments show that our model outperforms others in its long-term predictive power. Moreover, we simulate the effects of certain policies and predict their impacts on infection control.
translated by 谷歌翻译
由于Covid-19-19疫苗可用,因此没有研究量化不同的灾难疏散策略如何减轻避难所中的大流行风险。因此,我们应用了一个年龄结构化的流行病学模型,称为易感性暴露感染(SEIR)模型,以研究台湾不同的疫苗摄取水平以及在台湾实施的转移方案在多大程度上降低了感染和延迟流行峰值的情况。台湾的转移协议涉及转移因曝光而自我占用的人,从而阻止了他们与集体庇护所的普通公众融合。转移方案,结合足够的疫苗摄取,可以减少相对于没有这种策略的情况,相对于场景,感染的最大数量和延迟爆发。当所有暴露的人的转移是不可能的,或者疫苗的摄取不足时,转移方案仍然很有价值。此外,一组主要由年轻人人口组成的撤离者往往会早日出现大流行峰值,并且在实施转移方案时,多数老年人组的感染比多数老年人多。但是,当不执行转移方案时,多数老年人群体比大多数年轻成人群体高达20%。
translated by 谷歌翻译
Algorithms that involve both forecasting and optimization are at the core of solutions to many difficult real-world problems, such as in supply chains (inventory optimization), traffic, and in the transition towards carbon-free energy generation in battery/load/production scheduling in sustainable energy systems. Typically, in these scenarios we want to solve an optimization problem that depends on unknown future values, which therefore need to be forecast. As both forecasting and optimization are difficult problems in their own right, relatively few research has been done in this area. This paper presents the findings of the ``IEEE-CIS Technical Challenge on Predict+Optimize for Renewable Energy Scheduling," held in 2021. We present a comparison and evaluation of the seven highest-ranked solutions in the competition, to provide researchers with a benchmark problem and to establish the state of the art for this benchmark, with the aim to foster and facilitate research in this area. The competition used data from the Monash Microgrid, as well as weather data and energy market data. It then focused on two main challenges: forecasting renewable energy production and demand, and obtaining an optimal schedule for the activities (lectures) and on-site batteries that lead to the lowest cost of energy. The most accurate forecasts were obtained by gradient-boosted tree and random forest models, and optimization was mostly performed using mixed integer linear and quadratic programming. The winning method predicted different scenarios and optimized over all scenarios jointly using a sample average approximation method.
translated by 谷歌翻译
冠状病毒大流行的严重程度需要有效的行政决定。在印度超过4万人的人屈服于Covid-19,拥有超过3亿卢比的确认案例,仍然计数。合理的第三波的威胁继续困扰数百万。在这种不断变化的病毒动态中,预测性建模方法可以用作整体工具。大流行进一步引发了一个前所未有的社交媒体使用。本文旨在提出一种利用社交媒体,特别推特的方法来预测与Covid-19案件相关的即将发生的情景。在这项研究中,我们寻求了解Covid-19相关推文的潮流如何表明案件的增加。这种前瞻性分析可用于帮助管理员及时资源分配,以减少损坏的严重程度。使用Word Embeddings来捕获推文的语义含义,我们识别大量尺寸(SDS).Or方法,预测患情况的上升时间为15天,30天,R2分别为0.80和0.62。最后,我们解释了SDS的主题效用。
translated by 谷歌翻译
流行病学中的数学模型是一种不可或缺的工具,可以确定传染病的动态和重要特征。除了他们的科学价值之外,这些模型通常用于在正在进行的爆发期间提供政治决策和干预措施。然而,通过将复杂模型连接到真实数据来可靠地推断正在进行的爆发的动态仍然很难,并且需要费力的手动参数拟合或昂贵的优化方法,这些方法必须从划痕中重复给定模型的每个应用。在这项工作中,我们用专门的神经网络的流行病学建模的新组合来解决这个问题。我们的方法需要两个计算阶段:在初始训练阶段中,描述该流行病的数学模型被用作神经网络的教练,该主管是关于全球可能疾病动态的全球知识。在随后的推理阶段,训练有素的神经网络处理实际爆发的观察到的数据,并且揭示了模型的参数,以便实际地再现观察到的动态并可可靠地预测未来的进展。通过其灵活的框架,我们的仿真方法适用于各种流行病学模型。此外,由于我们的方法是完全贝叶斯的,它旨在纳入所有可用的关于合理参数值的先前知识,并返回这些参数上的完整关节后部分布。我们的方法在德国的早期Covid-19爆发阶段的应用表明,我们能够获得可靠的概率估计对重要疾病特征,例如生成时间,未检测到的感染部分,症状发作前的传播可能性,以及报告延迟非常适中的现实观测。
translated by 谷歌翻译