在整个2019年冠状病毒疾病(COVID-19)大流行中,决策者依靠预测模型来确定和实施非药物干预措施(NPI)。在构建预测模型时,需要从包括开发人员,分析师和测试人员在内的各种利益相关者进行不断更新的数据集,以提供精确的预测。在这里,我们报告了可扩展管道的设计,该管道可作为数据同步,以支持国际自上而下的时空时空观察和covid-19的预测模型,名为Where2test,用于德国,捷克西亚和波兰。我们已经使用PostgreSQL构建了一个操作数据存储(ODS),以连续合并多个数据源的数据集,执行协作工作,促进高性能数据分析和跟踪更改。 ODS不仅是为了存储来自德国,捷克和波兰的COVID-19数据,而且还存储了其他领域。元数据的模式采用维数事实模型,能够同步这些区域的各种数据结构,并且可以扩展到整个世界。接下来,使用批处理,转移和负载(ETL)作业填充ODS。随后创建了SQL查询,以减少为用户预处理数据的需求。然后,数据不仅可以支持使用版本控制的Arima-Holt模型和其他分析来预测,以支持决策制定,还可以风险计算器和优化应用程序。数据同步以每天的间隔运行,该间隔显示在https://www.where2test.de上。
translated by 谷歌翻译