最近,人们越来越关注多变量高斯过程(MGP),它扩展了高斯过程(GP)以处理多个输出。构建MGP并在输出之间考虑非平凡的共同性的一种方法采用卷积过程(CP)。 CP基于在多个卷积中共享潜在功能的想法。尽管CP结构的优雅,但它提供了尚未解决的新挑战。首先,即使具有适度数量的输出,由于计算命令和要估计的参数数量的大量增加,模型构建极其令人望而却步。其次,当某些产出不具有共性时,可能会出现负面的知识转移。在本文中,我们将解决这些问题。我们提出了使用CP建立的MGP的正则化成对建模方法。我们的方法的关键特征是将完整多变量模型的估计分配到一组单独构建的双变量GP中。有趣的是,成对建模具有独特的特征,这使我们能够通过惩罚促进每个双变量模型中信息共享的潜在功能来应对负转移的挑战。然后通过组合贝叶斯框架内的双变量模型的预测来进行预测。当输出数量很大时,所提出的方法具有极好的可扩展性,并且最小化了相关输出之间的知识的负向转移。对所提方法的统计保证进行了研究,并通过数值研究证明了其有利特征。
translated by 谷歌翻译
机器学习已成为解决复杂问题的一种日益强大的工具,其在公共卫生中的应用未得到充分利用。这项研究的目的是测试机器学习模型在现实环境中的非食物疾病检测的功效。为此,我们构建了一个机器学习模型,用于使用匿名和聚合的网络搜索和位置数据实时检测食源性疾病。我们计算了访问某个特定餐馆的人员的分数,然后搜索了指示食物中毒的故障以识别可能不安全的餐馆。我们利用这些信息来关注两个城市的餐馆检查,并证明FINDER提高了健康检查的准确性; FINDER确定的餐馆是通过现有方法确定的餐馆可能被视为未经检查的3.1倍。此外,FINDER使我们能够确定以前难以处理的流行病学信息,例如,在38%的情况下,餐馆潜在地引起食物中毒不是最后一次访问,这可能解释基于投诉的检查的准确性较低。我们发现,FINER能够可靠地识别具有主动失效信息的餐馆,允许实施纠正措施,以防止食源性疾病的潜在传播。
translated by 谷歌翻译