当只能获得有限数量的noisylog-likelihood评估时,我们考虑贝叶斯推断。例如,当基于复杂模拟器的统计模型适合于数据时,这发生,并且使用合成似然(SL)来使用计算成本高的前向模拟来形成噪声对数似然估计。我们将推理任务构建为贝叶斯序列设计问题,其中对数似然函数使用分层高斯过程(GP)代理模型进行建模,该模型用于有效地选择其他对数似然评估位置。最近在批处理贝叶斯优化中取得了进展,我们开发了各种顺序策略,其中自适应地选择多个模拟以最小化预期或中值损失函数,从而测量所得到的后验中的不确定性。我们从理论上和经验上分析了所得方法的性质。玩具问题和三个模拟模型的实验表明我们的方法是稳健的,高度可并行的,并且样本有效。
translated by 谷歌翻译
定居宿主的细菌群体在宿主健康中起着重要作用,包括作为向其他宿主传播的宿主以及从中出现侵入性菌株,从而强调了解殖民群体的获得和清除的重要性。对殖民化动力学的研究基于对连续样品是否代表单个群体或不同的定植事件的评估。估算采集和清除率的共同点是使用固定的遗传距离阈值。然而,这种方法通常不足以解释潜在的主体内发展人口的多样性,连续测量之间的时间间隔以及估计的获取和清除率的不确定性。在这里,我们总结了最近提交的工作\ cite {jarvenpaa2018named},并提出了一个贝叶斯模型,它提供了两个菌株是否应该被认为是相同的概率,允许确定细菌清除和从基因组样本中获取时间。我们使用种群遗传模拟明确地模拟宿主内变异,并且通过使用近似贝叶斯计算(ABC)和马尔可夫链蒙特卡罗(MCMC)的组合来组合来自多个数据源的信息来完成推断。我们使用该方法分析一组耐甲氧西林金黄色葡萄球菌(MRSA)分离株。
translated by 谷歌翻译
无可能性推理引擎(ELFI)是一个Python软件库,用于执行无可用推理(LFI)。 ELFI提供了一种方便的语法,用于将LFI中的组件(例如先验,模拟器,摘要或距离)安排到称为ELFI图的网络中。这些组件可以用各种语言实现。独立的ELFI图可以与任何可用的推理方法一起使用而无需修改。在ELFI中实现的中心方法是无可能性推理的贝叶斯优化(BOLFI),最近已经证明通过代理建模距离可以将无可能性推断加速到几个数量级。 ELFI还具有内置的输出数据存储支持,可用于重用和分析,并支持从多个核到群集环境的计算并行化。 ELFI旨在实现可扩展性,并提供扩展其功能的接口。这使得向ELFI添加新的推理方法变得简单并且自动与内置功能兼容。
translated by 谷歌翻译
近似贝叶斯计算(ABC)是贝叶斯推理的一种方法,当可能性不可用时,但是可以从模型中进行模拟。然而,许多ABC算法需要大量的模拟,这可能是昂贵的。为了降低计算成本,已经提出了贝叶斯优化(BO)和诸如高斯过程的模拟模型。贝叶斯优化使人们可以智能地决定在哪里评估模型下一个,但是常见的BO策略不是为了估计后验分布而设计的。我们的论文解决了文献中的这一差距。我们建议计算ABC后验密度的不确定性,这是因为缺乏模拟来准确估计这个数量,并且定义了测量这种不确定性的aloss函数。然后,我们建议选择下一个评估位置,以尽量减少预期的损失。实验表明,与普通BO策略相比,所提出的方法通常产生最准确的近似。
translated by 谷歌翻译
流式算法通常根据其解决方案的质量,内存占用和计算复杂性来判断。在本文中,我们研究了在基数设置约为$ k $的流设置中最大化单调子模块函数的问题。我们首先提出Sieve-Streaming ++,它只需要一次传递数据,只保留$ O(k)$元素并实现紧密的$(1/2)$ - 近似保证。以前最好的流式算法要么用$ \ Theta(k)$内存实现次优$(1/4)$ - 近似,要么用$ O(k \ log k)$ memory实现最佳$(1/2)$近似值。接下来,通过缓冲流的一小部分并应用仔细的过滤程序,可以大大减少自适应计算轮次的数量,从而大大降低了Sieve-Streaming ++的计算复杂度。然后,我们将结果推广到更具挑战性的多源流设置。我们展示了如何使用$ O(k)$共享内存实现紧密的$(1/2)$ - 近似保证,同时最大限度地减少所需的计算轮次,同时最小化通信位的总数。最后,我们展示了我们的算法在多源推文和YouTube视频流的实际数据汇总任务中的效率。
translated by 谷歌翻译
Oxford Nanopore Technologies的MinION是第一台便携式DNA测序设备。它能够产生长读数,报告超过100 kBp。然而,它具有比其他方法明显更高的错误率。在这项研究中,我们提出了MinCall,MinION的end2end basecaller模型。该模型基于深度学习并在其实现中使用卷积神经网络(CNN)。为了获得额外的性能,它使用了尖端的加深学习技术和架构,批量标准化和ConnectionistTemporal Classification(CTC)损失。表现最佳的深度学习模式使用R9孔隙化学和1D读数对大肠杆菌数据集的中位数匹配率达到91.4%。
translated by 谷歌翻译
复杂网络被用作物理学,生物学,社会学和其他领域的系统建模的抽象。我们提出了一种基于快速个性化节点排名和深度学习的最新进展的算法,用于学习监督网络嵌入以及直接对网络节点进行分类。从同构网络和异构网络学习,我们的算法在九个节点分类基准测试中表现出强大的基线。分子生物学,金融学,社交媒体和语言处理的领域 - 迄今为止最大的节点分类集合之一。在速度和预测准确性方面,结果与当前最先进的技术相当或更好。通过所提出的算法获得的嵌入也是网络可视化的可行选择。
translated by 谷歌翻译
我们考虑通过猕猴前额皮质中的多电极阵列记录的局部场电位(LFP)预测眼球运动目标的问题。猴子的任务是执行记忆引导的扫视八个目标之一,在此期间记录LFP活动并用于traina解码器。以前的报告主要依赖于LFP的频谱幅度作为解码步骤中的一个特征,以限制成功,而忽略了相位而没有适当的理论证明。本文阐述了在统计上最优的框架中解码眼动意图的问题,并使用高斯序列建模和Pinsker定理来对LFP信号进行最佳估计,后者在解码步骤中被用作特征。该方法显示为低通滤波器,并且在适当收缩后通过其复数傅里叶系数表示特征空间中的LFP,使得较高频率分量衰减;这样,LFP信号中固有存在的相位信息自然地嵌入到特征空间中。所提出的基于复频谱的解码器在前额叶皮层表面附近的表面电极深度上实现高达$ 94 \%$的预测精度,这标志着与传统的基于功率谱的解码器相比显着的性能改进。
translated by 谷歌翻译
2005年,DARPA将实现可行的自动驾驶汽车(AVs)标记为挑战;不久之后,这个想法变成了一个可以改变汽车行业的潮流。今天,安全问题介于现实和解决之间。如果有合适的平台,CPS社区将准备提供独特的见解。然而,测试真实车辆的安全性和性能极限是昂贵且危险的。大多数研究人员和学生都无法使用这些车辆。在本文中,我们提出了F1 / 10:anopen-source,经济实惠,高性能的1/10规模自主车辆试验台。 F1 / 10测试平台具有与全尺度解决方案类似的全套传感器,感知,规划,控制和网络软件堆栈。我们展示了由F1 / 10测试平台实现的研究的关键实例,以及该平台如何用于增强自治系统中的研究和教育,使自治更容易获得。
translated by 谷歌翻译
血糖(SMBG)和连续血糖监测(CGM)的自我监测通常被1型糖尿病(T1D)患者用于测量葡萄糖浓度。所提出的自适应基础推注算法(ABBA)支持来自SMBG或CGM设备的输入,以基于前一天患者的葡萄糖水平提供针对每日基础速率和餐时胰岛素剂量的个性化建议。 ABBA基于强化学习(RL),一种人工智能,并在计算机上验证了具有100个成年人的FDA接受人群,在三个模拟月份的不同现实情景下。这些情景包括每天三顿主餐和一小时零食,以及胰岛素敏感性,进餐时间,碳水化合物量和葡萄糖测量时间的不同变化和不确定性。结果表明,所提出的方法与CGM或SMBG作为输入信号实现了相当的性能,而不影响总的每日胰岛素剂量。结果是一个有希望的迹象,AI算法方法可以提供个性化的自适应胰岛素优化和实现葡萄糖控制 - 独立于葡萄糖监测技术的类型。
translated by 谷歌翻译