在线现场实验是评估现实世界交互式机器学习系统变化的黄金标准方法。然而,我们探索复杂的多维政策空间的能力 - 例如在建议和排名问题中发现的那些 - 往往受到可以同时运行的有限数量的实验的限制。为了减轻这些限制,我们使用离线模拟器增加在线实验,并应用多任务贝叶斯优化来调整实时机器学习系统。我们描述了在这些类型的应用程序中出现的实际问题,包括使用模拟器产生的偏差和多任务内核的假设。我们测量经验学习曲线,其显示来自包括偏向离线实验的数据的实质性收益,并且显示这些学习曲线如何与多任务高斯过程概括的理论结果一致。我们发现改进的内核推理是多任务泛化的重要驱动因素。最后,我们展示了贝叶斯优化的几个例子,它们通过结合离线实验和在线实验来有效地调整实时机器学习系统。
translated by 谷歌翻译
随机实验是评估变化对现实世界系统影响的黄金标准。这些测试中的数据可能难以收集,结果可能具有高度差异,从而导致潜在的大量测量误差。贝叶斯优化是一种有效优化多个连续参数的有前途的技术,但是当噪声水平高时,现有方法降低了性能,限制了其对多个随机实验的适用性。我们得到了一个表达式,用于预期的改进,具有噪声观察和噪声约束的批量优化,并开发了一种准蒙特卡罗近似,可以有效地进行优化。使用合成函数进行的仿真表明,噪声约束问题的优化性能优于现有方法。我们通过在Facebook上进行的两个真实的实验来进一步证明该方法的有效性:优化排名系统和优化服务器编译器标志。
translated by 谷歌翻译
本文探讨了使用软地面实例掩模(“软掩模”)来构建完全卷积神经网络(FCNN)来分割多发性硬化(MS)病变.MS病变的检测和分割主要是由于极端不平衡的数据,具有非常少的可用于训练的部分像素。利用解剖学知识,围绕像素的病变也可能包括一些病变水平信息,我们建议用相邻的像素数据增加病变类的数据集 - 减少通过给定专家提供的二元分割掩模的形态学扩张来构造软掩模,其中专家标记的体素接收标记1并且相关区域的体素被分配软标签。在所提出的方法中,使用软件训练FCNN。在ISBI 2015挑战数据集上,这是为了提供更好的精确召回权衡并实现更高的骰子骰子arity系数。我们还表明,与第二个独立专家相比,通过使用这个软掩码方案,我们可以提高网络分段性能。
translated by 谷歌翻译
我们引入了有效的算法,这些算法对于具有端到端反馈的随机在线最短路径路由问题实现了近乎最优的遗憾。该设置是组合随机带问题的自然应用,这是线性随机匪徒问题的一个特例。通过动作集的网络结构可以克服大规模动作集所带来的困难。我们的方法提出了强盗学习和最短路径算法之间的新颖连接。我们的主要贡献是一种自适应探索算法,对于任何有向无环网络都具有几乎最优的实例依赖性遗憾。然后我们修改它,以便同时实现几乎最佳的最坏情况遗憾。在精心设计的Top-Two Comparison(TTC)技术的驱动下,算法可以有效实现。我们进一步进行了广泛的数值实验,表明我们提出的算法不仅可以实现卓越的后悔性能,而且还可以大大减少运行时间。
translated by 谷歌翻译