生物重建VII轨道3挑战重点是在Twitter用户时间表中识别药物名称。对于我们提交这一挑战,我们通过使用多种数据增强技术扩展了可用的培训数据。然后,增强数据用于微调在一般域推特内容上预先培训的语言模型的集合。拟议的方法优于先前的最先进的算法Kusuri,并在竞争中排名高,为我们所选择的客观函数重叠F1分数。
translated by 谷歌翻译
Bayesian Optimization(Bo)是全球优化昂贵的客观功能的框架。古典BO方法假设客观函数是一个黑匣子。但是,有关客观函数计算的内部信息通常可用。例如,在使用模拟优化制造行的吞吐量时,除了整体吞吐量之外,我们还会观察每个工作站等待等待的部件数。最近的BO方法利用此类内部信息显着提高性能。我们称之为这些“灰盒”BO方法,因为它们将客观计算视为部分可观察且甚至可修改,将黑盒方法与所谓的“白盒”的第一原理进行客观函数计算的知识。本教程描述了这些方法,专注于复合物镜功能的博,其中可以观察和选择性地评估饲喂整体目标的单个成分;和多保真博,其中一个人可以通过改变评估oracle的参数来评估目标函数的更便宜的近似。
translated by 谷歌翻译
我们考虑贝叶斯型优化函数网络的输出,其中每个功能都将其作为输入其父节点的输出,并且网络在其位置需要评估。例如,在强化学习,工程设计和制造中出现了这些问题。虽然标准贝叶斯优化方法只观察到最终输出,但我们的方法通过利用前者忽略的信息来提供更大的查询效率:网络内中间输出。这是通过使用高斯过程建模网络的节点来实现的实现,并选择要使用的点作为我们的采集功能来评估点,所以在物镜上的隐含后续计算的预期改进。尽管这种后部的非高斯性质阻止了以封闭形式计算我们的采集功能,但我们表明它可以通过样本平均近似有效地最大化。此外,我们证明我们的方法是渐近的,这意味着它发现全球最佳解决方案随着评估的数量增长到无穷大,因此概括了预期改进的先前已知的收敛结果。值得注意的是,即使我们的方法可能无法谨慎地评估域,而是利用问题结构留下未开发的区域。最后,我们表明我们的方法在几个合成和现实世界问题中显着优于标准贝叶斯优化方法。
translated by 谷歌翻译
AI的蓬勃发展提示建议,AI技术应该是“以人为本”。然而,没有明确的定义,对人工人工智能或短,HCAI的含义。本文旨在通过解决HCAI的一些基础方面来改善这种情况。为此,我们介绍了术语HCAI代理商,以指配备有AI组件的任何物理或软件计算代理,并与人类交互和/或协作。本文识别参与HCAI代理的五个主要概念组件:观察,要求,行动,解释和模型。我们看到HCAI代理的概念,以及其组件和功能,作为弥合人以人为本的AI技术和非技术讨论的一种方式。在本文中,我们专注于采用在人类存在的动态环境中运行的单一代理的情况分析。
translated by 谷歌翻译
本文介绍了分类器校准原理和实践的简介和详细概述。校准的分类器正确地量化了与其实例明智的预测相关的不确定性或信心水平。这对于关键应用,最佳决策,成本敏感的分类以及某些类型的上下文变化至关重要。校准研究具有丰富的历史,其中几十年来预测机器学习作为学术领域的诞生。然而,校准兴趣的最近增加导致了新的方法和从二进制到多种子体设置的扩展。需要考虑的选项和问题的空间很大,并导航它需要正确的概念和工具集。我们提供了主要概念和方法的介绍性材料和最新的技术细节,包括适当的评分规则和其他评估指标,可视化方法,全面陈述二进制和多字数分类的HOC校准方法,以及几个先进的话题。
translated by 谷歌翻译
黑匣子机器学习模型的解释性是至关重要的,特别是在部署在药物或自主汽车等关键应用中。现有方法为模型的预测产生了解释,然而,如何评估这种解释的质量和可靠性仍然是一个开放的问题。在本文中,我们进一步迈出了一步,以便为从业者提供工具来判断解释的可信度。为此,我们通过测量一系列多样化的替代替代解释者中的序数共识来产生对给定解释的不确定性的估计。虽然我们通过使用集合技术鼓励多样性,但我们提出并分析了指标,以通过评级方案汇总解释者集合中所包含的信息。我们通过关于最先进的卷积神经网络集合的实验来凭经验说明了这种方法的性质。此外,通过量身定制的可视化,我们展示了不确定性估计为用户提供了超出标准代理解释者引起的具体可操作见解的具体示例。
translated by 谷歌翻译
有希望的方法来提高加固学习中的鲁棒性和探索正在收集人的反馈,并纳入目标环境的先验知识。然而,它通常太昂贵,无法获得足够的质量反馈。为了减轻这个问题,我们的目标是依靠一组多个专家(和非专家),具有不同的技能水平来产生足够的反馈。因此,这种反馈可以不一致,不常见。在本文的情况下,我们在前工作开始 - 建议,贝叶斯方法试图最大限度地利用人类反馈中获得的信息 - 扩展了算法,接受来自这一较大的人类,培训师的反馈,同时估计每个培训师的可靠性。我们展示了多培训师的积极反馈如何提高总反馈的准确性,并以两种方式更轻松地使收集过程更容易。首先,这种方法解决了一些培训师是对抗性的。其次,访问有关每个培训师可靠性的信息提供第二层稳健性,为管理整个系统的人提供有价值的信息,以提高系统的整体信任。它提供了可操作的工具,用于改进反馈收集过程或在需要时修改奖励功能设计。我们经验表明,我们的方法可以正确地学习每个培训师的可靠性,并使用它来最大化从多培训师的反馈中获得的信息,即使某些源是普发的。
translated by 谷歌翻译
Bayesian Optimization(BO)是一种优化昂贵对评估黑匣子功能的采样有效的方法。大多数BO方法忽略了评估成本如何在优化域中变化。然而,这些成本可以是高度异质的并且通常提前未知。这发生在许多实际设置中,例如机器学习算法或基于物理的仿真优化的超参数调整。此外,那些确认成本异质性的现有方法并不自然地适应总评估成本的预算限制。这种未知的成本和预算限制的组合引入了勘探开发权衡的新维度,其中关于成本的学习成本本身。现有方法没有原因地理由以原则的方式对此问题的各种权衡,经常导致性能不佳。我们通过证明,每单位成本的预期改进和预期改善,可以使这两个最广泛使用的采购职能在实践中的预期改进和预期的索赔可以是任意劣等的。为了克服现有方法的缺点,我们提出了预算的多步预期改进,是一个非近视收购函数,以概括为异质和未知评估成本的古典预期改进。最后,我们表明我们的采集功能优于各种合成和实际问题的现有方法。
translated by 谷歌翻译
这项工作调查了鲁棒优化运输(OT)的形状匹配。具体而言,我们表明最近的OT溶解器改善了基于优化和深度学习方法的点云登记,以实惠的计算成本提高了准确性。此手稿从现代OT理论的实际概述开始。然后,我们为使用此框架进行形状匹配的主要困难提供解决方案。最后,我们展示了在广泛的具有挑战性任务上的运输增强的注册模型的性能:部分形状的刚性注册;基蒂数据集的场景流程估计;肺血管树的非参数和肺部血管树。我们基于OT的方法在准确性和可扩展性方面实现了基蒂的最先进的结果,并为挑战性的肺登记任务。我们还释放了PVT1010,这是一个新的公共数据集,1,010对肺血管树,具有密集的采样点。此数据集提供了具有高度复杂形状和变形的点云登记算法的具有挑战性用例。我们的工作表明,强大的OT可以为各种注册模型进行快速预订和微调,从而为计算机视觉工具箱提供新的键方法。我们的代码和数据集可在线提供:https://github.com/uncbiag/robot。
translated by 谷歌翻译
基于神经网络的学习,从光伏(PV)和风中的来源以及负载需求的来源的不可转型可再生发电的分布的学习最近得到了注意力。由于通过直接对数似然最大化训练,归一化流量密度模型特别适用于此任务。然而,从图像生成领域的研究表明,标准归一化流量只能学习歧管分布的涂抹版本。以前的作品在规范化基于流的方案生成的情况下,不要解决这个问题,并且掩弹的分布导致噪声时间序列的采样。在本文中,我们利用了主成分分析(PCA)的等距,从而建立了较低尺寸空间中的标准化流量,同时保持直接和计算有效的似然最大化。我们在2013年至2015年培训PV和风力发电的数据以及德国的负载需求的所得到的主要成分流量(PCF)。本研究结果表明,PCF保留了原始分布的关键特征,如作为时间序列的概率密度和频率行为。然而,PCF的应用不限于可再生能力,而是扩展到任何数据集,时间序列或其他方式,可以使用PCA有效地减少。
translated by 谷歌翻译