如果不确定性量化(UQ)对于实现值得信赖的机器学习至关重要,则大多数UQ方法都遭受不同和不一致的评估协议。我们声称这种不一致的原因是社区对UQ的不明确要求。本意见论文通过通过五个下游任务指定这些要求来提供新的观点,我们期望不确定性得分具有实质性的预测能力。我们仔细设计了这些下游任务,以反映ML模型的现实用法。在7个分类数据集的示例基准上,我们没有观察到最新的内在UQ方法与简单基线的统计优势。我们认为,我们的发现质疑为什么我们量化不确定性并呼吁根据被证明与ML从业人员相关的指标进行标准化协议进行标准化协议。
translated by 谷歌翻译
生产中部署的ML模型通常必须面对未知的领域变化,这与培训环境根本不同。绩效预测模型执行了衡量这些变化对模型性能的影响的关键任务。我们通过学习生成的合成扰动来研究各种绩效预测模型对新领域的概括能力。对十个表格数据集的基准测试的经验验证表明,基于最先进的换档检测指标的模型不足以概括为看不见的域,而错误预测因子可以持续改善转移的性能预测。我们还提出了对预测准确性的自然和轻松的不确定性估计,以确保可靠地使用性能预测因子。我们的实现可在https://github.com/dataiku-research/performance_prediction_under_shift上获得。
translated by 谷歌翻译
我们提出了LOC-NERF,这是一种基于实时视觉的机器人定位方法,结合了蒙特卡洛定位和神经辐射场(NERF)。我们的系统使用预先训练的NERF模型作为环境的地图,可以使用RGB摄像机作为机器人唯一的外部感受传感器实时定位。尽管神经辐射场在计算机视觉和图形中看到了重要的视觉渲染应用,但他们发现机器人技术的用途有限。现有的基于NERF的本地化方法需要良好的初始姿势猜测和重大的计算,这使得它们对于实时机器人技术应用不切实际。通过使用Monte Carlo定位作为使用NERF MAP模型估算姿势的主力,LOC-NERF能够比ART的状态更快地执行本地化,并且不依赖初始姿势估计。除了测试合成数据外,我们还使用ClearPath Jackal UGV收集的实际数据运行系统,并首次证明了使用神经光辉场进行实时全球定位的能力。我们在https://github.com/mit-spark/loc-nerf上公开代码。
translated by 谷歌翻译
本文调查了两种基于逻辑的语言用于流的推理的相对表现力,即LARS程序 - 基于逻辑的基于逻辑的框架,用于分析推理,用于lars和LDSR的流,是最近扩展的语言用于流推理的I-DLV系统称为I-DLV-SR。尽管这两种语言在Datalog上构建,但语法和语义上确实有所不同。为了调和其表达能力的流推理能力,我们定义了一个比较框架,该框架使我们能够证明,不受任何限制,两种语言是无与伦比的,并确定可以通过另一种语言表达的每种语言的片段。
translated by 谷歌翻译
无人驾驶飞机(UAV)是飞机,其飞行可以完全自主,而无需任何人为干预。自然灾害管理是可以使用无人机的最有用和最有前途的领域之一。在本文中,我们专注于紧急情况,并提出使用无人机机队,以帮助营救团队个性化受影响区域内需要帮助的人。我们将这种情况建模为原始图理论问题,称为多部门多行车路由问题,总完成时间最小化(MDMT-VRP-TCT);我们经历了一些与之相似的文献研究中已经研究的问题,并突出了差异,提出了作为MILP作为MILP的数学表述,设计了一种数学框架来快速解决大型实例,并在实验中测试其性能。除了提出的应用程序之外,我们的解决方案在任何情况下都必须解决多部多行车路由问题的任何情况。
translated by 谷歌翻译
无监督的机器学习的目的是删除复杂的高维数据的表示形式,从而解释数据中的重要潜在因素以及操纵它们以生成具有理想功能的新数据。这些方法通常依赖于对抗方案,在该方案中,对代表进行调整以避免歧视者能够重建特定的数据信息(标签)。我们提出了一种简单,有效的方法,即在无需培训对抗歧视器的情况下解开表示形式,并将我们的方法应用于受限的玻尔兹曼机器(RBM),这是最简单的基于代表的生成模型之一。我们的方法依赖于在训练过程中引入对权重的足够约束,这使我们能够将有关标签的信息集中在一小部分潜在变量上。该方法的有效性在MNIST数据集,二维ISING模型和蛋白质家族的分类法上说明了。此外,我们还展示了我们的框架如何从数据的对数模型中计算成本,与其表示形式的删除相关。
translated by 谷歌翻译
提出了通过各向异性网格自适应过程增强的基于有限元的图像分割策略。该方法依赖于用于最小化基于区域的能量功能和基于各向异性的恢复的误差估计来驱动网格自适应的方法。更确切地说,认为贝叶斯能量功能被认为考虑到图像空间信息,确保方法能够在复杂图像中识别不均匀的空间模式。此外,各向异性网格适应保证了图像背景和前景的接口的清晰检测,具有减少的自由度。在一组真实图像上测试了所得到的分割适应Bregman算法,示出了该方法的准确性和稳健性,即使在高斯,盐和胡椒和散斑噪声也是如此。
translated by 谷歌翻译
本文提出了一种新方法,将多个标准排序或排名方法与项目组合选择程序结合在一起。多准则方法允许根据一组定性和定量标准对其优先级进行比较。然后,根据多个标准方法定义的优先级选择一组可行的项目,即投资组合。此外,投资组合必须满足一组资源约束,例如可用的预算以及一些逻辑约束,例如与要一起选择的项目或相互排斥的项目有关。提出的投资组合选择方法可以在不同的情况下应用。我们在城市规划领域提出了一个申请,我们的方法允许根据其优先级,预算约束和城市政策要求选择一组城市项目。鉴于历史城市重复其文化遗产的兴趣越来越大,我们在这种情况下应用和测试了我们的方法。特别是,我们展示了该方法如何支持在历史悠久的那不勒斯市中心(意大利)的建筑物干预措施的优先级,并考虑到几种观点。
translated by 谷歌翻译