Generative Adversarial Networks have shown remarkable success in learning a distribution that faithfully recovers a reference distribution in its entirety. However, in some cases, we may want to only learn some aspects (e.g., cluster or manifold structure), while modifying others (e.g., style, orientation or dimension). In this work, we propose an approach to learn generative models across such incomparable spaces, and demonstrate how to steer the learned distribution towards target properties. A key component of our model is the Gromov-Wasserstein distance, a notion of discrepancy that compares distributions relationally rather than absolutely. While this framework subsumes current generative models in identically reproducing distributions, its inherent flexibility allows application to tasks in manifold learning, relational learning and cross-domain learning.
translated by 谷歌翻译
本文将多目标跟踪的流行任务扩展到多目标跟踪和分割(MOTS)。为实现这一目标,我们使用asemi-automatic注释程序为两个现有的跟踪数据集创建密集像素级注释。我们的新注释包含70,430个像素掩模,用于10,870个视频帧中的1,084个不同对象(汽车和行人)。为了评估,我们将现有的多对象跟踪指标扩展到这个新任务。此外,我们提出了一种新的基线方法,它通过单个卷积网络共同解决检测,跟踪和分割问题。通过在MOTS注释培训时实现性能的提高,我们证明了数据集的价值。我们相信,我们的数据集,指标和基线将成为开发超越2D边界框的多目标跟踪方法的宝贵资源。
translated by 谷歌翻译
已知贝叶斯优化难以扩展到高维度,因为获取步骤需要在相同的搜索空间中解决非凸优化问题。为了扩展方法并保持其优点,我们提出了一种算法(LineBO),该算法将问题限制为一系列选择性的一维子问题。我们表明,当函数是强凸的时,我们的算法会全局收敛并获得快速的本地速率。此外,如果目标具有不变的子空间,则我们的方法在不改变算法的情况下自动适应有效维度。我们的方法可以很好地扩展到高维度并且使用全局高斯过程模型。当结合SafeOpt算法来解决子问题时,我们得到了第一个安全的贝叶斯优化算法,其理论保证适用于高维设置。我们在多个综合基准测试中评估我们的方法,我们获得了竞争性能。此外,我们部署我们的算法,以最多40个参数优化瑞士自由电子激光的光束强度,同时满足安全操作约束。
translated by 谷歌翻译
基于高斯过程模型的贝叶斯优化(BO)是优化评估成本昂贵的黑盒函数的有力范例。虽然几个BO算法可证明地收敛到未知函数的全局最优,但他们认为内核的超参数是已知的。在实践中情况并非如此,并且错误指定经常导致这些算法收敛到较差的局部最优。在本文中,我们提出了第一个BO算法,它可以证明是无后悔的,并且在不参考超参数的情况下收敛到最优。我们慢慢地调整了固定核的超参数,从而扩展了相关的函数类超时,使BO算法考虑了更复杂的函数候选。基于理论上的见解,我们提出了几种实用的算法,通过在线超参数估计来实现BO的经验数据效率,但是保留理论收敛保证。我们评估了几个基准问题的方法。
translated by 谷歌翻译
生成性对抗网络(GAN)在精确建模复杂分布方面已经取得了很好的成果,但已知它们的训练是由极具挑战性的极小极大优化问题引起的困难的不稳定性。鉴于缺乏可以可靠地检测非收敛行为的评估指标,这尤其麻烦。我们利用游戏理论中的二元性差距的概念,以便为具有低计算成本的GAN提出新的收敛度量。我们验证了文献中常用的各种测试场景的建议度量的有效性。
translated by 谷歌翻译
光伏(PV)发电厂的能量输出取决于环境,因此随时间波动。结果,PV电力可能导致电网不稳定,特别是在越来越多地使用时。限制功率输出的变化率是减轻这些波动的常用方法,通常在大电池的帮助下。使用这些电池来补偿斜坡的反应控制器在实践中起作用,但由于高能量吞吐量而导致电池受力。在本文中,我们提出了一种深度学习方法,该方法使用天空图像来预测性地补偿波动并减少电池压力。特别是,可以使用后见之明只能提供的信息来计算最优控制策略。在此基础上,我们使用模仿学习来训练神经网络近似于后见之明的最优政策,但仅使用当前可用的天空图像和传感器数据。我们对来自真实发电厂的测量和图像的大量数据集评估我们的方法,并表明经过训练的策略可以减少对电池的压力。
translated by 谷歌翻译
机会均等(EOP)是一种广泛研究的政治哲学中的失范概念。在这项工作中,我们将最近提出的算法公平性建议映射到EOP的经济模型。我们正式表明,通过我们提出的映射,算法公平的许多现有定义,例如预测值奇偶校验和赔率相等,可以被解释为EOP的特殊情况。在这方面,我们的工作是理解现有算法公平概念的理论道德框架。最重要的是,这个框架允许我们明确地阐明每个公平概念背后的道德假设,并以新的视角解释最新的公平不可能性。最后但并非最不重要的是,在EOP的运气平等主义模型的启发下,我们提出了一种新的,更通用的算法公平度量方法。我们凭经验表明,当其基本的道德假设得不到满足时,采用算法(非)公平的度量,会对受试者的福利产生破坏性后果。
translated by 谷歌翻译
通过允许机器人适应不确定的环境并改善其性能,学习算法在仿真中表现出相当的实力。然而,这种算法在安全关键系统的实践中很少使用,因为学习的策略通常不会产生任何安全保障。也就是说,所需的探索可能会对机器人或其环境造成物理伤害。在本文中,我们提出了一种学习非线性闭环动力系统准确安全证书的方法。具体来说,我们构建一个神经网络Lyapunov函数和一个训练算法,将其适应状态空间中最大安全区域的形状。该算法仅依赖于动态输入和输出的知识,而不依赖于任何特定的模型结构。我们通过学习模拟倒立摆的安全吸引区来证明我们的方法。此外,我们讨论了如何将我们的方法与动力系统的统计模型一起用于安全学习算法。
translated by 谷歌翻译
我们考虑离散概率模型中的推理问题,即有限地集的子集上的分布。这些包括机器学习中的一系列众所周知的模型,例如行列式点过程和Ising模型。局部移动的马尔可夫链蒙特卡罗算法,例如Gibbs采样器,通常用于这种模型中的推理,但是它们的收敛有时非常慢。这通常是由状态空间瓶颈引起的,这极大地阻碍了这种采样器的移动。我们提出了一种新的采样策略,它使用特定的产品分布混合来提出全局移动,从而加速收敛。此外,我们展示了如何使用半导体信息构造这样的混合。我们说明了将我们的采样器结合在一起的有效性,理论上是在一个示例模型上,以及实际上从实际数据集中学习的三个模型。
translated by 谷歌翻译
我们介绍了一种新方法,用于从过程的无监督演示中学习策略。给定系统模型和一组输出序列,我们发现一种策略具有与原始策略相当的性能,而无需访问这些演示的输入。我们首先通过观察无监督演示来估计系统的输入。然后,我们通过将vanilla监督学习算法应用于(估计的)输入 - 输出对来学习策略。对于输入估计,我们提出了一种新的自适应线性估计器(AdaL-IE),其在估计中明确地交换方差和偏差。正如我们在经验上显示的那样,与最先进的输入估计方法(UMV-IE)相比,AdaL-IE产生的误差较低[Gillijns and De Moor,2007]。将AdaL-IE与模仿学习结合使用,使我们能够成功学习控制策略,这些策略始终优于使用UMV-IE的控制策略。
translated by 谷歌翻译