随机块模型(SBM)及其变体,例如$,混合成员和重叠随机块模型,是基于潜变量的图的生成模型。事实证明,它们可以成功完成各种任务,例如在图形结构数据上发现社区结构和链接预测。最近,通过利用诸如局域性和不变性之类的图形属性,图形神经网络,例如$,图形卷积网络,也已成为一种有前景的方法,用于学习图形中节点的强大表示(嵌入)。在这项工作中,我们通过为图形开发\ emph {稀疏}变量自动编码器来统一这两个方向,这保留了SBM的可解释性,同时还享有图神经网络的出色预测性能。此外,我们的框架伴随着快速识别模型,可以快速推断节点嵌入(这对于SBM及其变体的推断具有独立的意义)。虽然我们为特定类型的SBM开发了这个框架,即\ emph {重叠}随机块模型,所提出的框架可以适用于其他类型的SBM。几个基准测试的实验结果证明了在链接预测方面的令人鼓舞的结果,同时学习了可用于社区发现的可解释的潜在结构。
translated by 谷歌翻译
在过去几年中,人们越来越关注学习基于物理基础的语言理解任务的模型,例如popularblocks world domain。这些工作通常将此问题视为单一进程,其中人工操作员发出指令,并评估自动代理执行它的能力。在本文中,我们采用第一个steptowards来增加这种交互的带宽,并建议一个包含建议,关于任务的高级观察的协议,这可以帮助消除代理的预测。我们评估我们对块世界任务的方法,并表明即使是简单的建议也可以帮助实现显着的性能提升。为了帮助减少提供建议所需的工作量,我们还要探索可以改善结果的模型自生建议。
translated by 谷歌翻译
在3D手姿势估计领域已经取得了巨大的进展,但是3D深度相机通常是不可访问的。我们提出了一种模型来识别RGB图像中的美国手语字母表。在训练深度神经网络之前,对训练图像进行了分析和预处理。该模型采用squeezenet架构进行训练,使其能够在移动设备上运行,精度为83.29%。
translated by 谷歌翻译
本文介绍了自动驾驶汽车的算法和系统架构。引入的车辆由设计用于鲁棒性,可靠性和可扩展性的软件栈提供动力。为了自主地绕过先前未知的轨道,所提出的解决方案结合了来自不同机器人领域的技术的状态。具体而言,感知,估计和控制被合并到一个高性能自主车辆中。这个复杂的机器人系统由AMZ Driverless和ETHZurich开发,在我们参加的每个比赛中获得第一名:Formula StudentGermany 2017,Formula Student Italy 2018和Formula Student Germany 2018. Wediscuss这些比赛的结果和学习,并对每个模块进行实验评估我们的解决方案
translated by 谷歌翻译
我们在卷积神经网络(CNN)中显示隐式滤波器级稀疏性表现,其使用批量归一化和ReLU激活,并且利用自适应梯度下降技术和L2正则化或权重衰减来训练。通过广泛的实证研究(Mehta et al。,2019),我们假设了稀疏化过程背后的机制,并发现与文献中提出的某些过滤器稀疏化启发式相关联。选择性特征的出现和随后的修剪被认为是有贡献的机制之一,导致特征稀疏性比某些明确的稀疏/修剪方法更好或更好。在本研讨会文章中,我们总结了我们的研究结果,并指出了选择性特征化的推论,这些推论也可以用作过滤修剪的启发式方法。
translated by 谷歌翻译
近年来,在基于场景的文本描述中生成图像的领域中已经见证了一些令人兴奋的发展。这些方法主要集中在从静态文本描述生成图像,并且限于一次性生成图像。他们无法基于增量添加的文本描述(更直观和类似于我们描述图像的方式)交互式地生成动画。我们提出了一种基于场景描述的图形序列(场景)递增地生成图像的方法-graphs)。我们提出了一种经常性的网络体系结构,它保留了之前步骤中生成的图像内容,并根据新提供的场景信息修改了累积图像。 Ourmodel利用图形卷积网络(GCN)来满足可变大小的图形以及生成对抗图像转换网络,以生成逼真的多对象图像,而无需在训练期间进行任何中间监视。我们使用Coco-Stuff数据集进行实验,该数据集具有多个对象图像以及描述视觉场景的注释,并且表明我们的模型明显优于同一数据集上的其他方法,从而为逐渐增长的场景图生成视觉上一致的图像。
translated by 谷歌翻译
本文研究了一类受限制的不安定多臂匪徒。约束的形式是随时可用的武器。这种变化可以是随机的也可以是半确定的。可以选择在每个决策间隔中播放固定数量的范围。每个军队的游戏都依赖于州的奖励。通过来自所释放的臂的二进制反馈信号可以部分地观察到当前的武器状态。武器的当前可用性是完全可以观察到的。目标是最大限度地累积奖励。有关部分国家信息的军备未来可用性的不确定性使这一目标具有挑战性。使用Whittle的索引策略分析了这个优化问题。为此,研究了一个不受约束的不安分的单臂匪徒。它被证明可以接受阈值类型的最优策略,并且也是可索引的。提出了一种计算Whittle指数的算法。此外,为了估计各种解的次优性程度,推导了价值函数的上界。仿真研究比较了Whittle指数,修正的Wittle指数和近视指标的表现。
translated by 谷歌翻译
域随机化是一种用于改善域转移的常用技术,当目标域未知或可以用于训练时,通常用于零镜头设置。在这项工作中,我们凭经验检验了域随机化对代理泛化的影响。我们的实验表明,域随机化可能导致次优的高方差策略,这些策略属于环境参数的统一采样。我们提出了ActiveDomain Randomization,一种学习参数采样策略的新算法。我们的方法通过利用随机和参考环境实例中policyrollouts的差异,在给定的随机化范围内寻找信息最丰富的环境变化。我们发现在这些情况下更频繁地训练会导致更好的整体代理一般化。此外,当域随机化和策略传输失败时,Active Domain Randomization可以更深入地了解所选参数范围和学习策略的不足,从而允许更集中的调试。我们在各种基于物理的模拟和区域机器人任务中的实验表明,这种增强可以产生更强大,更一致的策略。
translated by 谷歌翻译
基于卷积神经网络的单眼3D人体姿态估计方法通常需要大量具有3D姿势注释的训练图像。尽管为人类提供大量野外图像的2D联合注释是可行的,但是提供准确的3D注释,在野外语料库中实际上几乎不可行。大多数现有的3D标记数据集要么是综合创建的,要么是工作室内的图像。在这样的数据上训练的3D姿势估计算法通常具有推广到现实世界场景分集的有限性。因此,我们提出了一种新的基于深度学习的单眼三维人体姿态估计方法,该方法显示出高精度并且更好地概括为野外场景。它具有网络体系结构,其包括新的解析的隐藏空间编码的显式2D和3D特征,并且使用来自预测的3D姿势的新学习的投影模型的监督。我们的算法可以在图像数据上与3D标签和仅具有2D标签的图像数据联合训练。它在挑战野外数据方面实现了最先进的准确性。
translated by 谷歌翻译
必须逐步测量数英里的受污染管道,作为停用气体扩散浓缩设施的退役工作的一部分。目前的方法需要切除石棉衬里的热外壳,并执行重复的升高操作,以从外部手动测量管道。 RadPiper机器人是卡内基梅隆大学开发的管道爬行活动测量系统(PCAMS)的一部分,并被委托用于DOE朴茨茅斯气体扩散富集设施,从内部自动测量管道中的U-235。这提高了确定性,增加了安全性,并大大缩短了测量时间。 RadPiper机器人的核心是一个创新的圆盘准直组件中的碘化钠闪烁探测器。通过从内部管道测量,机器人相对于外部通管测量显着增加其计数率。机器人还提供图像,模拟内部管道几何形状,并精确测量距离,以便定位辐射测量。该系统收集的数据提供了对管道内部的深入了解,这是对前后测量无法实现的,同时保证了操作员的安全。本文介绍了PCAMS RadPiper机器人的技术细节。该机器人的主要功能包括精确距离测量,管道内障碍物检测,两种管道尺寸的变换能力以及自主操作的稳健性。提供了展示机器人功能的测试结果,包括部署公差测试,安全防护测试和本地化测试。还显示了集成的机器人测试。
translated by 谷歌翻译