基于通道的修剪在加速深度卷积神经网络方面取得了重大成功,深度卷积神经网络的管道是迭代的三步法:排序,修剪和微调。然而,这种迭代过程在计算上是昂贵的。在这项研究中,我们提出了一种基于粗略排序的新型计算有效的信道修剪方法,该方法利用微调期间的中间结果来对过滤器的重要性进行排序,建立在最先进的工作和数据驱动的排序标准之上。这项工作的目标不是提出一种基于特定通道修剪方法的单一改进方法,而是引入一种新的通用框架,该框架适用于一系列通道修剪方法。使用各种基准图像数据集(CIFAR-10,ImageNet,Birds-200和Flowers-102)和网络架构(AlexNet和VGG-16)来评估用于对象分类目的的所提出的方法。实验结果表明,所提出的方法可以与相应的艺术品(基线)达到几乎相同的性能,而我们的排名时间可以忽略不计。具体而言,通过所提出的方法,对于整个修剪过程的总计算时间的75%和54%可以分别针对CIFAR-10上的AlexNet和针对VGG-16 onImageNet而减少。我们的方法将极大地促进修剪实践,特别是在资源有限的平台上。
translated by 谷歌翻译
贝叶斯优化通常假设给出贝叶斯先验。然而,贝叶斯优化中强有力的理论保证在实践中经常因为先验中的未知参数而受到损害。在本文中,我们采用经验贝叶斯的变量并表明,通过估计从同一个先前采样的离线数据之前的高斯过程和构建后验的无偏估计,GP-UCB的变体和改进概率实现近乎零的后悔界限,其随着离线数据和离线数据的数量减少到与观测噪声成比例的常数。在线评估的数量增加。根据经验,我们已经验证了我们的方法,以挑战模拟机器人问题为特色的任务和运动规划。
translated by 谷歌翻译
我们提出了使用关系规则描述复杂不确定域中的过渡模型的表示。对于任何操作,规则选择一组相关对象,并在给定其在先前状态中的属性的情况下计算结果状态中那些对象的属性的分布。 Aniterative贪婪算法用于构造一组指示性参考,用于确定哪些对象在任何给定状态下是相关的。前馈神经网络用于学习相关对象属性的过渡分布。这种策略被证明比在模拟域中学习单片过渡模型更具通用性和样本效率,其中机器人将物体堆叠在杂乱的物体上。
translated by 谷歌翻译
丰富的高质量注释数据对于语义分段学习至关重要,但获取密集和像素方面的基础事实既耗费人力又耗时。粗略注释(例如,涂鸦,粗多边形)提供了经济上的替代方案,遗憾的是,训练阶段难以产生令人满意的性能。为了生成具有低时间成本的高质量注释数据以进行精确分割,本文提出了一种新的注释丰富策略,将现有的训练数据粗略注释扩展到更精细的尺度。对Cityscapes和PASCAL VOC 2012基准测试的广泛实验表明,使用我们框架中的丰富注释训练的神经网络比使用原始粗标记训练的产生显着改善。它与使用人类注释注释获得的性能竞争非常激烈。所提出的方法也优于其他最先进的弱监督分割方法。
translated by 谷歌翻译
在本文中,我们提出了一种学习算法,可以加速搜索任务和运动规划问题。我们的算法为学习提高计划效率中出现的三种不同挑战提出了解决方案:预测内容,如何表示计划问题实例,以及如何将知识从一个问题实例转移到另一个问题实例。我们提出了一种方法,它基于计划问题实例的通用表示来预测对搜索空间的约束,称为得分空间,其中我们根据尝试的一组解决方案的性能来表示问题实例。使用这种表示,我们以约束形式从基于得分空间相似性的先前问题转移知识。我们设计了一种能够有效预测这些约束的顺序算法,并在三个不同的挑战性任务和运动规划问题中对其进行评估。结果表明我们的方法比anuided计划者执行的数量级更快。
translated by 谷歌翻译
这项工作的目的是通过学习来增加机器人的基本能力,以使用新的感觉运动原语来解决复杂的长期问题。解决复杂领域中的长期问题需要灵活的生成规划,这种规划可以结合原始能力的新组合来解决世界上出现的问题。为了将原始行为结合起来,我们必须有先决条件的模型来影响这些行为:在什么情况下执行这个原则会在世界上产生某种特殊的影响?我们使用并开发了最先进的方法进行有趣学习和采样的新颖改进。我们使用高斯过程方法从机器人实验中收集的少量昂贵的训练样本中学习操作员有效性的条件。我们开发了自适应采样方法,用于在规划解决新任务期间生成连续集的各种元素(例如机器人配置和对象姿势),从而使计划尽可能高效。我们在一个集成系统中演示了这些方法,将新学习的模型与高效的连续空间机器人任务和运动规划器相结合,学习如何比以前更有效地解决长期问题。
translated by 谷歌翻译
最近,人们越来越关注贝叶斯优化 - 一种未知函数的优化,其假设通常由高斯过程(GP)先前表示。我们研究了一种直接使用函数argmax估计的优化策略。该策略提供了实践和理论上的优势:不需要选择权衡参数,而且,我们建立与流行的GP-UCB和GP-PI策略的紧密联系。我们的方法可以被理解为自动和自适应地在GP-UCB和GP-PI中进行勘探和利用。我们通过对遗憾的界限以及对机器人和视觉任务的广泛经验评估来说明这种自适应调整的效果,展示了该策略对一系列性能标准的稳健性。
translated by 谷歌翻译
最近,综合学习的进展提出了合成图像的训练模型,可以有效地降低人力和物质资源的成本。然而,由于与真实图像相比合成图像的不同分布,所期望的性能仍然不能实现。真实图像由多种形式的光取向组成,而合成图像由均匀的光取向组成。这些特征分别被认为是室外和室内场景的特征。解决这个问题,前一种方法学会了一种模型来改善合成图像的真实感。与以往的方法不同,本文采用净化真实图像的第一步。通过风格转移任务,将室外真实图像的分布转换为室内合成图像,从而减少光的影响。因此,本文提出了一种区域时间风格转移网络,其保留了输入图像(真实图像)的图像内容信息(例如,注视方向,瞳孔中心位置),同时推断了风格图像的风格信息(例如,图像颜色结构,语义特征)。合成图像)。此外,网络加速了模型的收敛速度,并适应多尺度图像。使用混合研究(定性和定量)方法进行实验,以证明在复杂方向上纯化真实图像的可能性。定性地,将所提出的方法与LPW数据集的一系列室内和室外场景中的可用方法进行比较。在定量计中,它通过在交叉数据集上训练凝视估计模型来评估纯化图像。结果显示,与原始实际图像相比,基线方法有显着改进。
translated by 谷歌翻译
目前用于人类活动识别(HAR)的金标准基于相机的使用。然而,相机系统的可扩展性差使得它们在追求在移动计算环境中更广泛地采用HAR的目标上是不切实际的。因此,研究人员反而依赖于可穿戴传感器,特别是惯性传感器。一种特别流行的可穿戴设备是智能手表,由于其集成的惯性和光学传感能力,在非突出的路径中实现更好的HAR具有很大的潜力。如果通常在智能手表或类似设备中找到的腕式光学传感器可以用作数据可用性识别的有用来源,本文试图通过确定来简化可穿戴方法。该方法有可能消除对惯性传感元件的需求,这又会降低智能手表和健身追踪器的成本和复杂性。这可能潜在地考虑到HAR的硬件要求,同时保留来自单个光学传感器的心率监测和活动捕获的功能。我们的方法依赖于基于适当缩放的光信号图来采用用于活动识别的机器视觉。我们采用这种方法,以便产生易于由非技术用户解释和解释的分类。更具体地,使用光电容积描记器信号时间序列的图像来重新训练最初在ImageNet数据库上训练的卷积神经网络的倒数第二层。然后,我们使用来自倒数第二层的2048维特征作为支持向量机的输入。实验结果的平均分类准确率为92.3%。该结果优于光学和惯性传感器的组合(78%)并且使用...来说明HAR系统的能力。
translated by 谷歌翻译
最近使用深度神经网络的研究已经显示出非凡的转换,特别是对于艺术和照片般逼真的图像。然而,使用全局特征相关的方法无法捕获小的,复杂的纹理并且保持艺术品的正确纹理尺度,并且基于局部补丁的方法在全局效果上是有缺陷的。在本文中,我们提出了一个新颖的特征金字塔融合神经网络,称为GLStyleNet,它通过最佳聚合VGG网络中的层来充分考虑多尺度和多级金字塔特征,并分层执行样式转移,具有多个不同的损失。我们提出的方法从损失函数约束和特征融合两个方面保留了图像的高频像素信息和低频构造信息。我们的方法不仅可以灵活地调整内容和风格之间的交易,还可以在全局和本地之间进行控制。与最先进的方法相比,我们的方法不仅可以传递大规模,明显的风格线索,还可以传递微妙,精致的方法,并且可以大大提高风格转换的质量。我们展示了我们的肖像风格转移,艺术风格转移,照片写实风格转移和中国古代绘画风格转移任务的方法的有效性。实验结果表明,我们的统一方法比以往最先进的方法提高了图像样式传递质量,同时也在一定程度上加速了整个过程。我们的代码可在https://github.com/EndyWon/GLStyleNet上获得。
translated by 谷歌翻译