许多现实世界的任务表现出丰富的结构,在州空间的不同部分或时间上重复。在这项工作中,我们研究了利用这种重复结构加速和规范学习的可能性。我们从KL正规化的预期奖励目标开始,该目标引入了一个额外的组件,即默认策略。我们不是依赖于固定的默认策略,而是从数据中学习它。但至关重要的是,我们限制默认策略接收的信息量,迫使其学习可重用行为,以帮助策略更快地学习。我们正式化了这一策略,并讨论了与信息瓶颈方法和变分EM算法的联系。我们在离散和连续作用域中提供实证结果,并证明,对于某些任务,在策略旁边学习默认策略可以显着加快和改善学习。
translated by 谷歌翻译
我们专注于学习单个电机模块的问题,该模块可以灵活地表达一系列行为,以控制高维物理模拟人形机器人。为此,我们提出了一种具有潜在变量瓶颈的逆模型的一般结构的电机架构。通过Weshow可以完全离线训练这个模型,以完成数千个专家政策并学习电机原始嵌入空间。训练的神经概率运动原始系统可以执行全身人形行为的一次性模仿,强有力地模仿未经观察的行为。此外,我们证明了直接控制控制器重用学习的电机原始空间来解决任务,并且产生的运动相对自然。为了支持我们的模型训练,我们比较了两种离线策略克隆方法,包括一种经验有效的方法,我们称之为线性反馈策略克隆。我们鼓励读者查看总结我们结果的补充视频(https://youtu.be/1NAHsrrH2t0)。
translated by 谷歌翻译
我们考虑跟踪在分布式设置中超时演变的过程状态的问题,其中多个观察者各自观察状态的部分,这是具有广泛应用的基本信息处理问题。我们提出了一种云辅助方案,其中跟踪是在云上进行的。特别是,为了提供及时和准确的更新,并缓解云计算的落后问题,我们提出了编码分布式计算方法,其中编码观察分布在多个工作者上。所提出的方案基于卡尔曼滤波器的编码版本,该滤波器对利用纠删码编码的数据进行操作,使得可以通过由工作人员的子集计算的部分更新来估计状态。我们将所提出的方案应用于跟踪多个车辆的问题,并且表明它实现了与相应的未编码方案相比更高的精度,并且当更新间隔足够大时接近理想中心化方案的准确性。最后,我们要在信息时代和估计准确性之间进行权衡。
translated by 谷歌翻译
重要性加权变分推理(Burda et al。,2015)使用multiplei.i.d。样本具有更严格的变分下界。我们认为联合提案有可能减少冗余样本的数量,并引入层次结构来诱导相关性。希望是提案将协调以弥补彼此之间的错误,以减少重要性估计的方差。从理论上讲,我们分析了估计方差的收敛可以与下界的收敛相关联的条件。根据经验,我们确认下界的最大化确实隐含地使方差最小化。进一步分析表明,这是由提出的分层抽样方案引起的负相关的结果,并且当样本数量增加时推理的性能也得到改善。
translated by 谷歌翻译
可穿戴式摄像机捕捉摄影师佩戴者日常活动的第一人称视角,提供用户行为的视觉日记。检测相机用户与社交互动分析相互作用的人的外观是非常感兴趣的。一般来说,社交活动,生活方式和健康是高度相关的,但缺乏监测和分析它们的工具。我们认为自我中心视觉提供了获取信息和理解用户社交互动的工具。我们提出了一个模型,可以让我们评估和可视化通过分析以自我为中心的照片流中的社交互动外观而获得的社会特征。给定一组以中心为中心的图像,我们在摄影机佩戴者的日子里检测出面部的外观,并依靠聚类算法对其特征描述符进行分组以重新识别人物。在照片流中检测到的面部的重现使我们能够塑造用户行为的社会模式的概念。我们验证了我们的模型在几周内由不同的相机佩戴者记录。我们的研究结果表明,社会概况对社会行为解释有潜在的用处。
translated by 谷歌翻译
在翻译短语(单词或单词组)时,人类译者有意或无意地采用不同的翻译过程,除了成语翻译,如成语等效,泛化,特殊化,语义调制等。译者和语言学家(如维纳和达贝尔内特) ,纽马克等人提出了几种类型来描述不同的翻译过程。然而,就我们所知,没有努力自动对这些细粒度的翻译过程进行分类。最近,TED会谈的英法平行语料库已经手动注释了翻译过程类别以及已建立的注释指南。基于这些注释示例,我们提出了在子系统级别上对翻译过程的自动分类。实验结果表明,我们可以将非字面翻译与字面翻译区分开来,准确度分别为87.09%和55.20%,用于五种非字面翻译过程的分类。这项工作表明可以自动对翻译过程进行分类。即使有少量注释示例,我们的实验也会显示我们在未来工作中可以遵循的方向。我们的长期目标之一是利用这种自动分类来更好地控制双语平行语料库中的词汇提取。
translated by 谷歌翻译
This short paper introduces an abstraction called Think Again Networks (ThinkNet) which can be applied to any state-dependent function (such as a recurrent neural network).
translated by 谷歌翻译
在本文中,我们提出使用称为确定性网格自适应直接搜索(MADS)算法和正交指向(Ortho-MADS)的黑盒优化方法来选择具有高斯核的支持向量机的超参数。与文献中利用数据属性或尝试最小化验证数据集在(C,伽马)的第一象限上的准确性的文献中的大多数方法不同,Ortho-MADS提供了收敛证明。我们提出了MADS,其次是theortho-MADS,由MADS网格大小和两种不同的搜索策略(Nelder-Mead和可变邻域搜索)定义的动态停止标准,它们有助于提高竞争收敛速度以及避免不希望的本地机制。极小。我们已经研究了具有高斯核的支持向量机的超参数的实际选择,即在几个基准数据集上正确地选择超参数伽马(带宽)和C(权衡)。实验结果表明,当使用通用配置时,所提出的超参数调整方法始终找到可比较或更好的解决方案,而不是其他方法。我们还使用Nelder-Mead搜索策略和使用网格尺寸作为停止标准的可变邻域搜索策略评估了Ortho-MADS的准确度和数量,并且我们已经达到了准确性,即没有其他方法可以达到超参数优化。
translated by 谷歌翻译
在过去两年中,超过30篇论文提出使用卷积神经网络(CNN)进行AD分类。但是,各研究的分类表现难以比较。此外,这些研究几乎不可复制,因为它们的框架不能公开获取。最后,由于不充分或不明确的验证程序,这些论文中的一些可能报告有偏差的性能,并且还不清楚如何选择模式结构和参数。在目前的工作中,我们的目标是通过三个主要贡献来增加这些局限性。首先,我们对使用CNN进行AD分类fromanatomical MRI的研究进行了系统性文献综述。我们确定了四种主要类型的方法:2D切片级,3Dpatch级,ROI级和3D主题级CNN。此外,我们发现,超过一半的被调查论文可能遭受数据泄漏,因此报告了偏见的表现。我们的第二个贡献是用于AD分类的开源框架。第三,我们使用这个框架,比较了不同的CNN架构,它们代表了现有的文献,并研究了关键部件对分类性能的影响。在验证集上,与其他方法相比,基于ROI的(海马)CNN实现了最高的平衡准确度(AD对CN为0.86,sMCI vspMCI为0.80)。使用自动编码器预训练进行的传递学习并没有提高平均准确度,但却降低了方差。使用纵向数据进行训练导致相似或更高的性能,这取决于方法,与仅使用基线数据的训练相比。复杂的图像预处理没有改善结果。最后,CNN执行类似于任务AD与CN的标准SVM,但优于SVM fortask sMCI vs pMCI,证明了深度学习对于具有挑战性的诊断任务的潜力。
translated by 谷歌翻译
区块链在其生命周期中会记录大量数据,这些数据在完全使用时会保留在整个数据库中。在机器人环境中,旧信息对于人类评估或者与区块链接口的神谕有用,但是对于仅需要当前信息以继续其工作的机器人来说它是无用的。这导致存储容量有限的区块链节点中的存储问题,例如在通常围绕嵌入式解决方案构建的机器人附着的节点的情况下。本文为具有有限存储容量的设备提供了一种时间分段解决方案,该解决方案集成在一个名为机器人链接的特定机器人定向区块链中。给出了关于所提出的解决方案的结果,该解决方案表明在不损害在这些容器中使用区块链所产生的所有益处的情况下达到了限制每个节点容量的目标,相反,它允许廉价节点使用该区块链,降低存储成本和允许更快地部署新节点。
translated by 谷歌翻译