策略强化学习(RL)算法具有高样本复杂度,而非策略算法难以调整。合并这两者有利于开发有效的算法,这些算法可以在不同的环境中进行推广。然而,在实践中找到适当的高参数来控制这种权衡是具有挑战性的。本文开发了一个名为P3O的简单算法,它将关闭策略更新与策略更新交错.P3O使用行为策略和目标策略之间的有效样本大小来控制它们彼此之间的距离,并且不会引入任何额外的超参数。 Atari-2600和MuJoCo基准测试套件的大量实验表明,这种简单的技术可以非常有效地降低最先进算法的样本复杂性。
translated by 谷歌翻译
Transformer架构在计算效率方面优于基于RNN的模型。最近,GPT和BERT使用大型scalecorpora上的预训练语言模型证明了变形金刚模型在各种NLP任务上的功效。令人惊讶的是,这些Transformer架构本身并不是语言模型本身。 Transformer中的自我关注和位置编码都无法有效地整合对语言建模至关重要的单词级顺序语言。在本文中,我们将探索用于语言模型的有效Transformer体系结构,包括添加额外的LSTM层以更好地捕获顺序上下文,同时仍保持计算效率。我们建议使用CoordinateArchitecture Search(CAS)通过迭代修改模型来找到有效的架构。 PTB,WikiText-2和WikiText-103的实验结果表明CAS在所有问题上实现了20.42和34.11之间的困惑,即与现有技术的LSTM相比平均提高了12.0的困难单位。
translated by 谷歌翻译
Deep embeddings answer one simple question: How similar are two images?Learning these embeddings is the bedrock of verification, zero-shot learning,and visual search. The most prominent approaches optimize a deep convolutionalnetwork with a suitable loss function, such as contrastive loss or tripletloss. While a rich line of work focuses solely on the loss functions, we showin this paper that selecting training examples plays an equally important role.We propose distance weighted sampling, which selects more informative andstable examples than traditional approaches. In addition, we show that a simplemargin based loss is sufficient to outperform all other loss functions. Weevaluate our approach on the Stanford Online Products, CAR196, and theCUB200-2011 datasets for image retrieval and clustering, and on the LFW datasetfor face verification. Our method achieves state-of-the-art performance on allof them.
translated by 谷歌翻译
我们提出了一种解决同时检测和分割问题的新方法。使用分层结构,我们使用一个有效且准确的过程,利用Locacy Sensitive Hashing利用层次结构特征信息。我们建立在最近的工作基础上,利用卷积神经网络来检测图像中的边界框,然后在散列后使用最适合每个边界框的顶级相似的分层区域,我们采用这种方法进行iSegmentation。然后,我们通过自动层次结构修剪来优化我们的最终分割结果。 iSegmentation为Hypercolumns引入了免费替代品。我们对PASCAL VOC2012分割数据集进行了大量实验,表明iSegmentation提供了具有竞争力的最先进的对象分割。
translated by 谷歌翻译
下一代内核方法(KMNG)引入了一个框架,在小批量设置中使用kernelapproximates,使用SGD Optimizer作为深度学习的替代方案。 McKernel是KMNG ML大规模的C ++库。它包含FastFood算法的CPU优化实现,允许在对数线性时间内计算近似内核扩展。该算法需要计算Walsh Hadamard变换(WHT)矩阵的乘积。 Acache友好的SIMD Fast Walsh Hadamard变换(FWHT)已经开发出来,其速度快,并且优于当前最先进的方法。 McKernel允许获得非线性分类组合快速食品和线性分类器。
translated by 谷歌翻译
We review machine learning methods employing positive definite kernels. Thesemethods formulate learning and estimation problems in a reproducing kernelHilbert space (RKHS) of functions defined on the data domain, expanded in termsof a kernel. Working in linear spaces of function has the benefit offacilitating the construction and analysis of learning algorithms while at thesame time allowing large classes of functions. The latter include nonlinearfunctions as well as functions defined on nonvectorial data. We cover a widerange of methods, ranging from binary classifiers to sophisticated methods forestimation with structured data.
translated by 谷歌翻译
我们探索人工神经网络作为从虚构时间格林函数重建光谱函数的工具,这是一个经典条件反问题。我们的ansatz基于有监督的学习框架,其中先验知识在训练数据中被编码,并且逆变换流形通过神经网络被明确地参数化。我们系统地研究了这种新的重建方法,提供了对其在物理动机模拟数据上的表现的详细分析,并将其与已建立的贝叶斯推理方法进行了比较。发现构造精度至少是可比较的,并且特别是在较大的噪声水平下可能是优越的。我们认为,在监督环境中使用标记的训练数据和确定优化目标的自由度是本方法的固有优势,并且可能导致对未来最先进方法的重大改进。进一步研究的潜在方向是详细讨论。
translated by 谷歌翻译
生物神经元之间基于尖峰的通信是稀疏且不可靠的。这使得大脑能够有效地处理来自眼睛的视觉信息。从生物学中汲取灵感,人工尖峰神经网络与硅视网膜相结合,试图对这些计算进行建模。机器学习中的最新发现允许推导出一系列强大的突触可塑性规则,近似于spikingnetworks的反向传播。这些规则是否能够处理真实的视觉感官数据?在本文中,我们评估事件驱动的随机背景传播(eRBP)在动态视觉传感器(DVS)提供的事件流中学习表示的性能。首先,我们展示了eRBP与DvsGesture的最新性能相匹配,并增加了一个简单的隐蔽注意机制。通过相对于运动的中心重新映射视觉接收场,与卷积相比,该注意机制提供了低计算成本的平移不变性。其次,我们在真实的机器人设置中成功整合了eRBP,其中机器人手臂抓住物体以检测视觉效果。在这种设置中,视觉信息由安装在机器人头上的DVS主动感测,执行微型眼动眼。我们的研究表明,我们的方法可以在微阵列开始后的100ms内快速对可供性进行分类,与行为研究中报告的人类表现相当。我们的研究结果表明,神经形态技术和可塑性规则的进步使得自主机器人能够以高速和低能量预算运行。
translated by 谷歌翻译
Machine learning (ML) techniques are enjoying rapidly increasing adoption. However, designing and implementing the systems that support ML models in real-world deployments remains a significant obstacle, in large part due to the radically different development and deployment profile of modern ML methods, and the range of practical concerns that come with broader adoption. We propose to foster a new systems machine learning research community at the intersection of the traditional systems and ML communities, focused on topics such as hardware systems for ML, software systems for ML, and ML optimized for metrics beyond predictive accuracy. To do this, we describe a new conference, SysML, that explicitly targets research at the intersection of systems and machine learning with a program committee split evenly between experts in systems and ML, and an explicit focus on topics at the intersection of the two.
translated by 谷歌翻译
目的:用于骨盆截骨术的现有导航系统使用具有外部基准的光学系统。我们建议使用X射线导航来估计没有基准点的髋臼周围碎片。方法:开发A2D / 3D配准管道以恢复片段姿态。该管道通过广泛的模拟研究和6个尸体测试进行了测试。在透视图像中使用截骨边界,术前计划被精炼,以更准确地匹配术中形状。结果:在模拟中,平均碎片姿势误差为1.3 {\ deg} /1.7 mm,计划碎片与术中碎片匹配,2.2 {\ deg当计划没有更新以匹配真实形状时,/ 2.1毫米,当术中估计碎片形状时,计划为1.9 {\ deg} /2.0毫米。在尸体实验中,当记录实际碎片形状,术前计划和术前计划时,平均姿势误差为2.2 {\ deg} /2.2 mm,3.8 {\ deg} /2.5 mm和3.5 {\ deg} /2.2mm计划分别。在模拟和尸体实验中,对于所有碎片形状,侧中心边缘角的平均误差小于2 {\ deg}。结论:所提出的管道能够在临床确定的长期关节生存能力范围内准确报告股骨头覆盖。意义:人类解释碎片姿势具有挑战性,通常仅限于围绕单个解剖轴的旋转。所提出的管道提供了关于所有解剖轴的术中估计的刚度姿势,与最小侵入性切口相容,并且不依赖于外部基准。
translated by 谷歌翻译