The recent work of Clark et al. (2018) introduces the AI2 Reasoning Challenge (ARC) and the associated ARC dataset that partitions open domain, complex science questions into an Easy Set and a Challenge Set. That paper includes an analysis of 100 questions with respect to the types of knowledge and reasoning required to answer them; however, it does not include clear definitions of these types, nor does it offer information about the quality of the labels. We propose a comprehensive set of definitions of knowledge and reasoning types necessary for answering the questions in the ARC dataset. Using ten annotators and a sophisticated annotation interface, we analyze the distribution of labels across the Challenge Set and statistics related to them. Additionally , we demonstrate that although naive information retrieval methods return sentences that are irrelevant to answering the query, sufficient supporting text is often present in the (ARC) corpus. Evaluating with human-selected relevant sentences improves the performance of a neu-ral machine comprehension model by 42 points.
translated by 谷歌翻译
策略梯度方法是强大的强化学习算法,并且已被证明可以解决许多复杂的任务。然而,这些方法也是数据无效的,受到高方差梯度估计的影响,并且经常陷入局部最优。这项工作通过将最近改进的非政策数据的重用和参数空间的探索与确定性行为政策相结合来解决这些弱点。由此产生的目标适用于标准的神经网络优化策略,如随机梯度下降或随机梯度哈密顿蒙特卡罗。通过重要性抽样对以前的推出进行大量提高数据效率,而随机优化方案有助于逃避局部最优。我们评估了一系列连续控制基准测试任务的建议方法。结果表明,该算法能够使用比标准策略梯度方法更少的系统交互成功可靠地学习解决方案。
translated by 谷歌翻译
常识知识关系对于高级NLU任务至关重要。我们检查CONCEPTNET中表示的这种关系的可学习性,考虑到它们的特定属性,这可以使关系分类变得困难:给定的概念对可以通过多种关系类型链接,并且关系可以具有不同语义类型的多字参数。我们探索了一种开放世界的多标签分类方法,该方法侧重于评估个体关系的分类准确性。在深入研究CONCEPTNET资源的特定属性的基础上,我们研究了不同关系表示和模型变化的影响。我们的分析表明,论证类型的复杂性和相关模糊性是要解决的最重要的挑战。我们设计了自定义评估方法,以解决在未来工作中可以扩展的资源的不完整性。
translated by 谷歌翻译
近年来,随着个体水平数据的日益普及和机器学习算法的进步,导致了用于寻找最佳个性化治疗规则(ITR)的方法学发展的爆炸式增长。这些新工具正在应用于各种领域,包括商业,医学和政治。然而,很少有方法可以评估ITR的功效。特别是,许多现有的ITR估算器都是基于复杂的模型,并没有统计不确定性估计。我们考虑共同的现实世界环境,其中政策制定者希望在目标人群中管理之前预测给定ITR的表现。我们建议使用randomizeproperiment来评估ITR。与现有方法不同,提出的方法是基于Neyman的重复抽样方法,并不需要建模假设。因此,它适用于从广泛的统计和机器学习模型衍生的ITR的经验评估。我们进行了一项模拟研究,以证明所提方法在小样本中的准确性。我们还将我们的方法应用于项目STAR(学生 - 教师成就比率)实验,以比较基于流行的机器学习方法的ITR的性能,该方法用于预测异质治疗效果。
translated by 谷歌翻译
我们研究了在多智能体系统中形成共识的有效性,其中既有基于直接证据的信念更新,也有代理之间的信任组合。特别是,我们考虑这样一种情况,即代理人数的增加是在最好的问题上进行合作的,其目的是就一组状态中最好的(或者说是真实的)状态达成共识,每个状态都有不同的质量。价值(或证据水平)。代理人的信念通过质量函数在Dempster-Shafer理论中表示,我们为这个多智能体共识形成问题揭示了四个众所周知的信念组合算子的宏观层次特性:Dempster规则,Yager规则,Dubois&Prade的算子和平均算子。考虑了算子的收敛性质,并针对不同的证据率和噪声水平进行了模拟实验。结果表明,直接证据的更新和代理之间的信念组合的结合导致对最佳状态的更好的共识,仅凭证据更新。我们还发现,在这个框架中,操作员对噪声具有鲁棒性。从广义上讲,Dubois&Prade的运算符可以更好地收敛到最佳状态。最后,我们考虑到针对最佳n问题的Dempster-Shafer方法对大量状态的影响。
translated by 谷歌翻译
诸如彩色图像和多光谱图像之类的张量图像数据集是高度相关的,并且它们包含许多图像细节。本文的主要目的是提出并开发一种正则化张量完成模型fortensor图像数据完成。在目标函数中,我们采用新的张量核范数(TNN)来表征这种图像数据集的全局结构。此外,我们制定了一个隐式正则化器来插入卷积神经网络(CNN)降噪器,它被证实能够表达先前从大量自然图像中学习的图像。可以通过交替方向的乘法器算法有效地求解所得到的模型。实验结果(彩色图像,视频和多光谱图像)表明,图像全局结构和细节都可以很好地恢复,并说明所提出的方法在PSNR和SSIM方面的性能优于测试方法。
translated by 谷歌翻译
声学数据提供从生物学和通信到海洋和地球科学等领域的科学和工程见解。我们调查了机器学习(ML)的进步和变革潜力,包括声学领域的深度学习。 ML是用于自动检测和利用模式印度的广泛的统计技术家族。相对于传统的声学和信号处理,ML是数据驱动的。给定足够的训练数据,ML可以发现特征之间的复杂关系。通过大量的训练数据,ML candiscover模型描述复杂的声学现象,如人类语音和混响。声学中的ML正在迅速发展,具有令人瞩目的成果和未来的重大前景。我们首先介绍ML,然后在五个声学研究领域强调MLdevelopments:语音处理中的源定位,海洋声学中的源定位,生物声学,地震探测和日常场景中的环境声音。
translated by 谷歌翻译
本文介绍了一种全方位的空中操纵平台,用于对非结构化环境进行鲁棒性和响应性交互,以实现基于接触的检测。完全驱动的倾转旋翼天线系统配备了一个刚性安装的末端执行器,能够施加6度的自由力和扭矩,解耦系统的平移和旋转动力学,并在保持稳定性的同时实现与环境的精确互动。具有选择性表观惯性的阻抗控制器被配制成允许在一定自由度下的顺应性,同时在其它自由度中实现精确的轨迹跟踪和干扰抑制。实验证明了干扰抑制,推 - 滑相互作用以及具有深度伺服的板载状态估计以与局部相互作用。该系统也被验证为基于接触的混凝土基础设施无损检测的工具。
translated by 谷歌翻译
与DSLR相机相比,智能手机相机具有更小的传感器,这限制了它们的空间分辨率;较小的孔径,限制了它们的光收集能力;和更小的像素,这降低了它们的信噪比。使用滤色器阵列(CFA)需要去马赛克,这进一步降低了分辨率。在本文中,我们使用多帧超分辨率算法取代传统的去帧在单帧和连拍摄影管道中的应用,该算法直接从CFA原始图像的突发中创建完整的RGB图像。我们利用手持式摄影中典型的自然手震,获得一小段偏移的原始帧。然后对齐并合并这些帧以在每个像素位置处形成具有红色,绿色和蓝色值的单个图像。这种方法不包括显式去掩蔽步骤,用于增加图像分辨率和提高信号噪声比。我们的算法对于具有挑战性的场景条件具有鲁棒性:局部运动,遮挡或场景变化。它在大规模生产的手机上以每12百万像素RAW输入突发帧100毫秒运行。具体来说,该算法是Super-Res Zoom功能的基础,以及Night Sight模式中的默认合并方法(无论是否缩放) onGoogle的旗舰手机。
translated by 谷歌翻译
音频驱动的3D面部动画已被广泛探索,但实现逼真的,类似人类的表现仍未得到解决。这是由于缺乏可用的3D数据集,模型和标准评估指标。为了补充这一点,我们推出了一个独特的4D人脸数据集,其中大约29分钟的4D扫描以60 fps捕获,同步音频来自12个扬声器。然后,我们在我们的数据集上训练神经网络,从而影响面部运动的身份。经过学习的模型,VOCA(语音操作角色动画)将任何语音信号作为输入 - 甚至是除英语以外的语言的语音 - 并且可以实际地动画化各种各样的成人面孔。在训练期间对主题标签进行调节允许模型学习各种现实主义风格。 VOCA还提供动画控制,以在动画期间改变说话风格,依赖身份的面部形状和姿势(即头部,下颌和眼球旋转)。据我们所知,VOCA是唯一真实的3D面部动画模型,可以很容易地应用于没有重定位的看不见的主题。这使得VOCA适用于诸如游戏内视频,虚拟现实化身或任何预先不知道说话者,语音或语言的情况的任务。我们在http://voca.is.tue.mpg.de上为研究目的提供了数据集和模型。
translated by 谷歌翻译