无监督维度选择是寻求降低数据维度的重要问题,同时保留最有用的特征。降维度通常用于构建低维度嵌入,它们产生难以解释的特征空间。此外,在诸如传感器设计之类的应用中,需要直接在输入域中执行缩减,而不是构造变换空间。因此,维度选择(DS)旨在解决识别最高$ k $维度的组合问题,这是有效实验设计所需的,在保持可解释性的同时减少数据,以及设计更好的感知机制。在本文中,我们基于图形信号分析开发了一种新的DS方法来测量特征影响。通过分析具有蓝色噪声谱的合成图形信号,我们表明我们可以测量每个维度的重要性。通过在监督学习和图像掩蔽中的实验,我们证明了所提出的方法优于现有技术在捕获高维空间的关键特征方面的优越性,仅使用原始特征的一小部分。
translated by 谷歌翻译
Interpretability has emerged as a crucial aspect of machine learning, aimed at providing insights into the working of complex neural networks. However , existing solutions vary vastly based on the nature of the interpretability task, with each use case requiring substantial time and effort. This paper introduces MARGIN, a simple yet general approach to address a large set of interpretability tasks ranging from identifying prototypes to explaining image predictions. MARGIN exploits ideas rooted in graph signal analysis to determine influential nodes in a graph, which are defined as those nodes that maximally describe a function defined on the graph. By carefully defining task-specific graphs and functions, we demonstrate that MARGIN outperforms existing approaches in a number of disparate interpretability challenges.
translated by 谷歌翻译
Executable semantic parsing is the task of converting natural language utterances into logical forms that can be directly used as queries to get a response. We build a transfer learning framework for executable semantic parsing. We show that the framework is effective for Question Answering (Q&A) as well as for Spoken Language Understanding (SLU). We further investigate the case where a parser on a new domain can be learned by exploiting data on other domains, either via multi-task learning between the target domain and an auxiliary domain or via pre-training on the auxiliary domain and fine-tuning on the target domain. With either flavor of transfer learning , we are able to improve performance on most domains; we experiment with public data sets such as Overnight and NLmaps as well as with commercial SLU data. The experiments carried out on data sets that are different in nature show how executable semantic parsing can unify different areas of NLP such as Q&A and SLU.
translated by 谷歌翻译
优化深度神经网络在很大程度上被认为是一种经验过程,需要手动调整几个参数,例如学习速率,重量衰减和辍学率。可以说,学习率是这些学习中最重要的,这在最近的研究中得到了更多的关注。本文提出了一种计算深度神经网络学习率的新方法。我们推导出一个动态计算学习率的理论框架,然后在标准数据集和体系结构上展示实验结果,以证明我们的方法的有效性。
translated by 谷歌翻译
我们介绍了一种方法来提供视觉分类任务的矢量表示,可以用来推断thosetasks的性质及其关系。给定具有地面实况标签和在这些标签上定义的损失函数的数据集,我们通过“探测网络”处理图像,并基于与探测网络参数相关联的Fisher信息矩阵的估计来计算嵌入。这提供了任务的固定维度嵌入,其独立于诸如类的数量之类的细节,并且不需要理解类标签语义。我们证明这种嵌入能够预测任务相似性,这些相似性与我们对不同视觉任务之间的语义和分类关系的直觉相匹配(例如,基于对不同类型的植物进行分类的任务是相似的)我们还展示了这个框架对于选择任务的主题的实际价值。用于新任务的预训练特征提取器。我们提供了一个简单的元学习框架,用于学习嵌入度量,它能够预测哪些特征提取器将表现良好。选择具有任务嵌入的特征提取器可以获得最佳可用特征提取器的性能,同时花费大大少于成本的训练和评估。所有可用的特征提取器。
translated by 谷歌翻译
本报告概述了利用大数据革命和大规模计算解决多信使天体物理学中的重大计算挑战的最新工作,特别强调实时发现活动。该文件承认了多信使天体物理学的跨学科性质,由物理学家,天文学,计算机科学,数据科学,软件和网络基础设施社区的成员编写,他们参加了NSF-,DOE-和NVIDIA资助的“多信使天体物理学的深度学习”。 :实时发现规模“研讨会,于2018年10月17日至19日在国家超级计算应用中心举办。本报告的重点包括一致同意这对于加速新型信号处理算法的开发和部署至关重要。利用人工智能(AI)和高性能计算之间的协同作用,最大限度地发挥Multi-Messenger天体物理学的潜在科学发现。我们讨论了实现这一努力的关键方面,即(i)为多信使天体物理学设计和利用可扩展和计算效率高的AI算法;(ii)数字模拟天体物理资源的网络基础设施要求,以及处理和解释多信使天体物理学数据; (iii)管理引力波探测和触发以实现电磁和天体粒子跟踪; (iv)利用未来发展的机器和深度学习以及网络基础设施资源的愿景与大数据时代的发现规模相结合; (v)需要建立一个社区,将领域专家与数据科学家一起进行平等,以最大限度地加速发现多信天体物理学的新兴领域。
translated by 谷歌翻译
2005年,DARPA将实现可行的自动驾驶汽车(AVs)标记为挑战;不久之后,这个想法变成了一个可以改变汽车行业的潮流。今天,安全问题介于现实和解决之间。如果有合适的平台,CPS社区将准备提供独特的见解。然而,测试真实车辆的安全性和性能极限是昂贵且危险的。大多数研究人员和学生都无法使用这些车辆。在本文中,我们提出了F1 / 10:anopen-source,经济实惠,高性能的1/10规模自主车辆试验台。 F1 / 10测试平台具有与全尺度解决方案类似的全套传感器,感知,规划,控制和网络软件堆栈。我们展示了由F1 / 10测试平台实现的研究的关键实例,以及该平台如何用于增强自治系统中的研究和教育,使自治更容易获得。
translated by 谷歌翻译
在过去几年中,使用配备摄像头的机器人平台进行数据采集和视觉监控应用的指数逐渐增长。地面上有许多物体(如砖块,管道等)的杂乱建筑工地是移动无人地面的挑战性环境车辆(UGV)导航。为了解决这个问题,本研究提出了一款移动UGV配备立体相机和机械臂,可以移除UGV路径上的障碍物。为了实现这一目标,立体摄像机捕获周围环境并检测障碍物。障碍物与UGV的相对位置通过RobotOperating System(ROS)发送到机器人臂模块。然后,机器人手臂拾取并移除障碍物。该方法将大大提高施工监测的自动化程度和数据采集频率。通过两个案例研究验证了所提出的系统。该结果成功地证明了障碍物的检测和消除,是开发具有各种建筑操作应用的自主UGV的一个有利因素。
translated by 谷歌翻译
用于涉及飞行或移动摄像机的户外场景的自主运动捕捉(mocap)系统依赖于i)机器人前端在他/她执行身体活动时实时跟踪和跟踪人类主体,以及ii)算法后端从保存的视频中估计全身人体姿势和形状。在本文中,我们为我们的航空mocapsystem提供了一个新颖的前端,它由多个微型飞行器(MAV)组成,只有单板相机和计算。在以前的工作中,我们提出了一种使用多个MAV对受试者进行协作检测和跟踪(CDT)的方法。但是,它并没有确保MAV的最佳视点配置能够最大限度地提高人们协同跟踪的3D位置估计中的不确定性。在本文中,我们介绍了CDT的主动方法。相比之下,仅协作地跟踪人的3D位置,MAV可以现在主动地计算最佳局部运动计划,从而产生最佳视点配置,其最小化跟踪估计中的不确定性。通过将主动跟踪的目标解耦为对应于MAV的角度配置的凸二次目标和非凸约束来解决这个问题。此人。我们使用CDT算法中的高斯观察模式假设来推导它。我们还展示了我们如何嵌入所有非凸面约束,包括动态和静态障碍的约束,作为MPC动力学中的外部控制输入。在几个具有挑战性的情况下,提供了多个真实的机器人实验和比较,涉及3个MAV(视频链接:https://youtu.be/1qWW2zWvRhA)。广泛的仿真结果证明了我们方法的可扩展性和稳健性。还提供了基于ROS的源代码。
translated by 谷歌翻译
本文的目的是估计RGB-D图像中的非显示对象实例的6D姿势和尺寸。与“实例级”6D姿势估计任务相反,我们的问题假设在训练或测试时间内没有精确的对象CAD模型可用。为了处理给定类别中的不同和看不见的对象实例,我们引入了规范化对象坐标空间(NOCS) - 一个类别中所有可能的对象实例的共享规范表示。然后训练基于Ourregion的神经网络直接推断从观察像素到该共享对象表示(NOCS)的对应性以及诸如类标签和实例掩模之类的其他对象信息。这些预测可以与深度图组合以联合估计主题6D在杂乱的场景中的多个对象的姿势和尺寸。为了统一我们的网络,我们提出了一种新的上下文感知技术,以生成大量完全注释的混合现实数据。为了进一步改进我们的模型并评估其在实际数据上的性能,我们还提供了具有大型环境和实例变体的完全注释的真实世界数据集。大量实验表明,所提出的方法能够在重新环境中进行环节估计看不见的物体实例的姿态和大小,同时还能在标准的6Dpose估算基准上实现最先进的性能。
translated by 谷歌翻译