如今,配备相机的无人机被用于探索大型场景并重建详细的3D地图。当场景中的自由空间近似已知时,离线计划员可以生成最佳计划以有效地探索场景。然而,为了探索未知的场景,规划者必须预测并最大限度地提高动态去向的有用性。传统上,这已经使用手工制作的实用功能实现。我们建议学习一种更好的函数来预测未来观点的有用性。我们的学习能力函数基于3D卷积神经网络。该网络作为输入提供新颖的体积场景表示,其隐式地捕获先前访问的视点并且推广到新场景。我们使用模拟深度相机评估我们在几个大型城市场景3D模型上的方法。我们表明,我们的方法在重建性能方面优于现有的效用测量,并且对传感器噪声具有鲁棒性。
translated by 谷歌翻译
Autonomous navigation for large Unmanned Aerial Vehicles (UAVs) is fairlystraight-forward, as expensive sensors and monitoring devices can be employed.In contrast, obstacle avoidance remains a challenging task for Micro AerialVehicles (MAVs) which operate at low altitude in cluttered environments. Unlikelarge vehicles, MAVs can only carry very light sensors, such as cameras, makingautonomous navigation through obstacles much more challenging. In this paper,we describe a system that navigates a small quadrotor helicopter autonomouslyat low altitude through natural forest environments. Using only a single cheapcamera to perceive the environment, we are able to maintain a constant velocityof up to 1.5m/s. Given a small set of human pilot demonstrations, we use recentstate-of-the-art imitation learning techniques to train a controller that canavoid trees by adapting the MAVs heading. We demonstrate the performance of oursystem in a more controlled environment indoors, and in real natural forestenvironments outdoors.
translated by 谷歌翻译
我们提出了一种新的阶段性学习范式,用于训练生成对抗性网络(GAN)。我们工作的目标是在不改变网络架构的情况下逐步加强鉴别器,从而加强发生器,每个后续阶段。我们称这种方法为RankGAN。我们首先为GAN鉴别器提出基于保证金的损失。 Wethen将其扩展到基于保证金的排名损失,以训练RankGAN的多个阶段。我们专注于CelebA数据集中的脸部图像,以及其他GAN方法(包括WGAN和LSGAN)的面部生成和完成任务的表观和定量改进。
translated by 谷歌翻译
事实证明,神经网络是现代人工智能应用的极其强大的工具,但计算和存储复杂性仍然是限制因素。本文介绍了两种兼容的贡献方式,减少了与多层感知器相关的时间,能量,计算和存储复杂性。无论实现平台如何,都提出了预定义的稀疏性以降低训练和推理期间的复杂性。我们的结果表明,存储和计算复杂度可以通过大于5倍的因子减少,而不会出现明显的性能损失。第二个贡献是硬件加速的体系结构,它与预定义的稀疏性兼容。这种架构支持训练和推理模式,并且在某种意义上是灵活的,它不依赖于特定数量的神经元。例如,这种灵活性表明各种尺寸的现场可编程门阵列(FPGA)可以支持各种尺寸的神经网络。
translated by 谷歌翻译
对个人和实体(UEBA)的行为的分析是人工智能的一个领域,其通过附加到基于签名的操作来检测由于观察到的事件的异常性质而导致的恶意行为(例如,攻击,欺诈,影响,中毒)。 UEBA过程通常涉及两个阶段,学习和推理。入侵检测系统(IDS)仍然存在偏差,包括问题的过度简化,AI潜力的不充分开发,对事件暂时性的充分考虑以及行为记忆周期的完善管理。此外,虽然基于签名的IDS生成的警报可以参考检测所基于的签名,但UEBA域中的IDS产生结果,通常与分数相关联,其可解释的特征不太明显。我们的监督方法是通过增加第三阶段相关事件(不一致,弱信号)来加强这一过程,这些事件被认为是完全相关的,具有减少误报和否定的好处。我们还寻求避免连续学习中固有的所谓“煮青蛙”偏见。我们的第一个结果很有趣,并且在合成和实际数据上都有可解释的特征。
translated by 谷歌翻译
深度学习导致了人工智能领域的巨大进步。然而,需要注意的是,需要大量的计算来完成这些深度学习模型。在具有现代GPU的单机上训练像ImageNet这样的基准数据集可能需要长达一周的时间,在多台机器上分发训练已经被观察到大大减少了这个时间。最近的工作已经将ImageNet训练时间降低到低至4分钟的时间使用一组2048个GPU。本文调查了用于分发培训的各种算法和技术,并介绍了现代分布式培训框架的当前状态。更具体地说,我们探索了分布式随机梯度下降的同步和异步变体,各种All Reduce梯度聚集策略和最佳实践,以便在群集中获得更高的整体和更低的延迟,例如混合精确训练,大批量训练和梯度压缩。
translated by 谷歌翻译
在子集选择中,我们搜索涉及变量的小子集的最佳线性预测器。从计算复杂性的角度来看,子集选择是NP难的,并且已知很少的类在多项式时间内是可解的。主要使用离散几何中的工具,我们表明原始数据矩阵上的一些稀疏性条件允许我们在多项式时间内解决问题。
translated by 谷歌翻译
公平性是一个越来越重要的问题,因为机器学习模型用于支持高风险应用中的决策制定,例如抵押贷款,雇用和监狱判刑。本文介绍了一个新的开源Python工具包,用于算法公平,AI Fairness 360(AIF360),在Apache v2.0许可证(https://github.com/ibm/aif360)下发布。该工具包的主要目的是帮助促进公平研究算法的转换,以便在工业环境中使用,并为公平研究人员提供共享框架,以共享和评估算法。该软件包包括一组全面的数据集和模型公平性度量标准,这些度量标准的解释以及减少偏见量和模型的算法。它还包括一个交互式Web体验(https://aif360.mybluemix.net),它简要介绍了业务线用户的概念和功能,以及广泛的文档,使用指南和行业特定的教程。数据科学家和从业者将最适合他们的问题的工具融入他们的工作产品中。该软件包的体系结构经过精心设计,符合数据科学中使用的标准范例,从而进一步提高了从业者的可用性。这种架构设计和架构使研究人员和开发人员能够利用他们的新算法和改进扩展工具包,并将其用于性能基准测试。 Abuilt-in测试基础设施可保持代码质量。
translated by 谷歌翻译
深度学习已经成为一个强大而有效的框架,可以应用于过去使用传统机器学习技术难以解决的广泛复杂学习问题。在最短的几年里,深度学习已经从根本上取得了进步,它可以在许多任务中超越人类的表现。因此,在最近的大多数日常应用中都广泛使用了深度学习。然而,深度学习系统的安全性是易受攻击的对抗性示例,这可能是人眼难以察觉的,但可能导致模型对输出进行错误分类。最近,基于威胁模型的不同类型的攻击者利用这些漏洞来破坏攻击者具有高度激励的深度学习系统。因此,为这些攻击者提供深度学习算法的鲁棒性非常重要。但是,只有少数强有力的措施可以用于所有类型的攻击场景来设计一个强大的深度学习系统。在本文中,我们试图用各种威胁模型详细讨论不同类型的对抗性攻击,并详细阐述最近对策的效率和挑战。
translated by 谷歌翻译
在本文中,我们探讨了使用ReLU激活函数训练神经网络的复杂性的一些基本问题。我们证明它是NP-hard totrain一个双隐藏层前馈ReLU神经网络。如果数据的维数d是固定的,那么我们表明存在针对相同训练问题的多项式时间算法。我们还表明,如果在ReLU神经网络的第一个隐藏层中提供了足够的参数化,则存在一个多项式时间算法,该算法找到权重,使得过度参数化的ReLU神经网络的输出与给定数据的输出匹配。
translated by 谷歌翻译