Autonomous navigation for large Unmanned Aerial Vehicles (UAVs) is fairlystraight-forward, as expensive sensors and monitoring devices can be employed.In contrast, obstacle avoidance remains a challenging task for Micro AerialVehicles (MAVs) which operate at low altitude in cluttered environments. Unlikelarge vehicles, MAVs can only carry very light sensors, such as cameras, makingautonomous navigation through obstacles much more challenging. In this paper,we describe a system that navigates a small quadrotor helicopter autonomouslyat low altitude through natural forest environments. Using only a single cheapcamera to perceive the environment, we are able to maintain a constant velocityof up to 1.5m/s. Given a small set of human pilot demonstrations, we use recentstate-of-the-art imitation learning techniques to train a controller that canavoid trees by adapting the MAVs heading. We demonstrate the performance of oursystem in a more controlled environment indoors, and in real natural forestenvironments outdoors.
translated by 谷歌翻译
自动驾驶所需的大量传感器对汽车总线系统的容量提出了巨大的挑战。需要理解比特率和感知性能之间的权衡。在本文中,我们将图像压缩标准JPEG,JPEG2000和WebP与基于生成对抗网络(GAN)的modernencoder / decoder图像压缩方法进行比较。我们使用诸如峰值信噪比(PSNR),结构相似性(SSIM)等的典型度量来评估纯压缩性能,还评估后续感知函数的性能,即语义分段(以对联合的平均交叉特征为特征) mIoU)措施)。毫不奇怪,对于所有调查的压缩方法,更高的比特率意味着在所有被调查的质量度量中更好的结果。然而,有趣的是,我们表明GAN自动编码器在高度相关的低比特率区域(at0.0625位/像素)的语义分段moU比JPEG2000更好3.9%的绝对值,尽管就PSNR来说,latterstill要好得多( 5.91 dB差异)。通过利用来自解码器的图像训练语义分割模型可以极大地扩大该效果,使得使用由GAN重建训练的分割模型的mIoU超过使用原始图像训练的模型几乎20%的绝对值。我们得出结论,未来自动驾驶中的分布式感知很可能不会通过使用JPEG2000等标准压缩方案来解决汽车总线容量瓶颈,但需要现代编码方法,GAN编码器/解码器方法是一种很有前景的候选方案。
translated by 谷歌翻译
Deep Reinforcement Learning已被证明在复杂游戏中非常成功,例如Atari或Go。这些游戏有明确的规则,因此允许模拟。然而,在许多实际应用中,与环境的相互作用是昂贵的并且不能获得良好的环境模拟器。此外,由于环境因应用而不同,增强剂的最佳诱导偏差(结构,超参数等)取决于应用。在这项工作中,我们提出了一种多臂强盗框架,从一组不同的强化学习代理中选择具有最佳归纳偏差的强化学习代理。为了缓解稀疏人员的问题,强化学习代理增加了代理人。这有助于强盗框架尽早选择最佳代理,因为这些奖励比环境奖励更顺畅,更少稀疏。 Thebandit具有双重目标,即在代理人学习并在有限数量的学习步骤之后选择最佳代理时最大化奖励。我们在标准环境中的实验结果表明,所提出的框架能够在完成一系列步骤之后始终选择最佳代理,与选择次优架构或在不同代理之间统一交替相比,收集更多累积奖励。
translated by 谷歌翻译
已知贝叶斯优化难以扩展到高维度,因为获取步骤需要在相同的搜索空间中解决非凸优化问题。为了扩展方法并保持其优点,我们提出了一种算法(LineBO),该算法将问题限制为一系列选择性的一维子问题。我们表明,当函数是强凸的时,我们的算法会全局收敛并获得快速的本地速率。此外,如果目标具有不变的子空间,则我们的方法在不改变算法的情况下自动适应有效维度。我们的方法可以很好地扩展到高维度并且使用全局高斯过程模型。当结合SafeOpt算法来解决子问题时,我们得到了第一个安全的贝叶斯优化算法,其理论保证适用于高维设置。我们在多个综合基准测试中评估我们的方法,我们获得了竞争性能。此外,我们部署我们的算法,以最多40个参数优化瑞士自由电子激光的光束强度,同时满足安全操作约束。
translated by 谷歌翻译
利用高斯和Rademacher复杂度导出均匀边界的方法扩展到样本平均值被非线性替换的情况。获得U统计量的平滑边界,平滑L-统计量和l2正则化算法的误差函数。
translated by 谷歌翻译
缺乏大型专家注释的MR数据集使得培训深度学习模型变得困难。因此,开发了一种跨模态(MR-CT)深度学习分割方法,该方法使用通过变换专家分割的CT图像产生的伪MR图像来增强训练数据。对来自28例非小细胞肺癌患者的81TeT2加权MRI进行了分析。交叉模态先前编码CT转换为类似T2w MRI的伪MR图像被学习为生成性对抗性深度学习模型。该模型增强了来自6个专家分割的T2wMR患者扫描的训练数据,其具有来自癌症成像档案库的非小细胞肺癌CT患者的377个伪MRI。对具有批次标准化的二维未实施进行训练以从T2wMRI分割肿瘤。该方法基于(a)标准数据增强和双模式交叉模态伪基于MR的增强和(b)双分段网络的基准。使用Dice相似系数(DSC),Hausdroff距离度量和体积比来计算分割精度。所提出的方法产生了伪和T2w MR图像之间的强度分布中的最低统计变异性,其测量为Kullback-Leiblerdivergence为0.069。该方法产生最高的分割精度,DSC为0.75,测试数据集的Hausdroff距离最小。该方法作为专家产生了高度相似的肿瘤生长估计(P = 0.37)。开发了一种新颖的深度学习MR分割,通过利用学习的跨模态先验来增强训练,克服了小数据集中学习鲁棒模型的局限性。结果表明该方法的可行性和相对于现有技术方法的相应改进。
translated by 谷歌翻译
本研究调查了一名物理机器人在语言学习练习中扮演教师或运动伙伴的角色。为了对此进行研究,开发了一个应用程序,可以在三种不同的条件下进行2:n语言学习词汇练习。在第一个条件下,学习者将从无实体的声音接收辅导,在第二个条件下,导师将在计算机屏幕上由动画化身体现,并且在最终条件下,导师是具有3D动画面罩的物理机器人头部。进行了15个科目的俄语词汇练习。在练习之前,没有受试者报告任何俄语语言技能。在练习阶段,每个受试者被教导一组9个单词中的三个单词,然后被要求在测试阶段回忆单词。结果表明,用物理机器人实现的单词的回忆率显着高于屏幕上用虚拟形象或用无实体声音练习的单词。
translated by 谷歌翻译
合成图像生成和操纵的快速进展现在已经到了这一点,它引起了人们对社会影响的重大关注。充其量,这会导致对数字内容失去信任,但它甚至可能通过散布虚假信息和创造虚假新闻而造成进一步的伤害。在本文中,我们研究了最先进的图像操作的真实性,以及检测它们的难度 - 无论是自动还是人类。特别是,我们专注于DeepFakes,Face2Face和FaceSwap作为面部操作的主要代表。我们分别为每种方法创建了超过一半的操作图像。由此产生的公共数据集至少比可比较的替代方案大一个数量级,它使我们能够以受监督的方式训练数据驱动的伪造检测器。我们表明,即使在强压缩的情况下,使用额外的特定领域知识也可以将伪造检测提高到前所未有的精度。通过一系列的实验,我们量化了经典方法,新型深度学习方法和人类观察者表现之间的差异。
translated by 谷歌翻译
基于高斯过程模型的贝叶斯优化(BO)是优化评估成本昂贵的黑盒函数的有力范例。虽然几个BO算法可证明地收敛到未知函数的全局最优,但他们认为内核的超参数是已知的。在实践中情况并非如此,并且错误指定经常导致这些算法收敛到较差的局部最优。在本文中,我们提出了第一个BO算法,它可以证明是无后悔的,并且在不参考超参数的情况下收敛到最优。我们慢慢地调整了固定核的超参数,从而扩展了相关的函数类超时,使BO算法考虑了更复杂的函数候选。基于理论上的见解,我们提出了几种实用的算法,通过在线超参数估计来实现BO的经验数据效率,但是保留理论收敛保证。我们评估了几个基准问题的方法。
translated by 谷歌翻译
越来越多的在线用户数据激发了对自动化处理技术的需求。在用户评级的情况下,一个有趣的选择是使用神经网络来学习预测给定项目和用户的评级。在对预测进行训练时,这种方法同时学习将用户与一个向量,即所谓的用户进行交互。嵌入。这种嵌入例如对于估计用户相似性是有价值的。然而,有多种方式可以将项目和用户信息组合在神经网络中,并且不清楚组合方式如何影响所得到的嵌入。在本文中,我们进行了一个关于电影评级数据的实验,我们分析了几种融合策略在神经网络中引起的嵌入质量的影响。为了评估嵌入质量,我们提出了一种新的测量,Pair-DistanceCorrelation,它量化了类似用户的条件。应该有类似的嵌入向量。我们发现融合策略影响预测性能和嵌入质量的结果。令人惊讶的是,我们发现预测性能不一定反映嵌入质量。这表明如果嵌入是有意义的,那么应该重新考虑基于其预测能力选择模型的共同趋势。
translated by 谷歌翻译