挖掘大型数据集以预测新数据时,统计机器学习背后原则的限制不仅对大数据迅速产生了严峻的挑战,而且对数据生成过程被偏置为低算法复杂性的传统假设构成了严峻的挑战。即使在有限数据集生成器中为简单呈现潜在的算法信息偏见时,我们也显示完全自动化,有或没有访问伪随机发生器,可计算学习算法,特别是当前机器学习方法中使用的统计性质的统计性质(包括深度学习),可以始终通过足够大的数据集来欺骗,自然地或人工。特别地,我们证明,对于每个有限的学习算法,存在足够大的数据集大小,上面不可预测的欺骗者的算法概率是算法的上限(最多只取决于学习算法的乘法常数)任何其他更大数据集的概率。换句话说,非常大的和复杂的数据集可能欺骗学习算法作为任何其他特定数据集的“简单泡沫”。这些欺骗数据集保证,任何预测都会从高算法复杂性全局最佳解决方案中发散,同时朝向低算法复杂度局部最佳解决方案。我们讨论框架和经验条件,以避免这种欺骗性现象,远离统计机器学习,以基于或激励的算法信息理论和可计算性理论的内在力量。
translated by 谷歌翻译
在这项工作中,我们介绍了一种基于双季度的单眼手眼校准的方法。由于单手术机制的非度量缩放转换,除了旋转和翻译校准之外,还必须估计缩放因子。为此,我们得出了一种二次约束的二次程序,允许组合估计所有外本校准参数。由于其紧凑的表示,使用双季度导致低运行时间。我们的问题配方进一步允许同时为相同传感器设置的不同序列估计多个缩放。基于我们的问题制定,我们派生了,快速的本地和全球最佳的解决方法。最后,评估了我们的算法,并与最先进的模拟和实际数据的方法进行了评估,例如,EUROC MAV数据集。
translated by 谷歌翻译
新的纳米级技术的出现对辐射环境中的可靠电子系统造成了重大挑战。少数种类的辐射等全电离剂量(TID)效应通常导致在这种纳米级电子设备上的永久性损坏,以及当前最先进的技术,以使用昂贵的辐射硬化装置。本文重点介绍了一种新颖且不同的方法:在消费者电子级现场可编程门阵列(FPGA)上使用机器学习算法来解决TID效果并在停止工作之前监控它们替换。这种情况有一个研究挑战,以期待电路板因TID效应而导致总失效。我们观察到γ辐射下FPGA板的内部测量,并使用了三种不同的异常检测机学习(ML)算法来检测伽马辐射环境中的传感器测量中的异常。统计结果表明伽马辐射曝光水平与板测量之间的高度显着关系。此外,我们的异常检测结果表明,具有径向基函数内核的单级支持向量机的平均召回得分为0.95。此外,在电路板停止工作之前,可以检测到所有异常。
translated by 谷歌翻译
在这项工作中,我们表明,可以在模拟中完全使用加强学习进行培训低级控制策略,然后,在Quadrotor机器人上部署它们而不使用真实数据进行微调。为了渲染零拍策略转移可行,我们应用模拟优化以缩小现实差距。我们的神经网络的策略仅使用车载数据,并完全在嵌入式无人机硬件上运行。在广泛的真实实验中,我们比较三种不同的控制结构,范围从低级脉冲宽度调制的电机命令到基于嵌套比例 - 积分衍生物控制器的高级姿态控制。我们的实验表明,利用加固学习培训的低级控制器需要比更高级别的控制策略更准确的模拟。
translated by 谷歌翻译
在自动驾驶领域内,环境感知的明显趋势趋于更多的传感器,更高的冗余和计算能力的总体增加。这主要是由范例驱动,以尽可能地掌握整个环境。然而,由于功能复杂性的持续上升,必须考虑妥协以确保感知系统的实时能力。在这项工作中,我们介绍了一种情况感知环境感知的概念,以控制资源分配在数据内处理相关区域,以及仅用于用于环境感知的功能模块的子集,如果足够的驱动任务。具体地,我们建议评估自动化车辆的上下文,以得出定义相关区域的多层注意图(MLAM)。使用此MLAM,动态配置有源功能模块的最佳状态,并强制执行仅相关数据的模块内处理。我们概述了我们概念在手头的直接实施中使用真实数据应用的可行性。在保留整体功能的同时,我们实现了59%的累计处理时间的降低。
translated by 谷歌翻译
本机MacOS应用PicArrange集成了最先进的图像排序和相似性搜索,以使用户能够更好地概述其图像。已添加许多文件和图像管理功能以使其成为一个解决完整图像管理工作流的工具。自排序地图算法的修改使得列表的图像布置能够在不丢失视觉排序的情况下实现。有效的计算和存储视觉功能以及使用许多麦斯科斯州API的使用导致流体使用的应用程序。
translated by 谷歌翻译
我们呈现NESF,一种用于单独从构成的RGB图像中生成3D语义场的方法。代替经典的3D表示,我们的方法在最近的基础上建立了隐式神经场景表示的工作,其中3D结构被点亮功能捕获。我们利用这种方法来恢复3D密度领域,我们然后在其中培训由构成的2D语义地图监督的3D语义分段模型。尽管仅在2D信号上培训,我们的方法能够从新颖的相机姿势生成3D一致的语义地图,并且可以在任意3D点查询。值得注意的是,NESF与产生密度场的任何方法兼容,并且随着密度场的质量改善,其精度可提高。我们的实证分析在复杂的实际呈现的合成场景中向竞争性2D和3D语义分割基线表现出可比的质量。我们的方法是第一个提供真正密集的3D场景分段,需要仅需要2D监督培训,并且不需要任何关于新颖场景的推论的语义输入。我们鼓励读者访问项目网站。
translated by 谷歌翻译
计算机愿景中的经典问题是推断从几个可用于以交互式速率渲染新颖视图的图像的3D场景表示。以前的工作侧重于重建预定定义的3D表示,例如,纹理网格或隐式表示,例如隐式表示。辐射字段,并且通常需要输入图像,具有精确的相机姿势和每个新颖场景的长处理时间。在这项工作中,我们提出了场景表示变换器(SRT),一种方法,该方法处理新的区域的构成或未铺设的RGB图像,Infers Infers“设置 - 潜在场景表示”,并合成新颖的视图,全部在一个前馈中经过。为了计算场景表示,我们提出了视觉变压器的概括到图像组,实现全局信息集成,从而实现3D推理。一个有效的解码器变压器通过参加场景表示来参加光场以呈现新颖的视图。通过最大限度地减少新型视图重建错误,学习是通过最终到底的。我们表明,此方法在PSNR和Synthetic DataSets上的速度方面优于最近的基线,包括为纸张创建的新数据集。此外,我们展示了使用街景图像支持现实世界户外环境的交互式可视化和语义分割。
translated by 谷歌翻译
尽管已经广泛地表明,对深度神经网络的检索特定培训是有益的,但是对于最近的邻居图像搜索质量,大多数这些模型都在地标图像的域中进行培训并测试。然而,某些应用程序使用来自各种其他域的图像,因此需要具有良好概括属性的网络 - 通用CBIR模型。据我们所知,到目前为止,没有关于一般图像检索质量的基准模型的测试协议。在分析流行的图像检索测试集后,我们决定手动策划GPR1200,易于使用和可访问的,但具有挑战性的基准数据集,具有广泛的图像类别。随后使用该基准测试在其泛化质量上评估不同架构的各种预磨料模型。我们表明,大规模预借鉴显着提高了检索性能,并通过适当的微调进一步提高这些属性的实验。通过这些有希望的结果,我们希望增加对通用CBIR的研究课题的兴趣。
translated by 谷歌翻译
以对象为中心的表示是通过提供柔性抽象可以在可以建立的灵活性抽象来实现更系统的推广的有希望的途径。最近的简单2D和3D数据集的工作表明,具有对象的归纳偏差的模型可以学习段,并代表单独的数据的统计结构中的有意义对象,而无需任何监督。然而,尽管使用越来越复杂的感应偏差(例如,用于场景的尺寸或3D几何形状),但这种完全无监督的方法仍然无法扩展到不同的现实数据。在本文中,我们采取了弱监督的方法,并专注于如何使用光流的形式的视频数据的时间动态,2)调节在简单的对象位置上的模型可以用于启用分段和跟踪对象在明显更现实的合成数据中。我们介绍了一个顺序扩展,以便引入我们训练的推出,我们训练用于预测现实看的合成场景的光流,并显示调节该模型的初始状态在一小组提示,例如第一帧中的物体的质量中心,是足以显着改善实例分割。这些福利超出了新型对象,新颖背景和更长的视频序列的培训分配。我们还发现,在推论期间可以使用这种初始状态调节作为对特定物体或物体部分的型号查询模型,这可能会为一系列弱监管方法铺平,并允许更有效的互动训练有素的型号。
translated by 谷歌翻译