由于不准确的检测和识别,自主车辆可能做出错误的决定。因此,智能车辆可以将自己的数据与其他车辆相结合,提高感知能力,从而提高检测精度和驾驶安全性。然而,多车协同感知要求现实世界场景的整合和原始传感器数据交换的流量远远超过现有车载网络的带宽。据我们所知,我们是第一个对原始数据级合作感知进行研究的人。提高自驾系统的检测能力。在这项工作中,依靠LiDAR 3D点云,我们完成了从连接车辆的不同位置和角度收集的传感器数据。提出了一种基于点云的三维物体检测方法,用于对齐点云的多样性。 KITTI和我们收集的数据集的实验结果表明,所提出的系统通过扩展感知区域优于感知,提高了检测精度并促进了增强结果。最重要的是,我们证明可以通过现有的车载网络技术传输用于协作感知的pointclouds数据。
translated by 谷歌翻译
我们介绍了DeepICP--一种新颖的端到端学习型3D点云注册框架,可以达到与先进的几何方法相当的注册精度。与通常需要RANSAC程序的其他基于关键点的方法不同,我们实现了使用各种深度神经网络结构来建立端到端的可训练网络。我们的关键点检测器通过这种端到端结构进行训练,并使系统能够避免动态对象的推断,利用静止物体上足够显着特征的帮助,从而实现高稳健性。不是在现有点之间搜索相应的点,而是关键的贡献是我们基于一组候选者之间的学习匹配概率创新地生成它们,这可以提高注册准确性。我们的损失功能结合了局部相似性和全局几何约束,以确保所有上述网络设计能够朝着正确的方向收敛。我们使用KITTI数据集和Apollo-SouthBay数据集全面验证了我们方法的有效性。结果表明,我们的方法比最先进的基于几何的方法实现了可比较的或更好的性能。包括详细的消融和可视化分析,以进一步说明我们网络的行为和见解。低注册错误以及我们方法的高稳健性使其对依赖点云注册任务的实质性应用具有吸引力。
translated by 谷歌翻译
交替时间时间逻辑(ATL / ATL *)代表了一系列模型,用于推理代理在多代理系统(MAS)中的战略能力。 ATL / ATL *对语义模型Concurrent GameStructures(CGS)的解释通常根据代理的能力而有所不同,例如,完美与不完美的信息,完美与不完美的回忆,导致广泛研究的各种变体在文学中。然而,它们是在语义层面定义的,这可能限制建模灵活性并且可能给出反直觉的解释。为了缓解这些问题,在这项工作中,我们建议扩展具有代理能力的CGS,并在此模型下研究ATL / ATL *的新语义。我们为ATL / ATL *提供PSACE / 2EXPTIME模型检查算法,并将它们作为原型工具实现。实验结果表明该方法的实际可行性。
translated by 谷歌翻译
深度监督哈希已经成为网络搜索和信息检索的一个活跃话题。它通过adeep散列网络的输出神经元生成散列位。在二进制离散化期间,散列比特中经常存在很多冗余,这使得在存储和准确性方面退化检索性能。本文将冗余问题表示为监督哈希作为图学习问题,并提出了一个新的层,名为神经元合并层(NMLayer)。 NMLayer构造一个图来模拟不同神经元之间的邻接关系。具体而言,它通过定义的活动和冻结阶段来学习关系。根据所学习的关系,NMLayer将冗余神经元合并在一起以平衡每个输出神经元的重要性。基于NMLayer,我们进一步提出了一种用于训练深度哈希网络的渐进优化策略。也就是说,逐步训练多个NMLayer以从长冗余代码中学习更紧凑的散列码。对四个数据集进行了大量实验,证明我们提出的方法优于最先进的哈希方法。
translated by 谷歌翻译
视觉是诗歌灵感的共同来源。人们从图像中感知的物体和感性印记可能会导致各种感觉,具体取决于读者。在本文中,我们从图像中提出了一个诗歌生成系统来模仿这个过程。给定一个图像,我们首先提取表示从图像中感知的对象和情感的一些关键词。然后根据它们在人类书面诗中的关联将这些关键词扩展为相关的关键词。最后,从使用现有诗歌训练的递归神经网络的关键词逐渐产生经文。我们的方法由人类评估员评估,并与其他一代基线进行比较。结果表明,我们的方法可以产生比基线方法更具艺术性的诗歌。这是从图像中产生诗歌的少数尝试之一。通过部署我们提出的方法,自2017年7月发布以来,小冰已经为用户创作了超过1200万首诗。由Cheers Publishing出版了一本诗集,声称这本书是人工智能编写的第一本诗集。人类历史。
translated by 谷歌翻译
条件生成对抗网络(GAN)中的对抗性损失未被设计为直接优化目标任务的评估度量,因此,可能不总是引导GAN中的生成器生成具有改进的度量分数的数据。为了克服这个问题,我们提出了一种新颖的MetricGAN方法,旨在针对一个或多个评估指标优化发电机。此外,基于MetricGAN,生成数据的度量分数也可以由用户任意指定。我们在语音增强任务上测试了所提出的MetricGAN,这特别适合于验证所提出的方法,因为存在多个度量来测量语音信号的不同方面。此外,这些指标通常是复杂的,并且无法通过Lp或传统的对抗性无法完全优化。
translated by 谷歌翻译
引入内在奖励来模拟人类智能如何运作,这通常通过内在动机的游戏来评估,即没有外在奖励的游戏,但是用外在奖励进行评估。然而,在这种非常具有挑战性的内在动机游戏环境下,现有的内在奖励方法都不能达到人类水平的表现。在这项工作中,我们提出了一种新颖的狂妄自大驱动的内在奖励(大奖励),据我们所知,这是第一种在内在动机游戏中实现可比较的人类表现的方法。超级奖励的出发来自于婴儿的智力在他们试图获得对环境中的实体的更多控制时的发展;因此,超级奖励旨在最大化特定环境中代理人的实体控制能力。为了形成大型奖励,提出了一种关系转换模型来弥合直接控制和潜在控制之间的差距。实验研究表明,超级奖励可以(i)大大超越最先进的内在奖励方法,(ii)通常达到与Ex-PPO和专业人类级别得分相同的表现水平; (iii)在与外在进展相结合时也具有优越的表现。
translated by 谷歌翻译
图神经网络(GNNs)受到越来越多的关注,部分归功于它们在许多节点和图形分类任务中的优越性能。然而,对于它们的学习和学习图形功能的复杂性缺乏了解。在这项工作中,我们首先提出了图形特征网络(GFN),一个简单的轻量级神经网络,在一组图形增强特征上定义。然后,我们建议将图形分类上的GNN解剖为两部分:1)图形过滤,其中执行基于图形的邻域聚合;以及2)集合函数,其中组成一组隐藏节点特征用于预测。为了分别测试这两个部分的重要性,我们通过线性化GNN的图形过滤部分来证明和利用GFN可以导出的连接。根据经验,我们对常见的图表分类基准进行了评估。令我们惊讶的是,我们发现,尽管有简化,但GFN可以匹配或超过最近提出的GNN产生的最佳精度,只需要一小部分计算成本。我们的结果为GNN学习的功能和当前评估它们的基准提供了新的视角。
translated by 谷歌翻译
机器学习和计算机科学中的许多凸问题共享相同的形式:\ begin {align *} \ min_ {x} \ sum_ {i} f_i(A_i x + b_i),\ end {align *}其中$ f_i $是凸函数on $ \ mathbb {R} ^ {n_i} $,常数为$ n_i $,$ A_i \ in \ mathbb {R} ^ {n_i \ times d} $,$ b_i \ in \ mathbb {R} ^ {n_i} $和$ \ sum_i n_i = n $。这个问题推广了线性规划,包括许多问题,经验风险最小化。在本文中,我们给出了一个运行intime \ begin {align *}的算法O ^ *((n ^ {\ omega} + n ^ {2.5 - \ alpha / 2} + n ^ {2+ 1/6}) \ log(n / \ delta))\ end {align *}其中$ \ omega $是matrixmultiplication的指数,$ \ alpha $是矩阵乘法的双指数,$ \ delta $是相对精度。请注意,运行时只对条件数或其他数据相关参数具有对数依赖性,并且这些参数在$ \ delta $中捕获。对于当前绑定的$ \ omega \ sim 2.38 $ [Vassilevska Williams'12,Le Gall'14]和$ \ alpha \ sim 0.31 $ [Le Gall,Urrutia'18],我们的运行时$ O ^ *(n ^ {\ omega} \ log(n / \ delta))$匹配当前最佳解决密集最小二乘回归问题,这是我们考虑的问题的一个特例。最近,[Alman'18]证明了目前所有已知的技术都无法提供低于$ 2.168 $的更好的$ \ omega $,这比$ 2 + 1/6 $更大。我们的结果推广了当前矩阵乘法时间[Cohen,Lee,Song'19]中线性程序的最新结果,以解决更广泛的问题。我们的算法提出了两个与[Cohen,Lee,Song'19]不同的概念:$ \ bullet $我们给出一个鲁棒的确定性中心路径方法,而前一个是随机中心路径,它通过randomsparse向量更新权重。 $ \ bullet $我们提出了一种有效的数据结构,即使权重更新向量密集,也能维持内点方法的中心路径。
translated by 谷歌翻译
早期发现肺癌是提高患者生存率的有效方法。在计算机断层扫描(CT)图像中准确检测肺结节是诊断肺癌的关键步骤。然而,由于肺结节的异质性和周围环境的复杂性,强大的结节检测一直是一项具有挑战性的任务。在这项研究中,我们提出了一种用于肺结节检测的两阶段卷积神经网络(TSCNN)架构。第一阶段的CNN架构基于改进的UNet分割网络,以建立肺结节的初始检测。同时,为了在不引入过多误报结节的情况下获得高召回率,我们提出了一种小说采样策略,并根据所提出的级联预测方法,使用离线硬挖掘思想进行训练和预测。第二阶段的CNN架构基于所提出的双池结构,其构建在三个3D CNN分类网络中用于假阳性减少。由于网络训练需要大量的训练数据,我们采用基于随机掩模的数据增强方法。此外,我们通过集成学习提高了误报减少模型的泛化能力。所提出的方法已经在LUNA数据集上进行了实验验证。实验结果表明,所提出的TSCNN架构可以获得有竞争力的检测性能。
translated by 谷歌翻译