鉴于卷积神经网络(CNN)用于图像分类和对象识别的巨大成功,已经尝试将该方法概括为一般的图形结构数据。一个主要方向是基于光谱图理论和图形信号处理。在本文中,我们通过引入图的并行流分解,从完全不同的角度研究问题。基本思想是分解一系列非交叉的一维(1D)路径的图形,之后,我们可以沿着每个路径族应用一维CNN。我们证明了我们的方法,我们称之为GraphFlow,能够将CNN架构转换为通用图。为了展示我们的方法的有效性,我们在经典的MNIST数据集,网络信息传播的合成数据集和新闻文章分类数据集上测试我们的方法。
translated by 谷歌翻译
我们在移动机器人上配备了超宽带(UWB)节点和2D LiDAR传感器,即2D激光测距仪,并将UWB信标节点放置在未知环境中的未知位置。所有UWB节点可以相互进行测距,从而形成协作传感器网络。我们建议融合在UWB节点和激光扫描信息之间测量的对等范围,即在机器人和附近物体/障碍物之间测量的范围,用于机器人的同时定位,所有UWB信标和LiDAR映射。该融合受两个事实的启发:1)LiDAR可以提高仅UWB的定位精度,因为它可以提供更精确和全面的环境环境图像; 2)另一方面,UWB测距测量可以去除在基于LiDAR的SLAM算法中累积的误差。我们的实验表明,UWB / LiDAR融合仅基于变换测量实时实现无漂移SLAM。
translated by 谷歌翻译
参与众包平台的工人可以拥有广泛的能力和兴趣。众包中的一个重要问题是任务推荐问题,其中向该工作人员推荐最能匹配特定工作人员的偏好和可靠性的任务。任务推荐方案可以分配更可能被工作人员接受的任务,更可能完全可靠地完成任务,从而为任务请求者提供更好的性能。如果没有关于工人的先前信息,他的偏好和可靠性需要随着时间的推移而学习。在本文中,我们提出了多臂强盗(MAB)框架,以了解工人对不同类别任务的偏好和可靠性。然而,与经典的MAB问题不同,工人完成任务的回报是不可观察的。因此,我们在我们的工作中包括使用黄金任务(即,其解决方案已知\ emph {先验}并且不产生任何奖励的任务)。任务推荐程序。我们的模型可以被视为MAB的一个新变体,其中随机奖励只能在使用金币的时间步骤中观察到,并且估计向工人重新执行任务的预期奖励的准确性取决于黄金任务的数量用过的。 Weshow最佳遗憾是$ O(\ sqrt {n})$,其中$ n $是推荐给工人的任务数量。我们开发了三个任务推荐策略来确定不同任务类别的黄金任务的数量,并表明它们是最优的。模拟验证了我们方法的效率。
translated by 谷歌翻译
我们基于来自可能不可靠或有偏见的多个人的意见来调查真相发现的问题。我们考虑代理商的可靠性或偏差如果属于同一社区而相关的情况,该社区定义了一组具有类似意见的代理人。代理商可以属于不同的社区,用于不同的事件,这些社区是先验未知的。我们将代理人社会网络的知识纳入我们的真相发现框架,并开发拉普拉斯变分推理方法来估计代理人的可靠性,社区和事件状态。我们还开发了一种随机变分推理方法,以将我们的模型扩展到大型社交网络。对实际数据的模拟和实验表明,当观测稀疏时,我们提出的方法比其他几种推理方法更好,包括多数投票,TruthFinder,AccuSim,信心感知真相发现方法,贝叶斯分类器组合(BCC)方法和社区BCC。方法。
translated by 谷歌翻译
本文探讨了跨不同知识图匹配实体的问题。给定一个知识图中的查询实体,我们希望在另一个知识图中找到对应的现实世界实体。我们在这个问题上形成了这个问题并提出了两个大规模的数据集,这个数据集基于DBpedia和维基数据之间的一对一的跨本体链接,主要关注数十万个模糊实体。使用基于分类的方法,我们发现基于从每个知识图中的实体的RDF2Vec图嵌入得到的表示的简单多层感知器足以实现高精度,仅具有少量训练数据。我们工作的贡献是用于检查此问题的数据集以及未来工作可以基于的强基线。
translated by 谷歌翻译
视觉位置识别(VPR)是计算机视觉和机器人应用程序中的一个重要组成部分,这要归功于它能够确定是否已访问过某个地点以及具体位置。 VPR的一个主要挑战是处理环境条件的变化,包括天气,季节和光照。大多数VPR方法试图通过忽略环境因素来改善位置识别性能,导致当环境条件发生显着变化时精度降低,例如白天与夜晚。为此,我们提出了一种端到端的条件视觉位置识别方法。具体来说,我们引入了多域特征学习方法(MDFL)来捕获给定位置的多个属性描述,然后使用特征分离模块将环境条件相关特征与非特定元素分离。此功能学习管道中唯一需要的标签是环境条件。对多季节\ textit {NORDLAND}数据集和多天气\ textit {GTAV}数据集进行了建议方法的评估。实验结果表明,我们改进了对变异环境条件的特​​征鲁棒性。
translated by 谷歌翻译
有效的时空特征表示对于基于视频的动作识别任务至关重要。着眼于区分时空特征学习,我们提出了信息融合时间转换网络(IF-TTN),用于在流行的时间段网络(TSN)框架之上进行动作识别。在网络中,信息融合模块(IFM)旨在为每个视频片段提供多个ConvNet级别的外观和动作功能,从而形成短期视频描述符。利用融合特征作为输入,时间变换网络(TTN)用于模拟遵循顺序排序的相邻片段之间的中期时间变换。由于TSN本身通过分段共识来描述长期时间结构,因此所提出的网络综合考虑了多个粒度时间特征。我们的IF-TTN在两个最流行的动作识别数据集上实现了最先进的结果:UCF101和HMDB51。经验研究表明,我们的架构对输入运动图质量具有鲁棒性。利用来自压缩视频流的运动矢量放置光流,其性能仍然可与基于流量的方法相媲美,而测试速度则快10倍。
translated by 谷歌翻译
无模型单目标跟踪(SOT)算法的最新进展极大地激发了将SOT应用于\ emph {多目标跟踪}(MOT)以提高鲁棒性以及减轻对外部检测器的依赖性。然而,SOT算法通常被设计用于将目标与其环境区分开,因此当目标在空间上与在MOT中经常观察到的类似物体混合时遇到问题。为了解决这个问题,在本文中,我们提出了一种实例感知跟踪器,用于在目标模型内部和目标模型之间集成SOT技术以实现MOTby编码感知。特别地,我们通过融合用于区分目标与背景和其他实例(跟踪目标)的信息来构建每个目标模型。为了保证所有目标模型的唯一性,我们的实例感知跟踪器会考虑来自所有目标模型的响应图,并专门分配空间位置以优化整体精度。我们做出的另一个贡献是通过卷积神经网络学习的动态模型再雾化策略。该策略有助于消除初始化噪声以及适应目标大小和外观的变化。为了显示所提出的方法的有效性,它在流行的MOT15和MOT16挑战基准上进行了评估。在两个基准测试中,与已发布的结果相比,我们的方法实现了最佳的整体性能。
translated by 谷歌翻译
深度神经网络最近通过安装在道路段上的传感器获得的时间序列数据证明了交通预测能力。然而,捕获交通数据的时空特征通常需要大量的参数来训练,增加了计算负担。在这项工作中,我们证明嵌入道路网络的拓扑信息改善了学习交通特征的过程。我们使用具有递归神经网络(RNN)的车辆道路网络的agraph来推断相邻路段之间的相互作用以及时间动力学。道路网络的拓扑结构被转换为时空图形,以形成结构RNN(SRNN)。提出的方法是验证来自西班牙桑坦德市道路网的超速数据。实验表明,基于图形的方法优于基于时空图像的最先进的方法,需要更少的参数。
translated by 谷歌翻译
时间动作定位是计算机视觉的重要任务。尽管已经提出了许多方法,但仍然是一个悬而未决的问题,即如何准确地预测行动段的时间位置。最先进的作品在视频片段上训练动作分类器,由行动提议预先确定。然而,最近的工作发现,理想模型应该超出分段级别并在时间上以细粒度进行密集预测,以确定精确的时间边界。在本文中,我们提出了一种帧分割网络(FSN),它将时间CNN置于2D空间CNN之上。空间CNN负责抽象语义空间维度,而时间CNN负责引入时间上下文信息和执行密集预测。所提出的FSN可以使用空间和时间上下文信息在帧级别上对视频剪辑进行预测。 FSN以端到端的方式进行训练,因此可以在空间和时间域中共同优化模型。我们还调整FSN以在弱监督场景(WFSN)中使用它,其中在训练时仅提供视频级标签。公共数据集的实验结果表明,FSN在帧级动作定位和时间动作定位方面均取得了优异的性能。
translated by 谷歌翻译