鉴于卷积神经网络(CNN)用于图像分类和对象识别的巨大成功,已经尝试将该方法概括为一般的图形结构数据。一个主要方向是基于光谱图理论和图形信号处理。在本文中,我们通过引入图的并行流分解,从完全不同的角度研究问题。基本思想是分解一系列非交叉的一维(1D)路径的图形,之后,我们可以沿着每个路径族应用一维CNN。我们证明了我们的方法,我们称之为GraphFlow,能够将CNN架构转换为通用图。为了展示我们的方法的有效性,我们在经典的MNIST数据集,网络信息传播的合成数据集和新闻文章分类数据集上测试我们的方法。
translated by 谷歌翻译
我们在移动机器人上配备了超宽带(UWB)节点和2D LiDAR传感器,即2D激光测距仪,并将UWB信标节点放置在未知环境中的未知位置。所有UWB节点可以相互进行测距,从而形成协作传感器网络。我们建议融合在UWB节点和激光扫描信息之间测量的对等范围,即在机器人和附近物体/障碍物之间测量的范围,用于机器人的同时定位,所有UWB信标和LiDAR映射。该融合受两个事实的启发:1)LiDAR可以提高仅UWB的定位精度,因为它可以提供更精确和全面的环境环境图像; 2)另一方面,UWB测距测量可以去除在基于LiDAR的SLAM算法中累积的误差。我们的实验表明,UWB / LiDAR融合仅基于变换测量实时实现无漂移SLAM。
translated by 谷歌翻译
参与众包平台的工人可以拥有广泛的能力和兴趣。众包中的一个重要问题是任务推荐问题,其中向该工作人员推荐最能匹配特定工作人员的偏好和可靠性的任务。任务推荐方案可以分配更可能被工作人员接受的任务,更可能完全可靠地完成任务,从而为任务请求者提供更好的性能。如果没有关于工人的先前信息,他的偏好和可靠性需要随着时间的推移而学习。在本文中,我们提出了多臂强盗(MAB)框架,以了解工人对不同类别任务的偏好和可靠性。然而,与经典的MAB问题不同,工人完成任务的回报是不可观察的。因此,我们在我们的工作中包括使用黄金任务(即,其解决方案已知\ emph {先验}并且不产生任何奖励的任务)。任务推荐程序。我们的模型可以被视为MAB的一个新变体,其中随机奖励只能在使用金币的时间步骤中观察到,并且估计向工人重新执行任务的预期奖励的准确性取决于黄金任务的数量用过的。 Weshow最佳遗憾是$ O(\ sqrt {n})$,其中$ n $是推荐给工人的任务数量。我们开发了三个任务推荐策略来确定不同任务类别的黄金任务的数量,并表明它们是最优的。模拟验证了我们方法的效率。
translated by 谷歌翻译
我们基于来自可能不可靠或有偏见的多个人的意见来调查真相发现的问题。我们考虑代理商的可靠性或偏差如果属于同一社区而相关的情况,该社区定义了一组具有类似意见的代理人。代理商可以属于不同的社区,用于不同的事件,这些社区是先验未知的。我们将代理人社会网络的知识纳入我们的真相发现框架,并开发拉普拉斯变分推理方法来估计代理人的可靠性,社区和事件状态。我们还开发了一种随机变分推理方法,以将我们的模型扩展到大型社交网络。对实际数据的模拟和实验表明,当观测稀疏时,我们提出的方法比其他几种推理方法更好,包括多数投票,TruthFinder,AccuSim,信心感知真相发现方法,贝叶斯分类器组合(BCC)方法和社区BCC。方法。
translated by 谷歌翻译
Image feature extraction and matching is a fundamental but computation intensive task in machine vision. This paper proposes a novel FPGA-based embedded system to accelerate feature extraction and matching. It implements SURF feature point detection and BRIEF feature descriptor construction and matching. For binocular stereo vision, feature matching includes both tracking matching and stereo matching, which simultaneously provide feature point correspondences and parallax information. Our system is evaluated on a ZYNQ XC7Z045 FPGA. The result demonstrates that it can process binocular video data at a high frame rate (640 × 480 @ 162fps). Moreover, an extensive test proves our system has robustness for image compression, blurring and illumination.
translated by 谷歌翻译
视觉世界中的大多数物体都被部分遮挡,但人类可以毫无困难地识别它们。然而,仍然不知道卷积神经网络(CNN)等对象识别模型是否可以处理现实世界的遮挡。还有一个问题是,使这些模型对恒定掩模遮挡具有鲁棒性的努力是否对于真实世界的阻塞是有效的。我们测试了人类和上述计算模型在极端遮挡下对象识别的挑战性任务,其中目标对象被真实背景中的无关真实对象严重遮挡。我们的结果表明人类视觉对于极端遮挡是非常强大的,而CNN不是,即使经过修改以处理恒定的遮罩遮挡。这表明处理恒定掩模遮挡的能力并不意味着对现实世界遮挡的鲁棒性。作为比较,我们提出了另一种计算模型,该模型利用组合方式中的对象部分/子部分来构建对遮挡的鲁棒性。这在我们的任务上与基于CNN的模型相比具有与人类类似的错误模式。这些结果表明,极端遮挡下的测试可以更好地揭示视觉识别的稳健性,并且组成原则可以鼓励这种稳健性。
translated by 谷歌翻译
我们介绍了场景素描零射击学习(SSZSL)的一个新问题,这是一项具有挑战性的任务,因为(i)与照片不同,常见语义域(例如,词向量)和草图之间的差距太大,无法利用常见的语义知识作为知识转移的桥梁,以及(ii)与单一对象草图相比,需要更具表现力的特征表示,以适应其高水平的抽象和复杂性。为了克服这些挑战,我们提出了一种深嵌入模型forscene sketch zero-shot learning。特别地,我们提出增强语义向量通过融合多模态语义知识(例如,卡通图像,自然图像,文本描述)和采用基于注意的网络进行场景素描特征学习来进行域对齐。此外,我们提出了一种新的距离度量来改善测试期间的相似性度量。大量的实验和消融研究证明了我们的特定设计的好处。
translated by 谷歌翻译
理解物体之间的物理关系,尤其是它们的支撑关系,对机器人操纵至关重要。关于RGB-D图像中简单配置的支持关系和结构稳定性的研究已经有所进展。在本文中,我们提出了一种方法,从使用定性推理和直观物理模型从同一场景但来自不同视图的一组RGB-D图像中提取更详细的物理知识。我们的方法不是提供简单的接触关系图并且近似于凸形状的稳定性,而是能够提供基于体积表示的详细支持关系分析。具体来说,确定对象之间的真正支持关系(例如,如果一个对象通过触摸另一个对象来支持另一个对象,或者上面的对象有助于下面对象的稳定性)。我们将我们的方法应用于仓库中捕获的真实结构scenario并显示我们的方法按预期工作。
translated by 谷歌翻译
遮挡和姿势变化可以显着改变面部外观,是自动面部表情识别(FER)的两个主要障碍。尽管自动FER在过去几十年中取得了实质性进展,但FER的阻塞 - 稳健和姿势不变问题已经得到相对较少的关注,尤其是在真实场景中。本文通过三重贡献解决了真实世界的姿势和遮挡强大的FER问题。首先,为了激发FER在现实世界的遮挡和变异姿势的研究,我们为社区建立了几个带有手动注释的野外面部表情数据集。其次,我们提出了一种新颖的区域注意网络(RAN),以自适应地捕捉面部区域的重要性以进行遮挡和姿势变异FER。 RAN将骨干卷积神经网络产生的不同数量的区域特征聚合并嵌入到紧凑的固定长度表示中。最后,受面部表情主要由面部单位定义这一事实的启发,我们提出了一个区域偏见的损失,以鼓励对最重要区域的高度重视。我们在构建的测试数据集和四个流行数据集上验证了我们的RAN和区域偏差损失:FERPlus,AffectNet,RAF-DB和SFEW。大量实验表明,我们的RAN和区域偏差在很大程度上改善了FER的闭塞和变形性能。我们的方法还在FERPlus,AffectNet,RAF-DB和SFEW上实现了最先进的结果。代码和收集的测试数据将公开提供。
translated by 谷歌翻译
聚类旨在将观察到的数据分成不同的类别。流行的聚类模型的性能依赖于样本到样本的相似性。然而,成对相似性易于被噪声或异常值破坏,从而恶化随后的聚类。样本到样本之间的高阶关系可以详细说明数据的局部流形,从而提供补充信息来指导聚类。然而,很少有研究调查高阶相似性和通常的成对相似性之间的联系。为了填补这个空白,我们首先定义高阶张量相似性以利用样本到样本的亲和关系。然后我们建立张量相似性和空间相似性之间的联系,证明可分解张量相似性是通常成对相似性的Kronecker积,并且不可分解性相似性被推广以提供互补信息,其中相似性未能考虑。最后,通过享受其优点,将高阶张量相似度和成对相似度(IPS2)进行协同集成,以提高聚类性能。所提出的IPS2在合成和现实世界数据集中表现出优于或最具竞争力的最先进方法。大量实验表明,张量相似性能够提高经典聚类方法的性能。
translated by 谷歌翻译