在本研究中,我们专注于从Web语料库中提取知识渊博的片段和注释可知文档,其中包括来自社会媒体和We-media的文档。非正式地,知识渊博的片段是指文本描述概念,实体的属性或实体之间的关系,而知识文档是具有足够知识的片段的文档。这些可知的片段和文档可以在多种应用中有所帮助,例如知识库构建和面向知识的服务。以前的研究使用基于模式的方法提取了知识渊博的片段。在这里,我们提出了基于语义的方法来完成这项任务。具体而言,开发基于CNN的模型以同时提取知识渊博的片段和注释可知文档。此外,CNN的“低级共享,高级别拆分”结构旨在处理来自不同内容域的文档。与构建多个特定领域的CNN相比,该联合模型不仅可以大大节省训练时间,而且可以明显提高预测精度。在Wechat公共平台的真实数据集中演示了所提出的方法的优越性。
translated by 谷歌翻译
将对象解构为内容和风格的两个正交空间是具有挑战性的,因为每个对象可以不同地且不可预测地影响视觉观察。很少有人可以访问分离影响的大量数据帮助。在本文中,我们提出了一种新的框架,以完全无监督的方式容忍这种解缠结的表示。在双分支Autoencoder框架中解决此问题。对于结构内容分支,我们将潜在因子投影到一个软结构化的点对象中,并用先验知识得到的损失约束它。此约束鼓励分支提取几何信息。 Anotherbranch学习补充风格信息。这两个分支形成了一个有效的框架,可以解开对象的内容风格表示,而不需要任何人类注释。我们在四个图像数据集上评估我们的方法,在这些数据集上我们展示了合成和现实世界数据中的优越解开和视觉类比质量。我们能够生成具有256 * 256分辨率的非常逼真的图像,这些图像明显地解开了不确定和风格。
translated by 谷歌翻译
早期发现肺癌是提高患者生存率的有效方法。在计算机断层扫描(CT)图像中准确检测肺结节是诊断肺癌的关键步骤。然而,由于肺结节的异质性和周围环境的复杂性,强大的结节检测一直是一项具有挑战性的任务。在这项研究中,我们提出了一种用于肺结节检测的两阶段卷积神经网络(TSCNN)架构。第一阶段的CNN架构基于改进的UNet分割网络,以建立肺结节的初始检测。同时,为了在不引入过多误报结节的情况下获得高召回率,我们提出了一种小说采样策略,并根据所提出的级联预测方法,使用离线硬挖掘思想进行训练和预测。第二阶段的CNN架构基于所提出的双池结构,其构建在三个3D CNN分类网络中用于假阳性减少。由于网络训练需要大量的训练数据,我们采用基于随机掩模的数据增强方法。此外,我们通过集成学习提高了误报减少模型的泛化能力。所提出的方法已经在LUNA数据集上进行了实验验证。实验结果表明,所提出的TSCNN架构可以获得有竞争力的检测性能。
translated by 谷歌翻译
本地化和跟踪是机器人,自动化和物联网两个非常活跃的研究领域。准确跟踪大量设备通常需要部署大量基础设施(红外线跟踪系统,摄像机,无线天线等),这对于不可访问或受保护的环境来说并不理想。本文源于这样的环境所带来的挑战:覆盖大量小房间的大量单元,只需要最少的本地化基础设施。 Theidea旨在准确跟踪手持设备或移动机器人的位置,而不会干扰其架构。使用超宽带(UWB)设备,我们利用我们在分布式和协作机器人系统方面的专业知识,开发出一种新型解决方案,需要最少数量的固定锚。 Wediscuss分享UWB网络的策略以及扩展卡尔曼滤波器推导,以协作定位和跟踪配备UWB的设备,并显示我们在法国Chambordcastle跟踪访客的实验活动的结果。
translated by 谷歌翻译
面部幻觉是特定于领域的超分辨率问题,其目的是从低分辨率〜(LR)输入生成高分辨率(HR)面部图像。与现有的贴片式超分辨率模型相比,它将面部图像划分为常规贴片,并独立地将LR应用于HR映射到每个贴片,我们实施深度强化学习并开发一种具有novelattention意识的面部幻觉(Attention-FH)框架,该框架反复出现参加一系列补丁并通过合理利用图像的全局相互依赖性来执行面部部分增强。具体而言,我们提出的框架包含两个组成部分:循环策略网络,用于基于超分辨图像和过去参与区域序列的状态在每个时间步骤动态指定新的参与区域,以及用于选择的补丁幻觉和全局状态更新的局部增强网络。注意-FH模型通过最大化长期奖励来共同学习经常性策略网络和局部增强网络,该长期奖励反映了关于整个HR图像的幻觉结果。大量实验表明,我们的Attention-FH在具有大的姿势和照明变化的野外脸部图像方面明显优于最先进的方法。
translated by 谷歌翻译
在这项工作中,我们提出了一个名为Region-Aware Network(RANet)的新型框架,用于实现人体姿势估计的反混淆,包括重度遮挡,附近人和对称外观。具体地,我们提出的方法解决了人体姿势估计的三个关键方面,即数据增强,特征学习和预测融合。首先,我们提出基于分析的数据增强(PDA)来生成具有混淆纹理的丰富数据。其次,我们不仅提出特征金字塔干(FPS)模块在较低阶段容忍更好的低级特征;但也结合了有效区域提取(ERE)模块来研究更好的人体特异性特征。第三,我们引入级联投票融合(CVS)以明确地利用可见性来排除偏转的预测并实现最终的精确姿态估计。实验结果证明了我们的方法对现有技术的优越性,对两个流行的基准数据集(包括MPII和LSP)进行了重大改进。
translated by 谷歌翻译
旨在从原始特征匹配中寻找正确的特征对应关系的对应选择对于许多基于特征匹配的任务是关键的。随着数十年的发展,已经提出了各种2D(图像)对应选择算法。遗憾的是,由于缺乏内部评估,开发人员很难选择适当的算法给出特定的应用程序。本文通过评估八种二维对应选择算法填补了这一空白,这两种算法从经典方法到四个标准数据集中的最新方法。实验数据集的多样性带来各种滋扰,包括变焦,旋转,模糊,视点变化,JPEG压缩,光变化,不同的渲染风格和多结构的综合测试。为了进一步创建初始匹配的不同分布,还考虑了一组检测器和描述符的组合。我们从四个方面来衡量对应选择算法的质量,即精度,召回率,F-度量和效率。根据评估结果,汇总了所有被认为算法的优势和局限性,可以作为“用户指南”对待。对于以下开发人员。
translated by 谷歌翻译
由于公司引入新产品以跟上客户快速变化的口味的现象,我们考虑一种新颖的在线学习环境,即利润最大化的卖家需要通过提供建议来了解客户的偏好,这些建议可能包含已推出的现有产品和新产品在销售期间。我们提出了一个顺序多项logit(SMNL)模型来表征客户在产品推荐分层时的行为。对于具有已知客户偏好的离线版本,我们提出了一种多项式时间算法,并表征了最佳分层产品推荐的属性。对于在线问题,我们提出了一种学习算法来量化其遗憾的界限。此外,我们将设置扩展到包含aconstraint,确保每个新产品都能以一定的精度学习。我们的结果表明,层级结构可用于减轻与学习新产品相关的风险。
translated by 谷歌翻译
本文介绍了一种简单但非常有效的数据驱动方法,用于融合用于3D刚性数据匹配的低级和高级局部几何特征。通常通过融合来自各种视点或子空间的低级特征来生成独特的几何描述符,或通过利用多个高级特征来增强几何特征匹配。在先前的工作中,它们通常通过线性操作来执行,例如串联和最小池化。我们表明,通过在三重框架下优化神经网络(NN)模型可以实现更紧凑和独特的表示,该模型在欧几里德空间中非线性地融合局部几何特征.NN模型通过改进的三重损失函数训练,其完全消除所有成对关系在三胞胎内。此外,通过我们的方法的融合描述符也与来自数据的深度学习描述符竞争,同时更轻量级和旋转不变。具有各种数据模态和应用结果的四个标准数据集的实验结果证实了我们的方法在特征匹配和几何配准方面的优势。
translated by 谷歌翻译
非局域网(NLNet)通过将特定于查询的全局上下文聚合到每个查询位置,提供了一种捕获远程依赖关系的开创性方法。然而,通过严格的实证分析,我们发现由非局部网络建模的全局上下文对于图像内的不同查询位置几乎相同。在本文中,我们利用这一发现创建了一个基于独立于查询的配置的简化网络,该网络保持了NLNet的准确性,但计算量明显减少。我们进一步观察到这种简化设计与挤压激励网络(SENet)共享相似结构。因此,我们将它们统一为全球环境建模的三步通用框架。在通用框架内,我们设计了一个更好的实例化,称为全局上下文(GC)块,它是轻量级的,可以有效地模拟全局上下文。 thelightweight属性允许我们将其应用于骨干网络中的多个层以构建全局上下文网络(GCNet),该网络通常在各种识别任务的主要基准上优于简化的NLNet和SENet。代码和配置通过以下网址发布://github.com/xvjiarui/GCNet。
translated by 谷歌翻译