这是用于人体姿势估计的深度高分辨率表示学习的官方pytorch实现。在这项工作中,我们对人体姿势估计问题感兴趣,重点是学习可靠的高分辨率表示。大多数现有方法从高分辨率网络产生的低分辨率表示中恢复高分辨率表示。相反,我们提出的网络在整个过程中保持高分辨率的表示。我们从高分辨率子网开始作为第一阶段,逐一逐步添加高到低分辨率子网以形成更多阶段,并且并行地连接它们的分辨率子网。我们进行重复的多尺度融合,使得从高到低分辨率的表示中的每一个一遍又一遍地从其他平行表示接收信息,从而导致丰富的高分辨率表示。结果,预测的关键点热图可能更准确并且在空间上更精确。我们通过两个基准数据集的优越姿态估计结果,经验证明了我们网络的有效性:COCO关键点检测数据集和MPII人体姿势数据集。代码和模型已在\ url {https://github.com/leoxiaobin/deep-high-resolution-net.pytorch}公开发布。
translated by 谷歌翻译
在本文中,我们提出了一个基于开放的基于词汇的词汇知识库OpenOowNet。基于着名的知网,OpenHowNet包含三个组成部分:核心数据,由超过10万个带有注释的意义组成,OpenHowNet Web简要介绍OpenHowNet以及OpenHowNet信息的在线展示,OpenHowNet API包括几个有用的API,例如访问OpenHowNet核心数据和绘制感官的sememe树结构。在正文中,我们首先给出一些背景知识,包括sememe的定义和HowNet的细节。然后我们介绍一些以前的知网和基于sememe的研究工作。最后但并非至少,我们详细介绍了OpenHowNet的组成部分及其基本功能和功能。此外,我们简要地总结一下并列出一些未来的工作。
translated by 谷歌翻译
动态磁共振(MR)成像产生了巨大的研究兴趣,因为它可以为临床诊断提供空间和时间信息。然而,慢成像速度或长扫描时间仍然是动态MR成像的挑战之一。大多数现有方法在压缩传感(CS)或低秩理论的指导下从不完全k空间数据重建动态MR图像,其具有长迭代重建时间。最近,深度学习显示出非常有用的动态MR动态。我们以前的工作提出了一种动态磁共振成像方法,通过多监督网络训练整合k空间和空间先验知识。然而,在高加速因子下,重建图像仍然存在一定程度的平滑。在这项工作中,我们建议采用带有边缘增强损耗约束的动态磁共振成像的残余密集网络,称为CRDN。具体而言,级联残差密集网络利用来自所有卷积层的分层特征以及局部和全局特征融合。我们进一步利用具有边缘增强特性的总变差(TV)损失函数来训练网络。
translated by 谷歌翻译
背景减法是计算机视觉系统的重要组成部分。它广泛应用于视频监控,目标跟踪,异常检测等领域。一个新的背景扣除数据源出现了低成本深度传感器,如Microsof t Kinect,Asus Xtion PRO等。在本文中,我们提出了一种基于卷积神经网络(CNNs)的深度视频背景扣除方法,称为BGSNet-D(用于深度视频的BackGroundSubtraction神经网络)。该方法可以用于颜色不可用的场景,例如不良的照明情况,并且还可以与现有的RGB背景减法方法一起应用。预处理策略旨在减少深度传感器产生的噪声影响。 SBM-RGBD数据集的实验结果表明,所提出的方法优于现有的深度数据方法。
translated by 谷歌翻译
在本文中,我们提出了三种解决鲁比克立方体颜色识别的方法,包括一种离线方法和两种在线方法。提出了一种离线方法Scatterbalance \和极限学习机(SB-ELM)来说明基于训练的方法的效率。我们还指出了颜色漂移的概念,这表明离线方法总是有效,并且在连续变化环境中不能很好地工作。相比之下,动态重量标签传播被提出用于通过Rubik立方体的已知中心块颜色来标记块颜色。此外,弱标签层次传播,另一种在线方法,也被提出用于未知的全彩色信息,但仅利用中心块的弱标签进行颜色识别。我们最终设计了一个魔方机器人并构建了一个数据集来说明我们在线方法的效率和有效性,并通过我们的数据流中的颜色漂移来指示离线方法的无效性。
translated by 谷歌翻译
我们引入了一个名为Story Ending Generation(SEG)的新任务,旨在生成一系列故事情节结束的连贯故事。我们为此任务提供由Generator和奖励管理器组成的框架。该生成器遵循指针生成器网络,具有覆盖机制,具有词外(OOV)和重复单词。此外,引入了混合损失方法,使发电机能够产生与故事情节具有高度语义相关性的故事结局。在奖励管理器中,奖励计算用于通过策略渐变增强学习(PGRL)微调发生器。我们对最近推出的ROCStoriesCorpus进行了实验。我们在自动评估和人道评估中评估我们的模型。实验结果表明,我们的模型分别在CIDEr和一致性得分方面超过序列 - 序列基线模型15.75%和13.57%。
translated by 谷歌翻译
常识阅读理解(CRC)是一项具有重大挑战性的任务,旨在为涉及叙事通道的问题选择正确答案,这可能需要常识性知识推理。大多数现有方法只是从一个简单的组合方式融合了选择,通过和问题的交互信息,从而没有更深层次的比较信息。相反,我们提出了一个多视角融合网络(MPFN),通过引入\ emph {差异}和\ emph {相似}融合\删除{以及\ emph {union}}来扩展单一融合方法的多个视角。通过三种类型的融合可以捕获更全面和准确的信息。我们在MCScript数据集\ cite {Ostermann:LREC18:MCScript}上设计了几组实验,分别评估了融合类型的有效性。从实验结果可以看出,差异融合与联合融合相当,并且需要通过联合融合来激活相似融合。实验结果还表明,我们的MPFN模型在官方测试集上达到了最先进的精度,达到了83.52%。
translated by 谷歌翻译
本文提出了一个用于故事完整性测试的蒸馏 - 博览会增强匹配网络(DEMN),这在故事理解中仍然是一项具有挑战性的任务。我们将一个完整的故事分为三个叙事片段:一个\ textit {exposition},一个\ textit { climax}和\ textit {ending}。该模型由三个模块组成:输入模块,匹配模块和蒸馏模块。输入模块为三个段提供语义表示,然后将它们提供给另外两个模块。匹配模块化收集结尾和高潮之间的交互特征。蒸馏模块在展示中提取关键的语义信息,并以两种不同的方式将其注入匹配模块。我们在ROCStories Corpus \ cite {Mostafazadeh2016ACA}上评估我们的单一和集合模型,分别在测试集上达到80.1 \%和81.2 \%的准确度。实验结果表明,我们的DEMN模型实现了最先进的性能。
translated by 谷歌翻译
自然语言推理(NLI)是自然语言处理(NLP)中的一项基本且具有挑战性的任务。大多数现有方法仅对混合匹配特征应用单通道参考过程,该特征是前提和假设之间的不同匹配特征的串联。在本文中,我们提出了一种称为多匝推理匹配网络(MIMN)的新模型,以便对不同的匹配特征进行多匝推理。在每个回合中,模型都关注一个特定的匹配特征而不是混合匹配特征。为了增强不同匹配特征之间的交互,使用存储器组件来存储历史推断信息。每个回合的推理是在当前匹配特征和主题上进行的。我们在三个不同的NLI数据集上进行实验。实验结果表明,我们的模型在所有三个数据集上都优于或达到了最先进的性能。
translated by 谷歌翻译
最近,深度神经网络(DNN)已广泛应用于移动智能应用中。 DNN的推断通常在云中进行。但是,它会导致通过无线网络传输数据的大量开销。在本文中,我们展示了云边缘协作推理与量化的优势。通过分析DNN中层的特征,提出了一种用于协同推理的自整定神经网络量化框架。我们使用ImageNet数据集研究了最先进DNN的混合精确协同推理的有效性。实验结果表明,我们的框架可以生成合理的网络分区,减少移动设备上的存储,严重损失准确性。
translated by 谷歌翻译