这是用于人体姿势估计的深度高分辨率表示学习的官方pytorch实现。在这项工作中,我们对人体姿势估计问题感兴趣,重点是学习可靠的高分辨率表示。大多数现有方法从高分辨率网络产生的低分辨率表示中恢复高分辨率表示。相反,我们提出的网络在整个过程中保持高分辨率的表示。我们从高分辨率子网开始作为第一阶段,逐一逐步添加高到低分辨率子网以形成更多阶段,并且并行地连接它们的分辨率子网。我们进行重复的多尺度融合,使得从高到低分辨率的表示中的每一个一遍又一遍地从其他平行表示接收信息,从而导致丰富的高分辨率表示。结果,预测的关键点热图可能更准确并且在空间上更精确。我们通过两个基准数据集的优越姿态估计结果,经验证明了我们网络的有效性:COCO关键点检测数据集和MPII人体姿势数据集。代码和模型已在\ url {https://github.com/leoxiaobin/deep-high-resolution-net.pytorch}公开发布。
translated by 谷歌翻译
识别行人属性是计算机视觉社区的一项重要任务,因为它在视频监控中发挥着重要作用。已经提出Manyalgorithms来处理该任务。本文的目的是使用传统方法或基于深度学习网络来回顾现有作品。首先,我们介绍了行人属性识别的背景(简称PAR),包括行人属性的基本概念和相应的挑战。其次,我们介绍了现有的基准,包括流行的数据集和评估标准。第三,分析了多任务学习和多标签学习的概念,并阐述了这两种学习算法与行人属性识别之间的关系。我们还回顾了一些在深度学习社区中广泛应用的流行网络架构。第四,我们分析了这个任务的流行解决方案,例如属性组,基于部分,\ emph {etc}。第五,我们展示了一些应用程序,这些应用程序考虑了行人属性并实现了更好的性能。最后,本文对本文进行了论述,并为行人属性识别提供了几个可能的研究方向。可以从以下网站找到本文的项目页面:\ url {https://sites.google.com/view/ahu-pedestrianattributes/}。
translated by 谷歌翻译
将各种信息模式融入机器学习过程正在成为一种新趋势。来自各种来源的数据可以提供比单一数据更多的信息,无论它们是异构的还是同构的。现有的基于深度学习的算法通常直接将来自每个域的特征连接起来以表示输入数据。他们很少考虑数据的质量,这是相关多模式问题的关键问题。在本文中,我们提出了一种有效的质量感知深度神经网络,以使用深度强化学习(DRL)对来自每个领域的数据的权重进行建模。具体而言,我们将每个域的权重作为决策问题,并教导代理学习与环境交互。代理可以通过离散动作选择来调整每个域的权重,并且如果显着性结果得到改善则获得肯定的奖励。代理的目标是在完成其顺序动作选择后获得最大奖励。我们以粗到细的方式验证所提出的多模态显着性检测算法。粗略显着图是从编码器 - 解码器框架生成的,该框架通过内容损失和对抗性损失进行训练。最终结果可以通过来自每个域的地图的自适应加权来获得。对两种显着物体检测基准进行的实验验证了我们提出的质量感知深度神经网络的有效性。
translated by 谷歌翻译
逐个检测框架需要一组正和负训练样本来学习用于目标对象的精确定位的鲁棒跟踪模型。但是,现有的跟踪模型主要是独立处理不同的样本,而忽略它们之间的关系信息。在本文中,我们提出了一种新颖的结构感知深度神经网络来克服这些局限性。特别地,我们构造了一个图表来表示训练样本之间的成对关系,另外还将自然语言作为监督信息来强有力地学习特征表示和分类器。为了改善目标的状态并重新跟踪目标,当它从重度遮挡和视野中恢复时,我们会巧妙地设计一个新的子网,从视觉和自然语言线索的指导中学习目标驱动的视觉。扩展五个跟踪基准数据集的实验验证了我们提出的方法的有效性。
translated by 谷歌翻译
通过马尔可夫链的传统显着性检测仅考虑边界节点。然而,除了边界线索之外,背景先验和前景提示线索还起到补充作用以增强显着性检测。在本文中,我们提出了一种基于吸收马尔可夫链的显着性检测方法,该方法考虑边界信息和前景先验线索。所提出的方法通过双向马尔可夫链将边界和前景先验线索结合起来。具体地,图像是第一个分段的超像素,并且选择四个边界节点(复制为虚拟节点)。随后,计算过渡节点随机游走到吸收状态的吸收时间,以获得前景可能性。同时,使用前景作为虚拟吸收节点计算吸收时间并获得背景可能性。最后,融合两个获得的结果以使用成本函数获得组合显着图,以进行多尺度的进一步优化。实验结果证明了我们提出的模型在4个基准数据集上的表现优于17种最先进的方法。
translated by 谷歌翻译
YouTube提供了一个前所未有的机会,可以探索机器学习方法如何改善医疗信息传播。我们提出了一个跨学科的镜头,将机器学习方法与医疗保健信息学主题相结合,以解决开发可扩展的算法解决方案的关键问题,从健康素养和患者教育的角度评估视频。我们开发了一种深度学习方法,以了解YouTube视频中编码的医学知识水平。初步结果表明,我们可以从YouTube视频中提取医学知识,并根据嵌入的知识对视频进行分类,并获得令人满意的表现。 Deeplearning方法在知识提取,自然语言理解和图像分类方面显示出巨大的希望,特别是在以病人为中心的护理和精准医学的时代。
translated by 谷歌翻译
近年来,在姿势跟踪和姿势跟踪兴趣增加方面取得了重大进展。同时,总体算法和系统复杂性也增加,使得算法分析和比较更加困难。这项工作提供了简单有效的baseline方法。它们有助于鼓励和评估现场的新想法。在具有挑战性的基准测试中取得了最先进的成果。该代码将在https://github.com/leoxiaobin/pose.pytorch上提供。
translated by 谷歌翻译
最先进的人体姿势估计方法基于热图表示。尽管表现良好,但表示本质上存在一些问题,例如不可微分和量化误差。这项工作表明,简单的积分运算关联并统一了热图表示和联合回归,从而避免了上述问题。它与任何基于热图的方法无差别,高效且兼容。通过各种设置下的综合消融实验,特别是3D姿态估计,首次验证了其有效性。
translated by 谷歌翻译
Data center applications present significant opportunities for multiplexing server resources. Virtualization technology makes it easy to move running application across physical machines. In this paper, we present an approach that uses virtualization technology to allocate data center resources dynamically based on application demands and support green computing by optimizing the number of servers actively used. We abstract this as a variant of the relaxed on-line bin packing problem and develop a practical, efficient algorithm that works well in a real system. We adjust the resources available to each VM both within and across physical servers. Extensive simulation and experiment results demonstrate that our system achieves good performance compared to the existing work.
translated by 谷歌翻译
The problem addressed in this paper is that of orthogonally packing a given set of rectangular-shaped boxes into the minimum number of rectangular bins. The problem is strongly NP-hard and extremely diicult to solve in practice. Lower bounds are discussed, and it is proved that the asymptotical worst-case performance of the continuous lower bound is 1 8. An exact algorithm for lling a single bin is developed, leading to the deenition of an exact branch-and-bound algorithm for the three-dimensional bin packing problem, which also incorporates original approximation algorithms. Extensive computational results, involving instances with up to 60 boxes, are presented: it is shown that many instances can be solved to optimality within a reasonable time limit.
translated by 谷歌翻译