Recent years have witnessed significant growth of face alignment. Though dense facial landmark is highly demanded in various scenarios, e.g., cosmetic medicine and facial beautification, most works only consider sparse face alignment. To address this problem, we present a framework that can enrich landmark density by existing sparse landmark datasets, e.g., 300W with 68 points and WFLW with 98 points. Firstly, we observe that the local patches along each semantic contour are highly similar in appearance. Then, we propose a weakly-supervised idea of learning the refinement ability on original sparse landmarks and adapting this ability to enriched dense landmarks. Meanwhile, several operators are devised and organized together to implement the idea. Finally, the trained model is applied as a plug-and-play module to the existing face alignment networks. To evaluate our method, we manually label the dense landmarks on 300W testset. Our method yields state-of-the-art accuracy not only in newly-constructed dense 300W testset but also in the original sparse 300W and WFLW testsets without additional cost.
translated by 谷歌翻译
在推荐系统中,项目可能会接触到各种用户,我们想了解新用户对现有项目的熟悉。这可以作为异常检测(AD)问题进行配置,该问题区分“普通用户”(名义)和“新用户”(异常)。考虑到物品的庞大数量和用户项目配对数据的稀疏性,在每个项目上独立应用传统的单任务检测方法很快就变得困难,而项目之间的相关性则被忽略。为了解决这个多任务异常检测问题,我们建议协作异常检测(CAD)共同学习所有任务,并通过任务之间的嵌入编码相关性来学习所有任务。我们通过条件密度估计和条件可能性比估计来探索CAD。我们发现:$ i $)估计似然比的学习效率更高,并且比密度估计更好。 $ ii $)提前选择少量任务以学习任务嵌入模型,然后使用它来启动所有任务嵌入是有益的。因此,这些嵌入可以捕获任务之间的相关性并推广到新的相关任务。
translated by 谷歌翻译
从MRI和X射线等医学图像中自动检测的自动异常可显着减少人类在疾病诊断方面的努力。由于建模异常的复杂性以及领域专家(例如放射科医生)的高度手动注释成本,因此当前医学成像文献中的典型技术仅着重于从健康对象中得出诊断模型,假设该模型将检测到图像,来自患者作为异常值。但是,在许多实际情况下,与健康和患病患者混合在一起的未注释的数据集很丰富。因此,本文提出了一个研究问题,即如何通过(1)(1)(1)(2)(2)文献中使用的一组健康图像来改善无监督的异常检测。为了回答这个问题,我们提出了一种新型的单向图像到图像翻译方法的Healthygan,该方法学会了将图像从混合数据集中转换为仅健康图像。作为一方面的Healthygan,Healthygan放宽了现有未配对的图像到图像翻译方法的循环一致性的要求,这对于混合的未注释数据是无法实现的。一旦学习了翻译,我们通过减去其翻译输出来为任何给定图像生成差异图。差异图中显着响应的区域对应于潜在异常(如果有)。我们的Healthygan在两个公开可用的数据集上优于传统的最先进方法:Covid-19和NIH Chestx-Ray14,以及从Mayo Clinic收集的一个机构数据集。该实施可在https://github.com/mahfuzmohammad/healthygan上公开获得。
translated by 谷歌翻译
准确的牙齿体积分割是计算机辅助牙齿分析的先决条件。基于深度学习的牙齿分割方法已经达到了令人满意的表现,但需要大量的牙齿数据。公开可用的牙科数据是有限的,这意味着无法在临床实践中复制,评估和应用现有方法。在本文中,我们建立了一个3D Dental CBCT数据集Ctooth+,具有22个完全注释的卷和146个未标记的体积。我们进一步评估了基于完全监督的学习,半监督学习和积极学习的几种最先进的牙齿量细分策略,并定义了绩效原则。这项工作为牙齿体积分割任务提供了新的基准,该实验可以作为未来基于AI的牙科成像研究和临床应用开发的基线。
translated by 谷歌翻译
我们NN的机制与最新的MIT脑可塑性研究的结果非常一致,研究人员发现,随着突触的增强,相邻的突触会自动削弱自身以补偿。关于这种机制的重要性,斯坦福大学Luo博士的团队表示,关于突触形成的树突形态发生的竞争至关重要。我们试图通过模型在关键时期关闭时通过模型与以前的研究相反,对大脑可塑性的失败机理进行研究。尖端成像和遗传工具在其实验研究中结合在一起,而我们的研究更加重视新NN的模型,推导和模拟。在测试中,证明树突在一定程度上的产生是通过突触形成遏制的。在研究中还考虑了电流和助记符脑可塑性以及突触作用范围。此外,新NN的框架基于当前的梯度信息和助记符负和阳性梯度信息突触形成。助记符梯度信息需要考虑被遗忘的记忆 - 腹部突触形成记忆持续性因子(包括阴性和正面记忆 - 即迄今且相对较低的梯度信息)。我们发现,像吞噬作用因子一样,星形细胞记忆持续性因子会产生减少突触局部积累的作用。无论梯度更新如何,仅考虑突触吞噬作用的PNN,以及是否取消了不同变量和突触位置的突触吞噬作用,是否由相应时间间隔的相关系数确定,证明简单且有效。
translated by 谷歌翻译
基于光学传感器的运动跟踪系统通常遭受问题,例如差的照明条件,遮挡,有限的覆盖,并且可以提高隐私问题。最近,已经出现了使用商业WiFi设备的基于射频(RF)的方法,这些方法提供了低成本的普遍感感知,同时保留隐私。然而,RF感测系统的输出,例如范围多普勒谱图,不能直观地代表人类运动,并且通常需要进一步处理。在本研究中,提出了基于WiFi微多普勒签名的人类骨骼运动重建的新颖框架。它提供了一种有效的解决方案,通过重建具有17个关键点的骨架模型来跟踪人类活动,这可以帮助以更易于理解的方式解释传统的RF感测输出。具体地,MDPose具有各种增量阶段来逐渐地解决一系列挑战:首先,实现去噪算法以去除可能影响特征提取的任何不需要的噪声,并增强弱多普勒签名。其次,应用卷积神经网络(CNN)-Recurrent神经网络(RNN)架构用于从清洁微多普勒签名和恢复关键点的速度信息学习时间空间依赖性。最后,采用姿势优化机制来估计骨架的初始状态并限制误差的增加。我们在各种环境中使用了许多受试者进行了全面的测试,其中许多受试者具有单个接收器雷达系统,以展示MDPOST的性能,并在所有关键点位置报告29.4mm的绝对误差,这优于最先进的RF-基于姿势估计系统。
translated by 谷歌翻译
到目前为止,命名实体识别(ner)已经参与了三种主要类型,包括平面,重叠(嵌套)和不连续的ner,主要是单独研究。最近,为统一的人员建立了一个日益增长的兴趣,并与一个单一模型同时解决上述三个工作。当前最佳性能的方法主要包括基于跨度和序列到序列的模型,不幸的是,前者仅关注边界识别,后者可能遭受暴露偏差。在这项工作中,我们通过将统一的ner建模为Word-Word关系分类来提出一种小说替代方案,即W ^ 2ner。通过有效地建模具有下面邻近字(NNW)和尾页字 - *(THW- *)关系的实体单词之间的邻近关系来解决统一网内的内核瓶颈。基于W ^ 2ner方案,我们开发了一个神经框架,其中统一的网格被建模为单词对的2D网格。然后,我们提出了多粒度的2D卷积,以便更好地精炼网格表示。最后,共同预测器用于足够原因的单词关系。我们对14个广泛使用的基准数据集进行了广泛的实验,用于平板,重叠和不连续的NER(8英语和6个中文数据集),我们的型号击败了所有当前的顶级表演基线,推动了最先进的表演统一的网。
translated by 谷歌翻译
基于方面的情绪分析旨在确定产品评论中特定方面的情感极性。我们注意到,大约30%的评论不包含明显的观点词,但仍然可以传达清晰的人类感知情绪取向,称为隐含情绪。然而,最近的基于神经网络的方法几乎没有关注隐性情绪,这一审查有所关注。为了克服这个问题,我们通过域名语言资源检索的大规模情绪注释的Corpora采用监督对比培训。通过将隐式情感表达式的表示对准与具有相同情绪标签的人,预培训过程可以更好地捕获隐含和明确的情绪方向,以便在评论中的方面。实验结果表明,我们的方法在Semeval2014基准上实现了最先进的性能,综合分析验证了其对学习隐含情绪的有效性。
translated by 谷歌翻译
统一的意见角色标签(ORL)旨在给予一篇文章检测一次拍摄中“意见持有人 - 目标”的所有可能的意见结构。不幸的是,现有的基于转换的统一方法受到更长的意见术语,并且无法解决术语重叠问题。通过采用基于跨度的图形模型实现了当前的最佳性能,然而仍然存在高模型复杂性并且在意见和角色之间的互动不足。在这项工作中,我们通过重新检测转换架构并使用指针网络(PINETNET)来调查新的解决方案。该框架在线性时间复杂度解析了所有意见结构,同时通过限制与PointNet的任何术语的限制。为了实现明确的观点 - 角色互动,我们进一步提出了一个统一的依赖性意见图(UDOG),共同建立了句法依赖结构和部分意见角色结构。然后,我们设计了居中性的图形聚合器(RCGA)以编码多关键udog,其中产生的高阶表示用于促进香草过渡系统中的预测。我们的模型在MPQA基准测试中实现了新的最先进结果。分析进一步证明了我们对疗效和效率的方法的优越性。
translated by 谷歌翻译
对于四足运动的无模型深度增强学习,机器人配置的初始化对于数据效率和鲁棒性至关重要。这项工作侧重于通过自动发现初始状态的数据效率和鲁棒性的算法改进,这是由我们所提出的基于可访问度量的K访问算法实现的。具体而言,我们制定了可访问性度量来测量两个任意状态之间的转换难度,并提出了一种用于基于可访问度量的静态构成集群的质心的新颖的K访问算法。通过使用发现的质心静态姿势作为初始状态,我们可以通过减少冗余探索来提高数据效率,并通过更有效地从质心探索到采样的姿势来提高鲁棒性。专注于秋季恢复作为一套非常艰难的运动技能,我们使用8-DOF四极其机器人略微验证了我们的方法。与基线相比,我们的方法的学习曲线会收敛得更快,只需要60%的训练集。通过我们的方法,机器人可以在99.4%的测试用例的99.4%内成功恢复到常规姿势。此外,该方法可以概括为成功的其他困难技能,例如回空。
translated by 谷歌翻译