面部属性分析在过去几年中受到了深度神经网络发展的广泛关注。面部属性分析包含两个关键问题:面部属性估计(FAE),其识别面部属性是否存在于给定图像中;以及FacialAttribute Manipulation(FAM),其合成或移除期望的面部属性。在本文中,我们提供了关于FAE和FAM的深度面部分析的综合调查。首先,我们在一般深层面部属性分析管道中介绍了两个阶段(即数据预处理和模型构建)的基本知识。其次,我们总结了常用的数据集和性能指标。第三,我们创建了现有技术的分类,并分别在FAE和FAM中审查了详细的算法。此外,我们还介绍了几个与面部属性相关的问题和应用。最后,讨论了可能的挑战和未来的研究方向。
translated by 谷歌翻译
知识图是一种有价值的知识库,它将使许多与AI相关的应用程序受益。到目前为止,已经建立了大量的大规模知识图。但是,大多数都是非中国人,专为一般用途而设计。在这项工作中,我们介绍了TechKG,这是一个以技术为导向的大规模中国知识图。它是从大量技术论文中自动构建的,这些论文发表在不同研究领域的中国学术期刊上。一些精心设计的启发式规则用于提取高质量的实体和关系。它总共包含超过2.6亿个小节,这些小节是基于来自38个研究领域的超过5200万个实体构建的。我们的初步实验表明TechKG具有高适应性,可用作许多不同AI相关应用的数据集。我们在http://www.techkg.cn发布了TechKG。
translated by 谷歌翻译
目的:将深度卷积神经网络(CNN)应用于心肌动脉旋转标记(ASL)灌注成像中的左心室分割任务。开发基于特定假阳性与假阴性权衡的测量不确定性和适应性分类的方法。方法:我们使用改进的UNET架构和Monte Carlo(MC)压降。该模型对来自22名受试者的数据进行训练,并对来自6名心脏移植受者的数据进行测试。手动分割和定量心血流量(MBF)图可用于比较。我们考虑两个分割不确定性的全局核心,“骰子不确定性”和“MC不确定性”,它们分别使用和不使用手动分割计算。使用超参数$ \ beta $的Tversky损失函数来使模型适应特定的假阳性与假阴性权衡。结果:改进的UNET模型在测试集上实现了均值(std)= 0.91(0.04)$的Dice系数。使用自动分割测量的MBF与使用手动分割测量的自动分割相关($ R ^ 2 = 0.96 $)。骰子不确定性和MC不确定性非常一致($ R ^ 2 = 0.64 $)。随着$ \ beta $的增加,误报率系统性下降,假负率率系统性上升。结论:我们证明了使用CNN在心肌ASL数据中自动分离左心室的可行性。由于低血压和不一致的血液 - 心肌对比噪声比,这是特别具有挑战性的应用。我们还展示了衡量不确定性并适应假阳性率和假阴性率之间所需权衡的新方法。
translated by 谷歌翻译
单目深度估计旨在估计单个图像的像素深度图,其在场景理解和自动驾驶中具有广泛的应用。现有的监督和无监督方法面临着巨大的挑战。监督方法需要大量的深度测量数据,这些数据通常难以获得,而无监督的方法通常受限于估计精度。由图形引擎生成的合成数据为收集大量深度数据提供了可行的解决方案。然而,合成数据和实际数据之间的大范围差距使得直接训练它们具有挑战性。在本文中,我们建议使用立体匹配网络作为代理来从合成数据中学习深度,并使用预测的立体视差图来监督单眼深度估计网络。在这个新的框架中可以充分利用跨域合成数据。不同的策略是建议确保学习深度感知能力在不同领域之间传递。我们的广泛实验显示了KITTI数据集上单眼深度估计的最新结果。
translated by 谷歌翻译
在本文中,我们考虑利用部分重叠信道(POC)的网状结构无人机(UAV)网络。对于无人机网络中的基因标记收集任务,我们的目标是通过限制传输功率和服务质量(QoS)来优化网络吞吐量。就高度移动和不断变化的无人机网络而言,不幸的是,大多数现有方法依赖于确定对动态环境易受攻击的信息,使系统性能降低。为了对抗UAVnetworks的动态拓扑和变化干扰,提出了一种鲁棒的分布式学习方案。我们引入不确定性来表征无人机节点之间的动态信道增益,然后用模糊数解释,而不是完美的信道状态信息(CSI)。我们在映射模糊空间中实现学习和决策过程,而不是传统观察空间,其中信道容量是一个明确的奖励。这允许系统通过在备用空间中进行优化来实现更加平稳和更强大的性能。为此,我们设计了一个模糊支付函数(FPF)来描述波动的可能性,POCs分配的问题被公式化为模糊支付游戏(FPG)。在模糊双矩阵博弈的有吸引力的辅助下,证明了模糊纳什均衡(FNE)在我们制定的FPG中的存在性。我们的鲁棒模糊学习算法可以通过偏差法达到均衡解。最后,提供数值模拟以证明我们的新方案优于现有方案的优点。
translated by 谷歌翻译
In this paper, we study the problem of semantic annotation on 3D models thatare represented as shape graphs. A functional view is taken to representlocalized information on graphs, so that annotations such as part segment orkeypoint are nothing but 0-1 indicator vertex functions. Compared with imagesthat are 2D grids, shape graphs are irregular and non-isomorphic datastructures. To enable the prediction of vertex functions on them byconvolutional neural networks, we resort to spectral CNN method that enablesweight sharing by parameterizing kernels in the spectral domain spanned bygraph laplacian eigenbases. Under this setting, our network, named SyncSpecCNN,strive to overcome two key challenges: how to share coefficients and conductmulti-scale analysis in different parts of the graph for a single shape, andhow to share information across related but different shapes that may berepresented by very different graphs. Towards these goals, we introduce aspectral parameterization of dilated convolutional kernels and a spectraltransformer network. Experimentally we tested our SyncSpecCNN on various tasks,including 3D shape part segmentation and 3D keypoint prediction.State-of-the-art performance has been achieved on all benchmark datasets.
translated by 谷歌翻译
以前的方法已经处理了面部属性的离散操作,例如微笑,悲伤,愤怒,惊讶等,超出规范表达,并且它们不可扩展,以单一模态操作。在本文中,我们提出了一个支持连续编辑的anovel框架和使用对抗性学习的多模态肖像操作。具体而言,我们通过利用额外的面部标记信息,使循环一致性适应条件设置。这有两个作用:第一周期映射引起双向操作和身份保持;因此可以利用来自不同模态的第二配对样本。为了确保高质量的合成,我们采用纹理损失来强化纹理一致性和多层次的逆向监控,以促进梯度流动。定量和定性实验表明我们的框架在执行具有照片效果效果的柔性和多模态肖像操作方面的有效性。
translated by 谷歌翻译
在本文中,我们提出了一种新的甲状腺细胞病理学WSIs高效滤泡分离方法。首先,我们提出了一种混合分段架构,它通过添加分支将分类器集成到Deeplab V3中。通过使用分类分支来浏览不相关区域,节省了大量的WSI分段时间。其次,将Deeplab V3中的低尺度精细特征融入到原始的空间金字塔空间(ASPP)中,以准确地表示细胞病理图像。第三,我们的混合模型采用面向准则的自适应损失函数进行训练,使模型收敛速度更快。对甲状腺贴片的实验结果表明,所提出的模型在分割精度上达到80.9%。此外,采用我们提出的方法,WSI分割的时间减少了93%,WSI水平精度达到53.4%。
translated by 谷歌翻译
变分推理(VI)是贝叶斯估计中广泛使用的框架。对于大多数非高斯统计模型,找到一个可分析的解决方案来估计参数的后验分布是不可行的。最近,通过对变分目标函数采用下界近似,引入并应用改进的框架,即扩展变分参考(EVI),并应用于推导分析上可解决的解决方案。本文讨论并比较了EVI实施所需的两个条件,即弱条件和强条件。在实际实现中,EVI的收敛取决于下界近似的选择,无论弱条件还是强条件。通常,可以应用两种近似策略,即单一下界(SLB)近似和多次下界(MLB)近似,以执行下界近似。我们将讨论SLB和MLB之间的差异,我们还将讨论上述两个近似的收敛性质。基于一些现有的基于EVI的非高斯统计模型进行广泛的比较。进行理论分析以证明弱势和强势条件之间的差异。给出了定性和定量实验结果,以显示SLB近似的优点。
translated by 谷歌翻译
视网膜眼底图像上的视杯和盘的自动分割对于青光眼的自动检测/分析是基础。传统分割方法在很大程度上取决于手工制作的功能和用户的先验知识。因此,这些方法难以适应临床环境。最近,基于完全卷积网络(FCN)的深度学习方法已经成功地解决了分割问题。然而,在处理医学图像时,依赖于大注释的训练数据是有问题的。如果没有足够数量的带注释的训练数据来涵盖所有可能的变化,则FCN不提供准确的分割。此外,FCN在卷积层中具有大的感受场,因此产生粗略的边界输出。因此,我们提出了一种新的全自动方法,我们将其称为双级完全卷积网络(DSFCN)。我们的方法利用深度剩余架构和FCN,并以逐步的方式学习和推断光学杯和磁盘的位置,并具有细粒度的细节。在训练期间,ourapproach从训练数据和从前一次迭代得到的估计结果中学习。从前一次迭代中学习的能力可以优化光学杯和磁盘边界的学习。在测试(预测)期间,DSFCN使用测试(输入)图像和从先前迭代得到的估计概率图来逐渐改善分段准确性。我们的方法实现了视杯和磁盘分割的平均Dice系数为0.8488和0.9441,并且曲线下面积(AUC)为0.9513,用于青光眼检测。
translated by 谷歌翻译