目的:本研究的目的是使用颅内脑电图(iEEG)数据开发一种有效且可靠的癫痫发作预测系统,特别是对于耐药性癫痫患者。预测程序应以足够快的速度产生准确的结果,以警告患者癫痫发作。方法:我们定量分析人类iEEG数据,以了解人类大脑在癫痫发作之前和之间的行为方式。然后,我们引入了一种有效的预处理方法,用于减少数据大小并将时间序列iEEG数据转换为可用作卷积神经网络(CNN)输入的图像类型格式。此外,我们提出了一种癫痫发作预测算法,该算法使用协作多尺度CNN来进行iEEG数据的自动特征学习。结果:1)iEEG通道包含补充信息并排除个别通道不建议获得准确预测癫痫发作所需的空间信息。 2)传统的PCA不是癫痫发作预测中iEEG数据导出的可靠方法。 3)手工制作的iEEG特征可能不适用于可靠的癫痫发作预测性能,因为iEEG数据在患者之间以及随着时间的推移因同一患者而异。 4)癫痫发作预测结果表明,我们的算法优于现有方法,平均灵敏度为87.85%,AUC得分为0.84。结论:了解人类大脑在癫痫发作前的行为,并且远离它们有助于更好地设计癫痫发作预测因子。意义:准确的癫痫发作预测算法可以警告患者下次癫痫发作,以避免危险活动。然后可以服用药物以中止即将发作的癫痫发作并将受伤风险降至最低。
translated by 谷歌翻译
报道了一种新颖的中心线提取框架,其结合了端到端可训练的多任务完全卷积网络(FCN)和最小路径提取器。 FCN同时计算中心线距离图并检测分支端点。该方法生成没有伪分支的单像素宽中心线。它处理任意树形结构对象,没有关于树的深度或其分叉模式的先验假设。它对于目标对象的不同部分的大量尺度变化以及对象的分割掩模的微小缺陷也是稳健的。据我们所知,这是第一个基于深度学习的中心线提取方法,其保证了单像素宽的中心线。 Complextree结构对象。所提出的方法在620名患者(其中400名用作测试集)的数据集上的冠状动脉中心线提取中得到验证。由于大量冠状动脉支管,分支弯曲度以及长度,厚度,形状等的大的变化,因此该应用具有挑战性。所提出的方法产生定位良好的中心线,显示较少数量的缺失分支,并且在存在对象分割掩模的微小缺陷的情况下更加稳健。根据独立的人工专家评论,与最先进的传统最小路径方法相比,我们的方法将患者级中心线提取的成功率从54.3%提高到88.8%。
translated by 谷歌翻译
知识图是一种有价值的知识库,它将使许多与AI相关的应用程序受益。到目前为止,已经建立了大量的大规模知识图。但是,大多数都是非中国人,专为一般用途而设计。在这项工作中,我们介绍了TechKG,这是一个以技术为导向的大规模中国知识图。它是从大量技术论文中自动构建的,这些论文发表在不同研究领域的中国学术期刊上。一些精心设计的启发式规则用于提取高质量的实体和关系。它总共包含超过2.6亿个小节,这些小节是基于来自38个研究领域的超过5200万个实体构建的。我们的初步实验表明TechKG具有高适应性,可用作许多不同AI相关应用的数据集。我们在http://www.techkg.cn发布了TechKG。
translated by 谷歌翻译
目的:将深度卷积神经网络(CNN)应用于心肌动脉旋转标记(ASL)灌注成像中的左心室分割任务。开发基于特定假阳性与假阴性权衡的测量不确定性和适应性分类的方法。方法:我们使用改进的UNET架构和Monte Carlo(MC)压降。该模型对来自22名受试者的数据进行训练,并对来自6名心脏移植受者的数据进行测试。手动分割和定量心血流量(MBF)图可用于比较。我们考虑两个分割不确定性的全局核心,“骰子不确定性”和“MC不确定性”,它们分别使用和不使用手动分割计算。使用超参数$ \ beta $的Tversky损失函数来使模型适应特定的假阳性与假阴性权衡。结果:改进的UNET模型在测试集上实现了均值(std)= 0.91(0.04)$的Dice系数。使用自动分割测量的MBF与使用手动分割测量的自动分割相关($ R ^ 2 = 0.96 $)。骰子不确定性和MC不确定性非常一致($ R ^ 2 = 0.64 $)。随着$ \ beta $的增加,误报率系统性下降,假负率率系统性上升。结论:我们证明了使用CNN在心肌ASL数据中自动分离左心室的可行性。由于低血压和不一致的血液 - 心肌对比噪声比,这是特别具有挑战性的应用。我们还展示了衡量不确定性并适应假阳性率和假阴性率之间所需权衡的新方法。
translated by 谷歌翻译
单目深度估计旨在估计单个图像的像素深度图,其在场景理解和自动驾驶中具有广泛的应用。现有的监督和无监督方法面临着巨大的挑战。监督方法需要大量的深度测量数据,这些数据通常难以获得,而无监督的方法通常受限于估计精度。由图形引擎生成的合成数据为收集大量深度数据提供了可行的解决方案。然而,合成数据和实际数据之间的大范围差距使得直接训练它们具有挑战性。在本文中,我们建议使用立体匹配网络作为代理来从合成数据中学习深度,并使用预测的立体视差图来监督单眼深度估计网络。在这个新的框架中可以充分利用跨域合成数据。不同的策略是建议确保学习深度感知能力在不同领域之间传递。我们的广泛实验显示了KITTI数据集上单眼深度估计的最新结果。
translated by 谷歌翻译
在本文中,我们考虑利用部分重叠信道(POC)的网状结构无人机(UAV)网络。对于无人机网络中的基因标记收集任务,我们的目标是通过限制传输功率和服务质量(QoS)来优化网络吞吐量。就高度移动和不断变化的无人机网络而言,不幸的是,大多数现有方法依赖于确定对动态环境易受攻击的信息,使系统性能降低。为了对抗UAVnetworks的动态拓扑和变化干扰,提出了一种鲁棒的分布式学习方案。我们引入不确定性来表征无人机节点之间的动态信道增益,然后用模糊数解释,而不是完美的信道状态信息(CSI)。我们在映射模糊空间中实现学习和决策过程,而不是传统观察空间,其中信道容量是一个明确的奖励。这允许系统通过在备用空间中进行优化来实现更加平稳和更强大的性能。为此,我们设计了一个模糊支付函数(FPF)来描述波动的可能性,POCs分配的问题被公式化为模糊支付游戏(FPG)。在模糊双矩阵博弈的有吸引力的辅助下,证明了模糊纳什均衡(FNE)在我们制定的FPG中的存在性。我们的鲁棒模糊学习算法可以通过偏差法达到均衡解。最后,提供数值模拟以证明我们的新方案优于现有方案的优点。
translated by 谷歌翻译
In this paper, we study the problem of semantic annotation on 3D models thatare represented as shape graphs. A functional view is taken to representlocalized information on graphs, so that annotations such as part segment orkeypoint are nothing but 0-1 indicator vertex functions. Compared with imagesthat are 2D grids, shape graphs are irregular and non-isomorphic datastructures. To enable the prediction of vertex functions on them byconvolutional neural networks, we resort to spectral CNN method that enablesweight sharing by parameterizing kernels in the spectral domain spanned bygraph laplacian eigenbases. Under this setting, our network, named SyncSpecCNN,strive to overcome two key challenges: how to share coefficients and conductmulti-scale analysis in different parts of the graph for a single shape, andhow to share information across related but different shapes that may berepresented by very different graphs. Towards these goals, we introduce aspectral parameterization of dilated convolutional kernels and a spectraltransformer network. Experimentally we tested our SyncSpecCNN on various tasks,including 3D shape part segmentation and 3D keypoint prediction.State-of-the-art performance has been achieved on all benchmark datasets.
translated by 谷歌翻译
以前的方法已经处理了面部属性的离散操作,例如微笑,悲伤,愤怒,惊讶等,超出规范表达,并且它们不可扩展,以单一模态操作。在本文中,我们提出了一个支持连续编辑的anovel框架和使用对抗性学习的多模态肖像操作。具体而言,我们通过利用额外的面部标记信息,使循环一致性适应条件设置。这有两个作用:第一周期映射引起双向操作和身份保持;因此可以利用来自不同模态的第二配对样本。为了确保高质量的合成,我们采用纹理损失来强化纹理一致性和多层次的逆向监控,以促进梯度流动。定量和定性实验表明我们的框架在执行具有照片效果效果的柔性和多模态肖像操作方面的有效性。
translated by 谷歌翻译
零射击学习(ZSL)旨在通过从所见类中传递的知识来识别看不见的类。这通常通过利用由看见和未看到的类共享的语义特征空间(FS)(即属性或词向量)作为桥来实现。然而,由于训练(看到)和测试(看不见)数据的相互不相交,现有的ZSL方法容易且通常遭受域移位问题。为了解决这个问题,我们提出了一种名为AMS-SFE的新模型。它通过语义特征扩展来考虑流形结构的对齐。具体来说,我们建立了一个基于自动编码器的模型,以扩展语义特征,并将分解与从数据的视觉FS中提取的嵌入式流形联合起来。这是通过扩展语义特征来首次对齐这两个FS的尝试。大量实验表明,与其他现有方法相比,我们的模型性能得到了显着提高。
translated by 谷歌翻译
Human3.6M数据集中大规模标记3D姿势的可用性在推动静止图像的3D人体姿态估计算法中发挥了重要作用。我们观察到,该领域的最新创新主要集中在使用该数据集时明确解决泛化问题的新技术,因为该数据库是在人为主题和背景变化有限的高度控制的环境中构建的。尽管有这样的努力,我们可以证明目前的方法仍然容易出错,特别是在针对拍摄的图像进行测试时。在本文中,我们的目标是从不同的角度解决这个问题。我们提出了一种原则性的方法来生成高质量的3D姿势地面真实性,并与内部人员一起生成任何野外图像。我们通过首先设计一种新颖的立体灵感神经网络来直接将任何2D姿势映射到高质量3D对应物来实现这一点。然后,我们执行精心设计的几何搜索方案,以进一步细化关节。基于这个方案,我们建立了具有400,000个野外图像及其相应的3Dpose基础事实的大规模数据集。这使得能够训练高质量的神经网络模型,而无需专门的训练方案和辅助损失功能,其有利地抵抗最先进的3D姿势估计方法。我们还定量和定性地评估了我们模型的泛化能力。结果表明,我们的方法令人信服地优于以前的方法。我们公开提供数据集和代码。
translated by 谷歌翻译