持续健康监测的出现以及大量时间序列数据的可用性为进行个人健康追踪提供了很好的机会。近年来,无监督学习方法引起了研究人员的特别关注,以解决健康数据的sparseannotation和异常的实时检测一直是一个感兴趣的问题。然而,之前没有得到解决的一个问题是对即将发生的负面健康事件的早期预测。事件的早期迹象可以在健康信号发病之前引入微妙和渐进的变化,在有效预防中检测这些变化是非常宝贵的。在这项研究中,我们首先证明了我们对广泛采用的异常检测方法在揭示负面健康事件之前的变化方面的观察。然后,我们提出了一个框架,该框架依赖于信号段表示的在线聚类,该区域由专门设计的LSTM自动编码器自动学习。我们通过使用MIT-PICS数据集提前1.3分钟预测婴儿心动过缓事件,平均68%的AUC评分,无标签监督,显示我们方法的有效性。我们的研究结果可以表明我们的方法在其他应用中早期检测健康事件的可行性。
translated by 谷歌翻译
从场景图生成逼真的图像要求神经网络能够推理对象关系和组合。作为一个相对较新的任务,如何正确地确保生成的图像符合场景图或如何测量任务性能仍然是一个悬而未决的问题。在本文中,我们提出利用场景图形上下文来改善场景图形的图像生成。我们引入了一个场景图上下文网络,该网络汇集由图形卷积神经网络生成的特征,然后在图像生成网络和对抗性损失中提供。通过上下文网络,我们的模型不仅可以生成逼真的图像,还可以更好地保留非空间对象关系。我们还为这项直接评估场景图合规性的任务提供了新的评估指标,即关系得分和平均意见关系。我们使用定量和定性研究来证明我们提出的模型在这项具有挑战性的任务中完成了最先进的技术。
translated by 谷歌翻译
与许多其他分类器一样,深度神经网络的主要缺点之一是它们容易受到对抗性攻击。他们的脆弱性的一个重要原因是为几乎没有特征点的地区分配高信度。通过特征点,我们指的是输入空间的非线性变换,提取输入数据的有意义的表示。另一方面,深度RBF网络仅对包含足够特征点的区域赋予高可信度,但由于广泛认为它们具有消失的梯度问题,因此它们已被打折扣。在本文中,我们通过首先给出它们的一般公式来重新审视深度RBF网络,然后提出一系列受成本学习启发的成本函数。在所提出的深度RBF学习算法中,不会出现消失梯度问题。我们通过在其输出层添加拒绝选项使这些网络对adversarialattack具有鲁棒性。通过对MNIST数据集的多个实验,我们证明了我们提出的方法不仅能够实现显着的分类准确性,而且还能抵抗各种对抗性攻击。
translated by 谷歌翻译
采用临床使用的数字病理学工作流程面临的挑战之一是需要自动化质量控制。由于扫描仪有时会不准确地确定焦点,因此所得到的图像模糊会使扫描的幻灯片恶化到不可用的程度。此外,当以大于或等于20X的图像分辨率扫描时,扫描的幻灯片图像往往非常大。因此,对于临床上有用的数字病理学,必须使用计算工具快速准确地量化图像聚焦质量并确定是否需要重新扫描图像。我们提出了一种专门针对数字病理学图像的无参考焦点质量评估指标,该指标通过使用偶数导数滤波器的总和来合成类似人类视觉系统的内核,其被建模为镜头点扩散函数的逆。然后将该内核应用于数字病理图像,以修改由扫描仪光学系统劣化的高频图像信息,并量化贴片级别的聚焦质量。 Weshow在几个实验中表示,我们的方法与地面实例$ z $ -level数据相比其他方法更好,并且计算效率更高。我们还扩展了我们的方法,以生成局部幻灯片级焦点质量热图,可用于自动幻灯片质量控制,并通过与主观幻灯片质量分数进行比较,证明我们的临床扫描质量控制方法的实用性。
translated by 谷歌翻译
在本文中,我们提出了一种新颖的图像去模糊设计,它采用一次性卷积滤波的形式,可以直接与自然模糊图像进行卷积复原。光学模糊的问题是许多遭受光学损伤的成像应用的共同优点。尽管有许多反卷积方法盲目地估计以包容性或排他性形式存在,但由于高计算成本和有限的图像质量重构,它们实际上具有挑战性。高精度和高速的两个条件都是数字存档中高吞吐量成像平台的先决条件。重建精度与实现的算法能够多快地恢复潜像一样重要吗?在这样的平台中,在图像获取之后需要去模糊以馈送到通信管道中以进行存储,预览或处理以进行高级解释。因此,这种图像的即时校正是非常优选的,以避免可能的时间延迟,减轻计算量,并提高图像感知质量。我们通过将去卷积核合成为有限脉冲响应(FIR)偶数导数滤波器的线性组合来弥合这一差距,这些滤波器可以直接卷积在输入模糊图像中,以提高与光学模糊相关的点扩散函数(PSF)的频率衰减。我们采用高斯低通滤波器来解决图像边缘去模糊的图像去噪问题。此外,我们提出了一种盲目的方法来估计在许多成像管道中常见的两个高斯和拉普拉斯模型的PSF统计量。 Thoroughexperiments旨在测试和验证所提出的方法的效率,使用2054个自然模糊图像跨六个成像应用程序和七个最先进的反卷积方法。
translated by 谷歌翻译
在本文中,我们描述了机器学习(ML)和语言建模的应用,以生成波斯诗歌。事实上,我们通过阅读和学习波斯诗来教授机器,以与原诗相同的风格产生假诗。作为两位着名的诗人,我们使用了Hafez(1310-1390)和Saadi(1210-1292)诗。首先,我们用Hafez的诗歌为这台机器提供相同风格的假诗,然后我们用Hafez和Saadi诗歌为这台机器提供一种新的风格诗歌,这两种风格是情感(Hafez)和理性(Saadi)的结合。元素。这种将不同风格与ML结合起来的想法为扩展不同文化的过去文学的宝藏打开了新的大门。结果表明,有足够的记忆,处理能力和时间可以产生合理的好词。
translated by 谷歌翻译
人工智能技术(如基于代理的建模和概率推理)在模拟复杂的生物系统和通过模拟测试生态假设方面显示出了前景。我们从Medniy岛开发基于anagent的北极狐模型,同时利用概率图模型捕获随机变量之间的条件依赖性。这些模型为分析这一人口灾难性退化背后的因素提供了有价值的见解,并揭示了其在高密度环境中持续存在的革命机制。我们从Medniy岛的研究中获得的经验数据,我们创建了一个现实的北极狐模型作为代理人,并研究他们的生存和人口动态的各种条件。
translated by 谷歌翻译
运动捕捉序列的语义分割在manydata驱动的运动合成框架中起着关键作用。这是一个预处理步骤,其中运动捕捉序列的长记录被划分为小分段。之后,可以将其他方法(如统计建模)应用于每组结构相似的段,以学习抽象运动流形。然而,分割任务通常仍然是手动任务,这增加了生成大规模运动数据库的工作量和成本。因此,我们提出了使用扩张的时间完全卷积网络的运动捕获数据的语义分段的自动框架。我们的模型在动作分割中执行最先进的模型,以及用于序列建模的三个网络。我们进一步展示了我们的模型对于高噪声训练标签是强健的。
translated by 谷歌翻译
我们推出了一个新的293,008高清(1360 x 1360像素)时尚图像数据集,与专业造型师提供的项目描述配对。每个项目都是从各个角度拍摄的。我们提供基线结果1)高分辨率图像生成,以及2)以给定文本描述为条件的图像生成。我们邀请社区改进这些基线。在本文中,我们还概述了基于此数据集启动的挑战的详细信息。
translated by 谷歌翻译
我们解决了在对象被部分遮挡的情况下来自单输入图像的已知刚性对象的6D姿态估计的任务。最近基于RGB-D的方法对于中等程度的遮挡是稳健的。对于RGBinputs,以前的方法没有适用于部分遮挡的对象。我们的主要贡献是提出第一个基于深度学习的系统,该系统根据RGB-D和RGB输入估计部分遮挡对象的准确姿势。我们使用新的实例感知管道来实现这一点,该管道将6D对象姿态估计分解为一系列更简单的步骤,其中每个步骤都删除了问题的特定方面。第一步使用实例分割网络对图像中的所有已知对象进行定位,从而消除了周围的杂波和遮挡。第二步使用编码器 - 解码器网络将像素密集地映射到3D对象表面位置,即所谓的对象坐标,从而消除对象外观。第三步也是最后一步使用几何优化来预测6Dpose。我们证明,对于RGB和RGB-D输入的部分遮挡对象的姿态估计,我们显着地表现出最先进的技术。
translated by 谷歌翻译