目的:将深度卷积神经网络(CNN)应用于心肌动脉旋转标记(ASL)灌注成像中的左心室分割任务。开发基于特定假阳性与假阴性权衡的测量不确定性和适应性分类的方法。方法:我们使用改进的UNET架构和Monte Carlo(MC)压降。该模型对来自22名受试者的数据进行训练,并对来自6名心脏移植受者的数据进行测试。手动分割和定量心血流量(MBF)图可用于比较。我们考虑两个分割不确定性的全局核心,“骰子不确定性”和“MC不确定性”,它们分别使用和不使用手动分割计算。使用超参数$ \ beta $的Tversky损失函数来使模型适应特定的假阳性与假阴性权衡。结果:改进的UNET模型在测试集上实现了均值(std)= 0.91(0.04)$的Dice系数。使用自动分割测量的MBF与使用手动分割测量的自动分割相关($ R ^ 2 = 0.96 $)。骰子不确定性和MC不确定性非常一致($ R ^ 2 = 0.64 $)。随着$ \ beta $的增加,误报率系统性下降,假负率率系统性上升。结论:我们证明了使用CNN在心肌ASL数据中自动分离左心室的可行性。由于低血压和不一致的血液 - 心肌对比噪声比,这是特别具有挑战性的应用。我们还展示了衡量不确定性并适应假阳性率和假阴性率之间所需权衡的新方法。
translated by 谷歌翻译
RNN语言模型已经在各种任务上取得了最先进的结果,但它们对语法的确切表达尚不清楚。在这里,我们研究RNN语言模型是否在句法变更中学习类似人类的单词顺序偏好。我们收集语言模型的惊人得分,用于控制句子刺激,在英语中表现出重要的句法变化:重度NP移位,粒子移位,交替交替和属性交替。我们表明RNN语言模型基于NP长度,生命力和确定性在这些交替中重现人类偏好。我们在第一个可接受判断实验中直接操纵语法的预测因子,为我们的刺激收集人类的可接受性等级。我们表明RNN的表现类似于人类可接受性评级,并且与n-gram基线模型不匹配。我们的研究结果表明,RNNs学习了权重,生命和无限性的抽象特征,这是句法变更的软约束的基础。
translated by 谷歌翻译
X射线行李安全检查广泛用于维护航空和运输安全。特别感兴趣的是对特定类别物体(如电子,电子设备和液体)的自动安全X射线分析的关注。但是,在处理潜在的异常物品时,手动检查这些物品是一项挑战。在这里,我们提出了一种双卷积神经网络(CNN)架构,用于在复杂的安全X射线图像中进行自动异常检测。我们利用基于区域(R-CNN),基于掩模的CNN(掩模R-CNN)和检测结构(例如RetinaNet)的最新进展来为特定的感兴趣对象类提供对象定位变体。随后,利用一系列已建立的CNN对象和细粒度类别分类方法,我们在对象异常检测中将其形成为两类问题(异常或良性)。虽然最佳执行对象定位方法能够以超过六级X射线物体检测问题的97.9%平均平均精度(mAP)执行,但随后的两级异常/良性分类能够在对象异常检测中实现66%的性能。 。总的来说,这种表现既包括在杂乱的X射线安全图像的背景下对物体异常检测的挑战和承诺。
translated by 谷歌翻译
We propose a novel conditioned text generation model. It draws inspiration from traditional template-based text generation techniques , where the source provides the content (i.e., what to say), and the template influences how to say it. Building on the successful encoder-decoder paradigm, it first encodes the content representation from the given input text; to produce the output, it retrieves exemplar text from the training data as "soft templates," which are then used to construct an exemplar-specific decoder. We evaluate the proposed model on abstractive text sum-marization and data-to-text generation. Empirical results show that this model achieves strong performance and outperforms comparable baselines.
translated by 谷歌翻译
本文提出了一种新的随机算法,用于无对应的鲁棒点云注册。大多数现有的注册方法需要通过提取不变描述符而获得的一组推定的对应关系。但是,这些描述符在嘈杂和污染的环境中可能变得不可靠。在这些设置中,直接处理输入点集的方法更可取。然而,没有对应关系,传统的随机技术需要非常大量的样本才能达到令人满意的解决方案。在本文中,我们提出了一种新的方法来解决这个问题。特别是,我们的工作使得能够使用随机方法进行点云登记,而无需假定的对应关系。通过考虑点云对齐作为图匹配的一个特殊实例,采用有效的半定松弛,我们提出了一种新颖的采样机制,其中采样子集的大小可以大于最小。我们的紧张松弛方案能够快速拒绝样本集中的异常值导致高质量假设。我们进行了广泛的实验,以证明我们的方法优于其他最先进的方法。重要的是,我们提出的方法用作通用框架,可以扩展到已知对应的问题。
translated by 谷歌翻译
多语言翻译的泛化和可靠性通常高度依赖于每种语言兴趣对的可用并行数据量。在本文中,我们将重点放在零射击概括 - 一个具有挑战性的设置上,用于测试他们在训练时尚未优化的平移方向模型。为了解决这个问题,我们(i)将多语言翻译重新定义为概率推理,(ii)定义零射击一致性的概念,并说明为什么标准训练经常导致模型不适合零射击任务,以及(iii)引入一致的基于协议的训练方法,鼓励模型在辅助语言中产生平行句的等效翻译。我们在多个公共零射击基准测试(IWSLT17,UN语料库,Europarl)上测试我们的多语言NMT模型,并表明基于协议的学习通常会导致2-3个BLEU在强基线上的零镜头改进,而在监督翻译方向上没有任何性能损失。
translated by 谷歌翻译
在本文中,我们提出了一种混合深度成像系统,其中通过来自标准数码相机的第二图像来增强非极化相机。对于设备复杂性的这种适度增加而言,与传统的极化相比,我们获得了许多好处,使我们能够克服极化形状线索的长期问题。立体声提示提供深度图,虽然粗糙,但是在度量上是准确的。这被用作使用更高阶图形模型来消除偏振表面或男性估计的歧义的引导表面。反过来,这些用于估计漫反射反照率。通过将先前的从极化形状方法扩展到透视情况,我们展示了如何计算密集,详细的绝对深度图,同时保留线性公式。我们展示了我们的混合方法能够恢复密集的3D几何形状,这种几何形状是优于现有技术的极化形状或仅两个视图立体声。
translated by 谷歌翻译
使用X射线扫描仪进行行李检查现已成为航空安全的常规方法,具有自动威胁检测方法,基于3D X射线计算机断层扫描(CT)图像,在航空安全行业内称为自动威胁识别(ATR)。与对新出现的威胁信号的适应性相比,这些当前策略使用预定义的威胁物质签名。为了解决这个问题,自适应自动威胁识别(AATR)的概念在之前的工作中由\ cite {to7}提出。在本文中,我们提出了一种基于这种X射线CT行李扫描图像的AATR解决方案。这旨在解决在屏幕要求内快速发展的威胁签名的问题。理想地,在这些安全扫描仪内部署的检测算法应该易于适应不同的情况,同时具有不同的威胁特征要求(例如,威胁材料,对象的物理特性)。我们使用一种新颖的自适应机器学习方法来解决这个问题,我们的解决方案包括多尺度3D CT图像分割算法,用于对象材料识别的多类支持向量机(SVM)分类器以及实现方法适应性的策略。在针对AATR研究专门收集的开放和隔离的3D CTbaggage图像数据集上进行实验。我们提出的方法在识别和适应方面都表现良好。总的来说,我们的方法可以实现大约90%的检测概率,概率为低于20%的非警报。我们的AATR显示了适应不同类型材料的能力,甚至是训练数据中没有的未知材料,适应不同的检测概率和适应威胁对象的不同尺度。
translated by 谷歌翻译
无监督域适应旨在将知识从源域转移到目标域,以便可以在没有该域的任何显式标记信息的情况下识别目标域数据。问题设置的一个限制是在训练期间需要从目标域测试数据,尽管没有标签,这阻止了训练模型被直接应用于对看不见的测试实例进行分类。我们制定了一个新的跨领域分类问题,这个问题来自真实世界的情景,其中标记数据可用于目标域中的一个类子集(已知类),并且我们期望识别属于任何类(已知和未见过的类)的新样本。学习模型。这是一个广义的零镜头学习问题,其中辅助信息来自标记样本形式的源域,而不是传统零射击学习中常用的类级语义表示。我们提出了无监督和零射击学习条件的统一域适应框架。我们的方法从源和目标域学习一个联合子空间,以便子空间中两个数据的投影可以是不变的并且易于分离。我们使用监督的局部保留投影(SLPP)作为启用技术,并在无监督和零镜头学习条件下进行实验,在三个域适应基准数据集上实现最先进的结果:Office-Caltech,Office31和Office-Home。
translated by 谷歌翻译
课程学习(CL)受到人类和动物认知过程的启发,通过逐渐增加训练数据的难度来训练模型。在本文中,我们研究CL是否可以应用于复杂的几何问题,如估计单眼视觉测距(VO)。与现有的CLapproaches不同,我们提出了一种新的CL策略,通过在训练过程中逐渐使学习目标更加困难来学习单眼VO的几何学。为此,我们提出了一种新的几何感知目标函数,它通过有界姿态回归损失在小窗口上共同优化相对和复合变换。设计了级联光流网络,其后是具有可微分窗口组合层的复制网络,称为CL-VO,以学习所提出的目标。对三个真实世界数据集的评估显示CL-VO优于基于现有特征和基于学习的VO的优越性能。
translated by 谷歌翻译