我们提出了一种基于注意力的方法,该方法将局部图像特征聚合到主题级表示以预测疾病严重性。与需要固定维度输入的经典深度学习相比,我们的方法在一组图像补丁上运行;因此它可以容纳可变长度输入图像而无需调整图像大小。该模型学习临床解释的主题水平表示,反映疾病的严重程度。我们的模型由三个相互依赖的模块组成,这些模块相互调节:(1)一个辨别网络,它从局部特征中学习固定长度的表示,并将它们映射到疾病严重程度; (2)通过关注对预测任务贡献最大的解剖学区域来提供可解释性的注意机制; (3)生成网络可以促进当地潜在特征的多样性。生成的关键是注意力量是非退化的,同时保持局部区域与疾病严重程度的相关性。我们在慢性阻塞性肺病(COPD)的大规模肺CT研究中训练我们的模式到终点。我们的模型为预测COPD严重程度的临床指标提供了最先进的性能。注意力的分布提供了肺组织与临床测量的区域相关性。
translated by 谷歌翻译
常识知识关系对于高级NLU任务至关重要。我们检查CONCEPTNET中表示的这种关系的可学习性,考虑到它们的特定属性,这可以使关系分类变得困难:给定的概念对可以通过多种关系类型链接,并且关系可以具有不同语义类型的多字参数。我们探索了一种开放世界的多标签分类方法,该方法侧重于评估个体关系的分类准确性。在深入研究CONCEPTNET资源的特定属性的基础上,我们研究了不同关系表示和模型变化的影响。我们的分析表明,论证类型的复杂性和相关模糊性是要解决的最重要的挑战。我们设计了自定义评估方法,以解决在未来工作中可以扩展的资源的不完整性。
translated by 谷歌翻译
由于高计算需求,执行高参数优化(HPO)方法之间的严格比较通常是麻烦的。本文的目标是通过提供评估便宜但仍代表实际用例的基准,促进对HPO方法的更好的实证评估。我们相信这些基准测试提供了一种简单有效的方法,可用于神经超参数搜索的可重复实验。 Ourbenchmarks包含四个不同回归数据集的前馈神经网络的大型网格配置,包括有关训练管道的架构超参数和超参数。基于这些数据,我们进行了深入分析,以更好地理解优化问题的属性,以及不同类型的超参数的重要性。其次,我们在性能和鲁棒性方面详尽地比较了这些基准上的超参数优化文献中的各种不同的最新方法。
translated by 谷歌翻译
强化学习(RL)能够通过解决自主管理无固定,资源受限设置的问题来管理无线,能量收集物联网节点。我们表明,RL的最先进的政策梯度方法适用于IoT域,并且它们优于以前的方法。由于具有模拟连续观察和动作空间的能力,以及改进的功能近似能力,新方法能够解决更难的问题,允许奖励功能更好地与实际应用目标一致。我们展示了这样的奖励功能,并使用策略梯度方法容忍有能力的策略,导致更适合物联网节点的行为,无需手动设计工作,提高了物联网的自治水平。
translated by 谷歌翻译
人工智能(AI)应用程序被用于预测和评估多个领域的行为,例如刑事司法和消费者财务,这直接影响人类福祉。但是,如果AI是为了改善人们的生活,那么人们必须能够信任AI,这意味着能够理解系统正在做什么以及为什么。尽管在这种情况下透明度通常被视为要求,但实际上它可能并不总是可行的或可取的,而确保系统在设定的道德范围内运行的需要仍然存在。在本文中,我们提出了一种方法,在监测其输入和输出的基础上,评估人工智能系统的道德界限。我们通过将道德价值映射到限制输入和输出的明确可验证规范,在系统周围放置一个“玻璃盒子”,这样如果这些仍然在框内,我们可以保证系统坚持价值。对输入和输出的关注允许对完全不同的智能系统进行验证和比较;来自深度神经网络的基于代理的系统。将抽象道德价值观明确转化为具体规范,在可解释性方面带来了巨大的好处;利益相关者确切地知道该制度如何解释和运用相关的抽象道德人类价值并相应地校准他们的信任。此外,通过在更高级别操作,我们可以检查系统是否符合相同值的不同解释。这些优势将对人工智能系统用户的福祉产生影响,建立他们的信任并为他们提供有关系统如何遵守道德价值观的具体知识。
translated by 谷歌翻译
在室外环境中捕获的图像质量会受到诸如雾,灰尘和其他粒子的大气散射等极端天气条件的影响。此问题可能会给图像分割和对象检测等高级计算机视觉任务带来额外挑战。然而,之前关于图像去雾的研究遭受了巨大的计算工作量和原始图像的损坏,例如过饱和和晕圈。在本文中,我们提出了一种基于雾度图像和正则化优化的光学模型的新型图像去雾方法。具体而言,我们通过估计大气光常数将关于未知无雾图像和光传输分布的凸 - 双凸问题转换为凸的线性优化问题。通过引入多级Haar小波变换进一步加速了我们的方法。相反,优化应用于原始图像的低频子带分解。这种尺寸减小显着提高了我们方法的处理速度,并展示了实时应用的潜力。实验结果表明,我们的方法优于图像重建质量和计算效率的最先进的去雾算法。有关实现的详细信息,源代码可以通过http://github.com/JiaxiHe/Image-and-Video-Dehazing公开访问。
translated by 谷歌翻译
抽象意义表示(AMR)将句子表示为有向,非循环和有根图形,旨在以机器可读格式捕获它们的含义。 AMR解析将自然语言句子转换为此类图形。但是,通过与手动创建的AMR图形进行比较来评估新数据的解析器是非常昂贵的。此外,我们希望能够检测质量有问题的解析,或者通过选择我们可以评估优质的替代系统的结果来选择替代系统的结果。我们建议将AMR准确度预测作为预测自动生成的AMR解析的几个正确性度量的任务 - 在没有相应的黄金解析的情况下。我们开发了一个神经端到端多输出回归模型,并进行了三个案例研究:首先,我们评估了模型预测AMR解析精度的能力,并测试它是否可以为黄金解析分配高分。其次,我们基于预测的候选解析系统的解析精度进行解析选择,目的是改善整体结果。最后,根据他们预测的解析准确度平均值,对两个AMR共享任务的提交进行系统排序。所有实验都是在两个不同的领域进行的,并表明我们的方法是有效的。
translated by 谷歌翻译
最近的研究表明,视觉语境改善了名词的跨语言感知。我们将这一系列工作扩展到更具挑战性的跨语言动词消歧歧义,介绍了用英语,德语和西班牙语动词注释的9,504张图像的MultiSensedataset。 MultiSense中的每个图像都标有英文动词及其在德语或西班牙语中的翻译。我们表明,与单峰基线相比,跨语言动词感消歧模型可以从视觉上下文中获益。我们还表明,当用于多模式翻译任务时,我们最好的消歧模型预测的动词感可以改善纯文本机器翻译系统的结果。
translated by 谷歌翻译
基于端到端,自回归模型的TTS已经显示出优于传统的TTS的显着性能改进。然而,自回归模块训练受到暴露偏差或实际数据和预测数据的不同分布之间的不匹配的影响。虽然实际数据在培训中可用,但在测试中,只有预测数据可用于提供自回归模块。通过在训练中引入实际和生成的数据序列,我们可以减轻暴露偏差的影响。我们建议使用Generative Adversarial Network(GAN)以及教授强制训练的关键思想。 GAN中的鉴别器被联合训练以使真实数据和预测数据之间的差异均衡。在AB主观测试中,结果表明新方法优于标准转移学习,CMOS改进为0.1。句子水平可懂度测试显示病理学测试集显着改善.GAN训练的新模型也比基线更稳定,以产生更好的Tacotron输出比对。
translated by 谷歌翻译
可以直接从给定的字素或音素序列预测语音的端到端TTS已经表现出比传统TTS更好的性能。然而,其预测能力仍然受到训练数据的声学/语音覆盖的限制,通常受到训练集大小的约束。为了进一步提高发音,韵律和感知自然度的TTS质量,我们建议利用嵌入在句法解析树中的信息,其中句子的词组间/词语信息在多级树结构中组织。具体来说,研究了两个关键特征:短语结构和相邻词之间的关系。在三个测试集上测量的主观听力的实验结果表明,所提出的方法有效地提高了基线合成语音的发音清晰度,韵律和自然度。系统。
translated by 谷歌翻译