深度学习,大量注释数据和越来越强大的硬件的突出使得有可能在监督分类任务中达到显着的性能,在许多情况下使训练集饱和。然而,由于至少有三个原因,将学习的分类调整到新的领域仍然是一个难题:(1)领域和任务可能大不相同; (2)新域上可能存在非常有限的注释数据量;(3)由于deepnetworks参数的剪切数,每个新任务的新模型的完全训练在内存方面是禁止的。相反,新任务应该逐步学习,建立在已经学过的任务的预知基础之上,并且没有灾难性的遗忘,即不会损害先前任务的表现。据我们所知,本文提出了第一种多域/任务学习方法,无需使用完全张量化的体系结构进行灾难性的遗忘。我们的主要贡献是多域学习的方法,其将CNN内的相同结构块的组建模为高阶张量。我们证明了这种联合模式自然地利用了不同层之间的相关性,并且导致每个新任务/域比以前的方法更紧凑的表示,这些方法专注于分别调整每个层。我们将所提出的方法应用于视觉十项全能挑战赛的10个数据集,并表明我们的方法在分类准确度和迪卡侬评分方面平均提供约7.5倍的参数数量和优异的性能。特别是,我们的方法优于Visual DecathlonChallenge的所有先前工作。
translated by 谷歌翻译
强化学习(RL)是关于顺序决策的,并且传统上反对监督学习(SL)和无监督学习(USL)。在RL中,在给定当前状态的情况下,代理做出可能影响下一个状态而不是SL(和USL)的决定,其中下一个状态保持不变,无论采取何种决策,无论是批量还是在线学习。虽然这种差异在SL和RL之间是基本的,但是有一些被忽视的联系。特别是,我们在这个例子中证明了梯度策略方法可以被转换为监督学习问题,其中标签被替换为折扣奖励。我们提供了一个新的政策梯度方法证明(PGM),强调与交叉熵和监督学习的紧密联系。我们提供了一个简单的实验,其中我们交换标签和伪奖励。我们得出结论,如果我们明智地修改奖励函数,则可以与SL建立其他关系。
translated by 谷歌翻译
为了诊断黑素瘤,苏木精和曙红(H&E)染色的组织切片仍然是金标准。这些图像包含无关放大的定量信息。在本研究中,我们研究了深层卷积神经网络是否能够以修补的方式直接从这些大尺寸图像中提取互补文本的结构特征。为了应对组织病理学滑体形态多样性带来的挑战,我们建立了一个多中心数据库,包括来自2008年至2018年的132名患者的2241个数字全幻灯片图像。我们通过转移学习和测试性能,使用超过995万个补丁训练ResNet50和Vgg19两种关键分类:恶性黑色素瘤与良性痣不相关和混合放大;并在最大放大率中区分痣。 CNN在两个任务中都实现了卓越的性能,证明了能够根据病理学图像分析皮肤癌的AI。为了使分类合理,CNN表示的可视化还用于识别黑素瘤和痣之间的细胞。感兴趣的区域(ROI)也位于显着有用的位置,为病理学家提供了更多正确诊断的支持。
translated by 谷歌翻译
在这项工作中,提出了一个进化艺术项目,其中图像区域通过不同类型的透明,重叠和几何形状(例如,多边形,圆形,线条)进行近似。表示几何形状的特征和顺序的基因型利用适应度函数进化,该适应度函数具有输入图像的相应像素作为目标目标。因此,将基因型 - 表型作图应用于渲染图像,因为选择的遗传表示是间接的,即基因型不包括像素,而是形状与其性质的组合。形状,形状数量,突变类型和种群的不同组合进行了测试。这里的工作目标有两个:(1)用进化的间接编码尽可能精确地近似图像,(2)产生视觉上吸引人的结果和新颖的艺术风格。
translated by 谷歌翻译
社交媒体提供了丰富的有价值的原始数据来源,但是,非正式写作很快就会成为许多自然语言处理(NLP)任务的瓶颈。现成的工具通常通过正式文本进行培训,并且能够明确地处理短期在线帖子中发现的噪音。此外,各种不经常发生的语言变异带来了一些挑战,即使对于那些可能无法理解这些帖子的含义的人来说,尤其是当它们包含俚语和缩写时。文本规范化旨在将在线用户生成的文本转换为规范形式。当前的文本标准化系统依赖于以本地方式工作的字符串或语音相似性和分类模型。我们认为处理上下文信息对于该任务是至关重要的,并且引入了社交媒体文本标准化混合字词 - 基于关注的编码器 - 解码器模型,其可以用作NLP应用的预处理步骤以适应社交媒体中的噪声文本。我们基于字符的组件在合成对象示例上进行了训练,这些示例旨在捕获在用户生成的在线文本中常见的错误。实验表明,我们的模型超越了为文本规范化设计的neuralarchitectures,并实现了与最先进相关工作的可比性。
translated by 谷歌翻译
量子断层摄影术目前无处不在,用于测试量子信息处理设备的任何实现。从测量数据中分离和处理重建的各种复杂程序得到了很好的发展,并且得益于描述状态准备和测量装置的模型的精确知识。然而,物理模型受到内在限制,因为实际测量操作符和试验状态不能精确地知道。这种情况不可避免地导致状态准备和测量(SPAM)错误降低重建性能。在这里,我们开发实验性地实现基于机器学习的协议,减少SPAMerrors。我们训练了一个监督神经网络来过滤实验数据,从而揭示了表征原始状态的测量概率和没有SPAM误差的理想实验装置的显着模式。我们将神经网络状态重建协议与通过过程层析成像处理SPAM错误的协议以及具有理想化测量的SPAM不可知协议进行了比较。平均重建保真度显示分别增强10%和27%。所提出的方法适用于依赖于图像的大量量子实验。
translated by 谷歌翻译
对话是交换信息的有效方式,但细微的细节和资金非常重要。虽然重大进展为使用算法进行视觉对话铺平了道路,但细节和细微差别仍然是一个挑战。注意机制已经证明了提取细节隐形问题答案的引人注目的结果,并且由于其可解释性和有效性而为视觉对话提供了令人信服的框架。然而,伴随视觉对话的许多数据都挑战了现有的注意技术。我们解决了这个问题,并开发了visualdialog的一般注意机制,可以在任意数量的数据工具上运行。为此,我们设计了一个基于因子图的注意机制,它结合了任意数量的效用表示。我们说明了所提出的方法对具有挑战性和最近引入的VisDial数据集的适用性,在VisDial0.9中表现优于最近的最新方法1.1%,在VisRial1.0 onMRR上表现优于2%。我们的集合模型将VisDial1.0的MRR得分提高了6%以上。
translated by 谷歌翻译
协作是执行超出oneagent功能的任务的必要技能。广泛应用于传统和现代AI,多代理协作通常在简单的网格世界中进行研究。我们认为合作存在固有的视觉方面,应该在视觉丰富的环境中进行研究。一个关键的元素合作是通过显式,通过消息或隐式,通过对其他代理和视觉世界的感知来进行的交流。学习在视觉环境中进行协作需要学习(1)执行任务,(2)何时和沟通的内容,以及(3)如何根据这些沟通和视觉世界的感知采取行动。在本文中,我们研究了在AI2-THOR中学习直接从像素协作的问题,并展示了显式和隐式通信模式对于执行视觉任务的好处。有关更多详细信息,请参阅我们的项目页面:https://prior.allenai.org/projects/two-body-problem
translated by 谷歌翻译
我们研究了关系图注意网络,这是一类利用非关系图关注机制来结合关系信息的模型,将这些方法应用于更广泛的问题。对这些模型进行了充分的评估,并且对已建立的基准进行了比较。为了提供有意义的比较,我们重新训练关系图形卷积网络,即关系图注意网络的光谱对应物,并在相同条件下对它们进行评估。我们发现关系图注意网络的性能比预期的要差,尽管有些配置对分子特性建模有一定的帮助。我们提供了为什么会这样做的见解,并建议评估策略的修改,以及调查未来工作的方向。
translated by 谷歌翻译
在本文中,我们提出了一种针对低功率汽车级SoC优化的多任务卷积神经网络(CNN)架构。我们介绍了基于统一架构的网络,其中编码器在两个任务之间共享,即检测和分段。提议的网络运行速度为25FPS,分辨率为1280x800。我们简要讨论了用于优化网络架构的方法,例如直接使用原生YUV图像,优化图层和特征图以及应用量化。我们还在设计中关注内存带宽,因为卷积是数据密集型的,大多数SOC都是带宽瓶颈。然后,我们展示了我们提出的专用CNN加速器网络的效率,该加速器为从硬件执行和相应的运行时间获得的检测和分段任务提供关键性能指标(KPI)。
translated by 谷歌翻译