随着机器人和其他智能代理从简单的环境和问题转移到更复杂的非结构化设置,手动编程他们的行为变得越来越具有挑战性和昂贵。通常,教师更容易展示所需的行为,而不是尝试手动启动它。这种从示范中学习的过程,以及算法的研究,被称为模仿学习。这项工作提供了模仿学习的介绍。它涵盖了基本的假设,方法以及它们之间的关系;为解决问题而开发的丰富算法集;关于有效工具和实施的建议。我们打算将本文服务于两个受众。首先,我们希望机器学习专家能够熟悉模仿学习的挑战,尤其是机器人技术的挑战,以及它与更熟悉的框架(如统计监督学习理论和强化学习)之间有趣的理论和实践区别。其次,我们希望应用人工智能中的神经病学家和专家对模仿学习的框架和工具有广泛的了解。
translated by 谷歌翻译
到目前为止,已经进行了许多研究以建立用于推荐时尚物品和服装的系统。尽管他们在各自的任务中取得了良好的表现,但他们中的大多数都无法向用户解释他们的判断,从而影响了他们的实用性。对于可解释的时尚推荐,这项研究提出了一个系统,它不仅能够为装备提供良好的分数,而且能够通过提供背后的理由来解释分数。为此,我们提出了一种方法,用于量化每个项目的每个特征对分数的影响程度。使用这种影响力值,我们可以确定哪个项目和哪些特征使装备好或坏。我们用人类可解释的特征组合表示每个项目的图像,从而对最有影响力的项目 - 特征对的识别给出了输出得分的使用复合计划。为了评估这种方法的性能,我们设计了一个可以在没有人类注释的情况下进行的实验;在装备中放置单个项目 - 特征对,以便得分减少,然后我们测试所提出的方法是否可以使用上述影响值正确地检测被替换的项目。实验结果表明,该方法能够准确地检测降低机芯的不良物品。
translated by 谷歌翻译
本文提出了一种用模糊时间戳建模事件序列的方法,这是一种时间折扣卷积。与普通时间序列不同,时间间隔不是恒定的,小的时移没有显着的影响,并且将时间戳或持续时间输入到模型中是无效的。我们建模所需的标准是提供针对时间变化或时间戳不确定性的稳健性以及维持时间序列模型的基本能力,即忘记无意义的过去信息和处理无限序列。所提出的方法使用具有特定参数化的时间卷积机制来处理它们,其有效地表示时移不变量中的事件依赖性,同时折扣过去事件的影响,以及动态池化机制,其提供针对时间戳中的不确定性的鲁棒性并且增强时间。 -discounting功能通过动态更改池窗口大小。在我们的学习算法中,衰减和动态池化机制在处理无限长度和可变长度序列中起着关键作用。对具有模糊时间戳和普通时间序列的真实世界事件序列的数值实验证明了我们的方法的优点。
translated by 谷歌翻译
到目前为止,已经进行了许多关于图像恢复的研究,即从其扭曲版本中恢复清晰图像的问题。有许多不同类型的失真会影响图像质量。以前的研究集中在单一类型的变形上,提出了去除它们的方法。但是,由于现实世界中的多种因素,图像质量下降。因此,取决于应用,例如自动驾驶汽车或监视摄像机的视觉,我们需要能够处理具有未知混合比的多个组合失真。为此,我们提出了一种简单而有效的神经网络层结构。它以并行方式执行多个操作,这些操作由注意机制加权,以便根据输入选择适当的操作。该层可以堆叠形成陡峭的网络,这是可区分的,因此可以通过梯度下降以端到端的方式进行训练。实验结果表明,所提出的方法比以前的方法更好地利用多个组合失真的图像恢复任务。
translated by 谷歌翻译
构建一个能够执行人类视觉和语言任务的人工智能系统仍然具有挑战性。到目前为止,研究人员已经分别单独列出了各个任务,他们为每个任务设计了网络,并在其专用数据集上对其进行了训练。虽然这种方法取得了一定程度的成功,但它难以理解不同任务之间的关系,并将学到的知识转移给其他人。我们提出了一种多任务学习方法,该方法能够学习视觉语言表示,这些表示由来自其多样化的任务的许多任务共享。表示是分层的,每个任务的预测都是从层次结构的相应级别的表示中计算出来的。我们通过实验证明,我们的方法在图像标题检索,视觉问题转换和视觉基础方面始终优于单一任务学习方法。我们还通过可视化在我们的网络中生成的注意力图来分析学习的层次表示。
translated by 谷歌翻译
本文提出了一种使用深度神经网络直接从线性全息图进行粒子体积重建的方法。数字全息体积重建通常使用多次衍射计算从在线全息图获得截面重构图像,然后通过使用焦点度量来检测侧面和轴向位置以及粒子的大小。然而,轴向分辨率受到数值孔径的限制。光学系统,这些过程非常耗时。这里提出的方法可以同时检测横向和轴向位置,并通过深度神经网络(DNN)进行粒子化。我们用数字方式研究了DNN在检测到的位置和尺寸误差方面的性能。计算时间比传统的基于衍射的方法快。
translated by 谷歌翻译
情绪对人类智能非常重要。例如,情绪与内部身体状态和外部刺激的评估密切相关。这有助于我们快速响应环境。人类智能中另一个重要的角色是情绪在决策中的作用。此外,情绪的社会方面也非常重要。因此,如果阐明情绪的机制,我们就可以朝着对自然智慧的本质理解前进。在这项研究中,提出了一种模式的情绪,通过计算模型阐明情绪的机制。此外,从伙伴机器人的角度来看,情感模型可以帮助我们建立能够对人类产生共鸣的机器人。为了理解和同情人们的感受,机器人需要拥有自己的情感。这可能允许机器人在人类社会中被接受。所提出的模型使用由三个模块组成的深度神经网络实现,这三个模块彼此相互作用。仿真结果表明,所提出的模型表现出合理的行为作为情感的基本机制。
translated by 谷歌翻译
A unified method for extracting geometric shape features from binary image data using a steady state partial differential equation (PDE) system as a boundary value problem is presented in this paper. The PDE and functions are formulated to extract the thickness, orientation, and skeleton simultaneously. The main advantages of the proposed method is that the orientation is defined without derivatives and thickness computation is not imposed a topological constraint on the target shape. A one-dimensional analytical solution is provided to validate the proposed method. In addition, two and three-dimensional numerical examples are presented to confirm the usefulness of the proposed method.
translated by 谷歌翻译
本文介绍了一种基于全自动图谱的胰腺分割方法,该方法利用基于3D完全卷积网络(FCN)特征的胰腺定位从CT体积中提取。胰腺的分割是困难的,因为它具有比其他器官更大的患者间空间变异。先前的胰腺分割方法未能处理这种变化。我们提出了一种全自动胰腺分割方法,该方法包含非定位和分割。由于胰腺与许多其他器官相邻,其位置和大小与周围的位置密切相关。我们通过回归森林估计来自全球特征的胰腺(局部)的位置和大小。作为全局特征,我们使用强度差异和3D FCN深度学习功能,其中包括自动提取的分割基本功能。我们从经过训练的3D U-Net中选择了3D FCN功能,这些功能经过训练可以执行多器官分割。全局特征包括胰腺和周围器官信息。定位后,进行患者特异性基于概率图谱的胰腺分类。在146个CT体积的评估结果中,实现了Jaccard指数的60.6%和Dice重叠的73.9%。
translated by 谷歌翻译
本文提出了一种结肠变形估计方法,可用于估计结肠镜插入期间的结肠变形。需要在结肠镜插入期间导航医生到息肉位置的结肠镜跟踪或导航系统以减少诸如结肠穿孔的并发症。先前的结肠镜跟踪方法通过注册结肠镜形状和冒号形状来获得结肠中的结肠镜位置。使用电磁传感器获得组合镜形状,并且从CT体积获得结肠形状。然而,由于在结肠镜插入期间发生结肠变形,观察到大的跟踪误差。这种变形使登记变得困难。由于结肠变形是由结肠镜引起的,因此结肠镜形状与结肠镜形状之间存在很强的关系。在结肠镜插入期间发生的结肠的估计方法对于减少跟踪误差是必要的。我们提出了一种结肠变形估计方法。该方法用于估计结肠镜形状的变形结肠形状。我们使用回归森林算法来估计变形的结肠形状。使用成对的结肠和结肠镜形状训练回归森林算法,其包括在结肠镜插入期间发生的变形。作为初步研究,我们利用该方法估计结肠体模的变形。在我们的实验中,所提出的方法正确地估计了变形的结肠幻影形状。
translated by 谷歌翻译