由于大数据革命和不断增长的计算能力,人工智能(AI)在过去几年中取得了令人印象深刻的复兴,现在在研究和工业领域都无处不在。创意部门一直是人工智能技术的早期采用者,这种情况一直如此。事实上,最近的技术发展突破了创意应用中智能系统的界限:2016年发布的备受好评的电影“Sunspring”完全是由人工智能技术编写的,也是有史以来第一部名为“Hello World”的音乐专辑,使用人工智能生产的产品已于今年发布。同时,创造性过程的探索性特征为AI提出了重要的技术挑战,例如,在传统的“大数据”方法或者处理,分析和匹配数据的能力下,人工智能技术在有限的数据源下是准确的。从多种形式(文本,声音,图像等)同时进行。本白皮书的目的是了解人工智能的未来技术进步及其对创造性产业日益增长的影响。本文讨论了以下问题:AI在创意产业中的运作方式?它的作用是什么? AI将如何在未来十年内转变创意产业?本白皮书旨在提供关于创意产业中人工智能行为范围的现实视角,提出该技术如何为此类背景下的研究和开发工作做出贡献的愿景,并确定研究和发展挑战。
translated by 谷歌翻译
最近,几何深度学习(GDL)被引入作为计算机辅助疾病分类的新型和多样化框架。 GDL使用患者的信息(例如年龄和性别)来模拟agraph结构中的患者群组关系。利用来自图形信号处理的概念来学习多模态特征的最佳映射,例如,从图像到疾病等级。到目前为止,相关研究已经考虑了在预处理步骤中提取的图像特征。我们假设这种方法可以防止网络优化特征表示,从而在图形网络中实现最佳性能。我们提出了一种新的网络体系结构,该体系结构利用归纳的端到端学习方法进行疾病分类,其中来自CNN和图的过滤器被联合训练。我们针对最先进的感应图网络验证了这种架构,并证明了在改进的MNIST玩具数据集上的显着改进的分类核心,以及在胸部X射线图像数据集上具有更高稳定性的可比较的分类结果。另外,我们解释了图形的结构信息如何影响图像过滤器和特征学习。
translated by 谷歌翻译
许多现实世界的任务表现出丰富的结构,在州空间的不同部分或时间上重复。在这项工作中,我们研究了利用这种重复结构加速和规范学习的可能性。我们从KL正规化的预期奖励目标开始,该目标引入了一个额外的组件,即默认策略。我们不是依赖于固定的默认策略,而是从数据中学习它。但至关重要的是,我们限制默认策略接收的信息量,迫使其学习可重用行为,以帮助策略更快地学习。我们正式化了这一策略,并讨论了与信息瓶颈方法和变分EM算法的联系。我们在离散和连续作用域中提供实证结果,并证明,对于某些任务,在策略旁边学习默认策略可以显着加快和改善学习。
translated by 谷歌翻译
图神经网络(GNN)利用图形拓扑和图形标签的能力是构建判别性节点和图形嵌入的基础。在前面的工作基础上,我们理论上表明edGNN,我们的定向标记图模型,与Weisfeiler - 图同构的Lehman算法一样强大。我们的实验支持我们的理论研究,证实图形神经网络可以有效地用于具有节点和边缘标签的有向图上的参考问题。可从https://github.com/guillaumejaume/edGNN获得代码。
translated by 谷歌翻译
为了创建对光照变化具有鲁棒性的图像分割方法,研究了图像区域的两个新的均匀性标准。两者都是使用对数图像处理(LIP)框架来定义的,该框架的模式模型改变了。第一个标准估计LIP-加性同质性并且基于LIP-加法定律。理论上,由相机曝光时间或源强度的变化引起的不敏感的改变。第二个是LIP乘法同质性标准,它基于LIP乘法定律,并且对由于物体厚度或不透明度的变化引起的变化不敏感。然后将每个标准应用于Revol和Jourlin(1997)区域生长方法,该方法基于图像区域的同质性。因此,区域生长方法对于针对每个标准的照明变化是稳健的。在模拟和真实图像上进行光照变化的实验证明了这些变化的标准的稳健性。与基于imagecomponent-tree的最先进方法相比,我们的方法更加强大。这些结果为许多应用开辟了道路,其中照明是不受控制的或部分受控的。
translated by 谷歌翻译
为了估计由亲和性和两个径向畸变构成的眼底图像的配准模型,我们引入了基于血管之间误差的估计标准。在[1]中,我们通过最小化特征点之间的误差来估计该模型。在本文中,使用从我们的模型推导出的重叠对象的圆和椭圆方程来选择检测到的血管。我们的方法成功地将271对中的96%记录在主要使用不同相机获取的公共卫生数据集中。这比我们以前的方法[1]更好,并且比其他三种最先进的方法更好。在公开可用的数据集上,我们仍然比参考方法更好地注册图像。
translated by 谷歌翻译
为了监测复杂基础设施(例如航空器,运输或能源网络)的行为,部署了高速率传感器以准连续时间捕获多变量数据,通常是未标记的,以便快速检测可能危及平稳运行的异常现象。感兴趣的系统。对这种功能性质量数据的统计分析提出了许多具有挑战性的方法论问题。本文的主要目标是将最初专用于有限维观测的流行隔离森林(IF)方法扩展到功能数据。主要困难在于各种各样的拓扑结构,这些拓扑结构可以配备一系列功能,以及可以表征异常曲线的多种模式。我们以灵活的方式解决(随机)分割功能空间的问题,以便逐步隔离任何轨迹,这是算法效率的关键因素。除了算法的详细描述之外,还详细研究了计算复杂性和稳定性问题。根据所提出的IF算法变体提供的观测异常程度的评分函数,定义并讨论了Functional StatisticalDepth函数以及多变量函数扩展。数值实验为所提出的扩展的准确性提供了强有力的经验证据。
translated by 谷歌翻译
Bernstein-von Mises结果(BvM)证明拉普拉斯近似在大数据极限中是偶然正确的。然而,这些结果对于计算目的来说是不合适的,因为它们仅保留大多数数据集,而不是所有数据集并且涉及难以估计的常数。在这篇文章中,我提出了一个新的BvM定理,它定义了固定对数凹密度$ f \ left(\ boldsymbol {\ theta} \ right)$和它的拉普拉斯近似之间的Kullback-Leibler(KL)偏差。由于$ f \ left(\ boldsymbol {\ theta} \ right)$的高阶导数趋向于$ 0 $和$ f \ left(\ boldsymbol {\ theta} \ right)$变得越来越高斯,因此界限变为$ 0 $ 。 IID大数据渐近线中的经典BvM定理作为参数被恢复。关键的是,这个定理进一步表明了KL分歧的一些可计算的近似,最有希望的是:\ [KL \ left(g_ {LAP},f \ right)\ approx \ frac {1} {2} \ text {Var} _ {\ boldsymbol {\ THETA} \ SIMG \左(\ boldsymbol {\ THETA} \右)} \左(\ LOG \左侧的[f \左(\ boldsymbol {\ THETA} \右)\右] - \日志\ left [g_ {LAP} \ left(\ boldsymbol {\ theta} \ right)\ right] \ right)\]对逻辑分类模型中这些界限的实证研究表明,这些近似值是KL发散的重要替代指标。该结果和类似性质的未来结果可以提供由于拉普拉斯近似和更现代的近似方法而严格控制误差的路径。
translated by 谷歌翻译
无人监督的人员重新识别(Re-ID)方法包括使用经过仔细标记的源数据集进行训练,然后对未标记的目标数据集进行推广,即人员身份信息不可用。受域调整技术的启发,这些方法避免了代价高昂,繁琐且经常难以承受的贴标签过程。本文研究了摄像机索引信息的使用,即哪个摄像机捕获了哪个图像,用于监督人员Re-ID。更准确地说,受领域适应对抗方法的启发,我们开发了一个对抗框架,其中特征提取器的输出应该对人Re-ID有用,同时应该欺骗相机鉴别器。我们将所提出的方法称为摄像机对偶传输(CAT)。我们评估对抗性变体,以及每种变体实现的相机稳健性。我们报告了交叉数据集ReIDperformance,我们将我们的方法的变体与几种最先进的方法进行比较,从而表明了在无人监督的人Re-ID的对抗框架内利用相机索引信息的兴趣。
translated by 谷歌翻译
最近在强化学习(RL)社区取得的突破在学习和部署真实世界机器人系统的政策方面取得了显着进展。然而,即使使用当前最先进的算法和计算资源,这些算法仍然受到高样本复杂性的困扰,因此训练时间长,特别是对于高自由度(DOF)系统。新兴政策缺乏可靠的稳定性或稳健性保证也引起了人们的担忧。本文旨在通过以下方式减轻这些缺点:(1)用一个简单的复杂,高DOF系统建模,(2)明确使用正向和反向运动而不强迫RL算法自己“学习”它们,(3)学习笛卡尔空间中的运动政策而不是联合空间。在本文中,这些方法适用于JPL的Robosimian,但可以很容易地在具有基础和末端效应器的任何系统上使用。这些运动政策可以在几分钟内完成,并在一台笔记本电脑上进行培训。我们将得到的学习策略的鲁棒性与其他控制方法的结果进行了比较。本文附带的视频可以在http://youtu.be/xDxxSw5ahnc找到。
translated by 谷歌翻译