由于大数据革命和不断增长的计算能力,人工智能(AI)在过去几年中取得了令人印象深刻的复兴,现在在研究和工业领域都无处不在。创意部门一直是人工智能技术的早期采用者,这种情况一直如此。事实上,最近的技术发展突破了创意应用中智能系统的界限:2016年发布的备受好评的电影“Sunspring”完全是由人工智能技术编写的,也是有史以来第一部名为“Hello World”的音乐专辑,使用人工智能生产的产品已于今年发布。同时,创造性过程的探索性特征为AI提出了重要的技术挑战,例如,在传统的“大数据”方法或者处理,分析和匹配数据的能力下,人工智能技术在有限的数据源下是准确的。从多种形式(文本,声音,图像等)同时进行。本白皮书的目的是了解人工智能的未来技术进步及其对创造性产业日益增长的影响。本文讨论了以下问题:AI在创意产业中的运作方式?它的作用是什么? AI将如何在未来十年内转变创意产业?本白皮书旨在提供关于创意产业中人工智能行为范围的现实视角,提出该技术如何为此类背景下的研究和开发工作做出贡献的愿景,并确定研究和发展挑战。
translated by 谷歌翻译
我们提出了一个深度网络,可以训练解决图像重建和分类问题,涉及检测多个对象实例,而无需对其行踪进行任何监督。网络可以提取最重要的top-K补丁,并将这些补丁提供给特定任务的网络 - 例如自动编码器或分类器 - 以解决特定于域的问题。培训这种网络的挑战是可区分的顶级K选择过程。为了解决这个问题,我们通过将top-K选择的结果视为aslack变量来解除训练优化问题,从而产生简单但有效的多阶段训练。我们的方法能够学习通过学习重建图像来检测训练数据集中的复发结构。当只提供关于对象出现的知识时,它还可以学习本地化结构,并且在这方面它优于最先进的技术。
translated by 谷歌翻译
我们介绍了一种新颖的文本表示形式,它保留了文档的2D布局。这是通过将每个文档页面编码为二维网格字符来实现的。基于此表示,我们提供了结构化文档的通用文档理解管道。该管道使用完全卷积编码器 - 解码器网络来预测分段掩码和边界框。我们通过发票展示其在信息提取任务方面的能力,并表明它基于顺序文本或文档图像显着优于方法。
translated by 谷歌翻译
本文提出了一种新的交通事故分析数据集。我们的目标是解决道路交通安全自动时空注释研究缺乏公共数据。我们的车祸检测和预测(CADP)数据集包括从YouTube收集的1,416个视频片段,其中205个视频片段具有完整的时空韵律注释。据我们所知,与相关数据集相比,我们的数据集在交通事故数量方面最大。通过对所提出的数据集的分析,由于场景的对象大小和复杂性,我们在数据集中观察到行人类别中物体检测的显着退化。为此,我们建议使用上下文挖掘(CM)和语音上下文挖掘(ACM)将上下文信息整合到传统的快速R-CNN中,以补充小型行人检测的准确性。我们的实验表明物体检测准确度有了相当大的提高:CM为+ 8.51%,ACM为+6.20%。对于人(行人)类别,我们观察到显着改善:与快速R-CNN相比,CM为+ 46.45%,ACM为45.22%。最后,我们使用更快的R-CNN和事故LSTM架构,在我们的数据集中演示了事故预测的性能。我们在时间到事故测量方面平均达到1.359秒,平均精度为47.36%。我们的论文网页是https://goo.gl/cqK2wE
translated by 谷歌翻译
在对空间X定义的实函数的监督学习的框架中,所谓的Kriging方法站在X上定义的真实高斯场上。欧几里德案例是众所周知的并且已被广泛研究。在本文中,我们探讨了较不经典的情况,其中X是非交换的排列有限群。在此设置中,我们提出并研究协方差算子的协调分析,以便考虑高斯过程模型和预测问题。我们的理论是由统计问题引发的。
translated by 谷歌翻译