许多感兴趣的活动都是罕见的事件,只有少数标记的例子可用。因此,期望能够从几个示例中容忍的用于时间活动检测的模型。在本文中,我们提出了几乎简单和一般但新颖的几拍时间性检测框架,它检测未修剪视频中的少数输入活动的开始和结束时间。我们的模型是端到端的可训练的,可以从更多的几个例子中受益。在测试时,为每个提议分配与最大相似度得分相对应的少数活动类别的标签。我们的相似性R-C3D方法在几次拍摄设置中优于之前关于时间活动检测的三个基准测试(THUMOS14,ActivityNet1.2和ActivityNet1.3数据集)的工作。我们的代码将可用。
translated by 谷歌翻译
这项工作旨在解决具有挑战性的几个镜头对象检测问题,其中只有少数带注释的示例可用于每个对象类别以构建检测模型。这种从少数例子中学习检测物体的能力对于人类视觉系统来说是常见的,但对于计算机视觉系统来说仍然不存在。尽管少数元学习提供了一种promisingsolution技术,但以前的工作主要针对图像分类的任务,并不直接适用于更复杂的对象检测任务。在这项工作中,我们提出了一种新颖的基于元学习的模型,该模型具有精心设计的架构,包括元模型和基础检测模型。基础检测模型在几个基类上进行训练,并提供足够的样本以提供基本特征。元模型被训练为从输入图像的基础检测模型重新加权特征的重要性,并且通过少数示例来适应这些特征以辅助新颖的对象检测。元模型重量轻,端到端可训练,并且能够使基本模型具有快速检测新物体的能力。通过实验,我们证明了我们的模型可以通过在多个数据集和设置上进行少数对象检测的大数据来优于基线。我们的模型也表现出对新颖的几次射击类的快速适应速度。
translated by 谷歌翻译
我们在最近普及的分散执行(CTDE)制度的集中培训中探索基于价值的多智能体强化学习(MARL)任务解决方案。然而,VDN和QMIX是代表性的例子,它将联合行动 - 价值函数的因子分解为分散执行的个体化。 VDN和QMIX仅解决可分解的MARL任务的分数,因为它们在诸如可加性和单调性之类的因素中具有结构约束。在本文中,我们提出了一种新的MARL分解方法,即QTRAN,它没有这种结构约束,并采用了一种新的方法将原始的联合作用 - 值函数转换为易于分解的函数,具有相同的优化。 QTRAN保证比VDN或QMIX更通用的因子分解,因此比以前的方法覆盖了更广泛的MARL任务类。多域Gaussian-squeeze和modifiedpredator-prey任务的Ourexperiments展示了QTRAN在游戏中的特殊大规模优越性能,其收益更加积极地惩罚非合作行为。
translated by 谷歌翻译
信用评分无处不在,对贷款提供商和监管机构起着重要作用。在本文中,我们展示了如何在实际环境中开发小额贷款信用系统。我们展示了出现的挑战并讨论了解决方案。特别是,我们关注模型的可解释性和数据质量。最后,我们介绍了有助于模型开发和评估其性能的半监督算法。
translated by 谷歌翻译
人工智能(AI)技术的进步使得可以从现有地图或其他视觉中学习风格设计标准,并转移这些风格以制作新的数字地图。在本文中,我们提出了一种新的框架,使用AI进行地图样式转换,适用于多个地图尺度。具体来说,我们通过两个生成性对抗网络(GAN)模型识别并从一组目标视觉示例(包括Google Maps,OpenStreetMap和艺术绘画)将设计元素转移到未经校正的GIS矢量数据。然后,我们基于深度卷积神经网络训练二元分类器,以评估转移风格的地图图像是否保留了原始地图设计特征。我们的实验结果表明,GAN具有很大的多尺度地图样式转移潜力,但仍存在许多挑战,需要进一步研究。
translated by 谷歌翻译
大数据的出现使我们能够通过应用情感计算从统计角度评估各种人类情感。在这项研究中,提出了一种从不同地方的大规模地理参考照片中提取人类情感的新框架。在基于用户生成的足迹收集的社交媒体网站的空间聚类构建之后,利用在线认知服务利用最先进的计算机视觉技术从面部表情中提取人文动机。并且定义了两个幸福指标用于测量不同地方的人文情绪。为了验证该框架的可行性,以世界各地的80个旅游景点为例,以及根据600多万张照片中检测到的超过200万张面孔的人类情感,生成幸福的地方列表。通过考虑不同类型的地理环境,找出人类情感与环境因素之间的关系。结果表明,不同地方的大部分情感变异可以用一些因素来解释,比如开放性。该研究可以提供关于整合人类情感的见解,以丰富对地理和地方GIS中的地方感的理解。
translated by 谷歌翻译
我们研究了不同扰动类型之间的深度神经网络的对抗鲁棒性的转移。虽然大多数关于对抗性实例的工作都集中在$ L_ \ infty $和$ L_2 $ -bounded扰动上,但这些并没有捕获对手可用的所有类型的扰动。目前的工作评估了5种不同类型的32次攻击,对抗100个ImageNet子集的对抗模型。我们的实证结果表明,对广泛的扰动大小进行评估对于理解扰动类型之间的对抗鲁棒性转移是必要的。我们进一步证明针对一种扰动类型的鲁棒性可能并不总是意味着可能有时会损害对其他扰动类型的鲁棒性。鉴于这些结果,我们建议对各种扰动类型和大小的对抗性防御进行评估。
translated by 谷歌翻译
网络是强大的数据结构,但与传统的机器学习方法相结合具有挑战性。网络嵌入(NE)方法试图通过学习节点的向量表示来解决这个问题,随后在下游机器学习任务中使用。链接预测(LP)是一种这样的下游机器学习任务,它是NE方法的重要用例和流行基准。不幸的是,尽管NE方法在这项任务中表现得非常好,但与简单的LP方法相比,它们缺乏不透明性。我们引入了ExplaiNE,一种通过识别网络中解释预测链接的现有链接,为基于NE的LP方法提供反事实解释的方法。 ExplaiNE适用于广泛的NE算法。对NE方法“条件网络嵌入”进行广泛的实证评估,特别证明了其准确性和可扩展性。
translated by 谷歌翻译
近年来,已经提出了将深度学习应用于诸如图形的结构化数据的先进方法。特别是,研究的重点是将卷积神经网络推广到图形数据,其中包括重新定义图形的卷积和下采样(池化)操作。将卷积运算概括为图的方法已被证明可以提高性能并被广泛使用。然而,对图表应用下采样的方法仍然难以执行并且具有改进的空间。在本文中,我们提出了一种基于自我关注的图池化方法。使用图卷积的自我注意允许我们的池化方法考虑节点特征和图形拓扑。为了确保公平比较,对现有的池化方法和方法使用相同的培训程序和模型体系结构。实验结果表明,我们的方法使用合理数量的参数在基准数据集上实现了卓越的图分类性能。
translated by 谷歌翻译
基于特征的时间序列表示在广泛的时间序列分析方法中引起了广泛的关注。最近,使用时间序列特征进行预测模型选择和模型平均已经成为预测社区研究的焦点。尽管如此,大多数现有方法依赖于手动选择一组适当的特征。在最先进的时间序列分析中,利用机器学习方法从时间序列中自动提取特征变得至关重要。在本文中,我们介绍了一种基于图像的自动化方法来提取时间序列特征。时间序列是首先转换的生成图像,可以使用计算机视觉算法从中提取局部特征。提取的特征用于预测模型选择和模型平均。我们的实验表明,基于自动提取特征的预测,较少的人为干预和对原始时间序列数据的更全面的观点,产生与最大预测竞争M4中提出的最佳方法相当的性能。
translated by 谷歌翻译