信息融合是众多工程系统和生物功能的重要组成部分,例如人类认知。融合发生在许多层面,从信号的低级组合到异构决策过程的高级聚合。虽然过去十年见证了深度学习研究的爆发,但神经网络融合并没有观察到同样的革命。具体而言,大多数神经融合方法是特定的,不被理解,分布与局部,和/解释性低(如果存在的话)。在此,我们证明了模糊Choquet积分(ChI),一种强大的非线性聚合函数,可以表示为多层网络,以下称为ChIMP。我们还提出了一种改进的ChIMP(iChIMP),它根据ChI不等式约束的指数数量导致基于随机梯度下降的优化。 ChIMP / iChIMP的另一个好处是它可以实现可解释的AI(XAI)。提供了综合验证实验,并将iChIMP应用于远程感知中的一组异构架构深度模型的融合。我们展示了模型精度的提高,我们之前建立的XAI指数揭示了我们的数据,模型及其决策的质量。
translated by 谷歌翻译
我们考虑用于表示车辆动力学的神经网络的在线适应问题。神经网络模型旨在由MPC控制法使用以自主地控制车辆。这个问题具有挑战性,因为输入和目标分布都是非平稳的,而在线适应的天真方法会导致灾难性的遗忘,从而导致控制器故障。我们提出了一种新颖的在线学习方法,它将伪排练方法与局部加权投影回归相结合。我们证明了在模拟中使用局部加权投影回归伪排练(LW-PR $ ^ 2 $)方法的有效性以及使用1/5比例自动驾驶车辆收集的大型真实世界数据集。
translated by 谷歌翻译
连续晶体学是通过衍射图案研究晶体结构和性质的科学领域。在本文中,我们引入了由真实和合成图像组成的新的连续晶体学数据集;通过使用既可扩展又准确的模拟器生成合成图像。生成的数据集称为DiffraNet,它由25,457个512x512灰度标记图像组成。我们探索了几种用于在DiffraNet上进行分类的计算机视觉方法,例如与随机森林和支持VectorMachines相关的标准特征提取算法,以及一个被称为DeepFreak的端到端CNN拓扑,用于处理这个新数据集。所有实施都是公开的,并且使用现成的AutoML优化工具进行精细调整,以进行公平的比较。我们的最佳模型在合成图像上的准确率达到98.5%,在真实图像上达到94.51%的准确度。我们相信,DiffraNet数据集及其分类方法将在长期内对加速许多学科的发现产生积极影响,包括化学,地质学,生物学,材料科学,冶金学和物理学。
translated by 谷歌翻译
Localizing moments in untrimmed videos via language queries is a new and interesting task that requires the ability to accurately ground language into video. Previous works have approached this task by processing the entire video, often more than once, to localize relevant activities. In the real world applications that this task lends itself to, such as surveillance, efficiency a is pivotal trait of a system. In this paper, we present TripNet, an end-to-end system that uses a gated attention architecture to model fine-grained textual and visual representations in order to align text and video content. Furthermore, TripNet uses reinforcement learning to efficiently localize relevant activity clips in long videos, by learning how to intelligently skip around the video. In our evaluation over Charades-STA, ActivityNet Captions and the TACoS dataset, we find that TripNet achieves high accuracy and saves processing time by only looking at 32-41% of the entire video.
translated by 谷歌翻译
我们提出了一种合成数据生成的任务感知方法。我们的框架采用可训练的合成器网络,通过评估“目标”网络的优势和劣势,优化产生意义的训练样本。合成器和目标网络以对抗性方式进行训练,其中每个网络的更新目标是超越另一个。另外,我们通过将其与在真实世界图像上训练的鉴别器配对来确保合成器生成真实数据。此外,为了使目标分类器对于混合人工制品不变,我们将这些人工制品引入训练图像的背景区域,以使目标不会过度拟合。我们通过将其应用于不同的目标网络(包括AffNIST上的分类网络)和不同数据集上的两个物体检测网络(SSD,Faster-RCNN)来证明我们的方法的功效。在AffNISTbenchmark上,我们的方法能够超越基线结果,只需要一半的训练样例。在VOC人员检测基准测试中,由于我们的数据增加,我们显示了高达2.7%的改进。类似地,在GMU检测基准上,我们报告mAP在基线方法中的性能提升为3.5%,优于先前的技术方法,在特定类别上达到7.5%。
translated by 谷歌翻译
我们考虑基于作为插值估计器计算的一步估计量加上参数影响函数估计量的经验均值的非参数模型下的标量参数的推断。我们关注一类具有影响函数的参数,这些函数依赖于两个无限维度的烦扰函数,并且使得感兴趣的参数的一个stepetimator的偏差是对两个烦扰函数的估计误差的乘积的期望。我们的课程包括许多重要的治疗效果对比因果推断和计量学因素,如ATE,ATT,与持续治疗的综合因果对比,以及不随意丢失的结果的平均值。我们提出了目标参数的提取器,这些参数接受用于扰乱函数的近似稀疏回归模型,从而允许潜在混淆的数量甚至大于样本大小。通过应用分裂,交叉拟合和基于目标函数的讨厌函数的$ \ ell_1 $ _regularized回归估计,其方向性导数与参数的影响函数一致,我们获得目标参数的选择器具有两个理想的鲁棒性:(1)它们当两个函数都遵循近似稀疏模型时,即使一个函数具有非稀疏回归系数,另一个函数具有足够稀疏的回归系数,并且(2),它们具有双倍稳健性,因为它们是根本一致且非常正常的)它们是模型双重鲁棒的,因为它们是根本一致且渐近正常的,即使其中一个有害函数不遵循近似稀疏模型,只要另一个有害函数遵循具有足够稀疏回归系数的近似稀疏模型。
translated by 谷歌翻译
我们使用用于视频识别的深度模型来解决学习运动表示的挑战性问题。为此,我们利用注意力模块来学习突出视频中的区域和聚合功能以进行识别。具体而言,我们建议利用输出关注度图作为车辆,将学习的表示从运动(流)网络传输到RGB网络。我们系统地研究了注意模块的设计,并开发了一种新的注意蒸馏方法。我们的方法在主要行动基准上进行了评估,并且一直在显着提高基线RGB网络的性能。此外,我们证明了ourattention地图可以利用学习中的运动线索来识别视频帧中的动作位置。我们相信我们的方法为深度模型中的学习运动感知表示提供了一个步骤。
translated by 谷歌翻译
In many research fields, the sizes of the existing datasets vary widely. Hence, there is a need for machine learning techniques which are well-suited for these different datasets. One possible technique is the self-organizing map (SOM), a type of artificial neural network which is, so far, weakly represented in the field of machine learning. The SOM's unique characteristic is the neighborhood relationship of the output neurons. This relationship improves the ability of generalization on small datasets. SOMs are mostly applied in unsupervised learning and few studies focus on using SOMs as supervised learning approach. Furthermore, no appropriate SOM package is available with respect to machine learning standards and in the widely used programming language Python. In this paper, we introduce the freely available SUpervised Self-organIzing maps (SUSI) Python package which performs supervised regression and classification. The implementation of SUSI is described with respect to the underlying mathematics. Then, we present first evaluations of the SOM for regression and classification datasets from two different domains of geospatial image analysis. Despite the early stage of its development, the SUSI framework performs well and is characterized by only small performance differences between the training and the test datasets. A comparison of the SUSI framework with existing Python and R packages demonstrates the importance of the SUSI framework. In future work, the SUSI framework will be extended, optimized and upgraded e.g. with tools to better understand and visualize the input data as well as the handling of missing and incomplete data.
translated by 谷歌翻译
提出了一种聚类高光谱图像(HSI)数据的无监督学习算法,该算法利用空间正则化的随机游走。马尔可夫扩散定义在HSI光谱的空间上,其中跃迁约束于近空间邻域。将空间规律性明确地结合到扩散构造中导致更平滑的随机过程,其比仅基于光谱的那些更适合于无监督的机器学习。随后使用凝聚扩散过程通过扩散距离将高维HSI嵌入到较低维空间中。使用密度估计和扩散距离计算聚类模式,并且根据这些模式标记所有其他点。所提出的方法具有低计算复杂度并且在真实数据上执行竞争性的最先进的HSI聚类算法。特别地,所提出的空间正则化赋予超过非正则化方法的经验优势。
translated by 谷歌翻译
本报告描述了18个项目,这些项目探讨了如何在国家实验室中将商业云计算服务用于科学计算。这些演示包括在云环境中部署专有软件,以利用已建立的基于云的分析工作流来处理科学数据集。总的来说,这些项目非常成功,并且他们共同认为云计算可以成为国家实验室科学计算的宝贵计算资源。
translated by 谷歌翻译