我们开发了一种自动变分方法,用于推导具有高斯过程(GP)先验和一般可能性的模型。该方法支持多个输出和多个潜在函数,不需要条件似然的详细知识,只需将其评估为ablack-box函数。使用高斯混合作为变分分布,我们表明使用来自单变量高斯分布的样本可以有效地估计证据下界及其梯度。此外,该方法可扩展到大数据集,这是通过使用诱导变量使用增广先验来实现的。支持最稀疏GP近似的方法,以及并行计算和随机优化。我们在小数据集,中等规模数据集和大型数据集上定量和定性地评估我们的方法,显示其在不同似然模型和稀疏性水平下的竞争力。在涉及航空延误预测和手写数字分类的大规模实验中,我们表明我们的方法与可扩展的GP回归和分类的最先进的硬编码方法相同。
translated by 谷歌翻译
神经进化是一种通过进化算法训练神经网络(NN)的过程,通常用作状态 - 动作映射模型的控制或强化学习型问题。本文以增强拓扑(NEAT)形式主义的NeuroEvolution为基础,允许设计拓扑和权重演化NN。对神经进化过程进行了根本性的改进,以解决过早的停滞和收敛问题,其中最重要的是结合自动机制来控制人口多样性和神经进化过程中的平均适应性改善。通过对Open AI平台和无人驾驶飞行器(UAV)防撞问题的三个基准问题进行评估,获得了对新算法的性能和效率的见解。
translated by 谷歌翻译
Learning a generative model from partial data (data with missingness) is a challenging area of machine learning research. We study a specific implementation of the Auto-Encoding Variational Bayes (AEVB) algorithm, named in this paper as a Variational Auto-Decoder (VAD). VAD is a generic framework which uses Variational Bayes and Markov Chain Monte Carlo (MCMC) methods to learn a generative model from partial data. The main distinction between VAD and Varia-tional Auto-Encoder (VAE) is the encoder component , as VAD does not have one. Using a proposed efficient inference method from a multivari-ate Gaussian approximate posterior, VAD models allow inference to be performed via simple gradient ascent rather than MCMC sampling from a probabilistic decoder. This technique reduces the inference computational cost, allows for using more complex optimization techniques during latent space inference (which are shown to be crucial due to a high degree of freedom in the VAD latent space), and keeps the framework simple to implement. Through extensive experiments over several datasets and different missing ratios, we show that encoders cannot efficiently marginalize the input volatility caused by imputed missing values. We study multimodal datasets in this paper , which is a particular area of impact for VAD models.
translated by 谷歌翻译
随着功能强大,低成本的物联网系统的出现,处理数据的数据越来越多,称为边缘计算,已成为一种越来越可行的选择。除了降低网络基础设施的成本之外,边缘计算还可以减少边缘云延迟,这是关键的关键应用。在本文中,我们展示了使用物联网设备进行图像分类的可行性和研究。具体来说,我们探讨了可能影响能耗的图像分类算法的各种因素之间的关系,如数据集大小,图像分辨率,算法类型,算法阶段和设备硬件。 Ourexperiments在三个预测变量之间显示出强烈的正线性关系,即模型复杂度,图像分辨率和数据集大小,与能耗有关。另外,为了提供预测执行图像分类的边缘设备的能量消耗的手段,我们使用从我们的实验产生的数据来研究三种机器学习算法的使用。讨论和验证了使用线性回归,高斯过程和随机森林的表现以及交易。我们的结果表明随机森林模型优于前两种算法,两个不同验证数据集的R平方值为0.95和0.79。
translated by 谷歌翻译
动作预测是仅在观察到其一部分时识别正在进行的活动的类别标签。在本文中,我们关注流式3D骨架序列中的在线动作预测。引入扩张的卷积网络以通过时间轴上的滑动窗口对时间维度中的运动动力学进行建模。由于在不同时间步骤中正在进行的动作的观察部分存在显着的时间尺度变化,因此提出了一种新的窗口尺度选择方法,以使我们的网络关注正在进行的动作的执行部分并且试图抑制来自先前动作的可能的干扰。在每一步。还提出了一种激活共享方案来处理相邻时间步骤之间的重叠计算,这使得我们的框架能够更有效地运行。此外,为了增强我们的骨架输入数据动作预测框架的性能,还对扩展树卷积的层次结构进行了设计。学习每帧骨架关节的多层次结构化语义表示。我们提出的方法是在四个具有挑战性的数据集上进大量实验证明了我们的方法对基于骨架的在线动作预测的有效性。
translated by 谷歌翻译
在本文中,我们考虑使用portmanteau测试来测试多重季节性自回归移动平均(SARMA)模型的充分性,假设误差是不相关的但不一定是独立的。为了扩展误差项的标准独立性假设,我们应该扩展应用的范围。 SARMA模型。我们研究了残差和归一化残差经验自协方差和自相关的渐近分布。我们建立了所提统计的渐近行为。提出了一套蒙特卡罗实验和月平均总太阳黑子数的应用。
translated by 谷歌翻译
尽管存在固有的不明确定义,但异常检测是机器学习和视觉场景理解中相当兴趣的研究工作。通常,异常检测被认为是基于某种正态度量在给定数据分布中检测异常值。现实世界异常检测问题中最重要的挑战是可用数据对于正常性(即非异常)高度不平衡并且包含所有可能的异常样本的大部分子集 - 因此限制了良好建立的监督学习方法的使用。相比之下,我们介绍了无监督异常检测模型,仅对正常(非异常,丰富)样本进行训练,以便了解域的正态分布,从而根据与该模型的偏差检测异常。我们提出的方法采用编码器 - 解码器卷积神经网络,跳过连接,彻底捕捉高维图像空间中正常数据分布的多尺度分布。此外,利用针对该选择的体系结构的对抗性训练方案,在高维图像空间和更低维的潜在向量空间编码中提供了优越的重建。在训练期间最小化图像和隐藏向量空间内的重建误差度量,使模型根据需要学习正态性的分布。因此,在随后的测试和部署期间的较高重构度量指示了与该正态分布的偏差,因此指示了异常。在X射线安全屏幕的背景下,对已建立的异常检测基准和具有挑战性的真实数据集的实验表明了这种提议方法的独特前景。
translated by 谷歌翻译
在本文中,提出了一种特征提升网络,用于从单个RGB图像估计3D手势和3D身体姿势。在这种方法中,卷积层所获得的特征被一个新的长短期依赖性(LSTD)模块提升,这使得中间卷积特征图能够感知不同手(或身体)部分之间的图形长期短期依赖性。设计图形ConvLSTM。由于在3D姿态估计的实际应用中的模糊性,纹理和照明变化以及自遮挡,学习一组可靠且有区别地代表手(或身体)部分的特征是困难的。为了提高表示每个部分的特征的可靠性并增强LSTD模块,我们在本文中进一步引入了上下文一致性门(CCG),其中卷积特征映射根据它们与上下文表示的一致性进行调制。我们评估了所提出的用于3D手势估计和3D全身姿态估计的挑战性基准数据集的方法。实验结果表明,我们的方法在两个任务中都达到了最先进的性能。
translated by 谷歌翻译
在本文中,我们提出了一个基于显着性的属性SalSi来检测地震体内的saltdome体。 SalSi基于显着性理论和人类视觉系统(HVS)的建模。在这项工作中,我们的目标是突出地震体的部分,这些部分受到人类解释者的高度关注,并且基于地震图像的显着特征,我们检测到盐丘。实验结果表明,SalSi对北海F3区块采集的地震数据集的有效性。主观上,我们使用了不同盐丘组合算法的基本事实和输出来验证SalSi的结果。为了客观评价结果,我们使用了接收器操作特征(ROC)曲线和曲线下的区域(AUC)来证明SalSi是地震解释的一个有前途和无效的属性。
translated by 谷歌翻译
计算机视觉的最终承诺之一是帮助机器人代理执行活动任务,例如提供包裹或做家务。然而,解决“视觉”的传统方法是定义一组离线识别问题(例如物体检测)并解决这些问题。首先,这种方法面临着最近兴起的Deep ReinforcementLearning框架的挑战,这些框架使用图像作为输入从头开始学习活动任务。这提出了一系列基本问题:如果从头开始学习一切,计算机视觉的作用是什么?中间视觉任务是否可以实际执行任意下游活动任务?我们表明,正确使用中级感知比从头开始训练具有明显的优势。我们将感知模块实现为中级可视化表示的集合,并证明学习具有中级特征的活动任务具有更高的样本效率,并且能够在从刮擦方法失败的情况下进行概括。但是,我们表明,实现这些收益需要仔细选择每个下游任务的特定中级功能。最后,我们根据我们的研究结果提出了一个简单而有效的感知模块,可以作为主动框架的相当通用的感知模块。
translated by 谷歌翻译