我们开发了一种自动变分方法,用于推导具有高斯过程(GP)先验和一般可能性的模型。该方法支持多个输出和多个潜在函数,不需要条件似然的详细知识,只需将其评估为ablack-box函数。使用高斯混合作为变分分布,我们表明使用来自单变量高斯分布的样本可以有效地估计证据下界及其梯度。此外,该方法可扩展到大数据集,这是通过使用诱导变量使用增广先验来实现的。支持最稀疏GP近似的方法,以及并行计算和随机优化。我们在小数据集,中等规模数据集和大型数据集上定量和定性地评估我们的方法,显示其在不同似然模型和稀疏性水平下的竞争力。在涉及航空延误预测和手写数字分类的大规模实验中,我们表明我们的方法与可扩展的GP回归和分类的最先进的硬编码方法相同。
translated by 谷歌翻译
图是有用的结构,可以模拟几个重要的现实问题。最近,学习图表引起了相当多的关注,从而提出了学习这些数据结构的新方法。其中一个研究产生了NetGAN,这是一种通过随机游走生成图形的新方法。虽然NetGAN在生成图形和链接预测的任务中的准确性方面已经显示出有希望的结果,但是从中开始随机游走的顶点的选择可能导致不一致和高度变量结果,特别是当步行时间很短时。作为randomstarting的替代方案,本研究旨在建立一种从一组密集顶点初始化随机行走的新方法。我们的目的是通过不同大小的随机游走,基于其对其邻域的整个顶点的影响的倒数来估计阳极的重要性。所提出的方法管理实现了显着更好的准确性,更少的方差和减少了更小的方法。
translated by 谷歌翻译
我们提出了一个结合了分层规划和机器学习的思想的导航系统。该系统使用传统的全局规划器来计算朝向目标的最佳路径,并使用深度局部轨迹规划器和速度控制器来计算运动命令。系统的后者组件通过注意机制调整机器人的行为,使其朝向目标移动,避开障碍物,并尊重近距离行人的空间。所提出的深度模型的结构和使用注意机制都使得系统的执行可以解释。我们的仿真实验表明,所提出的架构优于基线,可以将全局计划信息和传感器数据直接映射到velocitycommands。与手工设计的传统导航系统相比,所提出的方法表现出更一致的性能。
translated by 谷歌翻译
基于深度的人体活动分析研究取得了突出的成绩,并证明了3D表示在行动识别中的有效性。现有的基于深度和基于RGB + D的动作识别基准具有许多局限性,包括缺乏大规模训练样本,不同类别的实际数量,多样化的内部视图,不同的环境条件以及各种人类主体。在这项工作中,我们引入了一个用于RGB + D人类行为识别的大规模数据集,该数据集来自106个不同的主题,包含超过114,000个视频样本和800万帧。该数据集包含120种不同的动作类,包括日常,相互和健康相关的活动。我们评估了该数据集上一系列现有3D活动分析方法的性能,并展示了将deeplearning方法应用于基于3D的人类行为识别的优势。此外,我们在数据集上研究了一种新的一次性三维活动识别问题,并为此任务提出了一种简单而有效的动作部分语义相关性(APSR)框架,为新型动作类的识别提供了有希望的结果。我们相信,引入这个大规模数据集将使社区能够应用,调整和开发各种渴望数据的学习技术,以实现基于深度和基于RGB + D的人类活动理解。 [数据集可在以下网址获得:http://rose1.ntu.edu.sg/Datasets/actionRecognition.asp]
translated by 谷歌翻译
多实例学习(MIL)是一种弱监督学习范例,它允许对机器学习问题进行建模,其中标签仅适用于称为包的示例组。正袋可以包含一个或多个正面的例子,但是不知道袋中的哪些例子是正面的。负袋中的所有例子都属于负面类。这些问题在计算机视觉,医学图像处理和生物信息学领域中经​​常出现。已经在MIL的文献中提出了许多基于神经网络的解决方案,然而,几乎所有这些解决方案都依赖于在架构中引入专用块和连接。在本文中,我们提出了一种在神经网络中进行多实例学习的noveland有效方法。我们提出了一种简单的bag-levelranking损失函数,它允许在任何神经网络中进行多实例分类。我们已经证明了我们提出的方法对流行的MIL基准数据集的有效性。此外,我们已经在卷积神经网络中测试了我们的方法的性能,该网络用于模拟从众所周知的MNIST数据集派生的MIL问题。结果表明,尽管更简单,但我们提出的方案在实际情况下是文献中可比较的或更好的现有方法。所有实验的Python代码文件都可以在https://github.com/amina01/ESMIL找到。
translated by 谷歌翻译
这项研究的目的是引入一个全面的步态数据库,包括93名在两个不同时段在两个终点之间行走的人类,并使用两个智能手机记录他们的步态数据,一个连接到右侧,另一个连接在腰部左侧。该数据被收集在内部以供基于深度学习的方法使用,该方法需要足够的时间点。记录包括年龄,性别,吸烟,每日运动时间,身高和体重的元数据。此数据集是公开可用的。
translated by 谷歌翻译
真相发现是广泛的统计方法的通用名称,旨在根据来自嘈杂来源的多个答案提取正确的问题答案。例如,众包平台中的工作人员。在本文中,我们设计了由\ emph {proxyvoting}启发的简单真理发现方法,这些方法对那些答案接近其他工作者的工人给予更高的权重。我们证明,在标准统计假设下,基于代理的真实发现(\ PTD)允许我们估计每个工人的真实能力,工人是否面临问题,其答案是真实的,分类的,orrankings。然后,我们通过对合成和真实数据的广泛实证研究证明,PTD比未加权聚合要好得多,并且在所有上述领域中与其他真实发现方法竞争良好。
translated by 谷歌翻译
在本文中,为微电网开发了一种生物启发的自适应智能二级控制器,以解决系统动态不确定性,故障和/或干扰。开发的自适应生物启发控制器采用了一种新的情绪学习的哺乳动物边缘系统计算模型。所提出的生物学智能控制器的学习能力使其成为一种有前途的方法,可以在不增加控制器复杂性的情况下利用电力系统非线性和易失动态,并通过使用有效的参考跟踪机制来维持电压和频率稳定性。所提出的智能二级控制器的性能在模拟微电网中的电压和频率绝对误差方面得到验证。与其他基准控制器相比,仿真结果突出了所提出的智能控制器在故障条件下的效率和鲁棒性以及不同的系统不确定性。
translated by 谷歌翻译
我们解决了从图像提议集合中查找包含常见但未知的对象类别的一组图像的问题。我们的配方假设我们获得了一系列袋子,每个袋子都是一组图像提示。我们的目标是从每个包中选择一个图像,使得所选图像具有相同的对象类别。我们将选择模型建模为具有一元和成对势函数的能量最小化问题。受最近几次学习算法的启发,我们提出了一种直接从数据中学习潜在函数的方法。此外,我们提出了一种快速简单的贪婪推理算法,用于能量最小化。我们评估了关于少数常见对象识别和对象共定位任务的理解。我们的实验表明,学习成对和一元术语可以大大提高模型在几种众所周知的方法中的性能。所提出的贪婪优化算法实现了与现有技术的结构化推理算法相当的性能,同时快了约10倍。该代码可通过以下网址公开获取://github.com/haamoon/finding_common_object。
translated by 谷歌翻译
将储层表示为具有邻近和非邻近连接的离散隔室网络是一种快速而准确的方法,用于分析油气藏。具有独特静态和动态特性的粗大型隔室的自动和快速检测是这种高水平油藏分析的一个组成部分。在这项工作中,我们提出了一个特定于油藏分析的混合框架,用于使用空间和时间场数据自动检测空间中的聚类,并结合基于物理的多尺度模型化方法。在这项工作中,提出了一种新颖的混合方法,其中我们将基于物理的非局部建模框架与数据驱动的聚类技术相结合,以提供快速和准确的分区储层的多尺度建模。本研究还通过对水库首次应用的时空聚类进行了全面的研究,充分考虑了聚类复杂性,数据的内在稀疏性和噪声性,以及结果的可解释性。关键词:人工智能;机器学习;空间 - TemporalClustering;基于物理的数据驱动配方;多尺度建模
translated by 谷歌翻译