多智能体系统的行为动态具有丰富有序的结构,可用于理解这些系统,并改善人工智能学习如何在其中运行。在这里,我们介绍了用于多智能体学习的关系前向模型(RFM),这些网络可以学习如何在多智能体环境中对代理的未来行为进行准确的预测。因为这些模型对环境中存在的离散实体和关系进行操作,所以它们产生可解释的中间体表达能够深入了解推动代理人行为的因素,以及调解社交互动的强度和价值的事件。此外,我们展示了代理内部的RFM模块,与非增强基线相比,可以实现更快的学习系统。随着我们开发和交互的自治系统越来越多地成为多智能体,开发利用分析工具来表征代理如何以及为何做出决策的工具越来越必要。此外,开发快速且易于学会彼此协调的人工制剂以及在共享环境中与人类协调是至关重要的。
translated by 谷歌翻译
在本报告中,我们回顾了基于记忆的元学习作为建筑样本有效策略的工具,该策略从过去的经验中学习以适应目标类中的任何任务。我们的目标是为读者提供此工具的概念基础,以构建在陆域上运行的新的可扩展代理。为此,我们提出了基本的算法模板,用于建立最佳预测器和强化学习器,其行为就好像它们具有允许它们有效地利用任务结构的概率模型。此外,我们在贝叶斯框架内重建基于内存的元学习,显示元学习策略接近最优,因为它们分摊贝叶斯过滤数据,其中适应在内存动态中实现为具有足够统计数据的状态机。从本质上讲,基于记忆的学习 - 学习将概率序贯推理的难题转化为回归问题。
translated by 谷歌翻译
认识到作为诗歌或散文的一段文字对于大多数人来说通常都很容易;但是,只有专家可以确定哪个仪表是poembelongs。在本文中,我们建立了回归神经网络(RNN)模型,可以根据纯文本中的米来对诗歌进行分类。输入文本在字符级别进行编码,并直接输入到模型而不进行特征处理。这是机器理解和语言合成的一个进步,尤其是阿拉伯语。在16个阿拉伯语和4米英语的诗歌中,网络能够对诗歌进行错误的分类,总体准确率分别为96.38%和82.31%。用于进行这项研究的诗集数据量很大,超过150万节经文,并且来自不同的非技术资源,几乎阿拉伯和英国文学网站,以及不同的异构和非结构化格式。现在,这些数据集以干净,结构化和文档化的格式公开提供,供其他未来研究使用。据作者所知,这项研究是第一个通过机器学习方法对诗计进行分类,特别是在RNN无特征方法中。此外,该数据集是第一个公开可用的数据集,可用于未来的计算研究。
translated by 谷歌翻译
恶意网络攻击的传播者继续增加其技术的复杂性和复杂性,并且其逃避检测的能力也在不断提高。因此,入侵检测系统也必须发展以满足这些日益具有挑战性的威胁。机器学习用于支持这种必要的改进。但是,训练良好的预测模型可能需要大量标记的训练数据。由于隐私问题阻止了大多数入侵检测机构共享其敏感数据,因此难以获得此类数据集。在本文中,我们建议使用模仿学习,通过私人数据培训的教师模型将入侵检测知识转移到模糊的模型。该学生模型提供了从私有数据中提取的公开共享知识的手段,而不共享数据本身。我们的结果证实,所提出的方案可以产生模仿教师模型的学生入侵检测模型,而无需访问原始数据集。
translated by 谷歌翻译
D-Wave量子退火炉(QA)具有2048个量子位晶格,没有丢失的量子位和耦合,允许嵌入RestrictedBoltzmann Machine(RBM)的完整图形。使用具有8x7像素可见单位的手写数字OptDigits数据集用于使用经典的ContrastiveDivergence训练RBM。将经过经典训练的RBM嵌入到D-Wave格子中用于证明QA提供了经典马尔可夫链蒙特卡罗(MCMC)的高效替代方案,用于重建测试图像的缺失标签以及生成模型。在任何训练迭代中,基于D-Wave的分类的分类误差比MCMC低两倍以上。本研究的主要目的是从RBM模型分布中调查样本的质量,并将其与经典MCMC样本进行比较。对于OptDigits数据集,与MCMC样本相比,D-Wave样本中的状态属于大约两倍多的局部谷。通过D-Wave也可以找到MCMC样本中的所有最低能量(最高联合概率)局部最小值。 D-Wave错过了许多较高能量的山谷,同时发现MCMC一直错过许多“新的”当地山谷。已经确定,D-Wave发现的“新”局部山谷对于模型分布而言对于相应的局部最小值的能量,局部山谷的宽度和逃逸屏障的高度而言是重要的。
translated by 谷歌翻译
许多昂贵的黑盒优化问题对它们的输入敏感。在这些问题中,找到一个好的设计区域比一个可能的脆弱的优化设计更有意义。使用贝叶斯优化可以有效地优化昂贵的黑盒功能,其中高斯过程是一种流行的选择,作为先前的昂贵功能。我们提出了一种使用贝叶斯优化的稳健优化方法,以找到设计空间的区域,其中昂贵的功能性能对输入不敏感,同时保持良好的质量。这是通过对高斯过程进行抽样实现来实现的,该高斯过程对昂贵的函数进行建模并评估每个实现的改进。通过演化算法可以廉价地优化这些改进的期望,以确定评估昂贵功能的下一个位置。我们描述了一种有效的过程来确定最佳的预期改进。我们凭经验证明,在候选最佳位置评估模型最不确定的位置上的昂贵函数随机产生与剥削方案相比的最佳收敛。我们用二,五和八维度中的六个测试函数来说明我们的方法,并证明它能够胜过文献中最先进的方法。
translated by 谷歌翻译
X射线行李安全检查广泛用于维护航空和运输安全。特别感兴趣的是对特定类别物体(如电子,电子设备和液体)的自动安全X射线分析的关注。但是,在处理潜在的异常物品时,手动检查这些物品是一项挑战。在这里,我们提出了一种双卷积神经网络(CNN)架构,用于在复杂的安全X射线图像中进行自动异常检测。我们利用基于区域(R-CNN),基于掩模的CNN(掩模R-CNN)和检测结构(例如RetinaNet)的最新进展来为特定的感兴趣对象类提供对象定位变体。随后,利用一系列已建立的CNN对象和细粒度类别分类方法,我们在对象异常检测中将其形成为两类问题(异常或良性)。虽然最佳执行对象定位方法能够以超过六级X射线物体检测问题的97.9%平均平均精度(mAP)执行,但随后的两级异常/良性分类能够在对象异常检测中实现66%的性能。 。总的来说,这种表现既包括在杂乱的X射线安全图像的背景下对物体异常检测的挑战和承诺。
translated by 谷歌翻译
天气和大气模式通常是持久的。最简单的天气预报方法是所谓的持久性模型,它假定系统的未来状态与当前状态相似(或相等)。机器学习(ML)模型广泛用于不同的天气预报应用,但它们需要与持久性模型进行比较,以分析它们是否能够为手头的问题提供有竞争力的解决方案。在本文中,我们使用专家混合的概念设计了一种新的模型来预测机场的低能见度。可见性级别被编码为两个不同的分类变量:云高度和跑道视觉高度。该应用中的基础系统大约在90%的情况下停滞不前,标准ML模型未能改善持久性模型的性能。因此,我们不是试图简单地使用ML来击败持久性模型,而是使用这种持久性作为基线并学习通过专注于学习天气波动来改进其结果的神经网络模型。结果表明,该方案优于持续性和其他有序自回归模型,特别是对于较长时间的预测和跑道视觉高度变量。
translated by 谷歌翻译
鲸鱼优化算法(WOA)是一种自然启发的元启发式优化算法,由Mirjalili和Lewis于2016年提出。该算法已经显示出解决许多问题的能力。已经对其他一些自然启发的算法进行了综合调查,如ABC,PSO等。尽管如此,还没有对WOA进行过调查搜索工作。因此,本文对WOA进行了系统的元分析调查,以帮助研究人员。在不同的领域使用它或与其他常用算法混合。因此,WOA在算法背景,其特征,限制,修改,杂交和应用方面进行了深入介绍。接下来,提出WOA表现以解决不同的问题。然后,建立WOA修改和杂交的统计结果,并与最常用的优化算法和WOA进行比较。调查结果表明,WOA在收敛速度和开发与开发之间的平衡方面表现优于其他常用算法。与WOA相比,WOA修饰和杂交也有效。此外,我们的研究通过杂交WOA和BAT算法为展示新技术铺平了道路。 BAT算法用于探索阶段,而WOA算法用于探索阶段。最后,从WOA-BAT获得的统计结果非常具有竞争力,并且在16个基准测试函数中优于WOA。 WOA-BAT在CEC2005的13个功能和CEC2019的7个功能方面也表现出色。
translated by 谷歌翻译
传统的治疗方法限制了外科医生的灵活性控制,这是由于有限的视野。随着机器人辅助手术的出现,微创手术的医疗技术已经发生了范式转变。然而,在手术场景中追踪手术器械的位置是非常具有挑战性的,并且精确检测和识别手术工具是至关重要的。基于深度学习的手术视频的语义分割框架有可能促进这项任务。在这项工作中,我们通过引入经过预先训练的编码器并重新设计解码器部分来修改名为U-NetPlus的U-Net架构,方法是将转置的卷积操作替换为基于最近邻(NN)插值的上采样操作。为了进一步提高性能,我们还采用了一种非常快速且灵活的数据增强技术。我们通过MICCAI 2017EndoVis Challenge数据集对8 x 225帧机器人手术视频序列进行了框架训练,并在8 x 75帧和2 x 300帧视频上进行了测试。使用我们的U-NetPlus架构,我们报告用于二进制分割的90.20%DICE,用于仪器部分分割的76.26%DICE,以及​​用于仪器类型(即,所有仪器)分段的46.07%,优于在这些数据上实现和测试的先前技术的结果。
translated by 谷歌翻译