AI的一个关键挑战是构建体现的系统,该系统在动态变化的环境中运行。此类系统必须适应更改任务上下文并持续学习。虽然标准的深度学习系统实现了最先进的静态基准的结果,但它们通常在动态方案中挣扎。在这些设置中,来自多个上下文的错误信号可能会彼此干扰,最终导致称为灾难性遗忘的现象。在本文中,我们将生物学启发的架构调查为对这些问题的解决方案。具体而言,我们表明树突和局部抑制系统的生物物理特性使网络能够以特定于上下文的方式动态限制和路由信息。我们的主要贡献如下。首先,我们提出了一种新颖的人工神经网络架构,该架构将活跃的枝形和稀疏表示融入了标准的深度学习框架中。接下来,我们在需要任务的适应性的两个单独的基准上研究这种架构的性能:Meta-World,一个机器人代理必须学习同时解决各种操纵任务的多任务强化学习环境;和一个持续的学习基准,其中模型的预测任务在整个训练中都会发生变化。对两个基准的分析演示了重叠但不同和稀疏的子网的出现,允许系统流动地使用最小的遗忘。我们的神经实现标志在单一架构上第一次在多任务和持续学习设置上取得了竞争力。我们的研究揭示了神经元的生物学特性如何通知深度学习系统,以解决通常不可能对传统ANN来解决的动态情景。
translated by 谷歌翻译
大多数基于机器学习的回归器从过去的观察结果有限的观察结果中提取信息,以便将来做出预测。因此,当对这些训练的模型的输入是具有与用于培训的数据明显不同的数据时,无法保证准确的预测。因此,使用这些模型在分布外输入数据上可能会导致与所需的结果完全不同的预测结果,这不仅是错误的,而且在某些情况下也可能是危险的。这些机器学习模型在任何系统中的成功部署都需要一个检测系统,该系统应该能够区分分布和分配数据(即与培训数据相似)。在本文中,我们使用降低的鲁棒随机切割森林(RRRCF)数据结构引入了一种新的检测过程方法,该方法可用于小型和大数据集。与强大的随机切割森林(RRCF)相似,RRRCF是一个结构化的,但训练数据子空间的表示形式减少了。该方法对低维数据和高维数据的经验结果表明,有关数据的推断可以有效地进行/退出训练分布,并且该模型很容易训练,而无需不困难的高参数调整。本文讨论了两个不同的用例,用于测试和验证结果。
translated by 谷歌翻译
预测流感病毒引起的住院治疗对于公共卫生计划至关重要,因此医院可以为大量患者做好准备。在流感季节中实时使用了许多预测方法,并提交给疾病预防控制中心进行公共交流。预测模型范围从机械模型和自动回归模型到机器学习模型。我们假设我们可以通过使用多个机械模型生成潜在的轨迹并使用机器学习来学习如何将这些轨迹结合到改进的预测中,从而改善预测。我们提出了一种树木合奏模型设计,该设计利用基线模型Sikjalpha的各个预测指标来提高其性能。每个预测因子都是通过更改一组超参数来生成的。我们将为Flusight Challenge(2022)部署的前瞻性预测与所有其他提交的方法进行了比较。我们的方法是完全自动化的,不需要任何手动调整。我们证明,基于森林的随机方法能够根据平均绝对误差,覆盖范围和加权间隔得分来改善单个预测因子的预测。我们的方法根据平均绝对误差和基于当前季节所有每周提交的平均值(2022)的平均值来优于所有其他模型。随机森林(通过对树木的分析)的解释能力使我们能够深入了解其如何改善单个预测因子。
translated by 谷歌翻译
提出了一种称为ABRF(基于关注的随机林)的新方法及其用于将注意机制应用于回归和分类的随机林(RF)的修改。拟议的ABRF模型背后的主要观点是以特定方式将注意力与可培训参数分配给决策树。权重取决于实例之间的距离,其落入树的相应叶子,以及落入同一叶子的情况。这种想法源于Nadaraya-Watson内核回归以RF的形式表示。提出了三种改进的一般方法。第一个基于应用Huber的污染模型,并通过解决二次或线性优化问题来计算注意力。第二个和第三种修改使用基于梯度的算法来计算可训练参数。各种回归和分类数据集的数值实验说明了所提出的方法。
translated by 谷歌翻译
作为深度学习模式,深入信心筛查森林(GClestcs)在各种应用中取得了巨大的成功。与传统的深森林方法相比,GcForestcs通过将一些实例直接传递到最后阶段,有效地减少了高度的情况。然而,在高置信区中存在一组具有低精度的实例,其被称为错误分区的实例。要查找这些错误分区实例,本文提出了一个深入的融合信心筛选森林(DBC-Forest)模型,基于他们的信心将所有情况包装成垃圾箱。以这种方式,可以将更准确的实例传递到最终阶段,并且性能得到改善。实验结果表明,DBC-Forest对相同的超参数实现高度准确的预测,比其他类似模型更快,以实现相同的准确性。
translated by 谷歌翻译
对森林生物量股票的知识及其发展对于实施有效的气候变化缓解措施是重要的。需要研究驾驶AF的过程,重新砍伐和森林砍伐,是碳核算的先决条件。使用空机激光雷达的遥感可用于测量大规模植被生物量。我们呈现深度学习系统,用于预测木材体积,地上生物量(AGB),随后直接从3D LIDAR点云数据碳。我们设计了不同的神经网络架构进行点云回归,并在遥感数据上评估AGB估计从国家森林库存中的现场测量获得的遥感数据。我们对回归的Minkowski卷积神经网络的调整给出了最佳结果。与在Point云的基本统计中运营的最先进的方法相比,深度神经网络产生了明显更准确的木材体积,AGB和碳估计,我们希望这一发现对基于LIDAR的分析产生了强烈影响陆地生态系统动态。
translated by 谷歌翻译
异常检测涉及识别不符合预期行为的数据集中的示例。虽然存在大量的异常检测算法,但是已经支付了很少的注意,以解释这些算法标志某些示例作为异常的原因。然而,这样的解释对于解释算法输出的任何人来说可能非常有用。本文开发了一种解释最先进的隔离森林异常检测算法的异常预测的方法。该方法输出解释载体,该解释矢量捕获示例的每个属性的重要性是如何将其识别为异常。合成和现实世界数据集的彻底实验评估表明,我们的方法比大多数现代最先进的解释性方法更准确,更有效。
translated by 谷歌翻译
我们表明,在随机林的培训过程下面,不仅存在众所周知的和几乎计算的释放速度超出袋点估计,而且还有一个路径来计算概念误差的置信区间要求再培训森林或任何形式的数据分裂。除了施工中涉及的低计算成本外,通过模拟显示这种置信区间,以在训练样本大小方面具有良好的覆盖率和适当的收缩速度。
translated by 谷歌翻译
权力下放的金融(DECI)是一种由各种区块链的智能合同构建的金融产品和服务系统。在过去的一年里,DEFI获得了普及和市场资本化。但是,它也成为了与加密货币相关的犯罪的震中,特别是各种类型的证券违规行为。缺乏了解您在DECII中的客户需求使各国政府不确定如何处理此空间的违规程度。本研究旨在通过机器学习方法解决这一问题,以确定基于其令牌的智能合同代码潜在地侵犯证券违规的污染项目。我们更广泛地调整了检测特定类型的证券违规行为的特定类型,基于从Defi项目令牌的智能合同代码中提取的功能来构建随机林分类器。最终分类器实现99.1%F1分数。对于任何分类问题来说,这种高性能令人惊讶,但是,从进一步的特征级别,我们发现一个特征使得一个高度可检测的问题。我们的研究的另一个贡献是一个新的数据集,由(a)验证的地面真理数据集,用于证券违规涉及的令牌和(b)来自项目中的Predi Aggregator的一组有效令牌,在项目上进行了尽职调查。本文进一步讨论了检察官在执法努力中使用我们的模式,并将其潜在利用与更广泛的法律背景联系起来。
translated by 谷歌翻译
无监督的异常检测解决了在没有标签可用性的情况下发现数据集内的异常问题的问题;由于数据标记通常很难或获得昂贵,因此近年来这些方法已经看到了巨大的适用性。在这种情况下,隔离森林是一种流行的算法,可以通过称为隔离树的独特树的集合来定义异常分数。这些是使用无规分区过程构建,这些程序非常快捷,廉价培训。但是,我们发现标准算法可以在内存要求,延迟和性能方面提高;这对低资源场景和在超约束微处理器上的Tinyml实现中特别重要。此外,异常检测方法目前没有利用弱势监督:通常在决策支持系统中消耗,用户来自用户的反馈,即使罕见,也可以是目前未探索的有价值的信息来源。除了展示IFOSEST培训限制外,我们在此提出TIWS-IFOREST,一种方法,即通过利用弱监管能够降低隔离森林复杂性并提高检测性能。我们展示了TIWS-IFOREST在真实单词数据集上的有效性,我们在公共存储库中共享代码,以增强可重复性。
translated by 谷歌翻译