The number of standardized policy documents regarding climate policy and their publication frequency is significantly increasing. The documents are long and tedious for manual analysis, especially for policy experts, lawmakers, and citizens who lack access or domain expertise to utilize data analytics tools. Potential consequences of such a situation include reduced citizen governance and involvement in climate policies and an overall surge in analytics costs, rendering less accessibility for the public. In this work, we use a Latent Dirichlet Allocation-based pipeline for the automatic summarization and analysis of 10-years of national energy and climate plans (NECPs) for the period from 2021 to 2030, established by 27 Member States of the European Union. We focus on analyzing policy framing, the language used to describe specific issues, to detect essential nuances in the way governments frame their climate policies and achieve climate goals. The methods leverage topic modeling and clustering for the comparative analysis of policy documents across different countries. It allows for easier integration in potential user-friendly applications for the development of theories and processes of climate policy. This would further lead to better citizen governance and engagement over climate policies and public policy research.
translated by 谷歌翻译
与经典的统计学习方法相比,机器和深度学习生存模型表现出相似甚至改进事件的预测能力,但太复杂了,无法被人类解释。有几种模型不合时宜的解释可以克服这个问题。但是,没有一个直接解释生存函数预测。在本文中,我们介绍了Survhap(t),这是第一个允许解释生存黑盒模型的解释。它基于Shapley添加性解释,其理论基础稳定,并在机器学习从业人员中广泛采用。拟议的方法旨在增强精确诊断和支持领域的专家做出决策。关于合成和医学数据的实验证实,survhap(t)可以检测具有时间依赖性效果的变量,并且其聚集是对变量对预测的重要性的决定因素,而不是存活。 survhap(t)是模型不可屈服的,可以应用于具有功能输出的所有型号。我们在http://github.com/mi2datalab/survshap中提供了python中时间相关解释的可访问实现。
translated by 谷歌翻译
预期的目标提供了对球队和球员表现的更具代表性的衡量标准,这也适合足球的低分性质,而不是现代足球比赛。比赛的得分涉及随机性,并且通常不能代表球队和球员的表现,因此近年来使用替代统计数据(例如目标,球控球和钻探)是很受欢迎的。为了衡量射击的可能性是预期目标的目标,使用了一些功能来训练基于事件并跟踪足球数据的预期目标模型。这些功能的选择,数据的大小和日期以及可能影响模型性能的参数。使用黑框机器学习模型来提高模型的预测性能,可降低其可解释性,从而导致可以从模型中收集的信息丢失。本文提出了一个准确的预期目标模型,该模型由2014 - 15年至2020 - 21年欧洲前五名的欧洲足球联赛的七个赛季中的315,430张训练。此外,通过使用可解释的人工智能工具来获取可解释的预期目标模型来评估团队或球员性能。据我们所知,这是第一篇论文,该论文展示了可解释的人工智能工具汇总配置文件的实际应用,以解释一组观察结果,以进行准确的预期目标模型,以监视团队和球员绩效。此外,这些方法可以推广到其他运动分支。
translated by 谷歌翻译
对深度学习应用的兴趣增加,以及他们的难以检测的偏见导致需要验证和解释复杂模型。然而,目前的说明方法是有限的,只要对推理过程和预测结果的解释来说都是如此。它们通常只显示模型预测很重要的图像中的位置。缺乏与解释互动的可能性使得难以确切地验证和理解模型如何工作。使用模型时,这会产生重大风险。通过解释不考虑解释的物体的语义含义,它变得复杂。为了逃避静态说明的陷阱,我们提出了一种称为Limecraft的方法,该方法允许用户交互地选择语义一致区域,并彻底检查图像实例的预测,在许多图像特征中。几种模型的实验表明,我们的方法通过检查可能表示模型偏差的图像片的模型公平来提高模型安全性。该代码可用于:http://github.com/mi2datalab/limecraft
translated by 谷歌翻译
评估模型性能的基准在机器学习中起重要作用。但是,没有确定的方法来描述和创建新的基准。此外,最常见的基准测试采用了具有多个限制的性能指标。例如,两个模型的性能差异没有概率的解释,没有参考点可以指示它们是否代表了显着的改进,并且比较数据集之间的此类差异是没有意义的。我们介绍了一种名为基于ELO的预测能力(EPP)的新的元评分评估,该评估构建在其他性能指标之上,并允许对模型进行可解释的比较。 EPP分数的差异具有概率的解释,可以直接比较数据集之间,此外,基于逻辑回归的设计允许根据偏差统计数据评估排名适应性。我们证明了EPP的数学属性,并通过30个分类数据集的大规模基准和视觉数据的现实基准测试的经验结果支持它们。此外,我们提出了一个统一的基准本体,用于对基准进行统一的描述。
translated by 谷歌翻译
数据革命对数据驱动的解决方案产生了巨大的需求。这一要求推动了越来越多的易于使用的工具和培训为有抱负的数据科学家提供,从而可以快速地构建预测模型。如今,无需详细的计划和验证即可轻松建造和部署数学破坏武器。这迅速扩大了AI失败的清单,即导致财务损失甚至违反民主价值(例如平等,自由和正义)的部署。围绕模型开发的计划,规则和标准缺乏,导致AI的无政府状态。此问题是在不同名称的情况下报告的,例如验证债务,可重复性危机和缺乏解释性。揭示了在模型开发或数据获取早期阶段犯的错误。因此,我们不再治愈部署有害模型的后果,而是通过将更多注意力提早地关注初始计划阶段来防止它们。在本文中,我们建议一个快速简单的框架来支持AI解决方案的规划。POCA框架基于四个支柱:性能,不透明,后果和假设。它有助于设置期望并计划在建立任何模型和任何模型之前的AI解决方案的约束条件收集了任何数据。借助POCA方法,可以为模型构建过程定义初步要求,以便昂贵的模型错误指定错误可以尽快甚至避免使用OR。 AI研究人员,产品所有者和业务分析师可以在构建AI解决方案的初始阶段使用此框架。
translated by 谷歌翻译
DatalOgMTL是与公制临时运算符的DataLog扩展程序,该临时操作员在基于时间本体的数据访问和查询答案以及流推理中找到了应用程序。DatalOgMTL的实用算法依赖于基于实质化的推理,在这些推理中,在连续的规则应用程序中以前向链接方式得出时间事实。但是,基于当前的基于物质化的程序是基于幼稚的评估策略,其中主要效率的主要来源源于冗余计算。在本文中,我们提出了一个基于物质化的过程,该过程类似于数据编号中的经典半算法,旨在通过确保在执行算法期间最多一次考虑每一个时间规则实例,以最大程度地减少冗余计算。我们的实验表明,我们针对DatalOgMTL的优化半策略能够显着减少实质化时间。
translated by 谷歌翻译
脊柱裂(SB)是在妊娠早期阶段出现的出生缺陷,脊髓周围的脊柱闭合不完全。对仍在怀孕子宫中的胎儿进行的对胎儿镜脊柱叶片修复的兴趣日益增加,这促使需要进行适当的训练。此类过程的学习曲线非常陡峭,需要出色的程序技能。基于计算机的虚拟现实(VR)模拟系统提供了一个安全,成本效益且可配置的培训环境,而没有道德和患者安全问题。但是,据我们所知,目前尚无用于胎儿镜SB修复程序的商业或实验VR培训模拟系统。在本文中,我们为SB-Repair的核心手动技能培训提供了新颖的VR模拟器。通过获得14位临床医生的主观反馈(面部和内容有效性),进行了初始的模拟现实主义验证研究。总体模拟现实主义平均在5分李克特量表上标记为4.07(1-非常不现实,5-非常现实)。它作为SB-REPAIR以及学习基本腹腔镜技能的有用性分别标记为4.63和4.80。这些结果表明,胎儿镜手术的VR模拟可能会导致外科训练,而不会使胎儿及其母亲处于危险之中。它还可以促进更广泛的胎儿镜手术适应,以代替更具侵入性的开放性胎儿手术。
translated by 谷歌翻译
生成对抗网络(GAN)是能够合成数据样本的强大模型,与真实数据的分布非常相似,但是由于所谓的模式崩溃现象在gans中观察到了这些生成样品的多样性受到限制。尤其容易崩溃的是有条件的gan,它们倾向于忽略输入噪声矢量并专注于条件信息。提议减轻这种限制的最新方法增加了生成的样品的多样性,但是当需要样品相似性时,它们会降低模型的性能。为了解决这一缺点,我们提出了一种新颖的方法,可以选择性地增加GAN生成样品的多样性。通过在训练损失功能中添加简单但有效的正则化,我们鼓励发电机发现与不同输出相关的输入的新数据模式,同时为其余的输出生成一致的样本。更确切地说,我们最大化生成的图像与输入潜在向量之间的距离之比,根据给定条件输入的样品的多样性缩放效果。我们在合成基准测试中显示了我们方法的优势,以及在CERN LHC的Alice实验零度量热计中模拟数据的现实情况。
translated by 谷歌翻译
估计数据分布的局部内在维度的大多数现有方法不能很好地扩展到高维数据。他们中的许多人依靠非参数最近的邻居方法,该方法受到维度的诅咒。我们试图通过提出一种新的问题来解决这一挑战:使用近似可能性(LIDL)的局部固有维度估计。我们的方法依赖于任意密度估计方法作为其子例程,因此通过利用最新的参数神经方法的进展来避免维度挑战,以进行可能性估计。我们仔细研究了所提出方法的经验特性,将其与我们的理论预测进行了比较,并表明LIDL在此问题的标准基准上产生竞争结果,并将其扩展到数千个维度。更重要的是,我们预计通过密度估计文献的持续进展,这种方法可以进一步改善。
translated by 谷歌翻译