基于树的机器学习模型,例如随机森林,决策树和梯度增强树,是当今实践中使用的最流行的非线性预测模型,但是对于解释它们的预测却相对较少关注。在这里,我们通过三个主要贡献显着提高了树模型的可解性:1)基于游戏理论计算最优解释的第一个多项式时间算法。 2)一种直接测量局部特征相互作用效果的新型解释。 3)一组新的工具,用于基于每个预测的许多局部解释来理解全局模型结构。我们将这些工具应用于三个医学机器学习问题,并展示如何结合许多高质量的局部解释使我们能够代表全局结构,同时保持对原始模型的本地忠诚度。这些工具可以使我们知道i)在美国一般人群中识别高幅度但低频率的非线性死亡率因素,ii)突出显示具有共同风险特征的不同群体子群,iii)识别慢性肾病危险因素之间的非线性相互作用, iv)通过识别哪些特征随着时间的推移降低模型的性能来监控部署在医院中的机器学习模型。鉴于基于树的机器学习模型的普及,这些对其可解释性的改进对于广泛的领域具有影响。
translated by 谷歌翻译
强化学习代理中的层次结构允许在多个时间尺度上进行控制,从而提高样本效率,处理长期视野的能力以及子策略可转移到训练分布之外的任务。它通常作为主要策略实施,为asub-policy提供目标。理想情况下,我们希望学习目标空间,但是,最佳目标空间的属性仍然是未知的,因此还没有方法可以学习最佳目标空间。受此启发,系统地分析了对地面真实目标空间的各种修改如何影响层次模型中的学习,目的是识别最佳目标空间的重要性质。我们的研究结果表明,虽然地面真实目标空间和噪声的旋转没有影响,但是在分层模型中有额外的不必要因素会严重影响学习。
translated by 谷歌翻译
真实世界的自动驾驶车辆通常在先验的非知识环境中运行。由于这些系统中的大多数都是安全关键的,因此确保它们在面对环境不确定性(例如看不见的障碍物)时安全运行非常重要。当前的安全分析工具使得自治系统能够在给出有关环境状态的完整信息的情况下对安全性进行审查。但是,这些工具无法很好地适应实时感测环境的情况,例如在导航任务期间。在这项工作中,我们提出了一种基于哈密尔顿 - 雅可比可达性的新型实时安全分析方法,该方法在环境不确定的情况下提供了强有力的安全保证。我们的安全方法与计划者无关,并为各种测绘传感器提供保证。我们展示了我们的方法模拟和硬件,以围绕最先进的基于视觉的,基于学习的规划器提供安全保障。
translated by 谷歌翻译
使机器人能够理解通过口头自然语言提供的指令将有助于机器人与家庭和工作场所中各种设置的人之间的互动。然而,自然语言指令缺少基于环境背景和常识对人类显而易见的信息,因此不需要明确说明。在本文中,我们介绍了基于语言模型的CommonsenseReasoning(LMCR),这是一种新的方法,它使机器人能够听取人类的自然语言指令,观察周围环境,并自动填写指令环境背景中缺失的信息。一种新的常识推理方法。我们的方法首先将作为无约束自然语言提供的指令转换为机器人可以通过将其解析为动词帧来理解的形式。我们的方法是通过观察附近的物体并利用常识推理来填充指令中缺失的信息。为了自动学习常识性,我们的方法通过训练语言模型从大型结构化文本语料库中提取知识。我们的结果显示了机器人从基于网络的文本语料库中自动学习常识知识的可行性,以及学习常识推理模型在使机器人能够基于不完整语言指令自主执行任务时的能力。
translated by 谷歌翻译
我们提出了时空视频问答的任务,它要求智能系统同时检索相关时刻并检测引用的视觉概念(人和物)以回答有关视频的自然语言问题。我们首先使用310.8kb的边框来增加TVQA数据集,将描述的对象链接到问题和答案中的视觉概念。我们将此增强版本命名为TVQA +。然后,我们提出了具有基础证据的时间回答者(STAGE),这是一个统一的框架,可以在空间和时间领域中提供证据来回答关于视频的问题。全面的实验和分析证明了我们的框架的有效性以及我们的TVQA +数据集中的丰富注释如何有助于问题回答任务。作为副产品,通过执行此联合任务,我们的模型能够产生更具洞察力的中间结果。数据集和代码是公开的。
translated by 谷歌翻译
Accurate diagnosis is crucial for preventing the progression of Parkinson's, as well as improving the quality of life with individuals with Parkinson's disease. In this paper, we develop a gender-specific and age-dependent classification method to diagnose the Parkinson's disease using the handwriting based measurements. The gender-specific and age-dependent classifier was observed significantly outperforming the generalized classifier. An improved accuracy of 83.75% (SD = 1.63) with the female-specific classifier, and 79.55% (SD = 1.58) with the old-age dependent classifier was observed in comparison to 75.76% (SD = 1.17) accuracy with the generalized classifier (One way ANOVA with Tukey's honestly significant difference post hoc test, p<0.05). Finally, combining the age and gender information proved to be encouraging in classification. We performed a rigorous analysis to observe the dominance of gender-specific and age-dependent features for Parkinson's detection and ranked them using the support vector machine (SVM) ranking method. Distinct set of features were observed to be dominating for higher classification accuracy in different category of classification.
translated by 谷歌翻译
混合多项Logit(MMNL)模型的标准Gibbs采样器涉及使用Metropolis-Hastings(MH)算法从效用参数的条件密度进行采样,因为对于日志内核的共轭先验不可用。为了解决这种非共轭问题,我们提出应用P \'olygamma数据增强(PG-DA)技术进行MMNL估计。对于两个替代方案(二元选择),增强和默认Gibbs采样器的后验估计是相似的,但是在更多替代方案($ J \ geq 3 $)的情况下我们遇到了经验识别问题。
translated by 谷歌翻译
体验式问答(EQA)是一项相对较新的任务,代理人需要从自我中心的感知中回答有关其环境的问题。 EQA制定了一个基本假设,即每个问题,例如“什么颜色是汽车?”,只有一个目标(“汽车”)被询问。该假设直接限制了代理人的能力。我们提出EQA的时间化 - 多目标EQA(MT-EQA)。具体来说,我们研究了其中有多个目标的问题,例如“卧室中的梳妆台是否比厨房的烤箱大?”,代理人必须导航到多个位置(“卧室梳妆台”,“厨房烤箱”)并且在它能回答问题之前执行比较推理(“梳妆台”比“烤箱”更大)。这些问题需要在代理中开发全新的模块或组件。为了解决这个问题,我们提出了一个由程序生成器,控制器,导航器和VQA模块组成的模块化架构。程序生成器将给定的问题转换为顺序的可执行子程序;导航器将代理引导到与导航相关的子程序相关的多个位置;并且控制器学会沿其路径选择相关的观察。然后将这些观察结果馈送到VQA模块以预测答案。我们对每个模型组件进行详细分析,并表明我们的联合模型可以在很大程度上优于以前的方法和强大的基线。
translated by 谷歌翻译
变分贝叶斯(VB)方法已经成为用于混合多项Logit(MMNL)模型的贝叶斯估计的马尔可夫链蒙特卡罗(MCMC)方法的快速且计算有效的替代方法。已经确定VB实际上比MCMC快得多,实际上在预测准确性方面没有妥协。在本文中,我们讨论了关于VB对MMNL的使用和理解的两个关键问题。首先,现有的VB方法仅限于涉及个体特定味道参数的实用规范。其次,VB估计量的有限样本性质以及VB,MCMC和最大模拟似然估计(MSLE)的相对性能尚不清楚。为了解决前者问题,本研究针对MMNL推出了几种VB方法,以允许实用规范,包括固定和随机效用参数。为了解决后者问题,我们进行了广泛的基于仿真的评估,以便在估算时间,参数恢复和预测精度方面对MCMC和MSLE的扩展VB方法进行基准测试。结果表明,所有VB变体在预测和恢复所有模型参数时都表现出MCMC和MSLE,并且多变量正态混合分布的协方差矩阵的出现。特别是,具有非共轭变分消息传递的VB和delta方法(VB-NCVMP-Delta)相对准确,比MCMC和MSLE快15倍。总的来说,VB-NCVMP-Delta是最适合快速预测最重要的应用,而MCMC应该在准确推断最重要的应用中优先考虑。
translated by 谷歌翻译
由于不受约束的外观变化和动态环境,视觉跟踪是一个复杂的问题。通过多种特征从对象环境中提取补充信息并适应目标的外观变化是这项工作的关键问题。为此,我们提出了一种基于多线索统一图形融合(UGF)的鲁棒对象跟踪框架,以适应对象的外观。所提出的稀疏和密集特征的交叉扩散不仅抑制了各个特征的缺陷,而且还从多线索中提取了补充信息。这种迭代过程构建了强大的统一特征,这些特征对于对象变形,快速运动和遮挡是不变的。统一特征的稳健性还使随机森林分类器能够精确地区分前景和背景,增加了背景杂乱的弹性。此外,我们提出了一种新的基于核的自适应策略,使用离群检测和转换可靠性度量。适应策略更新外观模型以适应比例,照明,旋转的变化。对25个基准视频序列(OTB-50,OTB-100和VOT2017 / 18)的定性和定量分析表明,在各种对象跟踪挑战下,所提出的UGF跟踪器对15种其他最先进的跟踪器有利。
translated by 谷歌翻译