Automated Machine Learning-based systems' integration into a wide range of tasks has expanded as a result of their performance and speed. Although there are numerous advantages to employing ML-based systems, if they are not interpretable, they should not be used in critical, high-risk applications where human lives are at risk. To address this issue, researchers and businesses have been focusing on finding ways to improve the interpretability of complex ML systems, and several such methods have been developed. Indeed, there are so many developed techniques that it is difficult for practitioners to choose the best among them for their applications, even when using evaluation metrics. As a result, the demand for a selection tool, a meta-explanation technique based on a high-quality evaluation metric, is apparent. In this paper, we present a local meta-explanation technique which builds on top of the truthfulness metric, which is a faithfulness-based metric. We demonstrate the effectiveness of both the technique and the metric by concretely defining all the concepts and through experimentation.
translated by 谷歌翻译
The discovery of drug-target interactions (DTIs) is a pivotal process in pharmaceutical development. Computational approaches are a promising and efficient alternative to tedious and costly wet-lab experiments for predicting novel DTIs from numerous candidates. Recently, with the availability of abundant heterogeneous biological information from diverse data sources, computational methods have been able to leverage multiple drug and target similarities to boost the performance of DTI prediction. Similarity integration is an effective and flexible strategy to extract crucial information across complementary similarity views, providing a compressed input for any similarity-based DTI prediction model. However, existing similarity integration methods filter and fuse similarities from a global perspective, neglecting the utility of similarity views for each drug and target. In this study, we propose a Fine-Grained Selective similarity integration approach, called FGS, which employs a local interaction consistency-based weight matrix to capture and exploit the importance of similarities at a finer granularity in both similarity selection and combination steps. We evaluate FGS on five DTI prediction datasets under various prediction settings. Experimental results show that our method not only outperforms similarity integration competitors with comparable computational costs, but also achieves better prediction performance than state-of-the-art DTI prediction approaches by collaborating with conventional base models. Furthermore, case studies on the analysis of similarity weights and on the verification of novel predictions confirm the practical ability of FGS.
translated by 谷歌翻译
变形金刚在NLP中广泛使用,它们始终如一地实现最先进的性能。这是由于他们基于注意力的架构,这使他们能够对单词之间的丰富语言关系进行建模。但是,变压器很难解释。能够为其决策提供推理是人类生命受影响的领域(例如仇恨言论检测和生物医学)的模型的重要特性。随着变压器在这些领域中发现广泛使用,因此需要为其量身定制的可解释性技术。在这项工作中研究了基于注意力的可解释性技术对文本分类中的有效性。尽管担心文献中的基于注意力的解释,但我们表明,通过适当的设置,可以将注意力用于此类任务,结果与最先进的技术相当,同时也更快,更友好。我们通过采用新功能重要性指标的一系列实验来验证我们的主张。
translated by 谷歌翻译
多标签分类是一项具有挑战性的任务,尤其是在要预测的标签数量很大的域中。深度神经网络通常在图像和文本数据的多标签分类方面有效。但是,在处理表格数据时,传统的机器学习算法(例如树形合奏)似乎超过了竞争。随机森林是一种流行的合奏算法,在各种现实世界中发现了使用。此类问题包括金融领域的欺诈检测,法律部门的犯罪热点检测以及生物医学领域,当患者记录可访问时疾病概率预测。由于它们对人们的生活有影响,因此这些领域通常需要可以解释决策系统。随机森林缺乏该特性,尤其是当使用大量树预测变量时。该问题在最近的一项名为Lionforests的研究中解决了有关单标签分类和回归。在这项工作中,我们通过对解释所涵盖的标签采用三种不同的策略来使该技术适应多标签分类问题。最后,我们提供了一组定性和定量实验,以评估该方法的功效。
translated by 谷歌翻译
主题控制的摘要是一个具有广泛潜在应用的新兴研究领域。但是,现有方法受到重大局限性。首先,目前尚无针对此任务的确定评估指标。此外,现有的方法基于经常性架构,与最新的基于变压器的架构相比,这可能会大大限制其性能,同时它们还需要对模型的架构进行修改以控制主题。在这项工作中,我们提出了一种新的面向主题的评估措施,以根据生成的摘要与所需主题之间的主题亲和力自动评估生成的摘要。我们还进行了一项用户研究,以验证该措施的可靠性。最后,我们提出了简单而有力的方法,用于将主题控制的摘要要么将主题嵌入到模型的体系结构中,要么采用控制令牌来指导摘要生成。实验结果表明,与更复杂的基于嵌入的方法相比,对照令牌可以实现更好的性能,同时更快。
translated by 谷歌翻译
发现药物目标相互作用(DTI)是一个非常有前途的研究领域,具有巨大的潜力。通过计算方法对药物和蛋白质之间可靠的相互作用的准确鉴定,这些方法通常利用从不同数据源检索到的异质信息,可以提高有效药物的发展。尽管随机行走和基质分解技术被广泛用于DTI预测中,但它们有几个局限性。通常以无监督的方式进行基于步行的嵌入生成,而矩阵分解中的线性相似性组合会扭曲不同视图提供的单个见解。为了解决这些问题,我们采用多层网络方法来处理多样化的药物和靶向相似性,并提出了一个新颖的优化框架,称为多重相似性基于DEEPSWALK的矩阵分解(MDMF),以进行DTI预测。该框架统一了嵌入的产生和相互作用预测,药物的学习矢量表示以及目标不仅保留了所有超层和特定层特异性局部不变性的高阶接近性,而且还可以近似与其内部产品的相互作用。此外,我们开发了一种集成方法(MDMF2A),该方法集成了MDMF模型的两个实例化,优化了Precision-Recall曲线(AUPR)和接收器操作特征曲线(AUC)下的面积。关于现实世界DTI数据集的实证研究表明,我们的方法在四种不同的环境中对当前最新方法实现了统计学上的显着改善。此外,对高度排名的非相互作用对的验证也证明了MDMF2A发现新型DTI的潜力。
translated by 谷歌翻译
计算模型已成为定量科学中的强大工具,以了解随时间发展的复杂系统的行为。但是,它们通常包含可能无法从理论中获得的值,但需要从数据中推断出其值。社会科学,经济学或计算流行病学中的模型尤其如此。然而,许多当前参数估计方法在数学上涉及,并且运行速度慢。在本文中,我们提出了一种计算简单且快速的方法,可以使用神经微分方程检索模型参数的准确概率密度。我们提出了一条管道,该管道包含多代理模型,该模型充当了普通或随机微分方程系统的前向求解器以及一个神经网络,然后从模型生成的数据中提取参数。这两个组合创建了一个强大的工具,即使对于非常大的系统,也可以快速估计模型参数的密度。我们演示了感染传播的SIR模型的合成时间序列数据的方法,并对网络上的Harris-Wilson经济活动模型进行了深入的分析,代表了非凸面问题。对于后者,我们将我们的方法应用于大伦敦的合成数据和经济活动数据。我们发现,我们的方法比先前使用经典技术对同一数据集进行的研究更准确地校准了数量级,同时运行的速度快于195至390倍。
translated by 谷歌翻译
神经切线内核(NTK)是分析神经网络及其泛化界限的训练动力学的强大工具。关于NTK的研究已致力于典型的神经网络体系结构,但对于Hadamard产品(NNS-HP)的神经网络不完整,例如StyleGAN和多项式神经网络。在这项工作中,我们为特殊类别的NNS-HP(即多项式神经网络)得出了有限宽度的NTK公式。我们证明了它们与关联的NTK与内核回归预测变量的等效性,该预测扩大了NTK的应用范围。根据我们的结果,我们阐明了针对外推和光谱偏置,PNN在标准神经网络上的分离。我们的两个关键见解是,与标准神经网络相比,PNN能够在外推方案中拟合更复杂的功能,并承认相应NTK的特征值衰减较慢。此外,我们的理论结果可以扩展到其他类型的NNS-HP,从而扩大了我们工作的范围。我们的经验结果验证了更广泛的NNS-HP类别的分离,这为对神经体系结构有了更深入的理解提供了良好的理由。
translated by 谷歌翻译
我们研究(选定的)宽,狭窄,深而浅,较浅,懒惰和非懒惰的训练环境中(选定的)深度神经网络中的平均鲁棒性概念。我们证明,在参数不足的环境中,宽度具有负面影响,而在过度参数化的环境中提高了鲁棒性。深度的影响紧密取决于初始化和训练模式。特别是,当用LeCun初始化初始化时,深度有助于通过懒惰训练制度进行稳健性。相反,当用神经切线核(NTK)初始化并进行初始化时,深度会损害稳健性。此外,在非懒惰培训制度下,我们演示了两层relu网络的宽度如何使鲁棒性受益。我们的理论发展改善了Huang等人的结果。[2021],Wu等。[2021]与Bubeck and Sellke [2021],Bubeck等人一致。[2021]。
translated by 谷歌翻译
神经体系结构搜索(NAS)促进了神经体系结构的自动发现,从而实现了图像识别的最新精度。尽管NAS取得了进展,但到目前为止,NAS对理论保证几乎没有关注。在这项工作中,我们研究了NAS在统一框架下的概括属性,从而实现(深)层跳过连接搜索和激活功能搜索。为此,我们从搜索空间(包括混合的激活功能,完全连接和残留的神经网络)的(包括)有限宽度方向上得出了神经切线核的最小特征值的下(和上)边界。由于在统一框架下的各种体系结构和激活功能的耦合,我们的分析是不平凡的。然后,我们利用特征值边界在随机梯度下降训练中建立NAS的概括误差界。重要的是,我们从理论上和实验上展示了衍生结果如何指导NAS,即使在没有培训的情况下,即使在没有培训的情况下,也可以根据我们的理论进行无训练的算法。因此,我们的数值验证阐明了NAS计算有效方法的设计。
translated by 谷歌翻译