源代码的AI建模理解任务一直在取得重大进展,并正在生产开发管道中采用。然而,可靠性问题,特别是模型是否实际上是学习源代码的任务相关方面,正在提出。虽然最近的模型探测方法已经观察到许多用于代码模型中的信号意识缺乏信号意识,即,未捕获任务相关信号的模型,它们不提供解决问题的解决方案。在本文中,我们探索了数据驱动的方法来提高模型的模型“信号意识:1)我们将SE概念与课程学习的AI技术相结合; 2)通过自定义Delta调试以生成简化的信号保留程序,将它们纳入AI模型,将SE辅助纳入AI模型。通过我们的技术,我们在模型信号意识方面取得了高达4.8倍的提高。使用代码复杂性的概念,我们进一步从数据集的角度介绍了一种新颖的学习内省方法。
translated by 谷歌翻译
近期目睹了机器学习算法系统的快速发展,尤其是加强学习,自然语言处理,计算机和机器人视觉,图像处理,语音和情感处理和理解。凭借机器学习模型,算法及其应用的越来越重要和相关性,并且随着更多创新使用的深度学习和人工智能的情况,目前的体积呈现出一些创新研究工作及其在现实世界中的应用,如股票交易,医疗和医疗保健系统和软件自动化。本书中的章节说明了如何设计,优化和部署机器学习和深度学习算法和模型。该体积对于高级毕业生和博士生,研究人员,大学教师,练习数据科学家和数据工程师,专业人士和顾问以及在机器学习,深度学习和人工智能的广泛领域。
translated by 谷歌翻译
深度学习(DL)模型为各种医学成像基准挑战提供了最先进的性能,包括脑肿瘤细分(BRATS)挑战。然而,局灶性病理多隔室分割(例如,肿瘤和病变子区)的任务特别具有挑战性,并且潜在的错误阻碍DL模型转化为临床工作流程。量化不确定形式的DL模型预测的可靠性,可以实现最不确定的地区的临床审查,从而建立信任并铺平临床翻译。最近,已经引入了许多不确定性估计方法,用于DL医学图像分割任务。开发指标评估和比较不确定性措施的表现将有助于最终用户制定更明智的决策。在本研究中,我们探索并评估在Brats 2019-2020任务期间开发的公制,以对不确定量化量化(Qu-Brats),并旨在评估和排列脑肿瘤多隔室分割的不确定性估计。该公制(1)奖励不确定性估计,对正确断言产生高置信度,以及在不正确的断言处分配低置信水平的估计数,(2)惩罚导致更高百分比的无关正确断言百分比的不确定性措施。我们进一步基准测试由14个独立参与的Qu-Brats 2020的分割不确定性,所有这些都参与了主要的Brats细分任务。总体而言,我们的研究结果证实了不确定性估计提供了分割算法的重要性和互补价值,因此突出了医学图像分析中不确定性量化的需求。我们的评估代码在HTTPS://github.com/ragmeh11/qu-brats公开提供。
translated by 谷歌翻译
互动对象理解,或者我们可以对对象做些什么以及计算机愿景的长期目标。在本文中,我们通过观察野外的自我高端视频的人类手来解决这个问题。我们展示了观察人类的手与之交互以及如何提供相关数据和必要的监督。参加双手,容易定位并稳定积极的物体以进行学习,并揭示发生与对象的交互的地方。分析手显示我们可以对物体做些什么以及如何做些。我们在史诗厨房数据集上应用这些基本原则,并成功地学习了国家敏感的特征,以及互动区域和提供了麦克拉斯的地区),纯粹是通过观察在EGoCentric视频中的手。
translated by 谷歌翻译
单个设备负载和能量消耗反馈是追求用户节省住宅能源的重要方法之一。这可以帮助在未使用时通过设备识别错误的设备并通过设备浪费能量。主要挑战是身份和估计每个设备上没有侵入式传感器的单个设备的能耗。非侵入性负荷监测(尼芯)或能量分解,是一种盲源分离问题,需要一个系统来估计来自聚合的家庭能量消耗的单个设备的电力使用。在本文中,我们提出了一种基于深度神经网络的基于深度神经网络的方法,用于在居住户口获得的低频电力数据上进行负载分解。我们将一系列一维卷积神经网络和长短期存储器(1D CNN-LSTM)组合以提取可以识别主动设备的特征,并给出聚合的家庭功率值的功耗。我们使用CNN在给定的时间帧中从主读取中提取特征,然后使用这些功能来分类给定设备在该时间段内是否有效。在此之后,提取的功能用于使用LSTM来模拟生成问题。我们训练LSTM以产生特定设备的分列的能耗。我们的神经网络能够产生需求方的详细反馈,为最终用户提供了重要的洞察力。该算法设计用于低功耗离线设备,如ESP32。实证计算表明,我们的模型优于参考能量分类数据集(REDD)的最先进。
translated by 谷歌翻译
网络系统研究中的一个关键任务是导出影响连接,同步性和鲁棒性的本地和全局属性。计算网络中的最短路径或测地仪产生节点中心性和网络连接的措施,可以有助于解释此类现象。我们在无限尺寸的限制中,我们从超临界制度的巨大分量或亚临界方案中的小部件上的巨型分量的分析分布分布在亚临界方案中的任何稀疏(可能导向的)图中,在无限尺寸的限制中。我们为广泛使用的网络系列提供了特定的结果,如随机块模型,DOT-Product图,随机几何图和Graphons等。最短路径长度分布的生存函数具有简单的闭合形式下绑定,该下绑定是有限长度的渐近紧密,具有在网络中遍历独立的测地仪的自然解释,并在上述网络系列中提供新的洞察力。值得注意的是,最短的路径长度分布允许我们为上面的网络系列推导,重要的图形属性如键的渗透阈值,巨大分量的大小,平均最短路径长度和接近度和中心之间。我们还提供了一组20个经验网络的核心分析。这个统一框架演示了如何在不访问真实或模拟网络的情况下计算丰富的随机图系列随机图的测地统计信息,特别是当它们稀疏而且过度大。
translated by 谷歌翻译
缺乏现实世界中深度神经网络可靠性缺乏可靠性的关键原因,他们对与真正标签的因果关系不相关的虚假输入特征的繁重依赖。专注于图像分类,我们将因果属性定义为始终是对象的一部分的可视特征,而杂散属性是可能与对象一起发生但不是它(例如,属性“的一部分手指“课堂”乐队援助“)。用于发现虚假功能的传统方法需要广泛的人类注释(因此,不可扩展),或者对特定模型有用。在这项工作中,我们介绍了一种可扩展的框架,以发现在一般模型推断下使用的虚假和因果视觉属性的子集,并在大量图像上本地化,具有最小的人类监督。我们的方法基于该关键的想法:识别模型预测中使用的虚假或因果视觉属性,我们通过有限的人类监督识别虚假或因果关系(鲁棒模型的倒数二次层神经元)(例如,使用每一个激活图像特征)。然后,我们认为这些神经特征注释在没有任何人类监督的情况下概括到更多图像。我们使用这些神经功能的激活图作为软掩模,以突出虚假或因果视觉属性。使用这种方法,我们介绍了来自想象成的大量样本的因果和虚假掩模的因果态图像。我们评估了几种流行的想象成型模型的表现,并表明他们严重依赖于他们预测中的各种杂散特征。
translated by 谷歌翻译
归一化流提供一种优雅的方法,用于通过使用可逆的变换获得来自分布的易于密度估计。主要挑战是提高模型的表现,同时保持可逆性约束完整。我们建议通过纳入本地化的自我关注来这样做。然而,传统的自我关注机制不满足获得可逆流的要求,并且不能胆无利地结合到标准化流中。为了解决这一点,我们介绍了一种称为细微的收缩流(ACF)的新方法,它利用了一种特殊类别的基于流的生成模型 - 收缩流。我们证明可以以即插即用的方式将ACF引入到最新的现有技术的状态。这被证明是不仅改善了这些模型的表示力(改善了每次昏暗度量的比特),而且还导致训练它们的速度明显更快。在包括测试图像之间的分隔的定性结果证明样本更加现实并捕获数据中的本地相关性。我们通过使用AWGN进行扰动分析来进一步评估结果,证明ACF模型(特别是点 - 产品变体)表现出更好,更加一致的恢复能力噪声。
translated by 谷歌翻译
草图是一种从个人的创造性角度传达视觉场景的媒介。添加颜色基本上增强了草图的总体表征。本文提出了通过利用轮廓绘制数据集来模仿人绘制着色草图的两种方法。我们的第一个方法通过应用k-means颜色聚类辅助的图像处理技术来呈现彩色的轮廓草图。第二种方法使用生成的对抗性网络来开发一个可以从先前未观察到的图像生成彩色草图的模型。我们评估通过定量和定性评估获得的结果。
translated by 谷歌翻译
可说明的机器学习(ML)近年来由于许多部门的ML基系统的增加而增加了近年来。算法refurrses(ARS)提供“如果输入数据点为x'而不是x的形式的反馈,那么基于ML的系统的输出将是Y'而不是Y.”由于其可行的反馈,对现有的法律框架和忠诚于底层ML模型,ARS由于其可行的反馈而具有吸引力。然而,当前的AR方法是单次拍摄 - 也就是说,它们假设X可以在单个时间段内更改为X'。我们提出了一种新的基于随机控制的方法,它产生序贯ARS,即允许X随机X移动到最终状态X'的ARS。我们的方法是模型不可知论和黑匣子。此外,ARS的计算被摊销,使得一旦训练,它适用于多个DataPoints,而无需重新优化。除了这些主要特征之外,我们的方法还承认可选的Desiderata,例如遵守数据歧管,尊重因果关系和稀疏性 - 通过过去的研究确定的ARS的理想性质。我们使用三个现实世界数据集评估我们的方法,并表现出尊重其他追索者的顺序ARS的成功生成。
translated by 谷歌翻译