基于树的机器学习模型,例如随机森林,决策树和梯度增强树,是当今实践中使用的最流行的非线性预测模型,但是对于解释它们的预测却相对较少关注。在这里,我们通过三个主要贡献显着提高了树模型的可解性:1)基于游戏理论计算最优解释的第一个多项式时间算法。 2)一种直接测量局部特征相互作用效果的新型解释。 3)一组新的工具,用于基于每个预测的许多局部解释来理解全局模型结构。我们将这些工具应用于三个医学机器学习问题,并展示如何结合许多高质量的局部解释使我们能够代表全局结构,同时保持对原始模型的本地忠诚度。这些工具可以使我们知道i)在美国一般人群中识别高幅度但低频率的非线性死亡率因素,ii)突出显示具有共同风险特征的不同群体子群,iii)识别慢性肾病危险因素之间的非线性相互作用, iv)通过识别哪些特征随着时间的推移降低模型的性能来监控部署在医院中的机器学习模型。鉴于基于树的机器学习模型的普及,这些对其可解释性的改进对于广泛的领域具有影响。
translated by 谷歌翻译
我们提出了一种深度强化学习方法来优化静态编译器中计算图的执行成本。关键思想是将神经网络策略与遗传算法 - 偏差随机密钥遗传算法(BRKGA)相结合。在给定要优化的输入图的情况下,策略被训练以预测BRKGA中的采样突变和交叉的节点级概率分布。我们的方法“基于REINFORCE的遗传算法学习”(REGAL)使用该策略转移到新图表的能力,以显着提高遗传算法的解决方案质量,以获得相同的客观评估预算。作为一个具体的应用,我们通过联合优化设备布局和调度来显示TensorFlow图中最小化峰值记忆的结果。在以前看不见的图表上,REGAL的峰值内存平均比BRKGA低3.56%,优于我们比较的所有算法,并且比下一个最佳算法的改进大4.4倍。我们还对生产编译器团队的XLA图表性能基准进行了评估,并且比BRKGA平均降低了3.74%的峰值内存,再次超越了所有人。我们的方法和分析是通过收集372个独特的真实世界TensorFlow图表的数据集来实现的,这比以前的工作多了一个数量级。
translated by 谷歌翻译
双边和非本地均值过滤器是基于内核的过滤器的实例,其通常用于图像处理。最近表明,可以使用核矩阵的低秩近似来执行灰度图像的快速且准确的双边滤波。更具体地,基于核矩阵的特征分解,使用空间卷积对整体滤波进行近似,对于该空间卷积,可以使用有效的算法。不幸的是,这种技术无法扩展到高维数据,如颜色和高光谱图像。这仅仅是因为需要计算/存储大矩阵并在此情况下执行其特征分解。我们展示了如何使用Nystr \“om方法解决这个问题,这种方法通常用于近似大矩阵的特征分解。所得算法也可用于非局部均值滤波。我们证明了我们的双边和非局部均值滤波方法的有效性。特别是,我们的方法与最先进的快速算法相比具有竞争力,而且它具有对近似误差的理论保证。
translated by 谷歌翻译
通常采用面内像素间距来获取三维(3D)生物医学图像集,所述面内像素间距远小于图像之间的面外间距。可以使用图像插值来减少在许多应用中可能有害的合成各向异性。已经证明光流和/或其他基于注册的内插器在过去的这种插值中起作用。当获取的图像由描述流体流速的信号组成时,可以使用附加信息来指导插值过程。在本文中,我们提出了一种基于光流的图像插值框架,它还可以最小化插值数据中的合成发散。
translated by 谷歌翻译
传统的反馈控制方法可以通过使用显式模型(例如刚体运动方程)捕获结构来非常有效地解决各种类型的机器人控制问题。然而,现代制造中的许多控制问题涉及接触和摩擦,这对于一阶物理建模是困难的。因此,将控制设计方法应用于这些类型的问题通常会导致脆弱且不准确的控制器,必须手动调整以进行部署。已证明强制学习(RL)方法能够通过与环境的交互来学习连续机器人控制器,即使对于包括摩擦和接触的问题。在本文中,我们研究如何通过将它们分解为通过常规反馈控制方法有效求解的部分以及用RL求解的残差来解决现实世界中的困难控制问题。最终控制策略是两个控制信号的叠加。我们通过训练代理来演示我们的方法,以成功执行涉及联系人和不稳定对象的真实世界块组装任务。
translated by 谷歌翻译
我们提出了一种新的视频编码算法,为低延迟模式学习端到端。在此设置中,我们的方法在几乎整个比特率范围内都优于所有现有的视频编码。据我们所知,这是第一个基于ML的方法。我们在低延迟模式下评估我们针对不同分辨率的标准视频压缩测试集的方法,以及针对所有主流商业编解码器的基准测试。在标准清晰度视频上,相对于我们的算法,HEVC / H.265,AVC / H.264和VP9通常会产生高达60%的代码。高清1080p视频,H.265和VP9通常可以产生高达20%的代码,而H.264则高出35%。此外,我们的方法不会受到块效应和像素化的影响,从而产生视觉上更令人愉悦的视频。我们提出两项主要贡献。第一种是用于视频压缩的新颖架构,其(1)推广运动估计以执行超出简单翻译的任何学习的补偿,(2)而不是严格地依赖于先前传输的参考帧,维持由模型学习的任意信息的状态,以及(3)能够共同压缩所有传输的信号(例如光流和残余)。其次,我们提出了一个基于ML的空间速率控制的框架:即,为每个帧在空间分配可变比特率的机制。这是视频编码的关键组件,据我们所知,这些组件尚未在机器学习环境中进行开发。
translated by 谷歌翻译
用于双边和非局部的现有快速算法意味着过滤主要与灰度图像一起工作。它们不能轻易扩展到高维数据,如颜色和高光谱图像,基于补丁的数据,流场等。在本文中,我们提出了一种快速的高维双向非局部均值滤波算法。与现有方法不同,现有方法的重点是使用量化(使用量化)或滤波器内核(通过analyticexpansions),我们使用高斯的加权和移位复制本地近似内核,其中权重和移位是从数据推断出来的。算法从提出的近似中出现的基本上涉及聚类和快速卷积,并且易于实现。此外,我们的算法的变体带有对近似误差的保证(约束),这是现有算法不能享受的。我们提出了一些高维双边和非局部均值滤波的结果,以证明我们提议的速度和准确性。此外,我们还表明,我们的算法在准确性和定时方面可以超越最先进的快速近似。
translated by 谷歌翻译
脑室(BV)结构的体积分析是研究胚胎小鼠中枢神经系统发育的关键工具。高频超声(HFU)是唯一可用于子宫内胚胎的快速体积成像的非侵入性实时模态。然而,从HFU卷手动分割BV是繁琐,耗时的,并且需要专门的特性。在本文中,我们提出了一种基于深度学习的BV分段系统,用于小鼠胚胎的全身HFU图像。我们的全自动系统包括两个模块:本地化和分段。它首先在整个体积的3D滑动窗口上应用体积卷积神经网络,以识别包含整个BV的3D边界框。然后使用完全卷积网络将检测到的边界框分割成BV和背景。该系统实现了骰子相似系数(DSC)为0.8956,对于看不见的111 HFU体积测试的BV分割,其通过先前的现有技术方法(DSC为0.7119),保证率为25%。
translated by 谷歌翻译
活细胞表现出身体组织的生长和再生。表观遗传追踪(ET)模拟活细胞的这种生长和再生品质,并已用于生成复杂的2D和3D形状。在本文中,我们提出了一种基于ET的算法,该算法帮助一群相同程序的机器人形成任意形状并在切割时重新生成它们。该算法以分布式方式使用仅使用局部交互和计算而无需任何中央控制,并帮助机器人形成三角形晶格结构中的形状。在形状受损或分裂的情况下,它帮助剩余机器人的每组再生并将其自身定位以构建原始形状的缩小版本。本文介绍了使用Kilombo模拟器通过算法形成和再生的形状。
translated by 谷歌翻译
材料理解对于设计,几何建模和功能对象分析至关重要。我们通过使用投影卷积神经网络架构来实现材料感知3D形状分析,以从基于视图的3D点表示中学习材料感知描述符,用于点材料分类或材料感知检索。不幸的是,3D存储库中只有一小部分形状被物理标记物标记,这对学习方法构成了挑战。为了解决这一挑战,我们使用部分材料标签对3080个3D形状的数据集进行众包。我们专注于具有有趣结构和材料多变性的家具模型。此外,我们还为来自Herman-Miller和宜家的115种形状提供高质量的专家标记基准,以进行评估。我们进一步应用网格感知条件随机场,其中包含旋转和反射对称,以平滑我们对相邻曲面块的局部材料预测。我们展示了自学纹理,材料感知检索和物理模拟的学习描述符的有效性。数据集和代码将公开提供。
translated by 谷歌翻译