胶质瘤是最常见的原发性脑恶性肿瘤,具有不同程度的侵袭性,可变预后和各种异质性组织亚区域,即肿瘤周围水肿/侵入组织,坏死核心,活性和非增强核心。这种内在的异质性也被用于它们的放射性表型,因为它们的子区域通过在多参数磁共振成像(mpMRI)扫描中传播的不同强度分布来描绘,反映了不同的生物学特性。它们的异质形状,范围和位置是其中的一部分。使这些肿瘤难以切除的因素,在某些情况下无法手术。切除肿瘤的数量也是纵向扫描中考虑的一个因素,用于评估表观肿瘤以进行潜在的进展诊断。此外,有越来越多的证据表明,各种肿瘤亚区域的准确分割可以为定量图像分析提供预测患者整体的基础。生存。该研究评估了在国际脑肿瘤分割(BraTS)挑战的最后七个实例(即2012-2018)期间用于mpMRI扫描中的脑肿瘤图像分析的最先进的机器学习(ML)方法。具体而言,我们专注于i)评估术前mpMRI扫描中各种神经胶质瘤亚区的分割,ii)通过肿瘤亚区的纵向生长评估潜在的肿瘤进展,超出RECIST标准的使用,以及iii)预测整体术前mpMRI扫描对经历完全切除的患者的生存率。最后,我们研究了为每个任务确定最佳ML算法的挑战,考虑到除了在每个挑战实例上多样化之外,多机构mpMRI BraTS数据集也是一个不断发展/不断发展的数据集。
translated by 谷歌翻译
在NeuroEvolution中,人工神经网络的拓扑结构采用进化算法进行优化,以解决数据回归,数据分类或强化学习中的任务。 NeuroEvolution的一个缺点是大量必要的适应性评估,这可能使得对于具有昂贵评估的任务(例如实时学习)非常有效。对于这些昂贵的优化任务,基于代理模型的优化经常应用,因为其具有良好的评估效率。虽然两个程序的组合似乎是一个有价值的解决方案,但是替代建模过程的适当距离测量的定义是困难的。在这项研究中,我们将通过使用基于替代模型的优化来扩展人工神经网络的笛卡尔遗传规划。我们提出了不同的距离测量,并在可复制的基准任务上测试我们的算法。结果表明,我们可以显着提高评估效率,并且基于相关神经网络行为的表型距离是最有希望的。
translated by 谷歌翻译
主题模型在自然语言处理及其他方面得到广泛应用。在这里,我们提出了一种新的框架,用于评估基于合成语料库的概率主题建模算法,该合成语料库包含明确定义的地面真实主题结构。我们的方法的主要创新是通过比较标记级别的指定主题标签来量化种植和推断的主题结构之间的一致性的能力。在实验中,我们的方法产生关于主题模型的相对强度的新颖见解,因为语料库特征变化,当种植结构薄弱时,主题模型的第一个证据是“不可检测的阶段”。我们还通过预测真实世界语料库中主题建模算法分类任务的性能,确定了对合成公司获得的见解的实际相关性。
translated by 谷歌翻译
已经提出基于符号的算法(例如signSGD)作为偏置梯度压缩技术,以减轻跨多个工作者的训练大型神经网络中的通信瓶颈。我们展示了简单的凸计数器 - 例子,其中signSGD没有收敛到最优。此外,即使它收敛,signSGD与SGD相比也可能表现不佳。这些问题的出现是因为符号压缩操作符的偏向性质。然后,我们表明使用错误反馈,即将压缩算子产生的错误纳入下一步,克服了这些问题。我们证明了我们的算法EF-SGD实现了与SGD相同的收敛速度,而没有任何压缩算子(包括标志运算符)的额外假设,这表明我们得到了免费的梯度压缩。 Ourexperiments彻底证实了表明算法优越性的理论。
translated by 谷歌翻译
传感器通常安装在机器人上,以获取时空领域的各种形式的测量。在资源受限的情况下,定位这些字段内的特征以及密集场的重建(映射)可能是具有挑战性的,例如当尝试从少量测量中找到agas泄漏源时。在这种情况下,可以利用基础复杂动力学模型来发现该领域内的信息路径。我们使用流体模拟器作为模型,以指导对气体泄漏位置的推断。我们通过最小化观察到的测量值与模拟器预测的气体浓度之间的差异来进行定位。我们的方法能够考虑动态变化的风流参数(例如,方向和强度),以及它对观察到的气体分布的影响。我们开发了用于离线推理的算法以及通过主动感测进行在线路径发现的算法。我们使用在室外环境中进行的物理机器人的实验证明了我们的算法的效率,准确性和多功能性。我们部署了一个安装有CO2传感器的无人驾驶飞行器(UAV),以通过喷嘴自动寻找气体二氧化碳排放。我们通过测量喷嘴的推断位置中的误差来评估我们的算法的准确性,基于哪个weshow我们提出的方法相对于艺术基线的状态是竞争的。
translated by 谷歌翻译
在过去几年中,布尔矩阵分解(BMF)已成为数据分析的重要方向。最小描述长度原理(MDL)在BMF中成功地适用于模型顺序选择。然而,从BMF中的标准测量的观点来看,BMF算法表现出良好的结果。在本文中,我们提出了一种基于形式概念分析的新型下布尔矩阵分解算法。该算法利用MDL原理作为因子选择的标准。在各种实验中,我们表明所提出的算法优于 - 从不同的角度 - 现有的最先进的BMF算法。
translated by 谷歌翻译
我们提出了第一种基于条件生成对抗网络(cGAN)的3D点云到图像转换的方法。该模型处理来自不同域的多模态信息源,即原始点集和图像。生成器能够处理三个条件,而点云被编码为原始点集和相机投影。 imagebackground补丁用作约束来偏置环境纹理。生成器内的全局近似函数直接应用于点云(Point-Net)。因此,代表性学习模型直接在潜在特征空间中结合全局3D特征。条件用于偏置背景和所生成图像的视点。这开辟了增强或纹理化3D数据的新方法,以瞄准生成个人图像。我们成功地在Kitti andSunRGBD数据集上评估了我们的方法,并获得了出色的物体检测初始分数。
translated by 谷歌翻译
训练非常大的机器学习模型需要分布式计算方法,模型更新的通信通常是瓶颈。出于这个原因,最近提出了几种基于更新的压缩(例如,稀疏化和/或量化)的方法,包括QSGD( Alistarh等,2017),TernGrad(Wen等,2017),SignSGD(Bernstein等,2018),和DQGD(Khirirat等,2018)。然而,这些方法都不能学习梯度,这意味着它们必然会遇到几个问题,例如在分批模式下无法收敛到真正的最佳状态,无法使用非光滑的正则化器,以及慢收敛速率。在这项工作中,我们提出了一种新的分布式学习方法--- DIANA ---通过压缩梯度差异来解决这些问题。我们在强凸和非凸面设置中进行理论分析,并表明我们的比率远远优于现有率。我们对块量化的分析以及$ \ ell_2 $和$ \ ell_ \ infty $量化之间的差异弥补了理论和实践中的差距。最后,通过将我们的分析技术应用于TernGrad,我们为此方法建立了第一个收敛。
translated by 谷歌翻译
堆叠是将多个模型组合在一起以获得更高预测精度的通用方法。它已经发现了不同领域的各种应用,这源于其元学习性质。然而,我们对如何以及为什么堆叠工作的理解仍然是直观的,缺乏理论上的洞察力。在本文中,我们使用学习算法的稳定性作为适合解决问题的元素分析框架。为此,我们分析了堆叠,袋堆叠和dag堆叠的假设稳定性,从而在袋堆叠和加重装袋之间建立了连接。我们证明了堆叠的假设稳定性是每个基本模型和组合器的假设稳定性的乘积。此外,在袋堆叠和堆叠中,假设稳定性取决于用于生成训练集重复的采样策略。我们的研究结果表明,1)子采样和自助采样提高了堆垛的稳定性,2)堆垛提高了包装和装袋的稳定性。
translated by 谷歌翻译
最近关于集合上函数表示的工作考虑了在潜在空间中使用求和来强制置换不变性。特别是,有人推测,随着所考虑的集合的基数增加,这个潜在空间的维度可能会保持不变。但是,我们证明导致这种猜想的分析需要高度不连续的映射,并认为这仅仅是有限的实际用途。 。在这种观察的启发下,我们证明了通过连续映射(例如由神经网络或高斯过程提供)实现该模型实际上对该空间的维度施加了约束。用于设定输入的实际通用函数表示通常至少具有输入元素的最大数量的大小的潜在维度来实现。
translated by 谷歌翻译