AdaNet是一个基于TensorFlow的轻量级(Abadi等,2015)框架,可以自动学习高质量的集合,只需要很少的专家干预。我们的框架受到AdaNet算法的启发(Cortes等,2017),它融合了神经网络的结构作为子网的集合。我们将其设计为:(1)与现有的TensorFlow生态系统集成,(2)可提供的默认搜索空间,以便在新数据集上表现良好;(3)提供灵活的API以在可用时利用专家信息,以及(4)通过分布式CPU有效加速培训,GPU和TPU硬件。代码isopen-source,可从以下网址获得:https://github.com/tensorflow/adanet。
translated by 谷歌翻译
寻找最佳的神经网络架构需要大量的时间,资源和人力资源。这些挑战部分地通过自然架构搜索(NAS)来解决,其能够找到最佳卷积层或小区,然后将其用作网络的构建块。但是,一旦找到一个好的构建块,仍然需要手动设计将最终体系结构组合为在预定义参数预算约束下的多个块的组合。常见的解决方案是将这些块堆叠到单个塔中并调整宽度和深度以填充参数预算。然而,这些单塔架构可能不是最佳的。相反,在本文中,我们提出了AdaNAS算法,它使用集合技术将神经网络自动组合成一个较小网络的集合。此外,我们引入了一种基于知识蒸馏的新技术,使用以前的集合作为教师来训练较小的网络。我们的实验表明,网络集合可以在单个神经网络上提高准确性,同时保持相同数量的参数。我们的模型与最先进的onCIFAR-10实现了可比较的结果,并在CIFAR-100上树立了最新的先进技术。
translated by 谷歌翻译
进化和学习是生命适应生存和超越限制的两个基本机制。这些生物学现象启发了成功的计算方法,如进化算法和深度学习。进化依赖于随机突变和随机遗传重组。在这里,我们表明,学习进化,即学习变异和重组比在任意时更好,改善了每代健身增加的进化结果,甚至在可达到的健康方面。我们使用深度强化学习来学习动态调整进化算法的策略以适应不同的环境。我们的方法在组合和连续优化问题上优于经典的进化算法。
translated by 谷歌翻译
在本文中,我们提出了一个生成框架,在不受约束的情景中,在具有重度遮挡和任意面部表情变化的情况下,动态地统一基于深度的3D面部姿势跟踪和面部模型适应。具体地,我们引入了一种灵活描述的统计3D可变形模型。面部模型表面上的点分布,具有足够的可切换在线适应性,逐渐捕获被跟踪对象的身份,并在主体改变时快速构建合适的面部模型。此外,与采用基于ICP的面部姿态估计的现有技术不同,为了提高对遮挡的鲁棒性,我们提出了一种射线可见度约束,其基于面部模型相对于输入点云的可见性来规范姿势。关于百威和ICT-3DHP数据集的消融研究和实验结果表明,所提出的框架是有效的,并且优于完成最先进的基于深度的方法。
translated by 谷歌翻译
乳腺癌是全世界死亡的主要原因之一。手术后组织中残留肿瘤的组织病理学细胞学评估用于分析肿瘤对治疗的反应。正确的细胞评估会增加获得适当治疗的机会,并促进患者的生存。在目前的临床实践中,肿瘤细胞性由病理学家手动估计;这个过程繁琐且容易出现评估者之间的错误或低协议率。在这项工作中,我们评估了三种强大的基于深度学习的方法,用于自我评估肿瘤细胞的肿瘤细胞性,后者用苏木精和伊红染色。我们在BreastPathQSPIE挑战数据集上验证了所提出的方法,该数据集包括从从64名患者获得的滑侧图像中选择的2395个图像块。与专家病理学家评分相比,我们表现最佳的方法得出Cohen的kappa系数为0.70(文献中先前已知的vs.0.42),并且类内相关系数为0.89(vs.0.83)。我们的研究结果表明,基于深度学习的方法具有显着的潜力,可以减轻病理学家的负担,增强诊断工作流程,从而促进乳腺癌治疗中更好的临床结果。
translated by 谷歌翻译
卷积神经网络(CNN)现在非常流行用于图像处理。 CNN允许人们在(大多数)监督机器学习环境中学习最佳滤波器。然而,这通常需要大量标记的训练数据来估计滤波器参数。已经部署了替代策略以减少要学习的参数和/或滤波器的数量,从而减少过度拟合。在恢复预置滤波器的背景下,我们在此提出一种计算有效的谐波块,其使用CNN中的离散余弦变换(DCT)滤波器。在这项工作中,我们研究了有限训练数据场景中谐波网络的性能。我们实验验证其性能与使用小波作为预设滤波器的散射网络相比较。
translated by 谷歌翻译
图形和视觉中的许多任务都需要使用稀疏参数集转换形状的机器;这些表示有助于渲染,编辑和存储。然而,当源数据嘈杂时,艺术家和工程师经常手动构建这样的表示,这是一个繁琐且可能耗时的过程。虽然深度学习中的进展已成功应用于嘈杂的几何数据,但迄今为止生成参数形状的任务一直难以实现。因此,我们提出了一个使用深度学习来预测参数化原语的新框架。我们使用距离场来在形状参数(如控制点)和栅格网格上的输入数据之间进行转换。我们展示了对2D和3D任务的效果,包括字体矢量化和表面抽象。
translated by 谷歌翻译
随着互联网和移动设备的使用越来越多,社交网络成为最常用的媒体来传达公民的想法和想法。这些信息对于根据他们在网络中发布的内容来识别具有共同想法的社区非常有用。本文介绍了一种基于机器学习技术自动检测城市社区的方法,该技术应用于来自波哥大市民的一组推文。在六个月内从Twitter收集的2,634,176条推文中收集了一份分析报告。结果表明,该方法是一种有趣的工具,可以根据机器学习方法和文本分析来表征城市人口。
translated by 谷歌翻译
本文介绍了提交到距离挑战2019的VOiCES的语音技术中心(STC)说话人识别(SR)系统。挑战的SR任务侧重于在嘈杂条件下单声道远/远场音频中的说话人识别问题。在这项工作中,我们研究了不同的深度神经网络架构,用于扬声器嵌入式提取以解决任务。我们表明,具有残余帧级连接的深度网络优于更浅层的体系结构。在这项工作中研究了基于简单能量的语音活动检测器(SAD)和基于自动语音识别(ASR)的SADare。我们还解决了强大的嵌入提取器训练的数据准备问题。使用自动房间脉冲响应发生器执行数据增强的混响。在我们的系统中,我们使用经过区别训练的余弦相似性度量学习模型作为嵌入后端。对我们使用的每个个体子系统应用分数归一化程序。我们最终提交的系统基于不同子系统的融合。在VOiCES开发和评估集上获得的结果证明了在嘈杂条件下处理远/远场音频时所提出的系统的有效性和鲁棒性。
translated by 谷歌翻译
越来越多的实验证据表明,轴突动作电位传导速度是成人中枢神经系统中的高度适应性参数。然而,这种新发现的可塑性对全球大脑动力学的影响却知之甚少。在这项工作中,我们分析了具有不同传导速度分布的生物可能的神经网络中的振荡。网络平均信号传输时间的1-2(ms)的变化导致非实际的网络振荡频率变化范围在0-120(Hz)。我们的结果表明,轴突传导速度的变化可能会显着影响脑节律的频率和同步性,这与学习,记忆和其他认知过程有着良好的联系。
translated by 谷歌翻译