我们提出了GraphTSNE,一种基于t-SNE的图形结构数据的新型可视化技术。对图形结构数据越来越感兴趣,增加了通过可视化获得人类对这些数据集的洞察力的重要性。然而,在最流行的可视化技术中,经典t-SNE不适用于此类数据集,因为它没有机制来使用来自图形连接的信息。另一方面,标准图可视化技术,例如拉普拉斯算子特征图,没有机制来利用来自节点特征的信息。我们提出的方法GraphTSNE可以产生可视化,其可以解释图形连接和节点特征。它基于对改进的t-SNE损失的图形卷积网络的可扩展和无监督训练。通过汇总一套评估指标,我们证明了我们的方法在三个基准数据集上产生了理想的可视化。
translated by 谷歌翻译
时间序列的建模在各种各样的应用中变得越来越重要。总体而言,数据通过遵循不同的模式而发展,这些模式通常由不同的用户行为引起。给定时间序列,我们定义进化基因以捕获潜在的用户行为并描述行为导致时间序列的生成。特别是,我们提出了一个统一的框架,通过学习分类器来识别不同的分段演化基因,并采用对抗生成器通过估计分段的分布来实现进化基因。基于合成数据集和五个真实世界数据集的实验结果表明我们的方法不仅可以获得良好的预测结果(例如,就F1而言平均为+ 10.56%),而且还能够提供结果的解释。
translated by 谷歌翻译
为了实现轻型物体探测器在边缘设备上的部署,本文提出了一种有效的模型压缩流水线。压缩管道包括骨干的自动通道修剪,分支层的固定通道删除和指导学习的知识蒸馏。结果,Resnet50-v1d被自动修剪并精细调整ImageNet,以获得紧凑的基础模型作为物体探测器的主干。然后,轻型物体探测器通过提出的压缩管道实现。例如,创建了型号尺寸= 16.3MB,FLOPS = 2.31G,mAP = 71.2的SSD-300,显示出比SSD-300-MobileNet更好的结果。
translated by 谷歌翻译
特征交叉捕获分类特征之间的交互,并且可用于增强现实世界企业中的表格数据的学习。在本文中,我们介绍了AutoCross,一种由4Paradigm为其客户提供的自动特征交叉工具,范围从银行,医院到Internetcorporations。通过在树状结构空间中执行波束搜索,AutoCrossenable可以高效生成高阶交叉特征,这是现有工作尚未实现的。此外,我们建议连续的小批量梯度下降和多粒度离散化,以进一步提高效率和有效性,同时确保简单性,以便不需要机器学习专业知识或繁琐的超参数调整。此外,算法旨在减少分布式计算中涉及的计算,传输和存储成本。在两个基准测试和实际业务数据集上的实验结果证明了AutoCross的有效性和有效性。结果表明,AutoCross可以显着提高线性和深度模型的性能。
translated by 谷歌翻译
提高模型性能始终是机器学习的关键问题,包括深度学习。然而,当堆叠更多层时,独立神经网络总是受到边际效应的影响。同时,整体是一种有用的技术,可以进一步提高模型性能。然而,训练几个独立的独立深度神经网络需要花费多种资源。在这项工作中,我们提出了Intra-Ensemble,这是一种端到端策略,具有随机训练操作,可以在一个神经网络内同时训练多个子网络。由于大多数参数是相互共享的,因此附加参数大小是微不足道的。同时,随机训练通过权重共享增加了子网的多样性,显着提高了整体性能。大量实验证明了整体在各种数据集和网络架构中的适用性。我们的模型与CIFAR-10和CIFAR-100上最先进的架构实现了可比较的结果。
translated by 谷歌翻译
在本文中,我们提出了一种新的甲状腺细胞病理学WSIs高效滤泡分离方法。首先,我们提出了一种混合分段架构,它通过添加分支将分类器集成到Deeplab V3中。通过使用分类分支来浏览不相关区域,节省了大量的WSI分段时间。其次,将Deeplab V3中的低尺度精细特征融入到原始的空间金字塔空间(ASPP)中,以准确地表示细胞病理图像。第三,我们的混合模型采用面向准则的自适应损失函数进行训练,使模型收敛速度更快。对甲状腺贴片的实验结果表明,所提出的模型在分割精度上达到80.9%。此外,采用我们提出的方法,WSI分割的时间减少了93%,WSI水平精度达到53.4%。
translated by 谷歌翻译
我们在本文中证明了可以设计生成模型以在具有挑战性的环境下执行分类任务,包括adversarialattacks和输入分布变化。具体来说,我们提出了一种条件变分自动编码器,它可以学习输入的分解和结果组件的分布。在测试期间,我们联合优化发生器的容量变量和松弛的组件标签,以找到给定输入和发生器输出之间的最佳匹配。该模型在识别来自multiMNIST数据集的重叠组件以及来自交通信号的新组件组合方面表现出有前途的表现。实验还表明,所提出的模型在MNIST和NORB数据集中实现了高鲁棒性,特别是对于高强度梯度攻击和非梯度攻击。
translated by 谷歌翻译
对抗性攻击下神经网络的脆弱性引发了严重的关注和广泛的研究。最近的研究表明,模型鲁棒性依赖于鲁棒特征的使用,即与标签强相关的特征,并且数据维度和分布影响鲁棒特征的学习。另一方面,实验表明,对抗对抗性攻击的人类视觉对于自然输入变换是不变的。借鉴这些研究结果,本文研究了转换不变性的约束,包括图像裁剪,旋转和缩放,是否会迫使图像分类器学习和使用鲁棒特征,从而获得更好的鲁棒性。对MNIST和CIFAR10的实验表明,单独的变换不变性效果有限。尽管如此,对裁剪不变攻击进行对等训练的模型尤其可以(1)提取更强大的特征,(2)具有比来自对抗训练的最先进模型更好的鲁棒性,以及(3)需要不正确的数据。
translated by 谷歌翻译
我们提出了一个通用框架来通过概率空间上的\ textbf {V} ariational \ textbf {Gr} adient Fl \ textbf {ow}(VGrow)学习深层生成模型。渐近收敛到目标分布的演化分布由向量场控制,向量场是它们之间的$ f $ - 发散的第一个变化的负梯度。我们通过残差映射的无限时间组合证明了演化分布与前向分布一致,残差映射是沿矢量场的特征映射的扰动。矢量场取决于前推分布的密度比和目标分布,这可以从二元分类问题中一致地学习。我们提出的VGrow方法与其他流行方法(如VAE,GAN和基于流的方法)的连接已在此框架中建立,获得了深层生成学习的新见解。我们还评估了几个常用的差异,包括Kullback-Leibler,Jensen-Shannon,Jeffrey分歧以及我们新发现的`logD'分歧,它作为logD-trick GAN的目标函数。基准数据集的实验结果表明,VGrow可以稳定,有效的方式生成高保真图像,通过最先进的GAN实现竞争性能。
translated by 谷歌翻译
准确地注释医学图像是图像艾滋病应用的关键步骤。然而,由于其高复杂性和需要经验丰富的医生,注释医学图像将招致大量的注释工作和费用。为了减轻注释成本,提出了一些主动学习方法。但是这样的方法只是减少了注释候选人的数量而没有研究医生将采取多少努力,这是不够的,因为即使注释少量医疗数据也会花费大量时间给医生。在本文中,我们提出了一个新的标准来评估医生注释医学图像的努力。首先,通过主动学习和U形网络,我们采用一种暗示性注释策略来选择最有效的注释候选者。然后我们利用一个精细的注释平台来减轻对每个候选人的注意力,并首先利用一个新的标准来定量计算医生所做的努力。在我们的工作中,我们以MRbrain组织分割为例来评估所提出的方法。对众所周知的IBSR18数据集和MRBrainS18挑战数据集进行的大量实验表明,使用提出的策略,只需使用60%的注释即可实现最先进的分割性能,并且注释工作可以减轻至少44%,44% ,47%分别来自CSF,GM,WM。
translated by 谷歌翻译