分析短文本可以推断出有辨别力和连贯性的潜在主题,这是一项关键的基本任务,因为许多现实世界的应用需要对短文本进行语义理解。基于单词共现的传统长文本主题建模算法(例如,PLSA和LDA)不能很好地解决该问题,因为在短文本中仅可获得非常有限的单词共现信息。因此,短文主题建模近年来已引起机器学习研究界的广泛关注,其目的在于克服短文本中的稀疏性问题。在本次调查中,我们对文献中提出的各种短文本主题建模技术进行了全面审查。我们提出了三类基于Dirichlet多项式混合,全局词共现和自聚合的方法,并以每个类别中的代表性方法为例,分析了它们在各种任务中的表现。我们开发了第一个全面的开源库,称为STTM,用于Java,在统一的界面,基准数据集中集成了所有调查算法,促进了该研究领域新方法的扩展。最后,我们在许多真实世界的数据集上评估这些最先进的方法,并将它们的性能相互比较,并与长文本主题建模算法进行比较。
translated by 谷歌翻译
谷歌,AWS,百度等主要云提供商广泛利用深度学习,提供各种计算机视觉相关服务,包括图像自动分类,对象识别和非法图像检测。虽然最近的许多作品证明深度学习分类模型容易受到对抗性的影响现实世界中基于云的图像检测服务比分类更复杂,并且几乎没有关于检测服务的对抗性示例攻击的文献。在本文中,我们主要关注研究真实世界的基于云的图像检测器的安全性。具体来说,(1)基于有效的语义分割,我们提出了四种不同的攻击来生成语义感知的对抗性实例,只与黑盒API交互; (2)我们首次尝试对基于真实世界云的图像检测器的黑盒攻击进行广泛的实证研究。通过对包括AWS,Azure,Google Cloud,百度云和阿里巴巴在内的五个流行云平台的评估,我们证明我们的IP攻击成功率约为100%,基于语义分段的攻击(例如,SP,SBLS,SBB)取得了成功在暴力,政治家和色情检测等不同的检测服务中,有90%的人获得率。我们讨论了可能的防御措施,以解决基于云的探测器中的这些安全挑战。
translated by 谷歌翻译
深度神经网络(DNN)已广泛应用于自然语言处理,计算机视觉和图像识别等领域。但是已经有几个研究表明,深度神经网络很容易被一些具有一些扰动的人工实例所欺骗,这些扰动被广泛称为对抗性的例子。对抗性示例可用于攻击深度神经网络或提高深度神经网络的鲁棒性。生成对抗性示例的常见方法是首先生成一些噪声,然后将它们添加到原始示例中。在实践中,不同的例子具有不同的噪声敏感性。为了生成有效的对抗性示例,可能需要在低噪声敏感示例中添加大量噪声,这可能会使对抗性示例变得毫无意义。在本文中,我们提出了基于噪声敏感度分析的测试优先级排序技术,通过噪声敏感度来挑选示例。我们构建了一个实验来验证四个图像集和两个DNN模型的不完全性,这表明这些例子对噪声敏感,我们的方法可以通过它们的噪声灵敏度有效地挑选出例子。
translated by 谷歌翻译
最近,它已经表明,加强学习的政策梯度方法已被用于训练深度端到端系统的自然语言处理任务。更重要的是,由于理解图像内容的复杂性以及用自然语言描述图像内容的各种方式,图像字幕一直是一个需要处理的具有挑战性的问题。据我们所知,大多数最先进的方法遵循顺序模型的模式,例如递归神经网络(RNN)。然而,在本文中,我们提出了一种新的图像字幕结构,具有深度加强学习,以优化图像字幕任务。我们利用两个称为“策略网络”和“价值网络”的网络来协同生成图像标题。实验在Microsoft COCO数据集上进行,实验结果验证了该方法的有效性。
translated by 谷歌翻译
客户通常会接触到在线数字广告渠道,例如电子邮件营销,展示广告,付费搜索引擎营销,以及购买或订购产品(即转换)的方式。营销人员跟踪所有客户旅程数据,并尝试衡量每个广告渠道的有效性。关于每个渠道的影响的推断在预算分配和库存定价决策中发挥着重要作用。几个简单的基于规则的策略和数据驱动的算法策略已广泛应用于营销领域,但它们没有解决诸如渠道互动等问题,时间依赖性,用户特征。在本文中,我们提出了一种基于深度学习的新型归因算法来评估每个广告渠道的影响。我们提出深度神经网络注意多点触摸归因模型(DNAMTA)模型,以监督学习方式预测一系列事件是否导致转换,并且有助于深入了解媒体渠道之间的动态交互效应。 DNAMTA还将用户上下文信息(例如用户图形和行为)作为控制变量,以减少媒体效应的估计偏差。我们使用大型真实世界营销数据集的计算实验来证明我们提出的模型在转换预测和媒体信道影响评估方面都优于现有方法。
translated by 谷歌翻译
本文提出了一种基于角度解搜索(MaOEA-CS)的进化多目标优化算法。 MaOEA-CS隐含地包含两个阶段:最重要的边界最优解的探索性搜索 - 第一阶段的角点解,以及基于角度的选择[1]的使用以及探索性搜索第二阶段PF近似的扩展。由于其高效率和对形状的稳健性,它赢得了CEC'2017进化多目标优化竞赛。此外,MaOEA-CS还应用于两个非常不规则PF的实际工程优化问题。实验结果表明,MaOEA-CS优于其他六种最先进的比较算法,这表明它具有处理不规则PF的现实复杂优化问题的能力。
translated by 谷歌翻译
Most thermal infrared (TIR) tracking methods are discriminative, treating the tracking problem as a classification task. However, the objective of the classifier (label prediction) is not coupled to the objective of the tracker (location estimation). The classification task focuses on the between-class difference of the arbitrary objects, while the tracking task mainly deals with the within-class difference of the same objects. In this paper, we cast the TIR tracking problem as a similarity verification task, which is coupled well to the objective of the tracking task. We propose a TIR tracker via a Hierarchical Spatial-aware Siamese Convolutional Neural Network (CNN), named HSSNet. To obtain both spatial and semantic features of the TIR object, we design a Siamese CNN that co-alesces the multiple hierarchical convolutional layers. Then, we propose a spatial-aware network to enhance the discriminative ability of the coalesced hierarchical feature. Subsequently, we train this network end to end on a large visible video detection dataset to learn the similarity between paired objects before we transfer the network into the TIR domain. Next, this pre-trained Siamese network is used to evaluate the similarity between the target template and target candidates. Finally , we locate the candidate that is most similar to the tracked target. Extensive experimental results on the benchmarks VOT-TIR 2015 and VOT-TIR 2016 show that our proposed method achieves favourable performance compared to the state-of-the-art methods.
translated by 谷歌翻译
提出了一种新的双线性判别特征线分析(BDFLA)用于图像特征提取。最近的特征线(NFL)是一个功能强大的分类器。最近引入了一些基于NFL的子空间算法。在大多数基于NFL的经典子空间学习方法中,输入样本是矢量。对于图像分类任务,图像样本应首先转换为矢量。该过程引起高计算复杂性并且还可能导致样品的几何特征的损失。提出的BDFLA是基于矩阵的算法。它旨在最大限度地减少类内散射,并最大化基于二维(2D)NFL的类间散射。双图像数据库的实验结果证实了其有效性。
translated by 谷歌翻译
目的:组织氧饱和度(StO2)的术中测量在缺血检测,监测灌注和鉴别疾病中是重要的。高光谱成像(HSI)测量组织的光学反射光谱,并使用该信息量化其组成,包括StO2。但是,由于捕获率和数据处理时间,实时监控很困难。方法:先前开发了一种基于多光纤探头的内窥镜系统,以稀疏地捕获HSI数据(sHSI)。这些通过深度神经网络与RGB图像组合,以生成高分辨率超立方体并计算StO2。为了提高准确度和处理速度,我们提出了双输入条件生成对抗网络(cGAN)Dual2StO2,通过融合RGB和sHSI的特征来直接估计StO2。结果:在vivoporcine肠道数据中进行了验证实验,其中地面实况StO2是从HSIcamera生成的。在平均StO2预测精度和结构相似性度量方面,还将性能与我们的先前光谱分辨率网络SSRNet进行了比较。 Dual2StO2也使用具有不同光纤数量的模拟探针数据进行测试。结论:在一般结构中,由二重StO2估计的StO2在视觉上更接近于地面实况,与SSRNet相比,实现了更高的预测精度和更快的处理速度。仿真表明,当在探头中使用更多数量的光纤时,结果得到改善。未来的工作将包括网络架构的改进,基于模拟结果的硬件优化,以及超出StO2估计的临床应用技术评估。
translated by 谷歌翻译
我们分析随机梯度算法来优化非凸问题。特别是,我们的目标是找到局部最小值(二阶静止点)而不是仅找到一阶静止点,这可能是某些不稳定的鞍点。我们证明了一个简单的扰动版本的随机递归梯度下降算法(称为SSRGD)可以找到$(\ epsilon,\ delta)$ - 二阶固定点,其中$ \ widetilde {O}(\ sqrt {n} / \ epsilon ^ 2 + \ sqrt {n} / \ delta ^ 4 + n / \ delta ^ 3)非凸有限和问题的$随机梯度复杂度。作为aby-product,SSRGD使用$ O(n + \ sqrt {n} / \ epsilon ^ 2)$随机梯度找到$ \ epsilon $ -first-order固定点。自Fang等人以来,这些结果几乎是最优的。 [2018]提供了一个下限$ \ Omega(\ sqrt {n} / \ epsilon ^ 2)$,用于查找甚至只是$ \ epsilon $ -first-orderstationary点。我们强调用于寻找二阶点的SSRGD算法就像通过有时添加均匀扰动来寻找一阶静止点一样简单,而用于寻找具有相似梯度复杂度的二阶静止点的所有其他算法需要具有负曲率的tocombine搜索子程序(例如,Neon2 [Allen-Zhu andLi,2018])。此外,简单的SSRGD算法得到了更简单的分析。此外,我们还扩展了非凸的有限和问题tononconvex在线(期望)问题的结果,并证明了相应的收敛结果。
translated by 谷歌翻译