效率对于在线推荐系统至关重要。将用户和项目表示为协同过滤(CF)的二进制向量可以在汉明空间中实现快速用户项目亲和度计算,近年来,我们已经尝试了利用CF方法的二进制散列技术的新兴研究工作。然而,具有二进制代码的CF由于每个位中的有限表示能力而自然地遭受低准确性,这阻碍了它对数据的复杂结构进行建模。在这项工作中,我们尝试通过利用实值向量的准确性和二进制代码表示用户/项目的效率来提高效率而不损害模型性能。特别地,我们提出了用于协同过滤的组合编码(CCCF)框架,其不仅获得比现有技术的CF方法更好的推荐效率,而且实现了比具有有价值的CF方法更高的精度。具体而言,CCCF创新地用一组二进制向量表示每个用户/项目,二进制向量与稀疏实际值权重向量相关联。权重向量的每个值将对应的二进制向量的重要性编码到用户/项目。连续权重向量极大地增强了二进制代码的表示能力,其稀疏性保证了处理速度。此外,提出了一种整数近似方案以进一步加快速度。基于CCCF框架,我们设计了一种有效的离散优化算法来学习其参数。在三个真实世界数据集上的广泛实验表明,我们的方法在推荐精度和效率方面都优于最先进的二值化CF方法(甚至实现了比实值CF方法更好的性能)。
translated by 谷歌翻译
理解人类的语言需要复杂的世界知识。然而,现有的大规模知识图主要关注实体的知识,而忽略了关于活动,状态或事件的知识,这些知识用于描述实体或事物在现实世界中的行为方式。为了填补这一空白,我们开发了ASER(活动,状态,事件及其关系),这是一种从超过110亿个令牌结构的文本数据中提取的大规模可能性知识图。 ASER包含15种属于五类的关系类型,1.94亿个独特的可能性,以及6400万个独特的边缘。人类和外在的评估都证明了ASER的质量和有效性。
translated by 谷歌翻译
终身机器学习是一种新颖的机器学习范式,它不断学习任务并积累知识以供重用。知识提取和重用能力使终身机器学习能够理解解决任务的知识并获得解决相关问题的能力。在情感分类中,像Naive Bayes这样的传统方法关注每个单词具有正面或负面情绪的概率。然而,本文中的终身机器学习将以不同的角度研究这个问题并试图发现哪些单词决定评论的情感。我们将全神贯注地在学习期间获取知识,以便将来学习,而不仅仅是解决当前的任务。
translated by 谷歌翻译
代理辅助进化算法(SAEAs)是计算成本高昂的问题(CEP)的强大优化工具。然而,由于没有免费的午餐定理,随机选择的算法可能无法解决未知问题,如果我们重新运行算法或尝试其他算法来获得更多解决方案,这将导致更多的计算资源,这在CEP中更为严重。在本文中,我们考虑SAEA的算法组合,以降低为CEP选择不适当算法的风险。我们提出了两个非常昂贵的问题的框架,其中最大数量的异常评估只是问题维度的5倍。一个名为Par-IBSAEA的框架并行运行所有候选算法,一个名为UCB-IBSAEA的更复杂的框架采用强化学习的上置信区(UCB)策略来帮助在每次迭代中选择最合适的算法。为UCB政策提出了有效的奖励定义。我们考虑了三个最先进的基于个体的SAEA,针对不同的问题,并将它们与基于几个基准问题的实例建立的组合进行比较,给出了有限的计算预算。 Ourexperimental研究表明,我们提出的投资组合框架在基准问题集合上显着优于任何单一算法。
translated by 谷歌翻译
计算机视觉近年来取得了令人瞩目的进展。同时,手机已经成为数百万人的主要计算平台。除了移动电话之外,许多自治系统依靠视觉数据来做出决策,其中一些系统的能量有限(例如无人驾驶飞行器也称为无人驾驶飞机和移动机器人)。这些系统依赖电池,能效至关重要。本文保留了两个主要目的:(1)检查低功率解决方案的最新技术,以检测图像中的对象。自2015年以来,IEEE年度国际低功耗图像识别挑战赛(LPIRC)一直致力于识别最节能的计算机视觉解决方案。本文总结了2018年获奖者的解决方案。 (2)建议研究方向以及低功耗计算机视觉的机会。
translated by 谷歌翻译
在本文中,我们提出了弱监督文档级多方面情感分类的变分方法。我们使用目标 - 意见词对作为“监督”,而不是使用由域专家提供的用户生成的评级或注释。可以使用依赖性解析器和简单规则来提取这些单词对。我们的目标是预测给定目标词的anopinion词,而我们的最终目标是学习情感极性分类器来预测文档中每个方面的情感极性。通过将潜在变量(即情感极性)引入目标函数,我们可以通过变分下界将情感极性分类器注入目标。我们可以通过优化下限来学习asentiment极性分类器。我们表明,我们的方法可以胜过在TripAdvisor和BeeAdvocate数据集上的弱监督基线,并且可以与最先进的监督方法相媲美,每个方面有数百个标签。
translated by 谷歌翻译
由于缺乏足够的训练数据和从头开始的traina深度神经网络的高计算成本,转移学习已被广​​泛用于许多基于深度神经网络的应用,例如人脸识别,图像分类,语音识别等。 - 使用转移学习方法涉及采用预训练模型的一部分,最后添加几个层,并使用小数据集重新训练新层。这种方法虽然有效且广泛使用,但却存在安全漏洞,因为转移学习中使用的经过预先训练的模型通常是公开的,包括潜在的攻击者。在本文中,我们展示除了预训练模型之外没有任何其他知识,攻击者可以发出有效且高效的暴力攻击,可以创建输入实例以高可信度触发每个目标类。请注意,我们假设攻击者无法访问任何特定于目标的信息,包括来自目标类的样本,重新训练的模型以及Softmax为每个类分配的概率,因此称为目标无关攻击。这些假设可以呈现所有先前的攻击在我们知识的最佳状态下,这是不切实际的。为了评估提出的攻击,我们在表面识别和语音识别任务上进行了一系列实验,并展示了攻击的有效性。我们的工作揭示了深度神经网络中转移学习的基本安全挑战。
translated by 谷歌翻译
我们使用用于视频识别的深度模型来解决学习运动表示的挑战性问题。为此,我们利用注意力模块来学习突出视频中的区域和聚合功能以进行识别。具体而言,我们建议利用输出关注度图作为车辆,将学习的表示从运动(流)网络传输到RGB网络。我们系统地研究了注意模块的设计,并开发了一种新的注意蒸馏方法。我们的方法在主要行动基准上进行了评估,并且一直在显着提高基线RGB网络的性能。此外,我们证明了ourattention地图可以利用学习中的运动线索来识别视频帧中的动作位置。我们相信我们的方法为深度模型中的学习运动感知表示提供了一个步骤。
translated by 谷歌翻译
在本文中,我们提出了一种新的元学习方法,用于深度神经网络的自动修剪。我们首先训练一个PruningNet,一个元网络,它能够为给定目标网络的任何结构生成权重参数。我们使用简单的随机结构采样方法来训练PruningNet。然后,我们应用演化过程来搜索性能良好的修剪网络。搜索效率很高,因为权重是由经过培训的PruningNet直接生成的,我们不需要任何微调。通过为目标网络培训的单个PruningNet,我们可以在不受人类参与的情况下搜索不同约束下的各种修剪网络。我们已经在MobileNet V1 / V2网络上展示了竞争性能,ImageNetaccuracy比V1 / V2高出9.0 / 9.9。与之前最先进的基于AutoML的修剪方法(如AMC和NetAdapt)相比,我们在各种条件下都达到了更高或更高的准确度。
translated by 谷歌翻译
基于事件的摄像机可以在高速运动和具有挑战性的照明条件下以微秒精度测量强度变化(称为“{\ it events}”)。利用有源像素传感器(APS),事件相机允许同时输出强度帧。然而,输出图像以相对低的帧速率捕获并且经常遭受运动模糊。可以将Ablurry图像视为潜像序列的积分,而事件表示潜像之间的变化。因此,我们能够通过将事件数据与alatent图像相关联来对模糊生成过程进行建模。基于丰富的事件数据和低帧率易受模糊的图像,我们提出了一种简单有效的方法来重建高质量和高帧率的视频。从单个模糊帧及其事件数据开始,我们提出了\ textbf {基于事件的双积分(EDI)}模型。然后,我们将它扩展到\ textbf {基于事件的多个DoubleIntegral(mEDI)}模型,以便根据多个图像及其事件获得更平滑和令人信服的结果。我们还提供了一种有效的求解器来最小化所提出的能量模型。通过优化能量模型,我们在消除一般模糊和重建高时分辨率视频方面取得了显着的进步。视频生成基于在单个标量变量中求解简单的非凸优化问题。合成图像和真实图像的实验结果证明了我们的mEDI模型和优化方法与现有技术相比的优越性。
translated by 谷歌翻译