在过去五年中,在线社交网络中的Hashtags已经获得了极大的欢迎。由此产生的大量数据为现代社会提供了新的思路。以前,研究人员主要依靠从Twitter收集的数据来研究某种类型的主题标签或某些标签属性。在本文中,我们对Instagram上共享的主题标签进行了第一次大规模的实证分析,这是主题标签共享的主要平台。 Westudy标签来自三个不同的维度,包括时空维度,语义维度和社会维度。在总共超过7百万个标签的三个大型数据集上进行的大量实验提供了一系列有趣的观察结果。首先,我们展示了主题标签的时间模式可以分为四个不同的集群,人们倾向于在某些地方共享更少的主题标签,而在其他地方则更多的标签。其次,我们观察到一个不可忽略的比例的hashtags表现出大的语义位移。我们演示了在用户之间更均匀共享的主题标签,由提议的hashtagentropy量化,不太容易出现语义位移。最后,我们提出了abipartite图嵌入模型来总结用户的标签配置文件,并依靠这些配置文件来执行友谊预测。评估结果表明,我们的方法实现了有效预测,AUC(ROC曲线下面积)高于0.8,这表明强大的社会信号具有吸入标志。
translated by 谷歌翻译
图像检索利用图像描述符来检索给定查询图像的最多相似图像。卷积神经网络(CNN)正成为提取图像检索图像描述符的主要方法。对于图像检索的低功率硬件实现,基于CNN的特征描述符的缺点是它需要数百兆的存储。针对这一问题,本文将深度模型量化和压缩应用于ASIC芯片中的CNN进行图像检索。证明了可以使用少至2比特量化来提取基于CNN的特征描述符,以提供与用于图像检索的浮点模型类似的性能。此外,为了在ASIC中实现CNN,特别是对于大规模图像,应考虑芯片的有限缓冲区大小。对于大规模图像,我们提出了一种改进的合并策略,区域不变池(RNIP),它使用裁剪的子图像进行CNN。芯片上的测试结果表明,将RNIP与提出的2比特CNN模型压缩方法相结合能够检索大比例图像。
translated by 谷歌翻译
最近使用二维wordembedding的Super Characters方法的工作在文本分类任务中获得了最先进的结果,展示了这种新方法的前景。本文借鉴了超字符方法和二维嵌入的思想,提出了一种生成开放域对话的会话响应的方法。公共数据集的实验结果表明,所提出的SuperChat方法可以产生高质量的响应。交互式演示已准备好在研讨会上展示。
translated by 谷歌翻译
近年来,深度学习在计算机视觉,自然语言处理,语音识别等多个领域取得了显着成绩。足够的培训数据是确保深层模型有效性的关键。但是,获取有效数据需要大量的时间和人力资源。数据增强(DA)是一种有效的替代方法,它可以使用保留标签的转换基于现有数据生成新的标记数据。虽然我们可以从DA中受益匪浅,但设计合适的DA策略需要大量的专家经验和时间消耗,并且搜索最优策略的评估成本很高。 Sowe在本文中提出了一个新问题:如何以尽可能低的成本实现自动数据增强?我们提出了一种名为BO-Aug的方法,通过使用贝叶斯优化方法找到最优的DA策略来对该过程进行有效的处理。我们的方法可以以相对较低的搜索成本找到最优策略,并且基于特定数据集的搜索策略可跨越不同的神经网络架构或甚至不同的数据集。我们在三个广泛使用的图像分类数据集上验证了BO-Aug,包括CIFAR-10,CIFAR-100和SVHN。实验结果表明,该方法可以达到最先进或接近先进的分类精度。有关重现我们实验的代码,请访问:http://github.com/zhangxiaozao/BO-Aug。
translated by 谷歌翻译
网络嵌入(或图形嵌入)已广泛用于许多实际应用中。然而,现有方法主要集中在具有单类节点/边缘的网络上,并且不能很好地扩展以处理大型网络。许多真实世界网络由数十亿个节点和多类型的边缘组成,并且每个节点与不同的属性相关联。在本文中,我们对归属Multiplex异构网络的嵌入学习问题进行了格式化,并提出了一个统一的框架来解决这个问题。该框架支持转换和归纳学习。我们还对所提出的框架进行了理论分析,展示了它与以往工作的联系,并证明了其更好的泛化能力。我们针对四种不同类型的具有挑战性的数据集(亚马逊,YouTube,Twitter和阿里巴巴数据集)对拟议框架进行系统评估。实验结果表明,通过所提出框架的学习嵌入,我们可以实现统计上显着的改进(例如,5.99-28.23%提升通过F1得分; p << 0.01,t-检验)超过先前的领域用于链接预测。该框架还成功应用于全球领先的电子商务公司阿里巴巴的推荐系统。产品推荐的离线A / B测试结果进一步证实了框架在实践中的有效性和效率。
translated by 谷歌翻译
作为表达情感的直观方式,动画图形交换格式(GIF)图像已广泛用于社交媒体。大多数先前关于自动GIF情感识别的研究未能有效利用GIF的独特属性,这可能会限制识别性能。在本研究中,我们通过提出的KeypointAttended Visual Attention Network(KAVAN)证明了人类相关信息在GIF中的重要性,并进行了以人为中心的GIF情感识别。该框架由facialattention模块和分层段时间模块组成。 facialattention模块利用GIF内容与人物之间的强关系,提取以人脸为中心的帧级视觉特征。然后提出分层段LSTM(HS-LSTM)模块以更好地学习全局GIF表示。我们提出的框架优于MIT GIFGIF数据集的最新技术。此外,面部注意模块提供可靠的面部区域掩模预测,这提高了模型的可解释性。
translated by 谷歌翻译
低精度操作可提供可扩展性,内存节省,可移植性和能效。本文提出了SWALP,这是一种精确度训练方法,可以通过修改的学习率计划平均低精度SGD迭代。 SWALP易于实现,即使所有数字量化到8位,包括梯度累加器,也可以匹配全精度SGD的性能。此外,我们证明SWALPconverges任意接近二次目标的最优解,并且在强凸设置中渐近地小于低精度SGD的噪声球。
translated by 谷歌翻译
最近提出了光学衍射神经网络(DNN)的概念,其通过级联相位掩模架构来实现。与光学计算机一样,该系统可以以全光学方式执行机器学习任务,例如数字数字识别。然而,该系统只能在非相干光照下工作,实际实验中的精度要求相当高。本文提出了一种基于单像素成像(MLSPI)的光学机器学习框架。 MLSPI系统可以执行与DNN相同的线性模式识别任务。此外,它可以在不相干的照明条件下工作,具有较低的实验复杂性和可编程的可编程性。
translated by 谷歌翻译
以前用于求解具有更快收敛性的最小 - 最大问题的随机原始 - 对偶算法的研究在很大程度上依赖于问题的双线性结构,这限制了它们在一系列问题中的适用性。本文的主要贡献是新随机原理的设计和分析。 -dual算法使用随机梯度更新和对数个确定性双重更新的混合来解决没有双线性结构的凸凹问题的假设。比$ O(1 / \ sqrt {T})$更快的收敛率,$ T $是随机梯度更新的数量是在原始和双变量的某些温和条件下建立的。例如,对于在原始变量方面具有弱强凸性并且具有双变量的强凹函数的一族问题,所提出的算法的收敛速率为$ O(1 / T)$。我们还研究了所提出的算法对于学习鲁棒模型和经验AUC最大化的有效性。
translated by 谷歌翻译
化学反应的实用性是所有基于符号智能的化学信息处理的核心任务,例如,它为进一步的自动合成路径推断提供了必不可少的线索。考虑到化学反应已经以语言形式表示,我们提出了一种新的解决方案,通常可以在不考虑复杂的量子物理模型或化学知识的情况下判断有机反应的实用性。在将实际判断作为机器学习任务从正面和负面(化学反应)样本中解决的同时,所有现有研究都必须仔细处理负面样本上的这些不足问题。我们提出了一种自动构建方法来很好地解决广泛存在的长期困难。实验结果表明,该模型能够有效预测化学反应的实际性,在实际大型化学实验室反应实用性判断中达到99.76%的高精度。
translated by 谷歌翻译