鉴于卷积神经网络(CNN)用于图像分类和对象识别的巨大成功,已经尝试将该方法概括为一般的图形结构数据。一个主要方向是基于光谱图理论和图形信号处理。在本文中,我们通过引入图的并行流分解,从完全不同的角度研究问题。基本思想是分解一系列非交叉的一维(1D)路径的图形,之后,我们可以沿着每个路径族应用一维CNN。我们证明了我们的方法,我们称之为GraphFlow,能够将CNN架构转换为通用图。为了展示我们的方法的有效性,我们在经典的MNIST数据集,网络信息传播的合成数据集和新闻文章分类数据集上测试我们的方法。
translated by 谷歌翻译
深度文本匹配方法已被广泛研究用于许多应用,包括问答和信息检索系统。为了处理标记数据不足的adomain,可以在传输学习(TL)设置中使用这些方法来利用来自资源丰富的源域的标记数据。为了获得更好的性能,源域数据选择在此过程中是必不可少的,以防止“负转移”问题。然而,新兴的深度传递模型不适合大多数现有的数据选择方法,因为数据选择策略和传输学习模型不是联合训练的,导致次优的训练效率。在本文中,我们提出了一种新颖的增强数据选择器来选择高质量的源域数据来帮助TL模型。具体地,数据选择器“作用”源域数据以找到用于优化TL模型的子集,并且TL模型的性能可以在turnto更新选择器中提供“奖励”。我们基于actor-critic框架构建强化数据选择器,并将其集成到基于DNN的转移学习模型,从而产生强化传递学习(RTL)方法。我们对文本匹配的两个主要任务进行了彻底的实验评估,即复述识别和自然语言推理。实验结果表明,所提出的RTL可以显着提高TL模型的性能。我们进一步研究状态,奖励和策略优化方法的不同设置,以检查我们方法的稳健性。最后,我们对所选数据进行了案例研究,发现我们的方法能够选择Wasserstein距离接近目标域数据的源域数据。这是合理且直观的,因为这样的源域数据可以为模型提供更多的可传输性功能。
translated by 谷歌翻译
三维(3D)形状识别在计算机视觉领域引起了很多研究关注。深度学习的进步鼓励用于3D特征表示的各种深度模型。对于点云和多视图数据,两种流行的三维数据模态,提出了具有显着性能的不同模型。然而,点云和观点之间的关系很少被研究。在本文中,我们介绍了点视图关系网络(PVRNet),这是一个有效的网络,旨在将视图特征和pointcloud特征与建议的关系评分模块融合在一起。更具体地,基于关系得分模块,通过融合点云特征和每个单视图特征与点 - 单视图关系来进行点 - 单视图融合特征,然后通过融合点提取点 - 多视图融合特征。点云特征和具有点 - 多视图关系的不同视图的特征。最后,将点 - 单视点融合特征和点 - 多视图融合特征进一步组合在一起,以实现3D形状的统一表示。我们提出的PVRNet已经在ModelNet40数据集上进行了评估,用于3D形状分类和检索。实验结果表明,与最先进的模型相比,我们的模型可以实现显着的性能提升。
translated by 谷歌翻译
深度神经网络(DNN)是一种广泛使用的深度学习技术。如何确保DNN系统的安全性是DNN研究应用的关键问题。鲁棒性是DNN的一个重要安全属性。然而,现有的验证DNN鲁棒性的工作耗时且难以扩展到大规模DNN。在本文中,我们提出了一种用于DNN鲁棒性验证的增强方法,旨在更早地找到反例。我们的观察是DNN的不同输入具有不同的现有计数器可能性 - 围绕它们的例子,并且最大输出值和第二大输出值之间的微小差异的输入往往是DNN的最后脚跟。我们已经实现了我们的方法,并将其应用于最先进的DNN验证工具--Rupuplex和四种DNN攻击方法。两个基准测试的广泛实验结果表明了我们的增强方法的有效性。
translated by 谷歌翻译
三维物体识别在多媒体和计算机视觉领域引起了广泛的研究关注。随着最近深度学习的激增,各种具有不同表现形式的深度模型已经达到了最先进的性能。其中,基于点云和多视图的3D形状表示最近很有前途,其相应的深度模型在3D形状识别方面表现出显着的性能。然而,在三维形状表示中集中点云数据和多视图数据的努力很少,在我们的考虑中,这是相互有益和补偿的。在本文中,我们提出了点视网络(PVNet),这是第一个将点云和多视图数据集成到联合3D形状识别的框架。更具体地,提出了一种联合注意融合方案,其可以利用来自多视图数据的高级特征来模拟来自点云数据的不同结构特征的内在相关性和不可区分性。特别地,辨别描述被量化并且被用作软关注掩模以进一步细化3D形状的结构特征。我们已经在ModelNet40数据集上评估了用于3D分类和检索任务的建议方法。实验结果和与现有技术方法的比较表明,我们的框架可以实现卓越的性能。
translated by 谷歌翻译
构建多转向信息寻求对话系统是一个重要且具有挑战性的研究课题。尽管已经提出了几种先进的神经文本匹配模型用于该任务,但它们通常对于工业应用是无效的。此外,它们依赖于大量标记数据,这些数据可能在实际应用中不可用。为了缓解这些问题,本文研究了多轮信息寻求对话的转移学习。我们首先提出一种基于卷积神经网络的高效且有效的多转对话模型。然后,我们扩展我们的模型以适应从资源丰富的域中学到的知识来提高性能。最后,我们将我们的模型部署在名为AliMe Assist(https://consumerservice.taobao.com/online-help)的工业聊天机器人中,并观察到对现有在线模型的显着改进。
translated by 谷歌翻译
本文提出了一种用于符号回归问题的混合基函数构造方法(GP-RVM),它结合了遗传编程的扩展版本Kaizen Programming和Relevance Vector Machine来演化最优的基函数集。与单个个体是完整解决方案的传统进化算法不同,我们的方法提出了一种解决方案,该解决方案基于在演化过程中从个体建立的基函数的线性组合。作为稀疏贝叶斯核方法的RVM选择合适的函数来构成基础。 RVM通过评估函数的质量和稀疏度来确定函数的后验权重。由GP-RVM产生的解是许多非线性函数系数的稀疏贝叶斯线性模型。我们的混合方法专注于非线性白盒模型,选择正确的函数组合来构建强大的预测,而无需事先了解数据。实验结果表明,GP-RVM优于传统方法,这表明它是一种有效而准确的SR解决方法。 GP-RVM的计算复杂度在$ O(M ^ {3})$中进行缩放,其中$ M $是基组中的数量,并且通常比训练模式的$ N $小得多。
translated by 谷歌翻译
本文将非政策强化学习扩展到多智能体案例,其中一组网络代理根据时变图与其邻居进行通信,在遵循不同的行为策略的同时协作评估和改进目标策略。为此,本文开发了非线性时间差分学习的多智能体版本,用于非政策性评估,证明了线性函数逼近下的收敛性。本文结合新的多智能体政策政策梯度定理,结合了这一结果。最近在多智能体政策和单一代理人的非政策行动者 - 批评方法方面的工作,为新的多智能体非策略行为者 - 评论者算法开发和提供融合保证。
translated by 谷歌翻译
在中国快速城市化建设过程中,城市地理信息的获取和及时的数据更新是城市精细化管理的重要和根本要素。随着国内遥感技术的发展,Gaofen-2(GF-2)高分辨率遥感图像的应用可以大大提高信息提取的准确性。本文介绍了一种基于面向对象分类方法的基于GF-2卫星数据的城市特征提取方法。利用光谱,空间属性和隶属函数相结合的方法绘制了南京市秦淮区的城市特色。数据预处理由ENVI软件执行,后续数据输出到eCognition软件中,用于面向对象的分类和城市特征信息的提取。最后,使用ARCGIS软件对获得的光栅图像分类结果进行矢量化,并将矢量图存储在库中,可用于进一步分析和建模。使用通过视觉解释和其他可靠的二级数据源获得的地面实况数据进行准确性评估。与基于像素的监督(神经网络)分类结果相比,开发的面向对象方法可以显着提高提取精度,经过人工解释后,总体准确率达到95.44%,Kappa系数为0.9405,客观证实面向对象方法的优越性和GF-2卫星数据利用的可行性。
translated by 谷歌翻译
最近,由于二进制代码的计算和存储效率,已经广泛研究了学习哈希以用于图像检索。对于大多数存在的学习到哈希方法,需要足够的训练图像并且使用容许精确的哈希码。然而,在一些现实世界的应用中,在感兴趣的领域中并不总是有足够的训练图像。此外,一些现有的监督方法需要大量标记数据,这在时间,标签和人类专业知识方面是一个昂贵的过程。为了解决这些问题,受到转移学习的启发,我们提出了一种简单的有效无监督散列方法,名为Optimal Projection Guided TransferHashing(GTH),我们借用其他不同但相关的域的图像,即源域,以帮助学习精确的哈希码。兴趣领域,即目标领域。此外,我们建议寻找由于域间隙导致的目标和源域的哈希函数的最大似然估计(MLE)解。此外,采用交替优化方法获得目标和源域的两个投影,使得域散列差异逐渐减小。各种基准数据库的广泛实验证明我们的方法优于最先进的学习方法。有关实施细节,请访问https://github.com/liuji93/GTH。
translated by 谷歌翻译