为会话代理定义行动空间并通过强化学习优化他们的决策制定过程是一个持久的挑战。通常的做法是使用手工制作的对话行为或输出词汇,例如:在神经编码器解码器中,作为动作空间。两者都有自己的局限性。本文提出了一种新的潜在行动框架,它将端到端对话代理的动作空间作为潜在变量进行处理,并开发无监督方法,以便从数据中引出自己的动作空间。综合实验研究了连续和离散动作类型以及基于随机变分推理的两种不同的优化方法。结果表明,在DealOrNoDeal和MultiWoz对话框中,所提出的潜在行为比先前的单词级政策梯度方法具有更好的经验性能改进。我们的详细分析还提供了有关政策学习的各种潜在变量方法的见解,并可作为在未来研究中开发更好的潜在反应的基础。
translated by 谷歌翻译
我们介绍Texar,一个开源工具包,旨在支持广泛的文本生成任务,将任何输入转换为自然语言,如机器翻译,摘要,对话,内容操作等。具有模块化,多功能性的设计目标,考虑到可扩展性,Texar提取了各种任务和方法的基本模式,创建了一个高度可重用的模块和功能库,并允许任意模型架构和算法范例。在Texar中,模式体系结构,损失和学习过程被完全分解。模块概念级别可以自由组装或插入/换出。这些特征使Texar特别适合研究人员和从业人员进行快速原型设计和实验,以及在不同的文本生成任务中促进技术共享。我们提供案例研究来证明该工具包的使用和优势。 Texar在Apache license2.0下发布,网址为https://github.com/asyml/texar。
translated by 谷歌翻译
Heterogeneous network embedding (HNE) is a challenging task due to the diverse node types and/or diverse relationships between nodes. Existing HNE methods are typically unsupervised. To maximize the profit of utilizing the rare and valuable supervised information in HNEs, we develop a novel Active Heterogeneous Network Embedding (Ac-tiveHNE) framework, which includes two components: Discriminative Heterogeneous Network Embedding (DHNE) and Active Query in Heterogeneous Networks (AQHN). In DHNE, we introduce a novel semi-supervised heterogeneous network embedding method based on graph convolutional neu-ral network. In AQHN, we first introduce three active selection strategies based on uncertainty and representativeness, and then derive a batch selection method that assembles these strategies using a multi-armed bandit mechanism. ActiveHNE aims at improving the performance of HNE by feeding the most valuable supervision obtained by AQHN into DHNE. Experiments on public datasets demonstrate the effectiveness of ActiveHNE and its advantage on reducing the query cost.
translated by 谷歌翻译
随着网络信息技术的快速发展,越来越多的人沉浸在网络带来的虚拟社区环境中,忽视了现实生活中的社会互动。随之而来的诽谤问题变得越来越严重。通过宠物机器人和育种者之间的情感沟通促进人与人之间的离线沟通“解决了这个问题,并开发了一种名为”汤姆“的设计。”汤姆“是一个智能宠物机器人,具有基于petrobot的社交机制,名为”Tom-本文的主要贡献是提出一种名为“Tom-Talker”的社交机制,鼓励用户离线社交。“Tom-Talker”也有相应的奖励机制和朋友推荐算法。它还提出了一个宠物机器人名为“汤姆“通过情感交互算法识别用户的情绪,模拟动物的情绪,并用情感进行交流。本文设计实验并分析结果。结果表明,荆棘机器人对解决城市自闭症问题有很好的效果。
translated by 谷歌翻译
我们考虑获取一方不拥有的一组数据(例如图像)的请求者。为了收集所有数据,众包机制已被广泛用于寻求人群的帮助。但是,现有的第三方平台机制以及来自这些平台的工作人员并不是必需的,而且冗余数据也没有得到妥善处理。为了解决这个问题,我们提出了一种基于社交网络的新型众包机制,其中工人的回报通过信息熵和修改后的Shapley值来计算。这种机制激励网络中的工作者不仅提供他们拥有的所有数据,而且还进一步邀请他们的邻居提供更多数据。最终,该机制能够通过受约束的奖励来获取网络上所有工作人员的所有数据。
translated by 谷歌翻译
我们考虑固定价格机制设计设置,卖方通过社交网络销售oneitem,但卖方最初只能直接与邻居沟通。网络中的每个其他节点都是潜在的买方,其估值来自共同分布。使用标准的固定价格机制,卖家只能在她的邻居中出售物品。为了增加收入,她需要更多的买家加入销售。为了实现这一目标,我们提出了第一个固定价格机制来激励这些邻居告知他们的邻居有关销售的信息并最终通知网络中的所有买家以提高卖家的收入。与同一目的的现有机制相比,我们的机制不需要买方揭示其估值,并且计算上容易。更重要的是,它保证了收益的改善至少是最优的1/2。
translated by 谷歌翻译
Image feature extraction and matching is a fundamental but computation intensive task in machine vision. This paper proposes a novel FPGA-based embedded system to accelerate feature extraction and matching. It implements SURF feature point detection and BRIEF feature descriptor construction and matching. For binocular stereo vision, feature matching includes both tracking matching and stereo matching, which simultaneously provide feature point correspondences and parallax information. Our system is evaluated on a ZYNQ XC7Z045 FPGA. The result demonstrates that it can process binocular video data at a high frame rate (640 × 480 @ 162fps). Moreover, an extensive test proves our system has robustness for image compression, blurring and illumination.
translated by 谷歌翻译
时间序列的可靠准确预测在经济投资,交通规划,港口规划和设计等领域中起着至关重要的作用。海上时间序列的动态增长具有非常复杂,非线性和非平稳的特性。为了保证高质量的预测性能,我们建议首先采用经验模式分解(EMD)和集合EMD(EEMD)方法将原始时间序列分解为高频和低频分量。可以通过传统的神经网络(NN)方法直接预测低频分量。由于数学规律性较弱,预测高频分量更加困难。为了利用高频分量中的内在自相似性,这些分量将被分成几个连续的小(重叠)分段。然后选择具有高相似性的聚类片段以形成用于传统NN方法的更多特性数据集。这种重组策略可以帮助提高高频分量的预测精度。通过对预测的高频和低频分量进行积分来获得最终预测结果。我们提出的三步预测框架受益于时间序列分解和类似的分段分组。港口货物吞吐量和船舶交通流量的实验表明,它在预测精度和鲁棒性方面具有优越的性能。
translated by 谷歌翻译
诸如彩色图像和多光谱图像之类的张量图像数据集是高度相关的,并且它们包含许多图像细节。本文的主要目的是提出并开发一种正则化张量完成模型fortensor图像数据完成。在目标函数中,我们采用新的张量核范数(TNN)来表征这种图像数据集的全局结构。此外,我们制定了一个隐式正则化器来插入卷积神经网络(CNN)降噪器,它被证实能够表达先前从大量自然图像中学习的图像。可以通过交替方向的乘法器算法有效地求解所得到的模型。实验结果(彩色图像,视频和多光谱图像)表明,图像全局结构和细节都可以很好地恢复,并说明所提出的方法在PSNR和SSIM方面的性能优于测试方法。
translated by 谷歌翻译
机器学习和计算机科学中的许多凸问题共享相同的形式:\ begin {align *} \ min_ {x} \ sum_ {i} f_i(A_i x + b_i),\ end {align *}其中$ f_i $是凸函数on $ \ mathbb {R} ^ {n_i} $,常数为$ n_i $,$ A_i \ in \ mathbb {R} ^ {n_i \ times d} $,$ b_i \ in \ mathbb {R} ^ {n_i} $和$ \ sum_i n_i = n $。这个问题推广了线性规划,包括许多问题,经验风险最小化。在本文中,我们给出了一个运行intime \ begin {align *}的算法O ^ *((n ^ {\ omega} + n ^ {2.5 - \ alpha / 2} + n ^ {2+ 1/6}) \ log(n / \ delta))\ end {align *}其中$ \ omega $是matrixmultiplication的指数,$ \ alpha $是矩阵乘法的双指数,$ \ delta $是相对精度。请注意,运行时只对条件数或其他数据相关参数具有对数依赖性,并且这些参数在$ \ delta $中捕获。对于当前绑定的$ \ omega \ sim 2.38 $ [Vassilevska Williams'12,Le Gall'14]和$ \ alpha \ sim 0.31 $ [Le Gall,Urrutia'18],我们的运行时$ O ^ *(n ^ {\ omega} \ log(n / \ delta))$匹配当前最佳解决密集最小二乘回归问题,这是我们考虑的问题的一个特例。最近,[Alman'18]证明了目前所有已知的技术都无法提供低于$ 2.168 $的更好的$ \ omega $,这比$ 2 + 1/6 $更大。我们的结果推广了当前矩阵乘法时间[Cohen,Lee,Song'19]中线性程序的最新结果,以解决更广泛的问题。我们的算法提出了两个与[Cohen,Lee,Song'19]不同的概念:$ \ bullet $我们给出一个鲁棒的确定性中心路径方法,而前一个是随机中心路径,它通过randomsparse向量更新权重。 $ \ bullet $我们提出了一种有效的数据结构,即使权重更新向量密集,也能维持内点方法的中心路径。
translated by 谷歌翻译