投注机制是引发代理人对事件预测的一次性投注机制。对于确定性投注机制,现有的不可能性结果表明一些理想的理论性质不相容。特别是,帕累托最优性(在分配之前没有盈利的边注)不能与弱激励兼容性,弱预算平衡和个人理性一起实现。在本文中,我们扩展了投注机制的设计空间,以允许随机化,并询问其中是否有随机化的投注机制,可以实现所有先前考虑​​的所需属性,包括帕累托最优性。我们用两类随机化的投注机制积极地回答这个问题:i)现有确定性投资机制的简单随机抽签式实施,以及ii)我们称之为代理投注机制的另一族简单和随机化投注机制,这些机制是强大的tonoisy基本事实。这一系列机制建立在嘈杂标签学习的基础上(Natarajan等人,2013),以及最近将该信息扩展到信息引出而没有验证设置(Liu和Chen2018)。我们表明,广泛的随机化投注机制家族满足了所有理想的理论属性。
translated by 谷歌翻译
由于深度网络和大型数据集,已知类别对象的视点估计得到了显着改善,但泛化的已知类别仍然非常具有挑战性。为了提高未知类别的表现,我们引入了类别级别的镜头观点估计问题。我们设计了一个新的框架来成功地为新类别训练视点网络,只有很少的例子(10个或更少)。我们将问题表述为学习估计特定类别的3D扫描形状,相关深度估计和语义2D关键点之一。我们应用元学习来学习我们网络的权重,这些权重是特定于特定类别的微观微调。此外,我们设计了一个灵活的暹罗网络,在元学习过程中最大化信息共享。通过对ObjectNet3D和Pascal3D + benchmark数据集的大量实验,我们证明我们的框架,我们称之为MetaView,明显优于微调状态。 -art模型与fewexamples,我们的方法的具体架构创新是实现良好性能的关键。
translated by 谷歌翻译
在自动驾驶车辆上逐渐出现了多个激光雷达,用于扩展视野和密集测量。然而,缺乏精确校准会对其局部化和感知系统中的潜在应用产生负面影响。在本文中,我们提出了一种新颖的系统,它能够实现自动多LiDAR校准,无需任何校准目标,先前的环境信息和外部参数的初始值。我们的方法首先是通过对齐每个传感器的估计运动进行自动初始化的手眼校准。然后通过最小化从点 - 平面对应构造的acost函数,使用基于外观的方法来细化所得到的参数。模拟和真实数据集的实验结果证明了我们的校准方法的可靠性和准确性。对于移动平台,所提出的方法可以校准多个LiDAR系统,其旋转和平移误差分别小于0.04 [rad]和0.1 [m]。
translated by 谷歌翻译
时间序列的建模在各种各样的应用中变得越来越重要。总体而言,数据通过遵循不同的模式而发展,这些模式通常由不同的用户行为引起。给定时间序列,我们定义进化基因以捕获潜在的用户行为并描述行为导致时间序列的生成。特别是,我们提出了一个统一的框架,通过学习分类器来识别不同的分段演化基因,并采用对抗生成器通过估计分段的分布来实现进化基因。基于合成数据集和五个真实世界数据集的实验结果表明我们的方法不仅可以获得良好的预测结果(例如,就F1而言平均为+ 10.56%),而且还能够提供结果的解释。
translated by 谷歌翻译
时间序列建模旨在捕获支撑观测数据及其演化的内在因素。然而,大多数现有的研究忽略了这些因素之间的进化关系,这些因素导致了给定时间序列的组合演化。在本文中,我们建议通过进化状态图结构来表示时间序列数据的内在因素之间的时变关系。因此,我们提出了使用图神经网络框架的演化图循环网络(EGRN)来学习这些因子的表示以及给定的时间序列。然后,学习的表示可以应用于时间序列分类任务。根据我们的实验结果,基于六个真实世界的数据集,可以看出我们的方法明显优于最先进的基线方法(例如,精确度为+ 5%,平均为F1的+ 15%) 。此外,我们证明由于图形结构的可解释性提高,我们的方法也能够解释预测事件的逻辑原因。
translated by 谷歌翻译
由于Web上用户生成的视频的爆发,有效地查找用户想要的视频内容的需求正在增加。基于现有关键字或基于内容的视频检索方法通常决定视频中的哪些内容,而不是何时何地。在本文中,我们通过制定新任务,即时空视频重新定位来回答何时何地的问题。具体地,给定查询视频和参考视频,时空视频重新定位的目的在于参考视频中的局部小块,使得小管在语义上对应于查询。为了准确地定位参考视频中所需的小管,我们提出了一种新颖的扭曲LSTM网络,该网络长时间传播时空信息,从而捕获相应的长期依赖性。时空视频定位的另一个问题是缺乏适当标记的视频数据集。因此,组织AVA数据集中的视频以形成新的数据集forspatio-temporal视频重新定位研究。大量的实验结果表明,所提出的模型在时空视频重定位任务上实现了优于设计基线的性能。
translated by 谷歌翻译
由于高存储和搜索效率,散列已经变得普遍用于大规模相似性搜索。特别是,深度哈希方法在监督场景下极大地提高了搜索性能。相比之下,由于缺乏可靠的监控相似性信号,无监督的深度哈希模型很难实现令人满意的性能。为了解决这个问题,我们提出了一种新的深度无监督散列模型,称为DistillHash,它可以学习由具有置信相似性信号的数据对组成的蒸馏数据集。具体地,我们研究了从局部结构学习的初始噪声相似性信号与由贝叶斯最优分类器分配的语义相似性标签之间的关系。我们表明,在一个温和的假设下,一些数据对,其中哪些标签与贝叶斯最优分类器指定的标签一致,可以被潜在地提炼出来。受此事实的启发,我们设计了一种简单的有效策略来自动提取数据对,并进一步采用贝叶斯学习框架从蒸馏数据集中学习哈希函数。三个广泛使用的基准数据集的广泛实验结果表明,提出的DistillHash始终如一地完成了最先进的搜索性能。
translated by 谷歌翻译
本文介绍了一种新的统一预训练语言模型(UniLM),可以对自然语言理解和生成任务进行微调。该模型使用三种类型的语言建模目标进行预训练:单向(从左到右和从右到左),双向和序列到序列预测。通过使用共享的变压器网络并利用特定的自注意掩模来控制预测条件的上下文来实现统一建模。我们可以将UniLM微调为单向解码器,双向编码器或序列到序列模型,以支持各种下游自然语言理解和生成任务。 UniLM在GLUE基准测试和SQuAD 2.0和CoQA问题回答任务方面优于BERT。此外,我们的模型在三个自然语言生成任务上实现了最新的结果,包括将CNN / DailyMail抽象概括ROUGE-L提高到40.63(2.16绝对改进),推动CoQA生成问题回答F1得分为82.5(绝对值37.1)改进)和SQUAD问题代BLEU-4到22.88(6.50绝对改进)。
translated by 谷歌翻译
Text effects are combinations of visual elements such as outlines, colors and textures of text, which can dramatically improve its artistry. Although text effects are extensively utilized in the design industry, they are usually created by human experts due to their extreme complexity, which is laborious and not practical for normal users. In recent years, some efforts have been made for automatic text effects transfer, however, the lack of data limits the capability of transfer models. To address this problem, we introduce a new text effects dataset, TE141K, with 141,081 text effects/glyph pairs in total. Our dataset consists of 152 professionally designed text effects, rendered on glyphs including English letters, Chinese characters, Arabic numerals, etc. To the best of our knowledge, this is the largest dataset for text effects transfer as far. Based on this dataset, we propose a baseline approach named Text Effects Transfer GAN (TET-GAN), which supports the transfer of all 152 styles in one model and can efficiently extend to new styles. Finally, we conduct a comprehensive comparison where 14 style transfer models are benchmarked. Experimental results demonstrate the superiority of TET-GAN both qualitatively and quantitatively, and indicate that our dataset is effective and challenging. Index Terms-Text effects, style transfer, deep neural network, large-scale dataset, model benchmarking.
translated by 谷歌翻译
复杂的社会系统由相互关联的个体组成,其相互作用导致群体行为。对现实世界复杂系统的最佳控制有许多应用,包括道路交通管理,流行病预防和信息传播。然而,由于高维和非线性系统动力学以及决策者的爆炸状态和动作空间,这种现实世界的复杂系统控制很难实现。现有方法可分为两类:基于模拟的方法和分析方法。现有的模拟方法在蒙特卡罗积分中具有高度方差,并且分析方法受到建模不准确性的影响。我们采用仿真建模来指定复杂系统的复杂动力学,并开发了具有高维状态动作空间的复杂网络中的最优策略的分析解决方案。为了捕捉复杂的系统动力学,我们将复杂的社会网络决策问题制定为离散事件决策过程。为了解决维度的诅咒和在复杂系统中的高维状态动作空间中的搜索,我们将复杂系统的控制减少到变分推理和参数学习,引入了Bethe entropyapproximation,并开发了期望传播算法。与现有的分析和采样方法相比,我们提出的算法在现实世界的运输方案中导致更高的系统预期回报,更快的收敛和更低的价值函数方差。
translated by 谷歌翻译