嘈杂的频道模型在神经机翻译(NMT)中特别有效。然而,最近的方法如“波束搜索和重新划分”(BSR)在推理期间引起了大量的计算开销,使实际应用不可行。我们的目标是建立一个摊销嘈杂的频道NMT模型,使得从它贪婪解码将生成转换,以最大化与使用BSR生成的翻译相同的奖励。我们尝试三种方法:知识蒸馏,1阶梯偏差仿制学习和Q学习。第一方法获得来自伪语料库的噪声信道信号,后两种方法旨在直接针对嘈杂的通道MT奖励优化。所有三种级别的速度推动速度推断为1-2级。对于所有三种方法,所生成的翻译无法实现与BSR相当的奖励,但BLEU近似的翻译质量类似于BSR产生的翻译的质量。
translated by 谷歌翻译
为了实现长文档理解的构建和测试模型,我们引入质量,具有中文段的多项选择QA DataSet,具有约5,000个令牌的平均长度,比典型的当前模型更长。与经过段落的事先工作不同,我们的问题是由阅读整个段落的贡献者编写和验证的,而不是依赖摘要或摘录。此外,只有一半的问题是通过在紧缩时间限制下工作的注释器来应答,表明略读和简单的搜索不足以一直表现良好。目前的模型在此任务上表现不佳(55.4%),并且落后于人类性能(93.5%)。
translated by 谷歌翻译
我们介绍了多变量时间序列中异常检测问题的新型,实际相关的变化:内在的异常检测。它出现在从DevOps到IoT的各种实践场景中,我们想认识到在周围环境影响下运行的系统的故障。固有的异常是时间序列之间的功能依赖性结构的变化,该时间序列代表代表所述环境中系统内部状态的环境和时间序列。我们将此问题形式化,为其提供了不足的公共和新的专用数据集,并提供了处理内在异常检测的方法。这些解决了无法区分系统状态的预期变化和意外情况的现有异常检测方法的缩写,即,偏离环境影响的系统的变化。我们最有前途的方法是完全无监督的,并结合了对抗性学习和时间序列表示学习,从而解决了标签稀疏性和主观性等问题,同时允许导航并改善臭名昭著的有问题的异常检测数据集。
translated by 谷歌翻译
内核岭回归(KRR)最近引起了新的兴趣,因为它可以解释在神经网络训练期间出现的瞬态效应,例如双重下降。在这项工作中,我们研究目标函数与内核之间的对齐方式如何影响KRR的性能。我们专注于截短的KRR(TKRR),该KRR(TKRR)利用一个控制核矩阵的光谱截断的附加参数。我们表明,对于多项式对齐,有一个\ emph {过度对准}制度,其中TKRR可以实现比Full KRR可以实现的要快的速度。 TKRR的速率可以一直提高到参数速率,而全krr的速率则以亚最佳值的限制。这表明,通过在内核方法中利用光谱截断,可以更好地利用目标alignemnt。我们还考虑了带有限制的对准设置,并表明TKRR的正则化表面可以表现出瞬态效应,包括多个下降和非单调行为。我们的结果表明,\ emph {对齐谱}的形状与内核方法的概括性能之间存在很强的关系,无论是在速率和有限样品方面。
translated by 谷歌翻译
我们使用多机构系统来建模代理(代表公司)如何合作并适应业务“景观”,其中一些更具影响力的公司有能力塑造其他公司的景观。我们研究的景观是基于著名的Kauffman的NK模型,并增加了“塑造者”,这些公司可以为自己和所有其他玩家改变景观的特征。我们的工作调查了还可以赋予认知和体验式搜索的公司,以及与其他公司建立合作的能力,可以使用这些能力来更快,更熟练地适应。我们发现,在一个合作集团中,公司仍然必须有自己的想法,并抵制更强大的合作伙伴的直接模仿,以共同达到更好的高度。具有更大影响力成员的较大群体和群体通常会做得更好,因此有针对性的智能合作是有益的。这些结论是暂定的,我们的结果表明了对景观坚固性和“锻造性”的敏感性(即,塑造公司将改变景观的能力)。总体而言,我们的工作展示了计算机科学,演变和机器学习在这些复杂环境中为业务策略做出贡献的潜力。
translated by 谷歌翻译
为了解决疫苗犹豫不决,这会损害COVID-19疫苗接种运动的努力,必须了解公共疫苗接种态度并及时掌握其变化。尽管具有可靠性和可信赖性,但基于调查的传统态度收集是耗时且昂贵的,无法遵循疫苗接种态度的快速发展。我们利用社交媒体上的文本帖子通过提出深入学习框架来实时提取和跟踪用户的疫苗接种立场。为了解决与疫苗相关话语中常用的讽刺和讽刺性的语言特征的影响,我们将用户社交网络邻居的最新帖子集成到框架中,以帮助检测用户的真实态度。根据我们从Twitter的注释数据集,与最新的仅文本模型相比,从我们框架实例化的模型可以提高态度提取的性能高达23%。使用此框架,我们成功地验证了使用社交媒体跟踪现实生活中疫苗接种态度的演变的可行性。我们进一步显示了对我们的框架的一种实际用途,它可以通过从社交媒体中感知到的信息来预测用户疫苗犹豫的变化的可能性。
translated by 谷歌翻译
疫苗的犹豫被认为是欧洲和美国在欧洲疫苗充足疫苗的疫苗停滞比率停滞的主要原因之一。快速准确地掌握公众对疫苗接种的态度对于解决疫苗犹豫至关重要,社交媒体平台已被证明是公众意见的有效来源。在本文中,我们描述了与Covid-19疫苗有关的推文数据集的收集和发布。该数据集由从西欧收集的2,198,090条推文组成,其中17,934条带有发起者的疫苗接种立场。我们的注释将有助于使用和开发数据驱动的模型来从社交媒体帖子中提取疫苗接种态度,从而进一步确认社交媒体在公共卫生监视中的力量。为了为未来的研究奠定基础,我们不仅对数据集进行了统计分析和可视化,而且还评估和比较了疫苗接种立场提取中已建立的基于文本的基准测试的性能。我们在实践中证明了我们的数据的一种潜在用途,以跟踪公共Covid-19-19疫苗接种态度的时间变化。
translated by 谷歌翻译
图形神经网络(GNN)已被广泛用于表示图数据的表示。但是,对图形数据实际上获得多少性能GNN的理解有限。本文介绍了上下文弹出的GNN框架,并提出了两个平滑度指标,以测量从图形数据获得的信息的数量和质量。然后,一种称为CS-GNN的新型GNN模型旨在根据图的平滑度值改善图形信息的使用。证明CS-GNN比不同类型的真实图中现有方法获得更好的性能。
translated by 谷歌翻译
运动估计方法通常采用传感器融合技术(例如Kalman滤波器)来处理单个传感器故障。最近,已经提出了基于深度学习的融合方法,提高了性能并需要更少的模型特定实现。但是,当前的深融合方法通常认为传感器是同步的,这并不总是实用的,尤其是对于低成本硬件。为了解决这一局限性,在这项工作中,我们提出了AFT-VO,这是一种新型的基于变压器的传感器融合体系结构,以估算来自多个传感器的VO。我们的框架结合了异步多视觉摄像机的预测,并说明了来自不同来源的测量值的时间差异。我们的方法首先采用混合密度网络(MDN)来估计系统中每个相机的6-DOF姿势的概率分布。然后引入了一个新型的基于变压器的融合模块AFT-VO,该模块结合了这些异步姿势估计以及它们的信心。更具体地说,我们引入了离散器和源编码技术,该技术使多源异步信号的融合。我们在流行的Nuscenes和Kitti数据集上评估了我们的方法。我们的实验表明,用于VO估计的多视图融合提供了强大而准确的轨迹,在挑战性的天气和照明条件下都超过了艺术的表现。
translated by 谷歌翻译
作为遗传和生理方面之间的桥梁,动物行为分析是生物学和生态学研究中最重要的主题之一。但是,识别,跟踪和记录动物行为是需要专业知识的劳动密集型作品。为了减轻注释数据的支出,研究人员转向用于自动标签算法的计算机视觉技术,因为大多数数据都是视觉记录的。在这项工作中,我们探讨了各种行为检测算法,涵盖了传统的视觉方法,统计方法和深度学习方法。这项工作的目的是对相关工作进行彻底的研究,为生物学家提供有效的动物行为检测方法。除此之外,我们还讨论了这些算法的优势和缺点,以为已经深入研究该领域的人们提供一些见解。
translated by 谷歌翻译