无监督学习是关于捕捉变量之间的依赖关系,并且由这些变量的可能与不可能的配置之间的对比驱动,通常是通过仅对可能性进行采样的生成模型或对于可能的低的能量函数(非标准化的对数密度)和不可思议的高。在这里,我们考虑学习能量函数和有效的近似抽样机制。尽管生成对抗网络(GAN)中的识别者学会分离数据和生成器样本,但在生成器上引入熵最大化正则化可以将批评者的解释转化为能量函数,将训练分布与其他所有内容分开,从而可以用于任务像异常或新奇的检测。然后,我们展示了如何在发生器潜在空间中完成MarkovChain Monte Carlo,其样本可以映射到数据空间,从而产生更好的样本。这些样本用于估计数据空间能量函数的对数似然梯度所需的负相位梯度。为了最大化发电机输出端的熵,我们利用最近引入的相互信息的神经估计器。我们发现除了为异常检测产生有用的评分函数之外,所得到的方法产生清晰的样本,同时很好地覆盖模式,导致高的Inception和Frechet分数。
translated by 谷歌翻译
基于van den Oord等人(2017)提出的方法,我们展示了一种有效音乐分解的条件自回归流水线。分解(Casal&Casey,2010)着重于重新制作现有的音乐作品,坚持高水平的结构,同时也重新想象工作的其他方面。这可能涉及重用预先存在的主题或原始部分的部分,同时还需要灵活地在不同的粒度级别生成新内容。将上述建模管道应用于重构,我们在和弦序列注释上展示了多样化和结构化的生成条件。
translated by 谷歌翻译
本文描述了我们的表面实现共享任务2018(SRST'18)的浅轨道提交系统。任务是将真正的UDstructures转换成正确的句子形式,从这些UDstructures中删除了词序信息,并将tokenshad语法化。我们将问题陈述分为两个部分,即单词重新反射和正确的词序预测。对于第一个子问题,我们使用基于长短期记忆的编码器 - 解码器方法。对于第二个子问题,我们提出了一种基于LanguageModel(LM)的方法。我们在LMBased方法中应用两种不同的子方法,这两种方法的组合结果被认为是系统的最终输出。
translated by 谷歌翻译
在本文中,我们提出了一种针对低功率汽车级SoC优化的多任务卷积神经网络(CNN)架构。我们介绍了基于统一架构的网络,其中编码器在两个任务之间共享,即检测和分段。提议的网络运行速度为25FPS,分辨率为1280x800。我们简要讨论了用于优化网络架构的方法,例如直接使用原生YUV图像,优化图层和特征图以及应用量化。我们还在设计中关注内存带宽,因为卷积是数据密集型的,大多数SOC都是带宽瓶颈。然后,我们展示了我们提出的专用CNN加速器网络的效率,该加速器为从硬件执行和相应的运行时间获得的检测和分段任务提供关键性能指标(KPI)。
translated by 谷歌翻译
典型的对话包括参与者之间的多次转弯,其中他们在不同主题之间来回转换。在每个用户转弯时,对话状态跟踪(DST)旨在通过处理当前的容差来估计用户的目标。然而,在许多回合中,用户隐含地提到了先前的目标,因此需要使用相关的对话历史。尽管如此,区分相关历史是具有挑战性的,并且使用对话新近度的流行方法是低效的。因此,我们提出了一种新的DST框架,通过参考特定时隙值变化的过去话语来识别相关的历史背景,并将其与加权系统话语一起用于识别相关的上下文。具体来说,我们使用当前用户话语和最近的系统话语来确定系统话语的相关性。实证分析表明,与以前最先进的GLAD模型相比,我们分别在WoZ 2.0和MultiWoZ 2.0餐厅域数据集上提高了2.75%和2.36%的联合目标准确度。
translated by 谷歌翻译
尽管在使用卷积神经网络的图像分割领域已经进行了许多改进,但是这些改进中的大多数依赖于具有较大数据集,模型架构修改,新颖损失函数和更好的优化器的训练。在本文中,我们提出了一种新的分段性能提升范例,它依赖于最优地修改网络输入而不是网络本身。特别地,我们利用训练的分割网络的梯度来考虑输入,将其转移到分割准确度提高的空间。我们在三个公开的医学图像分割数据集上测试了所提出的方法:ISIC 2017皮肤损伤分割数据集,深圳胸部X射线数据集和CVC-ColonDB数据集,我们的方法实现了5.8%,0.5%和4.8%的改进在平均Dice分数中。
translated by 谷歌翻译
我们考虑为具有交互动态和稀疏可用通信的移动机器人的大型网络寻找分布式控制器的问题。我们的方法是通过在训练时使用全局信息模仿集中控制器的策略来学习本地控制器,这些控制器在测试时仅需要本地信息和本地通信。通过将聚合图神经网络扩展到时变信号和时变网络支持,我们学习了一个通用的本地控制器,它可以通过仅使用本地通信交换来从远程队友那里获取信息。我们将这种方法应用于分散线性二次调节器问题,并观察通信速率和较小网络程度如何增加多跳信息的价值。学习分散式植绒控制器的独立实验证明了随着机器人移动而改变的通信图表的性能。
translated by 谷歌翻译
我们设想一个简洁地描述空中交通管制规则的系统,协助人类操作员并支持商业机场密集的自主空中交通。我们开发了一种方法,通过最大熵逆增强学习,从真实数据中学习空中交通控制规则作为成本函数。此成本函数用作基于研究的运动规划方法的惩罚,该方法将控制和状态空间离散化。我们通过展示我们的方法可以模仿机场到达路线和密集商业空中交通的分离规则来说明这种方法。得到的轨迹显示是安全,可行和有效的。
translated by 谷歌翻译
反向文件和非对称距离计算(IVFADC)已成功应用于近似最近邻搜索和随后最大内积搜索。在这样的框架中,矢量量化用于粗分区,而产品量化用于量化残差。在原始IVFADC及其所有变体中,计算后残差,第二产生量化步骤完全独立于第一矢量量化步骤。在这项工作中,当我们执行非穷举搜索时,我们寻求开发这两个步骤之间的联系。更具体地,我们将残差矢量局部地分解为两个正交分量,并分别对每个分量执行均匀量化和多尺度量化。所提出的方法,称为局部正交分解,与多尺度量化相结合,在相同比特率下比以前的方法具有更高的回忆率。我们对大规模数据集进行了全面的实验,并进行了详细的测试,证明了我们的方法的有效性。
translated by 谷歌翻译
心理健康和社交媒体一直是密切相关的研究领域。在这项研究中,提出了一种新的模型,AD预测模型,用于实时推文中的焦虑抑制预测。这种混合性焦虑抑郁症主要与不稳定的思维过程,烦躁不安和失眠有关。基于语言线索和用户发布模式,使用5元组向量<字,时间,频率,情感,对比度>来定义特征集。建立一种与焦虑相关的词汇来检测焦虑指标的存在。分析推特的时间和频率是否存在不规则性,并且进行意见极性分析以发现发布行为的不一致性。该模型使用三个分类器(多项式na \“ive bayes,梯度增强和随机森林)进行训练,并使用集合投票分类器进行多数投票。对抽样100个用户的推文评估初步结果,建议的模型分类精度为85.09 %。
translated by 谷歌翻译