本文讨论了一种在系统不确定性(包括参数变化,执行器非线性和外部扰动)下有效控制双臂机器人(DAR)非线性操纵运动的自适应策略。提出控制方案首先来自动态表面控制(DSC)方法,其允许机器人的末端执行器环绕地跟踪期望的轨迹。此外,由于系统的不确定性,准确地确定DAR系统的动态是不切实际的,因此通过使用径向基函数网络(RBFN)来提出自适应估计的不确定系统参数。自适应机制源于Lyapunov理论,该理论在理论上保证了闭环控制系统的稳定性。通过在具有实际参数的合成环境中实施该算法,证明了所提出的RBFN-DSC方法的有效性,其中获得的结果是高度有希望的。
translated by 谷歌翻译
多模态情绪分析是研究由语言,视觉和声学模式表达的说话者情感的核心研究领域。多模态学习中的中心挑战涉及推断可以处理和关联来自这些模态的信息的联合表示。然而,现有工作通过要求所有模态作为输入来学习联合表示,因此,学习的表示可能对测试时的噪声缺失模态敏感。随着机器翻译中序列序列(Seq2Seq)模型的最近成功,有机会探索在测试时可能不需要所有输入模态的联合表示的新方法。在本文中,我们提出了一种通过在模态之间进行转换来学习联合表示的方法。我们的方法基于以下关键洞察:从源到目标模态的转换提供了仅使用源模态作为输入来学习联合表示的方法。我们使用循环一致性损失来增强模态转换,以确保我们的联合表示保留最大的信息。一旦我们的翻译模型使用配对的多模态数据进行训练,我们只需要在测试时从源模态获得最终情绪预测的数据。这确保了我们的模型在其他模态中保持强大的功能或缺少信息。我们使用耦合的翻译预测目标训练我们的模型,并在多模态情感分析数据集上实现最新的结果:CMU-MOSI,ICT-MMMO和YouTube。另外的实验表明,我们的模型学习越来越多的判别性联合表示,具有更多的输入模态,同时保持对丢失或扰动模态的鲁棒性。
translated by 谷歌翻译
多模式机器学习是跨越语言,视觉和声学模式的核心研究领域。多模式学习的核心挑战涉及学习表示,可以处理和关联来自多种模态的信息。在本文中,我们提出了两种使用序列到序列(Seq2Seq)方法进行联合多模态表示的无监督学习的方法:a \ textit {Seq2Seq模态翻译模型}和\ textit {Hierarchical Seq2Seq模态翻译模型}。我们还探讨了这些seq2seq模型的多模式输入和输出的多种不同变化。我们使用CMU-MOSI数据集进行多模态情感分析的实验表明,我们的方法学习的信息多模态表示优于基线并在多模态情感分析中实现改进的性能,特别是在我们的模型能够将F1得分提高12分的双峰情况下。我们还讨论了多模式Seq2Seq方法的futuredirections。
translated by 谷歌翻译
近年来,信号时间逻辑(STL)作为编码机器人和物理系统的控制目标的实用和富有表现力的手段已经获得了关注。 STL轨迹综合的最新技术将问题形式化为混合整数线性程序(MILP)。对于有限的规范,MILPapproach是完整且完整的,但是如此强大的正确性保证以谓词的数量和规范的时间限制为代价。在这项工作中,我们提出了一种替代的合成范式,它依赖于贝叶斯优化而不是混合整数规划。这样可以放松完整性保证概率完整性,但效率明显更高:在STL中进行多项式时间限制,并在谓词数量中线性地进行。我们证明了我们的方法是合理且概率完整的,并且通过一个非常重要的例子展示了它的可扩展性。
translated by 谷歌翻译
在先前的盲去卷积方法中,可以通过使用边缘或像素信息来获得去模糊图像。然而,基于现有边界的方法没有利用边缘信息的方向,而是在恢复去模糊图像时仅使用水平和垂直边缘。这种限制降低了恢复图像的质量。本文提出了一种利用不同方向的边缘来恢复真实清晰图像的方法。我们还提供统计表核心,以显示有多少方向足以恢复高质量的真实清晰图像。为了对去模糊图像的质量进行分级,我们引入了一种测量,即利用哈尔 - 小波变换的哈尔散焦得分。实验结果证明,所提出的方法在Haar defocusscore和Peak Signal to Noise Ratio方面都获得了高质量的去模糊图像。
translated by 谷歌翻译
假新闻和错误信息越来越多地被用来操纵人们的观点并影响政治进程。为了更好地理解假新闻,它们如何传播,以及如何抵消它们的影响,有必要首先识别它们。最近,已经提出了基于其内容将文章自动分类为伪造的方法。这些方法的一个重要挑战来自于新闻的动态性质:随着新政治事件被覆盖,主题和话语不断变化,因此,使用在给定时间发表的文章内容训练的分类者可能在未来变得无效。为了应对这一挑战,我们提出了一种主题无关(TAG)分类策略,该策略使用语言和网络标记功能来识别虚假新闻页面。我们使用多个数据集来报告实验结果,这些数据集表明我们的方法在识别假新闻时具有高准确性,即使主题随着时间的推移而演变。
translated by 谷歌翻译
最近,用于语音识别的端到端序列到序列模型已经引起了研究界的极大兴趣。虽然以前的架构选择围绕延时神经网络(TDNN)和长期记忆(LSTM)递归神经网络,但我们建议通过Transformer架构作为替代方案来引起自我关注。我们的分析表明,具有高学习能力的深层变压器网络能够超越先前的端到端方法,甚至与传统的混合系统相匹配。此外,我们培训了非常深的模型,其中包含多达48个变压器层,用于编码器和解码器以及随机残余连接,这极大地提高了通用性和培训效率。由此产生的模型在Switchboard基准测试中优于所有先前的端到端ASR方法。这些模型的集合分别在Switchboard和CallHome测试集上实现了9.9%和17.7%的WER。这一发现使我们的端到端模型与之前的混合动力系统达到了竞争水平。此外,通过模型集成,变形金刚可以胜过某些混合系统,这在系统结构和训练过程方面都比较复杂。
translated by 谷歌翻译
人机协作(HRC)近年来已成为控制,机器人和心理学等领域的热门研究领域。在HRC中获得一个表达但同时易于处理的人类模型具有重要意义。在本文中,我们提出了一个名为VectorAutoregressive POMDP(VAR-POMDP)模型的模型,它是传统的POMDP模型的一个扩展,考虑了观察之间的相关性。 VAR-POMDP模型在特征表达方面比传统的连续观察POMDP更强大,因为传统的是VAR-POMDP模型的特例。同时,提出的VAR-POMDP模型也易于处理,因为我们可以从数据中有效地学习它,并且我们可以将基于扩展点的值迭代(PBVI)转换为VAR-POMDP规划。特别是,在本文中,我们建议使用贝叶斯非参数学习来决定潜在的人类状态,并使用从人类演示中收集的数据来学习VAR-POMDP模型。然后,我们考虑对PCTL进行规划,PCTL广泛用作机器人技术中的安全性和可达性要求。最后,使用从驾驶辅助试验台收集的数据,通过实验结果验证了使用所提出的HRC模型的优点。
translated by 谷歌翻译
化学反应的实用性是所有基于符号智能的化学信息处理的核心任务,例如,它为进一步的自动合成路径推断提供了必不可少的线索。考虑到化学反应已经以语言形式表示,我们提出了一种新的解决方案,通常可以在不考虑复杂的量子物理模型或化学知识的情况下判断有机反应的实用性。在将实际判断作为机器学习任务从正面和负面(化学反应)样本中解决的同时,所有现有研究都必须仔细处理负面样本上的这些不足问题。我们提出了一种自动构建方法来很好地解决广泛存在的长期困难。实验结果表明,该模型能够有效预测化学反应的实际性,在实际大型化学实验室反应实用性判断中达到99.76%的高精度。
translated by 谷歌翻译
我们对LeadingOnes函数的单变量边际分布算法进行了严格的运行时分析,这是演化计算理论界的一个众所周知的基准函数,决策变量之间存在高度相关性。对于大小为$ n $的问题实例,当前最知名的预期运行时上限是$ \ mathcal {O}(n \ lambda \ log \ lambda + n ^ 2)$(Dang and Lehre,GECCO 2015),而仍然缺少理解算法如何处理变量依赖性的必要限制。由此推动,我们证明该算法需要具有高概率的$ e ^ {\ Omega(\ mu)} $运行时并且期望选择压力低;否则,我们在预期的运行时获得$ \ Omega(\ frac {n \ lambda} {\ log(\ lambda- \ mu)})$的下限。此外,我们第一次考虑函数上的算法undera先前噪声模型并获得最优参数设置的$ \ mathcal {O}(n ^ 2)$预期运行时间。最后,我们的理论结果伴随着实证研究结果,不仅与严格的分析相匹配,而且还提供了对算法行为的新见解。
translated by 谷歌翻译