我们考虑用于表示车辆动力学的神经网络的在线适应问题。神经网络模型旨在由MPC控制法使用以自主地控制车辆。这个问题具有挑战性,因为输入和目标分布都是非平稳的,而在线适应的天真方法会导致灾难性的遗忘,从而导致控制器故障。我们提出了一种新颖的在线学习方法,它将伪排练方法与局部加权投影回归相结合。我们证明了在模拟中使用局部加权投影回归伪排练(LW-PR $ ^ 2 $)方法的有效性以及使用1/5比例自动驾驶车辆收集的大型真实世界数据集。
translated by 谷歌翻译
在本文中,我们提出了一个框架,用于结合基于深度学习的道路检测,粒子滤波器和模型预测控制(MPC),只使用单目相机,IMU和车轮速度传感器。该框架使用结合LSTM的深度卷积神经网络来学习车辆前方轨道的本地成本图表示。 Aparticle过滤器使用此动态观察模型在原理图中进行定位,并使用MPC积极地使用此基于粒子过滤器的状态估计进行驱动。我们展示了广泛的真实世界测试结果,并证明了车辆在复杂的污垢轨道上的摩擦极限下的可靠运行。我们使用我们的1:5比例测试车,在长达105英尺(32米)的泥路上达到27英里/小时(12米/秒)以上的速度。
translated by 谷歌翻译
最近的深度学习方法在语音增强和分离任务方面取得了令人瞩目的成绩然而,这些方法尚未被研究用于分离不同类型的任意声音的混合物,我们称之为通用声音分离的任务,并且未知语音任务的性能是否延续到非语音任务。为了研究这个问题,我们开发了包含任意形式的混合物的通用数据集,并用它来研究基于掩模的分离结构的空间,改变整体网络结构和信号转换的框架分析 - 合成基础。这些网络体系结构包括卷积长期短期记忆网络和时间膨胀卷积栈,其灵感来自最近成功的时间性能增强网络,如ConvTasNet。对于后一种体系结构,我们还提出了新的修改,以进一步提高分离性能。在框架分析 - 合成的基础上,我们使用在TEVasNet中使用的ashort-time傅立叶变换(STFT)或可学习的基础进行探索,并且对于这两个基础,我们检查窗口大小的影响。特别是对于STFT ,我们发现较长的窗口(25-50毫秒)最好的forspeech /非语音分离,而较短的窗口(2.5毫秒)工作最好的任意声音。对于可学习的基础,较短的窗口(2.5毫秒)最适合所有任务。令人惊讶的是,对于通用声音分离,STFT的性能优于基础。我们最好的方法可以改善语音/非语音分离的音阶 - 不变信号与失真比超过13 dB,并且通用声音分离接近10 dB。
translated by 谷歌翻译
由于暗示的参考文献所依赖的稀疏证据 - 通常基于没有或很少共享的单词,因此对暗示文本重用的检测尤其具有挑战性。可以说,词汇语义可以诉诸于,因为词语之间的语义关系有可能增加暗示的支持并减轻词汇稀疏性。另一个障碍是缺乏评估基准语料库,主要是由于注释过程的高度解释性。在本文中,我们将阐明自动典故检测的可行性。我们从信息检索的角度处理这个问题,其中引用textact作为查询和引用的文本作为要检索的相关文档,通过关于查询分割的新颖的注释器协议研究来估计基准语料库编译的难度。此外,我们研究了从分布模型和本体得到的词汇语义信息的整合在多大程度上可以帮助检索传统重用的案例。结果表明,(i)尽管协议得分低,但使用手动查询显着提高了关于awindowing方法的检索性能,并且(ii)检索性能可以用分布语义适度地加以改进。
translated by 谷歌翻译
事实证明,图形神经网络(GNN)在许多分类任务中都是成功的,在准确性方面优于以前最先进的方法。然而,单凭准确性对于高风险决策来说还不够。决策者想知道特定GNN预测是否正确的可能性。为此,获得校准模型是必要的。在这项工作中,我们分析了多个数据集上最先进的GNN的校准。我们的实验表明,GNN可以在某些数据集中进行校准,但在其他数据库中也会严重错误校准,并且最先进的校准方法很有帮助,但不能解决问题。
translated by 谷歌翻译
有大量复杂的动态系统对我们的日常生活和社会至关重要但却难以理解,即使今天有可能感知和收集大量的实验数据,它们也是如此复杂和不断发展,以至于它们的动力不太可能将被详细了解。然而,通过计算工具,我们可以尝试最好地利用当前技术和可用数据。我们认为,最有用的模型将在有限的知识或多个假设的背景下考虑系统复杂性和可用数据之间的不平衡。生物细胞的复杂系统是在系统生物学中研究的这种系统的一个主要例子,并且激发了本文提出的方法。它们是作为DARPA快速威胁评估(RTA)计划的一部分而开发的,该计划涉及对影响人体细胞的毒素或药物的作用机制(MoA)的理解。结合使用高斯过程和抽象网络建模,我们提出了三种基本的不同的基于机器学习的方法来学习因果关系,并从高维时间序列数据中合成因果网络。虽然其他类型的数据可用并且已经在我们的RTA工作中进行了分析和整合,但我们关注的是本文中从高通量微阵列实验获得的转录组学(即基因表达)数据,以说明我们的算法的能力和局限性。我们的算法使得不同但总体上相对较少的生物学假设,因此它们适用于其他类型的生物数据,甚至可能适用于其他复杂系统,这些系统具有高维度但不具有生物学性质。
translated by 谷歌翻译
机器人设计通常是一个缓慢而困难的过程,需要迭代构造和测试原型,目标是顺序优化设计。对于大多数机器人而言,当验证硬件的能力以解决所需任务时,该过程进一步复杂化,已经具有适当的控制器,该控制器又针对特定硬件设计和调整。在本文中,我们提出了一种新颖的方法HPC-BBO,可以有效地自动设计硬件配置,并通过自动调整相应的控制器来评估它们.HPC-BBO基于分层贝叶斯优化过程,可以优化形态配置(基于在控制器学习过程中先前设计的性能)并随后学习相应的控制器(利用从先前形态的优化中收集的知识)。此外,HPC-BBO可以同时选择多个形态设计的“批量”,从而并行化硬件验证并减少耗时的生产周期数。我们验证了HPC-BBO对模拟6腿机器人的形态和控制器的设计。实验结果表明,HPC-BBO优于多竞争基线,并且生产周期超过贝叶斯优化产生360美元/%的减少,从而将我们的微机器人的假设制造时间从21个月减少到4个月。
translated by 谷歌翻译
在电子制定过程中,美国的行政机构每年都会收到数百万条关于拟议的机构行动的评论。这些评论代表了支持和反对提案的各种论点。虽然要求各机构确定并回应实质性评论,但他们仍在努力跟上信息量。在这项工作中,我们解决了识别论证文本的任务,对所使用的论证索赔的类型进行分类,以及确定评论的立场。首先,我们基于对数千条规则和数百万条评论的分析,提出了论证主张的分类。其次,我们收集和半自动引导注释,以在句子级别创建具有参数声明类型注释的数百万个句子的数据集。第三,webuild一个系统,用于在层次分类模型中使用我们提出的分类法自动确定参数跨度和索赔类型。
translated by 谷歌翻译
随着深度学习的最新进展,相当多的注意力已经实现了自动语音识别性能,其接近人类在对话电话语音(CTS)识别等任务上的表现。在本文中,我们评估了这些提议技术在广播新闻(BN)上的有用性,这是一项类似的挑战性任务。我们还执行一组识别测量,以了解所实现的自动语音识别结果与人类在此任务上的表现有多接近。在两个公开可用的BNtest集合DEV04F和RT04上,我们的语音识别系统使用LSTM和基于残余网络的声学模型,结合n-gram和神经网络语言模型,单词误码率分别为6.5%和5.9%。通过在这些测试集上实现新的性能里程碑,我们的实验表明,在其他相关任务(如CTS)上开发的技术可以转移到类似的性能。相比之下,在这些测试集上测得的最佳人体识别性能要低得多,分别为3.6%和2.8%,这表明该空间仍有新技术和改进的空间,以达到人类的表现水平。
translated by 谷歌翻译
我们提出了一种新的图像分类架构,称为自注意胶囊网络(SACN)。 SACN是第一个将自注意机制作为囊网络(CapsNet)中的一个整体层的模型。虽然自我注意机制选择了更重要的图像区域,但CapsNet仅分析这些区域内的相关特征及其空间相关性。这些特征在卷积层中提取。然后,自注意层基于特征分析学习对不相关区域进行抑制,并突出显示对特定任务有用的显着特征。然后将注意力图输入到CapNet主要层,然后是分类层。 SACN提议的模型被设计为使用相对较浅的CapsNet架构来减少计算负荷,并通过使用自注意模块来显着改善结果来补偿不存在更深的网络。除了天然MNIST和SVHN之外,所提出的Self-Attention CapsNet架构在五个不同的数据集上进行了广泛的评估,主要是在三种不同的医疗集上。该模型能够比基线CapsNet更好地分类具有多样和复杂背景的图像及其补丁。因此,提议的Self-Attention CapsNet显着提高了不同数据集内和跨不同数据集的分类性能,并且不仅在分类准确性方面而且在稳健性方面优于基线CapsNet。
translated by 谷歌翻译