我们专注于解耦扩展卡尔曼滤波器(DEKF),用于分解模型中的在线参数学习,包括分解机器,矩阵和张量分解,并通过模拟说明该方法的有效性。通过DEKF学习模型参数使得因子化模型更加广泛有用,允许通过整个指数族进行更灵活的观察,建模参数漂移,并产生可以实现探索/利用和其他应用的参数不确定性估计。我们使用比标准DEKF更一般的参数动态,允许参数漂移,同时鼓励合理的值。我们还提出了常规扩展Kalmanfilter和DEKF的替代推导,它将这些方法与自然梯度方法联系起来,并且提出了迭代扩展卡尔曼滤波器的类似解耦版本。
translated by 谷歌翻译
随机实验是评估变化对现实世界系统影响的黄金标准。这些测试中的数据可能难以收集,结果可能具有高度差异,从而导致潜在的大量测量误差。贝叶斯优化是一种有效优化多个连续参数的有前途的技术,但是当噪声水平高时,现有方法降低了性能,限制了其对多个随机实验的适用性。我们得到了一个表达式,用于预期的改进,具有噪声观察和噪声约束的批量优化,并开发了一种准蒙特卡罗近似,可以有效地进行优化。使用合成函数进行的仿真表明,噪声约束问题的优化性能优于现有方法。我们通过在Facebook上进行的两个真实的实验来进一步证明该方法的有效性:优化排名系统和优化服务器编译器标志。
translated by 谷歌翻译
已经提出随机块模型作为用于检测网络中的社区结构以及用于生成用作基准标记的合成网络的工具。然而,大多数块模型忽略了顶点度的变化,使得它们不适合应用于真实世界的网络,这通常显示可能显着扭曲结果的广度分布。在这里我们演示了块模型的泛化如何结合这个减少元素导致改进复杂网络中社区检测的目标函数。我们还提出了一种启发式社区检测算法,使用该目标函数或其非度数校正对应物,并表明度校正版本明显优于真实世界和合成网络中的校正版本。
translated by 谷歌翻译
我们考虑用于表示车辆动力学的神经网络的在线适应问题。神经网络模型旨在由MPC控制法使用以自主地控制车辆。这个问题具有挑战性,因为输入和目标分布都是非平稳的,而在线适应的天真方法会导致灾难性的遗忘,从而导致控制器故障。我们提出了一种新颖的在线学习方法,它将伪排练方法与局部加权投影回归相结合。我们证明了在模拟中使用局部加权投影回归伪排练(LW-PR $ ^ 2 $)方法的有效性以及使用1/5比例自动驾驶车辆收集的大型真实世界数据集。
translated by 谷歌翻译
最近的深度学习方法在语音增强和分离任务方面取得了令人瞩目的成绩然而,这些方法尚未被研究用于分离不同类型的任意声音的混合物,我们称之为通用声音分离的任务,并且未知语音任务的性能是否延续到非语音任务。为了研究这个问题,我们开发了包含任意形式的混合物的通用数据集,并用它来研究基于掩模的分离结构的空间,改变整体网络结构和信号转换的框架分析 - 合成基础。这些网络体系结构包括卷积长期短期记忆网络和时间膨胀卷积栈,其灵感来自最近成功的时间性能增强网络,如ConvTasNet。对于后一种体系结构,我们还提出了新的修改,以进一步提高分离性能。在框架分析 - 合成的基础上,我们使用在TEVasNet中使用的ashort-time傅立叶变换(STFT)或可学习的基础进行探索,并且对于这两个基础,我们检查窗口大小的影响。特别是对于STFT ,我们发现较长的窗口(25-50毫秒)最好的forspeech /非语音分离,而较短的窗口(2.5毫秒)工作最好的任意声音。对于可学习的基础,较短的窗口(2.5毫秒)最适合所有任务。令人惊讶的是,对于通用声音分离,STFT的性能优于基础。我们最好的方法可以改善语音/非语音分离的音阶 - 不变信号与失真比超过13 dB,并且通用声音分离接近10 dB。
translated by 谷歌翻译
由于暗示的参考文献所依赖的稀疏证据 - 通常基于没有或很少共享的单词,因此对暗示文本重用的检测尤其具有挑战性。可以说,词汇语义可以诉诸于,因为词语之间的语义关系有可能增加暗示的支持并减轻词汇稀疏性。另一个障碍是缺乏评估基准语料库,主要是由于注释过程的高度解释性。在本文中,我们将阐明自动典故检测的可行性。我们从信息检索的角度处理这个问题,其中引用textact作为查询和引用的文本作为要检索的相关文档,通过关于查询分割的新颖的注释器协议研究来估计基准语料库编译的难度。此外,我们研究了从分布模型和本体得到的词汇语义信息的整合在多大程度上可以帮助检索传统重用的案例。结果表明,(i)尽管协议得分低,但使用手动查询显着提高了关于awindowing方法的检索性能,并且(ii)检索性能可以用分布语义适度地加以改进。
translated by 谷歌翻译
事实证明,图形神经网络(GNN)在许多分类任务中都是成功的,在准确性方面优于以前最先进的方法。然而,单凭准确性对于高风险决策来说还不够。决策者想知道特定GNN预测是否正确的可能性。为此,获得校准模型是必要的。在这项工作中,我们分析了多个数据集上最先进的GNN的校准。我们的实验表明,GNN可以在某些数据集中进行校准,但在其他数据库中也会严重错误校准,并且最先进的校准方法很有帮助,但不能解决问题。
translated by 谷歌翻译
有大量复杂的动态系统对我们的日常生活和社会至关重要但却难以理解,即使今天有可能感知和收集大量的实验数据,它们也是如此复杂和不断发展,以至于它们的动力不太可能将被详细了解。然而,通过计算工具,我们可以尝试最好地利用当前技术和可用数据。我们认为,最有用的模型将在有限的知识或多个假设的背景下考虑系统复杂性和可用数据之间的不平衡。生物细胞的复杂系统是在系统生物学中研究的这种系统的一个主要例子,并且激发了本文提出的方法。它们是作为DARPA快速威胁评估(RTA)计划的一部分而开发的,该计划涉及对影响人体细胞的毒素或药物的作用机制(MoA)的理解。结合使用高斯过程和抽象网络建模,我们提出了三种基本的不同的基于机器学习的方法来学习因果关系,并从高维时间序列数据中合成因果网络。虽然其他类型的数据可用并且已经在我们的RTA工作中进行了分析和整合,但我们关注的是本文中从高通量微阵列实验获得的转录组学(即基因表达)数据,以说明我们的算法的能力和局限性。我们的算法使得不同但总体上相对较少的生物学假设,因此它们适用于其他类型的生物数据,甚至可能适用于其他复杂系统,这些系统具有高维度但不具有生物学性质。
translated by 谷歌翻译
机器人设计通常是一个缓慢而困难的过程,需要迭代构造和测试原型,目标是顺序优化设计。对于大多数机器人而言,当验证硬件的能力以解决所需任务时,该过程进一步复杂化,已经具有适当的控制器,该控制器又针对特定硬件设计和调整。在本文中,我们提出了一种新颖的方法HPC-BBO,可以有效地自动设计硬件配置,并通过自动调整相应的控制器来评估它们.HPC-BBO基于分层贝叶斯优化过程,可以优化形态配置(基于在控制器学习过程中先前设计的性能)并随后学习相应的控制器(利用从先前形态的优化中收集的知识)。此外,HPC-BBO可以同时选择多个形态设计的“批量”,从而并行化硬件验证并减少耗时的生产周期数。我们验证了HPC-BBO对模拟6腿机器人的形态和控制器的设计。实验结果表明,HPC-BBO优于多竞争基线,并且生产周期超过贝叶斯优化产生360美元/%的减少,从而将我们的微机器人的假设制造时间从21个月减少到4个月。
translated by 谷歌翻译
在电子制定过程中,美国的行政机构每年都会收到数百万条关于拟议的机构行动的评论。这些评论代表了支持和反对提案的各种论点。虽然要求各机构确定并回应实质性评论,但他们仍在努力跟上信息量。在这项工作中,我们解决了识别论证文本的任务,对所使用的论证索赔的类型进行分类,以及确定评论的立场。首先,我们基于对数千条规则和数百万条评论的分析,提出了论证主张的分类。其次,我们收集和半自动引导注释,以在句子级别创建具有参数声明类型注释的数百万个句子的数据集。第三,webuild一个系统,用于在层次分类模型中使用我们提出的分类法自动确定参数跨度和索赔类型。
translated by 谷歌翻译