在本文中,我们对系统和输入矩阵的线性时变(LTV)系统的自适应状态观察问题感兴趣,这取决于未知的时变参数。假设这些参数满足一些已知的LTV动态,但初始条件未知。此外,状态等式由具有不确定恒定参数的外部系统产生的添加信号扰乱。我们的主要贡献是提出全局收敛状态观察者,该州只需要在系统上疲软的激励假设。
translated by 谷歌翻译
现代深度学习应用程序需要越来越多地计算培训最先进的模型。为了解决这一需求,大型企业和机构使用专用的高性能计算集群,其建筑和维护既昂贵又远远超出大多数组织的预算。结果,一些研究方向成为几个大型工业甚至更少的学术作用者的独家领域。为了减轻这种差异,较小的团体可以汇集他们的计算资源并运行有利于所有参与者的协作实验。这种范式称为网格或志愿者计算,在众多科学领域看到了成功的应用。然而,由于高延迟,不对称带宽以及志愿者计算独特的几个挑战,使用这种用于机器学习的方法是困难的。在这项工作中,我们仔细分析了这些约束,并提出了一种专门用于协作培训的新型算法框架。我们展示了我们在现实条件下的SWAV和Albert预先预价的方法的有效性,并在成本的一小部分中实现了与传统设置相当的性能。最后,我们提供了一份成功的协作语言模型预先追溯的详细报告,有40名参与者。
translated by 谷歌翻译
清洁和不同标记的数据的可用性是培训复杂任务(例如视觉问答(VQA))的培训模型的主要障碍。大型视觉和语言模型的广泛工作表明,自我监督的学习对预处理多模式相互作用有效。在此技术报告中,我们专注于视觉表示。我们审查和评估自我监督的方法,以利用未标记的图像并预处理模型,然后我们对其进行了自定义VQA任务,该任务允许进行控制的评估和诊断。我们将基于能量的模型(EBM)与对比度学习(CL)进行比较。尽管EBM越来越受欢迎,但他们缺乏对下游任务的评估。我们发现,EBM和CL都可以从未标记的图像中学习表示形式,这些图像能够在很少的注释数据上训练VQA模型。在类似于CLEVR的简单设置中,我们发现CL表示还可以改善系统的概括,甚至匹配来自较大,监督,预测模型的表示的性能。但是,我们发现EBM由于不稳定性和结果差异很高而难以训练。尽管EBMS被证明对OOD检测有用,但基于监督的基于能量的训练和不确定性校准的其他结果在很大程度上是负面的。总体而言,CL当前似乎比EBM的选项更为可取。
translated by 谷歌翻译
我们追求一系列研究,试图使深度神经网络的输入输出映射的雅各布频谱规范正规化。在先前的工作依赖上边界技术的同时,我们提供了针对确切光谱规范的方案。我们证明,与以前的光谱正则化技术相比,我们的算法可以提高概括性能,同时保持了防御自然和对抗性噪声的强大保护。此外,我们进一步探讨了一些以前的推理,这些推理是关于雅各布正规化提供的强大对抗保护,并表明它可能具有误导性。
translated by 谷歌翻译
开放信息提取(OpenIE)的最先进的神经方法通常以自回旋或基于谓词的方式迭代地提取三重态(或元组),以免产生重复。在这项工作中,我们提出了一种可以平等或更成功的问题的不同方法。也就是说,我们提出了一种新型的单通道方法,用于开放式启发,该方法受到计算机视觉的对象检测算法的启发。我们使用基于双方匹配的订单不足损失,迫使独特的预测和用于序列标签的仅基于变压器的纯编码体系结构。与质量指标和推理时间相比,与标准基准的最新模型相比,提出的方法更快,并且表现出卓越或类似的性能。我们的模型在CARB上的新最新性能为OIE2016评估,而推断的速度比以前的最新状态更快。我们还在两种语言的零弹奏设置中评估了模型的多语言版本,并引入了一种生成合成多语言数据的策略,以微调每个特定语言的模型。在这种情况下,我们在多语言Re-OIE2016上显示了15%的性能提高,葡萄牙语和西班牙语的F1达到75%。代码和型号可在https://github.com/sberbank-ai/detie上找到。
translated by 谷歌翻译
我们介绍了Pogema(https://github.com/airi-institute/pogema)一个沙盒,用于挑战部分可观察到的多代理探路(PO-MAPF)问题。这是一个基于网格的环境,专门设计为灵活,可调和可扩展的基准。它可以针对各种PO-MAPF量身定制,这些PO-MAPF可以作为计划和学习方法及其组合的绝佳测试基础,这将使我们能够填补AI计划和学习之间的差距。
translated by 谷歌翻译
肺癌是全球癌症死亡的主要原因,肺腺癌是最普遍的肺癌形式。 EGFR阳性肺腺癌已被证明对TKI治疗的反应率很高,这是肺癌分子测试的基本性质。尽管目前的指南考虑必要测试,但很大一部分患者并未常规化,导致数百万的人未接受最佳治疗肺癌。测序是EGFR突变分子测试的黄金标准,但是结果可能需要数周的时间才能回来,这在时间限制的情况下并不理想。能够快速,便宜地检测EGFR突变的替代筛查工具的开发,同时保存组织以进行测序可以帮助减少受比较治疗的患者的数量。我们提出了一种多模式方法,该方法将病理图像和临床变量整合在一起,以预测EGFR突变状态,迄今为止最大的临床队列中的AUC为84%。这样的计算模型可以以很少的额外成本进行大部分部署。它的临床应用可以减少中国接受亚最佳治疗的患者数量53.1%,在美国将高达96.6%的患者减少96.6%。
translated by 谷歌翻译
为了训练一个表现出色的神经网络进行语义细分,至关重要的是,拥有一个具有可用地面真相的大数据集以供网络概括为看不见的数据。在本文中,我们提出了新颖的点云增强方法,以人为地使数据集多样化。我们以传感器为中心的方法保持数据结构与LIDAR传感器功能一致。由于这些新方法,我们能够通过高价值实例丰富低价值数据,并创建全新的场景。我们使用公共Semantickitti数据集验证了在多个神经网络上的方法,并证明与各自的基线相比,所有网络都会有所改善。此外,我们表明我们的方法能够使用非常小的数据集,节省注释时间,培训时间和相关成本。
translated by 谷歌翻译
半监督学习是减少机器学习对标记数据的依赖性的关键工具。但是,它主要通过利用其固有的空间和语义结构来应用于图像和语言数据。这些方法不适用于表格数据,因为这些域结构不可用。现有的伪标记方法(PL)方法可以有效地对表格数据有效,但容易受到噪声样本的影响,并且给定预定义阈值而贪婪的分配,这是未知的。本文通过提出自信的sndhorn分配(CSA)来解决此问题,该分配仅为具有较高置信分数的样本分配标签,并通过最佳运输来学习最佳的标签分配。CSA的表现优于这个实际重要领域的当前最新面积。
translated by 谷歌翻译
最近的年度航天器发射以及计划发布的大量发布提出了有关维持所有有关方面空间的可及性的问题。维持空间飞行未来的关键是服务故障的能力 - 并积极从轨道上删除功能失调的航天器。自主执行这些任务的机器人平台是正在进行的研究的主题,因此必须在启动之前进行彻底的测试。对于代表性的系统级测试,欧洲航天局(ESA)使用了轨道机器人技术和GNC Lab(ORGL),这是一个平坦的设施,基于空气的平台在其中表现出三个度的自由浮动行为自由(DOF)。这项工作介绍了测试环境中自由浮动平台的代表性模拟以及用于控制器开发的软件框架。最后,这项工作提出了该框架内的控制器,以查找和遵循任意状态之间的最佳轨迹,该轨迹在模拟和现实中进行了评估。
translated by 谷歌翻译