在终身环境中学习,动态不断发展,是对电流加强学习算法的艰难挑战。然而,这将是实际应用的必要特征。在本文中,我们提出了一种学习超策略的方法,其输入是时间,输出当时要查询的策略的参数。此超级策略验证,以通过引入受控偏置的成本来最大限度地提高估计的未来性能,有效地重用过去数据。我们将未来的性能估计与过去的绩效相结合,以减轻灾难性遗忘。为避免过度接收收集的数据,我们派生了我们嵌入惩罚期限的可差化方差。最后,我们在与最先进的算法相比,在逼真的环境中,经验验证了我们的方法,包括水资源管理和交易。
translated by 谷歌翻译
\ emph {几何深度学习}(GDL)的最新进展显示了其提供强大数据驱动模型的潜力。这提供了探索从图形数据中\ emph {部分微分方程}(PDES)控制的物理系统的新方法的动力。然而,尽管做出了努力和最近的成就,但几个研究方向仍未开发,进步仍然远非满足现实现象的身体要求。主要障碍之一是缺乏基准数据集和常见的物理评估协议。在本文中,我们提出了一个2-D Graph-Mesh数据集,以研究High Reynolds制度的机翼上的气流(从$ 10^6 $及以后)。我们还对翼型上的应力力引入指标,以评估重要的物理量的GDL模型。此外,我们提供广泛的GDL基准。
translated by 谷歌翻译
我们对数据驱动的需求工程,尤其是对用户评论的考虑。这些在线评论是提取新需求和改进请求的丰富信息来源。在这项工作中,我们使用Camembert提供了自动分析,Camembembert是法语中最先进的语言模型。我们从健康与健身领域的三个应用程序中创建了一个由6000个用户评论的多标签分类数据集。结果令人鼓舞,并建议可以自动识别有关新功能请求的评论。数据集可在以下网址获得:https://github.com/jl-wei/apia2022-french-user-reviews-classification-dataset。
translated by 谷歌翻译
数值验证是机器学习研究的核心,因为它允许评估新方法的实际影响,并确认理论和实践之间的一致性。然而,该领域的快速发展构成了一些挑战:研究人员面临着大量的方法来比较,有限的透明度和最佳实践的共识以及乏味的重新实施工作。结果,验证通常是非常部分的,这可能会导致错误的结论,从而减慢研究的进展。我们提出了Benchopt,这是一个协作框架,旨在在跨编程语言和硬件体系结构的机器学习中自动化,复制和发布优化基准。 Benchopt通过提供用于运行,共享和扩展实验的现成工具来简化社区的基准测试。为了展示其广泛的可用性,我们在三个标准学习任务上展示基准:$ \ ell_2 $ regulaine的逻辑回归,套索和RESNET18用于图像分类的培训。这些基准强调了关键的实际发现,这些发现对这些问题的最新问题更加细微,这表明在实际评估中,魔鬼在细节上。我们希望Benchopt能在社区中促进合作工作,从而改善研究结果的可重复性。
translated by 谷歌翻译
本文介绍了用于持久图计算的有效算法,给定一个输入分段线性标量字段f在D上定义的d二维简单复杂k,并带有$ d \ leq 3 $。我们的方法通过引入三个主要加速度来扩展开创性的“ Paircells”算法。首先,我们在离散摩尔斯理论的设置中表达了该算法,该算法大大减少了要考虑的输入简单数量。其次,我们介绍了问题的分层方法,我们称之为“夹心”。具体而言,minima-saddle持久性对($ d_0(f)$)和鞍 - 最大持久对($ d_ {d-1}(f)$)是通过与Union-Find-Find-Find-Find-Find-Find-Find-Find-find-find-find-find-find-find-find-find-find-find-find-find-find of nourstable组的1个有效计算的。 - addles和(D-1)addles的稳定集。尺寸为0和(D-1)的快速处理进一步减少,并且大幅度降低了$ d_1(f)$,即三明治的中间层的计算$ d_1(f)$的关键简单数量。第三,我们通过共享记忆并行性记录了几个绩效改进。我们为可重复性目的提供了算法的开源实施。我们还贡献了一个可重复的基准软件包,该基准软件包利用了公共存储库中的三维数据,并将我们的算法与各种公开可用的实现进行了比较。广泛的实验表明,我们的算法提高了两个数量级,即它扩展的开创性“ Paircells”算法的时间性能。此外,它还改善了14种竞争方法的选择,改善了记忆足迹和时间性能,比最快的可用方法具有可观的增长,同时产生了严格的输出。我们通过应用于表面,音量数据和高维点云的持续性一维发电机的快速和稳健提取的应用来说明我们的贡献实用性。
translated by 谷歌翻译
自从几十年前的频谱分析开创性工作以来,已经研究了提取音频和语音特征的方法。最近的努力以开发通用音频表示的雄心为指导。例如,如果深度神经网络在大型音频数据集上进行了培训,则可以提取最佳的嵌入。这项工作扩展了基于自我监督的学习,通过引导,提出各种编码器体系结构,并探索使用不同的预训练数据集的效果。最后,我们提出了一个新颖的培训框架,以提出一个混合音频表示,该框架结合了手工制作和数据驱动的学习音频功能。在HEAR NEURIPS 2021挑战中,对听觉场景分类和时间戳检测任务进行了评估。我们的结果表明,在大多数听到挑战任务中,带有卷积变压器的混合模型都会产生卓越的性能。
translated by 谷歌翻译
由于信息源通常不完美,因此有必要考虑其在多源信息融合任务中的可靠性。在本文中,我们提出了一个新的深层框架,使我们能够使用Dempster-Shafer理论的形式合并多MR图像分割结果,同时考虑到相对于不同类别的不同模式的可靠性。该框架由编码器折线功能提取模块组成,该模块是每个模态在每个体素上计算信念函数的证据分割模块,以及多模式的证据融合模块,该模块为每个模态证据和每个模态证据和折现率分配使用Dempster规则结合折扣证据。整个框架是通过根据折扣骰子指数最小化新的损失功能来培训的,以提高细分精度和可靠性。该方法在1251例脑肿瘤患者的Brats 2021数据库中进行了评估。定量和定性的结果表明,我们的方法表现优于最新技术,并实现了在深神经网络中合并多信息的有效新想法。
translated by 谷歌翻译
\ textit {petit larousse Illustr \'e}是一本法国词典,于1905年首次出版。其在语言和历史和地理方面的两个主要部分,对应于法国词典中的一个主要里程碑,也对应于经常知识的存储库,以及从这一时期。尽管从1905年开始的许多条目的价值仍然完好无损,但现在有些描述的维度比当代更具历史性。然而,它们对于分析和理解这段时间的文化代表性仍然很重要。与最新信息或对这些条目进行验证的比较将需要进行乏味的体力劳动。在本文中,我们描述了一种新的词汇资源,我们将历史记录和地理部分的所有字典条目与当前数据源联系起来。为此,我们将这些条目中的每一个链接到Wikidata标识符。使用Wikidata链接,我们可以更轻松地自动化识别,比较和验证历史上的表示形式。我们提供了一些有关如何处理Wikidata标识符的示例,并对词典中描述的实体进行了少量分析,以概述可能的应用程序。资源,即具有Wikidata链接的20,245个字典条目的注释,可从GitHub获得(\ url {https://github.com/pnugues/petit_larousse_1905/}))
translated by 谷歌翻译
深矩阵因子化(深MF)是最新的无监督数据挖掘技术,其灵感来自受约束的低级别近似值。他们旨在提取高维数据集中功能的复杂层次结构。文献中提出的大多数损失函数用于评估深MF模型的质量和基础优化框架不一致,因为在不同层上使用了不同的损失。在本文中,我们引入了深层MF的两个有意义的损失功能,并提出了一个通用框架来解决相应的优化问题。我们通过整合各种约束和正规化(例如稀疏性,非负和最小体积)来说明这种方法的有效性。这些模型已成功应用于合成数据和真实数据,即高光谱的不混合和提取面部特征。
translated by 谷歌翻译
人与机器人之间的双向对象移交可以在机器人以人为中心的制造或服务方面具有重要的功能技能。实现此技能的问题在于任何解决方案的能力来处理三个重要方面:(i)交接阶段的同步时间;(ii)对象的处理构成约束;(iii)理解触觉交换以无缝地实现(i)的某些步骤。我们为(i)和(ii)提出了一种新的方法,该方法包括在任务空间二次编程控制框架中明确制定移交过程作为约束,以实现隐式时间和轨迹相遇。我们的方法是在熊猫机器人手臂上实施的,从人类操作员那里拿走对象。
translated by 谷歌翻译