智能论文笔记

InDiD: Instant Disorder Detection via Representation Learning

Evgenia Romanenkova , Alexey Zaytsev , Ramil Zainulin , Matvey Morozov

分类：机器学习

2021-06-04

对于顺序数据，更改点是突然的制度交换机的时刻。这种更改出现在不同的场景中，包括复杂的视频监控，并且我们需要尽可能快地检测它们。由于没有足够的数据表示学习程序，改变点检测（CPD）的经典方法对于半结构化的顺序数据而言。我们提出了一个原则性的损失函数，近似于经典严谨的解决方案，但有所不同，并实现了代表学习。此损耗函数余额将检测延迟和时间变平衡，以为CPD提供成功的模型。在实验中，我们考虑简单的系列和更复杂的真实图像序列和具有变化点的视频。对于更复杂的问题，我们表明我们需要针对CPD任务的特殊性量身定制的更有意义的陈述。考虑到这一点，所提出的方法临时改善了CPD的基线结果，以了解各种数据类型。对于爆炸检测，与基线相比，我们的方法的F1分数为0.54美元，价格为0.46美元和0.30美元。

translated by 谷歌翻译

Applying Transformer-based Text Summarization for Keyphrase Generation

Anna Glazkova , Dmitry Morozov

分类：自然语言处理 | 人工智能 | 机器学习

2022-09-08

键形对于搜索和系统化学术文档至关重要。大多数用于键形提取的方法是针对文本中最重要的单词的提取。但是实际上，密钥拼列表通常包含明确出现在文本中的单词。在这种情况下，键形列表表示源文本的抽象摘要。在本文中，我们使用基于流行的变压器的模型进行试验，以使用四个基准数据集进行键形式提取，以进行抽象文本摘要。我们将获得的结果与常见的无监督和监督方法的结果进行了比较。我们的评估表明，按照全匹配的F1分数和BertScore的术语，汇总模型在生成钥匙串方面非常有效。但是，它们产生的许多单词在作者的键形列表中没有，这使得摘要模型在Rouge-1方面无效。我们还研究了几种订购策略来连接靶标键形。结果表明，策略的选择会影响键形生成的性能。

translated by 谷歌翻译

Utilizing Class Separation Distance for the Evaluation of Corruption Robustness of Machine Learning Classifiers

Georg Siedel , Silvia Vock , Andrey Morozov , Stefan Voß

分类：机器学习 | 人工智能 | (统计)机器学习

2022-06-27

鲁棒性是机器学习（ML）分类器的基本支柱，实质上确定了它们的可靠性。因此，评估分类器鲁棒性的方法至关重要。在这项工作中，我们解决了评估腐败鲁棒性的挑战，该方式允许在给定数据集上可比性和解释性。我们提出了一种测试数据增强方法，该方法使用稳健性距离$ \ epsilon $从数据集中衍生的最小类分隔距离。由此产生的MSCR（平均统计损坏鲁棒性）允许对不同分类器在腐败鲁棒性方面进行特定于数据集的比较。 MSCR值是可以解释的，因为它代表了由于统计损坏而避免了准确性损失的分类器。在2D和图像数据上，我们表明度量标准反映了分类器鲁棒性的不同级别。此外，我们通过训练和测试不同级别的噪声测试分类器观察到分类器中意外的最佳精度。虽然研究人员经常在训练健壮的模型时经常报道准确性的重大权衡，但我们加强了这样一种观点，即准确性和腐败鲁棒性之间的权衡并不是固有的。我们的结果表明，通过简单数据增强，稳健性训练已经可以稍微提高准确性。

translated by 谷歌翻译

Capturing and Inferring Dense Full-Body Human-Scene Contact

Chun-Hao P. Huang , Hongwei Yi , Markus Höschle , Matvey Safroshkin , Tsvetelina Alexiadis , Senya Polikovsky , Daniel Scharstein , Michael J. Black

分类：计算机视觉

2022-06-20

推断人类场景接触（HSC）是了解人类如何与周围环境相互作用的第一步。尽管检测2D人类对象的相互作用（HOI）和重建3D人姿势和形状（HPS）已经取得了重大进展，但单个图像的3D人习惯接触的推理仍然具有挑战性。现有的HSC检测方法仅考虑几种类型的预定义接触，通常将身体和场景降低到少数原语，甚至忽略了图像证据。为了预测单个图像的人类场景接触，我们从数据和算法的角度解决了上述局限性。我们捕获了一个名为“真实场景，互动，联系和人类”的新数据集。 Rich在4K分辨率上包含多视图室外/室内视频序列，使用无标记运动捕获，3D身体扫描和高分辨率3D场景扫描捕获的地面3D人体。 Rich的一个关键特征是它还包含身体上精确的顶点级接触标签。使用Rich，我们训练一个网络，该网络可预测单个RGB图像的密集车身场景接触。我们的主要见解是，接触中的区域总是被阻塞，因此网络需要能够探索整个图像以获取证据。我们使用变压器学习这种非本地关系，并提出新的身体场景接触变压器（BSTRO）。很少有方法探索3D接触；那些只专注于脚的人，将脚接触作为后处理步骤，或从身体姿势中推断出无需看现场的接触。据我们所知，BSTRO是直接从单个图像中直接估计3D身体场景接触的方法。我们证明，BSTRO的表现明显优于先前的艺术。代码和数据集可在https://rich.is.tue.mpg.de上获得。

translated by 谷歌翻译

UniMorph 4.0: Universal Morphology

Khuyagbaatar Batsuren , Omer Goldman , Salam Khalifa , Nizar Habash , Witold Kieraś , Gábor Bella , Brian Leonard , Garrett Nicolai , Kyle Gorman , Yustinus Ghanggo Ate

分类：自然语言处理

2022-05-07

通用形态（UNIMORPH）项目是一项合作的努力，可为数百种世界语言实例化覆盖范围的标准化形态拐角。该项目包括两个主要的推力：一种无独立的特征架构，用于丰富的形态注释，并以各种语言意识到该模式的各种语言的带注释数据的类型级别资源。本文介绍了过去几年对几个方面的扩张和改进（自McCarthy等人（2020年）以来）。众多语言学家的合作努力增加了67种新语言，其中包括30种濒危语言。我们已经对提取管道进行了一些改进，以解决一些问题，例如缺少性别和马克龙信息。我们还修改了模式，使用了形态学现象所需的层次结构，例如多肢体协议和案例堆叠，同时添加了一些缺失的形态特征，以使模式更具包容性。鉴于上一个UniMorph版本，我们还通过16种语言的词素分割增强了数据库。最后，这个新版本通过通过代表来自metphynet的派生过程的实例丰富数据和注释模式来推动将衍生物形态纳入UniMorph中。

translated by 谷歌翻译

Rapid and Reliable Trajectory Planning Involving Omnidirectional Jumping of Quadruped Robots

Matthew Chignoli , Savva Morozov , Sangbae Kim

分类：机器人

2021-11-26

用多腿机器人的动态跳跃在规划和控制方面提出了一个具有挑战性的问题。制定跳转优化以允许快速在线执行难;有效地使用这种能够生成长地平轨迹的能力进一步复杂化问题。在这项工作中，我们提出了一种新的分层规划框架来解决这个问题。我们首先制定了一个实时的轨道轨迹优化，用于执行全向跳跃。然后，我们将该优化的结果嵌入到低维跳转可行性分类器中。该分类器由高级策划器利用，以产生动态可行的路径，并且对硬件轨迹实现中的可变性也很稳健。我们在迷你猎豹视觉上部署我们的框架，展示了机器人的生成和执行可靠的目标导向路径，这些路径涉及前进，横向和旋转跳跃到比机器人的标称臀部高度高1.35倍。通过全向跳跃计划的能力极大地扩展了机器人相对于限制跳跃到矢状或前平面的规划者的移动性。

translated by 谷歌翻译