传统文本分类方法通常需要良好数量的标记数据,这很难获得,尤其是限制域或较少的广泛语言。这种缺乏标记的数据导致了低资源方法的兴起,这在自然语言处理中具有低数据可用性。其中,零射击学习脱颖而出,它包括在没有任何先前标记的数据的情况下学习分类器。通过此方法报告的最佳结果使用变压器等语言模型,但下降到两个问题:高执行时间和无法处理长文本作为输入。本文提出了一种新的模型Zeroberto,它利用无监督的聚类步骤来获得分类任务之前的压缩数据表示。我们展示Zeroberto对长输入和更短的执行时间具有更好的性能,在FOLHauol数据集中的F1分数中表现出XLM-R大约12%。关键词:低资源NLP,未标记的数据,零射击学习,主题建模,变形金刚。
translated by 谷歌翻译
受试者经常与若干参与者的中等辩论经常变化,例如议会会议,选举辩论和审判。将争论分组到具有相同主题的块是必不可少的理解。通常,主持人负责在新块开始时定义,以便自动划分审核辩论的任务可以完全关注主持人的行为。在本文中,我们(i)提出了一种新的算法,Debacer,其审议审查辩论;(ii)在常规和Bertimbau管道之间进行比较研究;(iii)验证将其申请到葡萄牙共和国大会的分钟。我们的结果显示了Debacer的有效性。关键词:自然语言处理,政治文件,口语文本处理,语音分裂,对话分区。
translated by 谷歌翻译
在过去的几年中,深度学习用于脑电图(EEG)分类任务一直在迅速增长,但其应用程序受到EEG数据集相对较小的限制。数据扩展包括在培训过程中人为地增加数据集的大小,它一直是在计算机视觉或语音等应用程序中获得最新性能的关键要素。尽管文献中已经提出了一些脑电图数据的增强转换,但它们对跨任务的绩效的积极影响仍然难以捉摸。在这项工作中,我们提出了对主要现有脑电图增强的统一和详尽的分析,该分析在常见的实验环境中进行了比较。我们的结果强调了为睡眠阶段分类和大脑计算机界面界面的最佳数据增强,在某些情况下显示预测功率改善大于10%。
translated by 谷歌翻译
安全仍然是自动驾驶的主要问题,为了在全球部署,他们需要提前充分预测行人的动作。尽管对粗粒(人体中心预测)和细粒度预测(人体关键点的预测)进行了大量研究,但我们专注于3D边界框,这是对人类的合理估计,而无需对自动驾驶汽车进行复杂的运动细节进行建模。这具有灵活性,可以在现实世界中更长的视野中进行预测。我们建议这个新问题,并为行人的3D边界框预测提供了一个简单而有效的模型。该方法遵循基于复发性神经网络的编码器编码器体系结构,我们的实验在合成(JTA)和现实世界(Nuscenes)数据集中显示出其有效性。博学的表示形式具有有用的信息来增强其他任务的绩效,例如行动预期。我们的代码可在线提供:https://github.com/vita-epfl/bounding-box-prediction
translated by 谷歌翻译
强化学习是机器人抓握的一种有前途的方法,因为它可以在困难的情况下学习有效的掌握和掌握政策。但是,由于问题的高维度,用精致的机器人手来实现类似人类的操纵能力是具有挑战性的。尽管可以采用奖励成型或专家示范等补救措施来克服这个问题,但它们通常导致过分简化和有偏见的政策。我们介绍了Dext-Gen,这是一种在稀疏奖励环境中灵巧抓握的强化学习框架,适用于各种抓手,并学习无偏见和复杂的政策。通过平滑方向表示实现了抓地力和物体的完全方向控制。我们的方法具有合理的培训时间,并提供了包括所需先验知识的选项。模拟实验证明了框架对不同方案的有效性和适应性。
translated by 谷歌翻译
数值验证是机器学习研究的核心,因为它允许评估新方法的实际影响,并确认理论和实践之间的一致性。然而,该领域的快速发展构成了一些挑战:研究人员面临着大量的方法来比较,有限的透明度和最佳实践的共识以及乏味的重新实施工作。结果,验证通常是非常部分的,这可能会导致错误的结论,从而减慢研究的进展。我们提出了Benchopt,这是一个协作框架,旨在在跨编程语言和硬件体系结构的机器学习中自动化,复制和发布优化基准。 Benchopt通过提供用于运行,共享和扩展实验的现成工具来简化社区的基准测试。为了展示其广泛的可用性,我们在三个标准学习任务上展示基准:$ \ ell_2 $ regulaine的逻辑回归,套索和RESNET18用于图像分类的培训。这些基准强调了关键的实际发现,这些发现对这些问题的最新问题更加细微,这表明在实际评估中,魔鬼在细节上。我们希望Benchopt能在社区中促进合作工作,从而改善研究结果的可重复性。
translated by 谷歌翻译
超级机器人四肢(SRL)是可穿戴的机器人,通过充当同事,到达物体,支撑人的武器等来增强人类能力。但是,现有的SRL缺乏可控制互动力所需的机械背景和带宽作为绘画,操纵脆弱的物体等。具有高带宽的高度背景,而最小化重量则带来了由常规电磁执行器的有限表现施加的重大技术挑战。本文研究了使用磁性(MR)离合器耦合到低摩擦式静液传动的可行性,以提供高功能强大但可轻巧,可控制的SRL。设计和建造了2.7千克二线可穿戴机器人手臂。肩膀和肘关节的设计可提供39和25 nm,运动范围为115和180 {\ deg}。在一氧化基督测试台上进行的实验研究并在分析上进行了验证,即使在与外部阻抗相互作用时,也表明了高力带宽(> 25 Hz),并且能够控制相互作用的能力。此外,研究并通过实验研究了三种力对照方法:开环,闭环力和压力上的闭环。所有三种方法均显示为有效。总体而言,拟议的MR-Hydrstoratic致动系统非常适合与人类和环境相互作用的轻量级SRL,从而增加了无法预测的干扰。
translated by 谷歌翻译
在非参数回归设置中,我们构建了一个估计器,该估计器是一个连续的函数,以高概率插值数据点,同时在H \ h \'较大级别的平均平方风险下达到最小的最佳速率,以适应未知的平滑度。
translated by 谷歌翻译
$ \ mathbf {perive} $:使用人工智能(AI)到:(1)从相对较大的人群中利用视神经头(ONH)的生物力学知识; (2)评估ONH的单个光学相干断层扫描(OCT)扫描的稳健性; (3)确定哪些关键的三维(3D)结构特征使给定的ONH稳健。 $ \ Mathbf {Design} $:回顾性横断面研究。 $ \ mathbf {Methods} $:316个受试者通过Ophthalmo-Dynamometry在急性眼内和之后与OCT成像。然后将IOP诱导的椎板胶状变形映射为3D,并用于对ONH进行分类。 LC变形高于4%的人被认为是脆弱的,而变形较低的人则较低4%。从这些数据中学习,我们比较了三种AI算法,以严格地从基线(未呈现的)OCT卷中预测鲁棒性:(1)随机森林分类器; (2)自动编码器; (3)动态图CNN(DGCNN)。后一种算法还使我们能够确定哪些关键的3D结构特征使给定的智能稳定。 $ \ mathbf {结果} $:所有3种方法都能够单独预测3D结构信息的稳健性,而无需执行生物力学测试。 DGCNN(接收器操作曲线下的区域[AUC]:0.76 $ \ pm $ 0.08)的表现优于自动编码器(AUC:0.70 $ \ pm $ 0.07)和随机森林分类器(AUC:0.69 $ \ pm $ 0.05)。有趣的是,为了评估稳健性,DGCNN主要使用了巩膜和LC插入部位的信息。 $ \ mathbf {结论} $:我们提出了一种AI驱动的方法,可以仅从ONH的单个OCT扫描中评估给定ONH的稳健性,而无需进行生物力学测试。纵向研究应确定ONH鲁棒性是否可以帮助我们确定快速的视野损失进展者。
translated by 谷歌翻译
本文与离散观察到的非线性扩散过程的在线过滤有关。我们的方法基于完全适应的辅助粒子滤波器,该滤芯涉及DOOB的$ h $转换通常是棘手的。我们提出了一个计算框架,通过使用非线性FEYNMAN-KAC公式和神经网络求解基础的落后Kolmogorov方程来近似这些$ H $转换。该方法允许在数据鉴别过程之前训练本地最佳的粒子过滤器。数值实验表明,在高度信息观察结果的制度中,当观测值在模型下极端,如果状态维度很大时,所提出的方法可以比引导粒子滤波器更有效的数量级。
translated by 谷歌翻译