智能论文笔记

KazNERD: Kazakh Named Entity Recognition Dataset

Rustem Yeshpanov , Yerbolat Khassanov , Huseyin Atakan Varol

分类：自然语言处理

2021-11-26

我们展示了哈萨克克坦命名实体识别的数据集的开发。该数据集是在哈萨克公开可用的注释Corpora的情况下建立的，以及包含简单但严谨的规则和示例的注释指南。基于IOB2计划的数据集注释是在第一个作者的监督下由两个本土哈萨克演讲者进行电视新闻文本。生成的数据集包含112,702个句子和25个实体类的136,333注释。最先进的机器学习模型自动化哈萨克人命名实体识别，具有最佳性能模型，在测试集上实现了97.22％的精确匹配。用于培训模型的注释数据集，指南和代码可从HTTPS://github.com/kaznerd自由下载4.0许可。

translated by 谷歌翻译

End-to-End Deep Fault Tolerant Control

Daulet Baimukashev , Bexultan Rakhim , Matteo Rubagotti , Huseyin Atakan Varol

分类：机器人

2021-05-28

在机电一体化的IEEE / ASME交易上发布，DOI：10.1109 / TMECH.2021.3100150。理想情况下，需要精确的传感器测量来实现机电系统的闭环控制中的良好性能。因此，传感器故障将阻止系统正常工作，除非采用容错控制（FTC）架构。作为非线性系统的基于模型的FTC算法通常是具有挑战性的设计，本文基于深度学习的传感器故障存在于FTC的新方法。所考虑的方法用单个反复性神经网络替换故障检测和隔离和控制器设计的阶段，其在给定的时间窗口中具有过去的传感器测量值作为输入，以及控制变量的当前值作为输出。该端到端的深FTC方法应用于由球形倒立摆的机电调整系统，其构造通过反应轮改变，又通过电动机致动。模拟和实验结果表明，该方法可以处理连杆位置/速度传感器中发生的突然故障。提供的补充材料包括现实世界实验和软件源代码的视频。

translated by 谷歌翻译

Deep Convolutional Neural Networks for Onychomycosis Detection

Abdurrahim Yilmaz , Fatih Goktay , Rahmetullah Varol , Gulsum Gencoglan , Huseyin Uvet

分类：计算机视觉

2021-06-30

皮肤病学中浅表性感染的诊断仍然基于手动直接显微镜检查与氢氧化钾（KOH）溶液。然而，这种方法可能是耗时的，其诊断准确度率因临床医生的经验而广泛变化。随着临床显微镜领域的神经网络应用的增加，现在可以自动化此类手动过程，提高效率和准确性。本研究提出了一种深度神经网络结构，可以为这些问题提供快速解决方案，并且可以在没有染料的灰度图像中进行自动真菌检测。收集160个含有真菌元素的微观场照片，收集从甲癣患者获得的含有甲状腺菌的患者和含有从正常钉子获得的溶解角蛋白的微观田间照片。从这些图像中提取含有4234个真菌和4981个角蛋白的较小贴剂。为了检测真菌和角蛋白，开发了VGG16和Incepionv3模型。 VGG16型号的精度为95.98％，曲线（AUC）值下的面积为0.9930，而Inceptionv3模型的精度为95.90％，AUC值为0.9917。但是，临床医生的平均准确性和AUC值分别为72.8％和0.87。这种深度学习模型允许开发可以检测微观图像内的真菌的自动化系统。

translated by 谷歌翻译

Planting and Mitigating Memorized Content in Predictive-Text Language Models

C. M. Downey , Wei Dai , Huseyin A. Inan , Kim Laine , Saurabh Naik , Tomasz Religa

分类：自然语言处理

2022-12-16

Language models are widely deployed to provide automatic text completion services in user products. However, recent research has revealed that language models (especially large ones) bear considerable risk of memorizing private training data, which is then vulnerable to leakage and extraction by adversaries. In this study, we test the efficacy of a range of privacy-preserving techniques to mitigate unintended memorization of sensitive user text, while varying other factors such as model size and adversarial conditions. We test both "heuristic" mitigations (those without formal privacy guarantees) and Differentially Private training, which provides provable levels of privacy at the cost of some model performance. Our experiments show that (with the exception of L2 regularization), heuristic mitigations are largely ineffective in preventing memorization in our test suite, possibly because they make too strong of assumptions about the characteristics that define "sensitive" or "private" text. In contrast, Differential Privacy reliably prevents memorization in our experiments, despite its computational and model-performance costs.

translated by 谷歌翻译

De-risking Carbon Capture and Sequestration with Explainable CO2 Leakage Detection in Time-lapse Seismic Monitoring Images

Huseyin Tuna Erdinc , Abhinav Prakash Gahlot , Ziyi Yin , Mathias Louboutin , Felix J. Herrmann

分类：人工智能 | 计算机视觉

2022-12-16

With the growing global deployment of carbon capture and sequestration technology to combat climate change, monitoring and detection of potential CO2 leakage through existing or storage induced faults are critical to the safe and long-term viability of the technology. Recent work on time-lapse seismic monitoring of CO2 storage has shown promising results in its ability to monitor the growth of the CO2 plume from surface recorded seismic data. However, due to the low sensitivity of seismic imaging to CO2 concentration, additional developments are required to efficiently interpret the seismic images for leakage. In this work, we introduce a binary classification of time-lapse seismic images to delineate CO2 plumes (leakage) using state-of-the-art deep learning models. Additionally, we localize the leakage region of CO2 plumes by leveraging Class Activation Mapping methods.

translated by 谷歌翻译

TEACH: Temporal Action Composition for 3D Humans

Nikos Athanasiou , Mathis Petrovich , Michael J. Black , Gül Varol

分类：计算机视觉

2022-09-09

给定一系列自然语言描述，我们的任务是生成与文本相对应的3D人类动作，并遵循指令的时间顺序。特别是，我们的目标是实现一系列动作的综合，我们将其称为时间动作组成。文本条件运动合成中的艺术现状仅采用单个动作或单个句子作为输入。这部分是由于缺乏包含动作序列的合适训练数据，但这也是由于其非自动进取模型公式的计算复杂性，该计算的规模不能很好地扩展到长序列。在这项工作中，我们解决了这两个问题。首先，我们利用了最近的Babel运动文本集合，该收藏品具有广泛的标记作用，其中许多作用以它们之间的过渡为顺序。接下来，我们设计了一种基于变压器的方法，该方法在动作中进行非自动打击，但在动作序列中进行自动加工。与多个基线相比，这种层次配方在我们的实验中被证明有效。我们的方法被称为“为人类动作的时间动作组成”教授，为各种各样的动作和语言描述中的时间构成产生了现实的人类动作。为了鼓励从事这项新任务的工作，我们将代码用于研究目的，以$ \ href {toch.is.tue.mpg.de} {\ textrm {我们的网站}} $。

translated by 谷歌翻译

Transfer Learning of an Ensemble of DNNs for SSVEP BCI Spellers without User-Specific Training

Osman Berke Guney , Huseyin Ozkan

分类：机器学习

2022-09-03

目的：用脑电图（脑电图）测量的稳态视觉诱发电势（SSVEP），在脑部计算机界面（BCI）拼写中产生不错的信息传输速率（ITR）。但是，文献中当前高性能的SSVEP BCI拼写器需要针对每个新用户进行系统适应的最初冗长而累人的用户特定培训，包括使用脑电图实验，算法培训和校准的数据收集（所有这些都是在实际使用之前系统）。这阻碍了BCI的广泛使用。为了确保实用性，我们提出了一种基于深神经网络（DNN）合奏的高度新颖的目标识别方法，该方法不需要任何特定于用户的培训。方法：我们从先前进行的脑电图实验的参与者中利用已经存在的文献数据集来训练全球目标标识符DNN，然后对每个参与者进行微调。我们将这种微调DNN的合奏转移到新的用户实例中，根据参与者与新用户的统计相似性确定k最具代表性的DNN，并通过集合预测的加权组合来预测目标角色。结果：在两个大规模基准和β数据集上，我们的方法可实现令人印象深刻的155.51位/分钟和114.64位/分钟ITR。代码可用于可重复性：https：//github.com/osmanberke/ensemble-fnns结论：拟议的方法在[0.2-1.0]中的所有刺激持续时间上的所有最新替代方案都显着优于[0.2-1.0]秒。两个数据集。意义：我们的合奏-DNN方法有可能在日常生活中促进BCI拼写者的实际广泛部署，因为我们提供了最高的性能，同时无需任何特定于用户的培训即可立即使用。

translated by 谷歌翻译

Predicting Exotic Hadron Masses with Data Augmentation Using Multilayer Perceptron

Huseyin Bahtiyar

分类：机器学习

2022-08-19

最近，神经网络发生了重大发展。因此，神经网络经常在物理文献中使用。这项工作估计了使用神经网络从介子和巴里昂群众产生的异国情调的哈德子的质量。随后，使用最近提出的人工数据增强技术增加了数据数量。我们已经观察到，使用增强数据，神经网络的预测能力提高了。这项研究表明，数据增强技术在改善神经网络预测中起着至关重要的作用。此外，神经网络可以对异国情调的哈德子做出合理的预测，双重迷人和双重底层的重子。结果也与高斯过程和组成夸克模型相媲美。

translated by 谷歌翻译

Automatic dense annotation of large-vocabulary sign language videos

Liliane Momeni , Hannah Bull , K R Prajwal , Samuel Albanie , Gül Varol , Andrew Zisserman

分类：计算机视觉

2022-08-04

最近，手语研究人员已转向手语解释的电视广播，包括（i）连续签名的视频和（ii）与音频内容相对应的字幕，作为易于使用和大规模的培训数据来源。此类数据可用性的一个关键挑战是缺乏标志注释。利用这种弱对准数据的先前工作仅发现字幕中的关键字与单个符号之间的稀疏对应关系。在这项工作中，我们提出了一个简单，可扩展的框架，以极大地增加自动注释的密度。我们的贡献如下：（1）我们通过使用同义词和字幕签名对齐来显着改善先前的注释方法；（2）我们将标志识别模型中的伪标签的价值作为标志发现的方式；（3）我们提出了一种新的方法，以增加基于内域示例的已知和未知类别的注释；（4）在Bobsl BSL手语语料库上，我们将自信自动注释的数量从670K增加到5M。我们将这些注释公开用于支持手语研究社区。

translated by 谷歌翻译

GOCA: Guided Online Cluster Assignment for Self-Supervised Video Representation Learning

Huseyin Coskun , Alireza Zareian , Joshua L. Moore , Federico Tombari , Chen Wang

分类：计算机视觉

2022-07-20

聚类是无监督学习中无处不在的工具。大多数现有的自我监督表示方法通常基于视觉上的特征聚类样本。尽管这对于基于图像的自我审视非常有效，但它通常会失败，因为视频需要理解运动而不是专注于背景。将光流作为与RGB的互补信息可以减轻此问题。但是，我们观察到，两种观点的幼稚组合并不能带来有意义的收益。在本文中，我们提出了一种结合两种观点的原则方法。具体而言，我们提出了一种新颖的聚类策略，在该策略中，我们将每个视图的初始群集分配作为指导其他视图的最终群集分配。这个想法将对这两种视图强制执行类似的群集结构，并且形成的簇在语义上是抽象的，并且对来自每个单独视图的嘈杂输入。此外，我们提出了一种新颖的正则化策略来解决特征崩溃问题，这在基于聚类的自学学习方法中很常见。我们的广泛评估表明，我们学到的表示对下游任务的有效性，例如视频检索和动作识别。具体来说，我们在UCF上胜过7％，在HMDB上胜过4％，用于视频检索，而在UCF上的最高状态为5％，而HMDB则在HMDB上进行视频分类6％

translated by 谷歌翻译