智能论文笔记

Deep Neural Imputation: A Framework for Recovering Incomplete Brain Recordings

Sabera Talukder , Jennifer J. Sun , Matthew Leonard , Bingni W. Brunton , Yisong Yue

分类：机器学习 | 神经与进化计算 | (统计)机器学习

2022-06-16

神经科学家和神经工具长期以来一直依赖多电极神经记录来研究大脑。但是，在典型的实验中，许多因素损坏了来自单个电极的神经记录，包括电噪声，运动伪像和制造错误。当前，普遍的做法是丢弃这些损坏的录音，减少已经有限的数据，难以收集。为了应对这一挑战，我们提出了深层神经插补（DNI），这是一个从跨空间位置，天和参与者中收集的数据中学习的框架，以从电极中恢复缺失值。我们通过线性最近的邻居方法和两个深层生成自动编码器探索我们的框架，证明了DNI的灵活性。一位深度自动编码器单独建模参与者，而另一个则扩展了该体系结构以共同建模。我们评估了12名用多电极内电图阵列植入的人类参与者的模型；参与者没有明确的任务，并且在数百个记录小时内自然行为。我们表明，DNI不仅恢复了时间序列，还可以恢复频率内容，并通过在科学相关的下游神经解码任务上恢复出色的性能来进一步确立DNI的实际价值。

translated by 谷歌翻译

PulseImpute: A Novel Benchmark Task for Pulsative Physiological Signal Imputation

Maxwell A. Xu , Alexander Moreno , Supriya Nagesh , V. Burak Aydemir , David W. Wetter , Santosh Kumar , James M. Rehg

分类：机器学习 | 人工智能

2022-12-14

The promise of Mobile Health (mHealth) is the ability to use wearable sensors to monitor participant physiology at high frequencies during daily life to enable temporally-precise health interventions. However, a major challenge is frequent missing data. Despite a rich imputation literature, existing techniques are ineffective for the pulsative signals which comprise many mHealth applications, and a lack of available datasets has stymied progress. We address this gap with PulseImpute, the first large-scale pulsative signal imputation challenge which includes realistic mHealth missingness models, an extensive set of baselines, and clinically-relevant downstream tasks. Our baseline models include a novel transformer-based architecture designed to exploit the structure of pulsative signals. We hope that PulseImpute will enable the ML community to tackle this significant and challenging task.

translated by 谷歌翻译

Robust Inverse Framework using Knowledge-guided Self-Supervised Learning: An application to Hydrology

Rahul Ghosh , Arvind Renganathan , Kshitij Tayal , Xiang Li , Ankush Khandelwal , Xiaowei Jia , Chris Duffy , John Neiber , Vipin Kumar

分类：机器学习

2021-09-14

机器学习开始在一系列环境应用中提供最先进的性能，例如水文流域中的流量预测。但是，由于主要的水文工艺的可变性，在实践中建立准确的大规模模型在实践中仍然具有挑战性，这是通过一组与过程相关的盆地特征捕获的。现有的盆地特征遭受了噪音和不确定性的影响，以及许多其他事情，这会对模型性能产生不利影响。为了应对上述挑战，在本文中，我们提出了一种新颖的知识引导的自学学习（KGSSL）逆框架，以从驱动程序和响应数据中提取系统特征。即使特征被损坏，这个首先的框架即使在特征被损坏的情况下也达到了强大的性能。我们表明，KGSSL为骆驼的流量建模（大型研究的流域属性和气象学）实现了最新的结果，这是一个广泛使用的水文基准数据集。具体而言，KGSSL在重建特性中最多优于其他方法16 \％。此外，我们表明KGSSL比基线方法相对强大，并且在插入KGSSL推断的特征时，基线模型的表现优于35 \％。

translated by 谷歌翻译

A Deep Learning Approach for the Segmentation of Electroencephalography Data in Eye Tracking Applications

Lukas Wolf , Ard Kastrati , Martyna Beata Płomecka , Jie-Ming Li , Dustin Klebe , Alexander Veicht , Roger Wattenhofer , Nicolas Langer

分类：机器学习 | 人工智能

2022-06-17

眼目光信息的收集为人类认知，健康和行为的许多关键方面提供了一个窗口。此外，许多神经科学研究补充了从眼睛跟踪中获得的行为信息，以及脑电图（EEG）提供的高时间分辨率和神经生理学标记。必不可少的眼睛跟踪软件处理步骤之一是将连续数据流的分割为与扫视，固定和眨眼等眼睛跟踪应用程序相关的事件。在这里，我们介绍了Detrtime，这是一个新颖的时间序列分割框架，该框架创建了不需要额外记录的眼睛跟踪模式并仅依靠脑电图数据的眼部事件检测器。我们的端到端基于深度学习的框架将计算机视觉的最新进展带到了脑电图数据的《时代》系列分割的最前沿。 Detr Time在各种眼睛追踪实验范式上实现眼部事件检测中的最新性能。除此之外，我们还提供了证据表明我们的模型在脑电图阶段分割的任务中很好地概括了。

translated by 谷歌翻译

HyperTime: Implicit Neural Representation for Time Series

Elizabeth Fons , Alejandro Sztrajman , Yousef El-laham , Alexandros Iosifidis , Svitlana Vyetrenko

分类：机器学习

2022-08-11

隐式神经表示（INRS）最近已成为一种强大的工具，可提供准确和分辨率的数据编码。它们作为一般近似器的稳健性已在各种数据源中显示，并在图像，声音和3D场景表示方面进行了应用。但是，很少有人注意利用这些体系结构来代表和分析时间序列数据。在本文中，我们使用INRS分析了时间序列的表示，从重建精度和训练收敛速度进行比较不同的激活函数。我们展示了如何利用这些网络的时间序列的插补，并在单变量和多变量数据上进行了应用。最后，我们提出了一个超网络架构，该体系结构利用INR来学习整个时间序列数据集的压缩潜在表示。我们引入了基于FFT的损失来指导培训，以便在时间序列中保留所有频率。我们证明该网络可用于将时间序列编码为INR，并且可以将它们的嵌入方式内插以从现有时间序列中生成新的时间序列。我们通过将其用于数据增强来评估我们的生成方法，并表明它与当前的最新方法相对于时间序列的最新方法具有竞争力。

translated by 谷歌翻译

Don't Pay Attention to the Noise: Learning Self-supervised Representations of Light Curves with a Denoising Time Series Transformer

Mario Morvan , Nikolaos Nikolaou , Kai Hou Yip , Ingo Waldmann

分类： (统计)机器学习

2022-07-06

天体物理光曲线尤其具有挑战性的数据对象，因为噪音的强度和种类污染了它们。然而，尽管可用的光曲线有天文数量，但用于处理它们的大多数算法仍在按样本基础上运行。为了解决这个问题，我们提出了一个简单的变压器模型 - 称为Denoising时间序列变压器（DTST） - 并表明它在接受掩盖目标的训练时，在时间序列数据集中删除噪声和离群值，即使没有干净的目标也是如此可用。此外，自我发作的使用将丰富和说明性的查询带入学习的表示形式。我们介绍了从过境外行空间卫星（TESS）的真实恒星光曲线进行的实验，与传统的Denoising技术相比，我们的方法的优势。

translated by 谷歌翻译

Drop, Swap, and Generate: A Self-Supervised Approach for Generating Neural Activity

Ran Liu , Mehdi Azabou , Max Dabagia , Chi-Heng Lin , Mohammad Gheshlaghi Azar , Keith B. Hengen , Michal Valko , Eva L. Dyer

分类：机器学习

2021-11-03

神经活动的意义和简化表示可以产生深入了解如何以及什么信息被神经回路内处理。然而，如果没有标签，也揭示了大脑和行为之间的联系的发现表示可以挑战。在这里，我们介绍了所谓的交换，VAE学习神经活动的解开表示一种新型的无监督的办法。我们的方法结合了特定实例的排列损失，试图最大限度地输入（大脑状态）的转变观点之间的代表性相似性的生成模型框架。这些转化（或增强）视图是通过掉出神经元和抖动样品中的时间，这直观地应导致网络维护既时间一致性和不变性用于表示神经状态的特定的神经元的表示创建的。通过对从数百个不同的灵长类动物大脑的神经元的模拟数据和神经录音的评价，我们表明，它是不可能建立的表示沿有关潜在维度解开神经的数据集与行为相联系。

translated by 谷歌翻译

Multi-Variate Time Series Forecasting on Variable Subsets

Jatin Chauhan , Aravindan Raghuveer , Rishi Saket , Jay Nandy , Balaraman Ravindran

分类：机器学习

2022-06-25

我们在多变量时间序列预测（MTSF）的域中制定了一个新的推理任务，称为变量子集预报（VSF），其中仅在推理过程中可用一小部分变量子集。由于长期数据丢失（例如，传感器故障）或列车 /测试之间的高 - >低资源域移动，因此在推理过程中没有变量。据我们所知，在文献中尚未研究MTSF模型在存在此类故障的情况下的稳健性。通过广泛的评估，我们首先表明，在VSF设置中，最新方法的性能显着降低。我们提出了一种非参数包装技术，该技术可以应用于任何现有的预测模型。通过在4个数据集和5个预测模型的系统实验中，我们表明我们的技术能够恢复模型的接近95 \％性能，即使仅存在15 \％的原始变量。

translated by 谷歌翻译

Deep Learning for Time Series Anomaly Detection: A Survey

Zahra Zamanzadeh Darban , Geoffrey I. Webb , Shirui Pan , Charu C. Aggarwal , Mahsa Salehi

分类：机器学习 | 人工智能

2022-11-09

Time series anomaly detection has applications in a wide range of research fields and applications, including manufacturing and healthcare. The presence of anomalies can indicate novel or unexpected events, such as production faults, system defects, or heart fluttering, and is therefore of particular interest. The large size and complex patterns of time series have led researchers to develop specialised deep learning models for detecting anomalous patterns. This survey focuses on providing structured and comprehensive state-of-the-art time series anomaly detection models through the use of deep learning. It providing a taxonomy based on the factors that divide anomaly detection models into different categories. Aside from describing the basic anomaly detection technique for each category, the advantages and limitations are also discussed. Furthermore, this study includes examples of deep anomaly detection in time series across various application domains in recent years. It finally summarises open issues in research and challenges faced while adopting deep anomaly detection models.

translated by 谷歌翻译

Seeing the forest and the tree: Building representations of both individual and collective dynamics with transformers

Ran Liu , Mehdi Azabou , Max Dabagia , Jingyun Xiao , Eva L. Dyer

分类：机器学习

2022-06-10

通常通过从单个组件的动力学上抽象来构建人口级动力学的模型来研究复杂的时变系统。但是，当构建人群级别的描述时，很容易忽略每个人，以及每个人如何贡献更大的情况。在本文中，我们提出了一种新颖的变压器体系结构，用于从时变数据中学习，该数据构建了个人和集体人口动态的描述。我们没有在一开始就将所有数据结合到我们的模型中，而是开发可分离的体系结构，该体系结构先在单个时间序列上运行，然后再将它们传递给它们。这会导致置换式属性属性，可用于跨不同大小和顺序的系统传输。在证明我们的模型可以应用于在多体系统中成功恢复复杂的相互作用和动力学之后，我们将方法应用于神经系统中的神经元种群。在神经活动数据集上，我们表明我们的多尺度变压器不仅会产生强大的解码性能，而且在转移方面提供了令人印象深刻的性能。我们的结果表明，可以从一种动物的大脑中的神经元学习并传递不同动物大脑中神经元的模型，并在集合和动物之间具有可解释的神经元对应。这一发现为解码并表示大量神经元的新途径开辟了一条新的途径。

translated by 谷歌翻译

STING: Self-attention based Time-series Imputation Networks using GAN

Eunkyu Oh , Taehun Kim , Yunhu Ji , Sushil Khyalia

分类：机器学习 | 人工智能

2022-09-22

时间序列数据在现实世界应用中无处不在。但是，最常见的问题之一是，时间序列数据可能会通过数据收集过程的固有性质丢失值。因此，必须从多元（相关）时间序列数据中推出缺失值，这对于改善预测性能的同时做出准确的数据驱动决策至关重要。插补的常规工作简单地删除缺失值或基于平均/零填充它们。尽管基于深层神经网络的最新作品显示出了显着的结果，但它们仍然有一个限制来捕获多元时间序列的复杂生成过程。在本文中，我们提出了一种用于多变量时间序列数据的新型插补方法，称为sting（使用GAN基于自我注意的时间序列插补网络）。我们利用生成的对抗网络和双向复发性神经网络来学习时间序列的潜在表示。此外，我们引入了一种新型的注意机制，以捕获整个序列的加权相关性，并避免无关序列带来的潜在偏见。三个现实世界数据集的实验结果表明，刺痛在插补精度以及具有估算值的下游任务方面优于现有的最新方法。

translated by 谷歌翻译

EEG2Vec: Learning Affective EEG Representations via Variational Autoencoders

David Bethge , Philipp Hallgarten , Tobias Grosse-Puppendahl , Mohamed Kari , Lewis L. Chuang , Ozan Özdenizci , Albrecht Schmidt

分类：机器学习 | 人工智能

2022-07-16

人们对人类情感状态的稀疏代表性格式的需求日益增长，这些格式可以在有限的计算记忆资源的情况下使用。我们探讨了在潜在矢量空间中代表神经数据对情绪刺激的响应是否可以用于预测情绪状态，并生成参与者和/或情绪特定于情绪的合成EEG数据。我们提出了一个有条件的基于变异自动编码器的框架EEG2VEC，以从脑电图数据中学习生成歧视性表示。关于情感脑电图记录数据集的实验结果表明，我们的模型适用于无监督的脑电图建模，基于潜在表示的三个不同情绪类别（正，中性，负）的分类，可实现68.49％的稳健性能，并产生的合成eeg序列共同存在于真实的脑电图数据输入到特别重建低频信号组件。我们的工作推进了情感脑电图表示可以在例如生成人工（标签）训练数据或减轻手动功能提取的领域，并为记忆约束的边缘计算应用程序提供效率。

translated by 谷歌翻译

Latent Space Unsupervised Semantic Segmentation

Knut J. Strømmen , Jim Tørresen , Ulysse Côté-Allard

分类：机器学习 | 人工智能

2022-07-22

紧凑和节能的可穿戴传感器的发展导致生物信号的可用性增加。为了分析这些连续记录的，通常是多维的时间序列，能够进行有意义的无监督数据分割是一个吉祥的目标。实现这一目标的一种常见方法是将时间序列中的变更点确定为分割基础。但是，传统的更改点检测算法通常带有缺点，从而限制了其现实世界的适用性。值得注意的是，他们通常依靠完整的时间序列可用，因此不能用于实时应用程序。另一个常见的限制是，它们处理多维时间序列的分割（或无法）。因此，这项工作的主要贡献是提出一种新型的无监督分段算法，用于多维时间序列，名为潜在空间无监督的语义细分（LS-USS），该算法旨在轻松地与在线和批处理数据一起使用。在将LS-USS与其他最先进的更改点检测算法进行比较时，在各种现实世界数据集上，在离线和实时设置中，LS-USS在PAR或更好的性能上都可以系统地实现。

translated by 谷歌翻译

A Probabilistic Autoencoder for Type Ia Supernovae Spectral Time Series

George Stein , Uros Seljak , Vanessa Bohm , G. Aldering , P. Antilogus , C. Aragon , S. Bailey , C. Baltay , S. Bongard , K. Boone

分类：机器学习

2022-07-15

我们从一组稀疏的光谱时间序列中构建了一个物理参数化的概率自动编码器（PAE），以学习IA型超新星（SNE IA）的内在多样性。 PAE是一个两阶段的生成模型，由自动编码器（AE）组成，该模型在使用归一化流（NF）训练后概率地解释。我们证明，PAE学习了一个低维的潜在空间，该空间可捕获人口内存在的非线性特征范围，并且可以直接从数据直接从数据中准确地对整个波长和观察时间进行精确模拟SNE IA的光谱演化。通过引入相关性惩罚项和多阶段训练设置以及我们的物理参数化网络，我们表明可以在训练期间分离内在和外在的可变性模式，从而消除了需要进行额外标准化的其他模型。然后，我们在SNE IA的许多下游任务中使用PAE进行越来越精确的宇宙学分析，包括自动检测SN Outliers，与数据分布一致的样本的产生以及在存在噪音和不完整数据的情况下解决逆问题限制宇宙距离测量。我们发现，与以前的研究相一致的最佳固有模型参数数量似乎是三个，并表明我们可以用$ 0.091 \ pm 0.010 $ mag标准化SNE IA的测试样本，该样本对应于$ 0.074 \ pm。 0.010 $ mag如果删除了特殊的速度贡献。训练有素的模型和代码在\ href {https://github.com/georgestein/supaernova} {github.com/georgestein/supaernova}上发布

translated by 谷歌翻译

Decoding speech from non-invasive brain recordings

Alexandre Défossez , Charlotte Caucheteux , Jérémy Rapin , Ori Kabeli , Jean-Rémi King

分类：人工智能 | 机器学习

2022-08-25

从大脑活动中解码语言是医疗保健和神经科学中期待已久的目标。由于颅内设备，最近已经达到了主要里程碑：对基本语言任务的侵入性大脑反应训练的主题特定管道现在开始有效地解释可解释的功能（例如字母，单词，频谱图）。但是，将这种方法扩展到自然语音和非侵入性脑记录仍然是一个主要挑战。在这里，我们提出了一个端到端的架构，该体系结构在大量个体中进行了对比学习，以预测自然语音的自我监督的表现。我们在四个公共数据集上评估了我们的模型，其中包括169名用磁性或电脑图（M/EEG）记录的志愿者，同时他们听了自然的语音。结果表明，我们的模型可以从3s MEG信号中识别出相应的语音段，其中1,594个不同的段中最高72.5％的前10个精度（和44％的TOP-1准确性），最多可在19.1％中获得19.1％。脑电图记录的2,604个细分市场 - 因此允许训练集中不存在短语。模型比较和消融分析表明，这些性能直接从我们的原始设计选择中受益，即（i）对比目标，（ii）语音的预估计表示和（iii）在几个参与者中同时培训的常见卷积架构。这些结果共同描述了一个有希望的途径，可以从无创的大脑活动记录中实时解码自然语言处理。

translated by 谷歌翻译

Multistage Large Segment Imputation Framework Based on Deep Learning and Statistic Metrics

JinSheng Yang , YuanHai Shao , ChunNa Li , Wensi Wang

分类：机器学习

2022-09-22

缺少价值是传感器中非常普遍且不可避免的问题，研究人员已经进行了许多尝试丢失价值的尝试，尤其是在深度学习模型中。但是，对于实际传感器数据，很少考虑特定的数据分布和数据周期，因此很难为不同传感器选择适当的评估索引和模型。为了解决这个问题，本研究提出了一个基于深度学习的多阶段插补框架，并适应缺失价值插补。该模型提出了数据分布的低阶和高阶统计数据的混合测量指数，以及对数据插补性能指标的新观点，该指标比传统的平均平方误差更适应性和有效。多阶段的归档策略和动态数据长度被引入数据周期的插补过程中。对不同类型的传感器数据的实验结果表明，多阶段的归合策略和混合指数是优越的，并且缺失价值插补的效果在一定程度上得到了改善，尤其是对于大段插补问题。代码和实验结果已上传到GitHub。

translated by 谷歌翻译

Toward Open-World Electroencephalogram Decoding Via Deep Learning: A Comprehensive Survey

Xun Chen , Chang Li , Aiping Liu , Martin J. McKeown , Ruobing Qian , Z. Jane Wang

分类：机器学习

2021-12-08

脑电图（EEG）解码旨在识别基于非侵入性测量的脑活动的神经处理的感知，语义和认知含量。当应用于在静态，受控的实验室环境中获取的数据时，传统的EEG解码方法取得了适度的成功。然而，开放世界的环境是一个更现实的环境，在影响EEG录音的情况下，可以意外地出现，显着削弱了现有方法的鲁棒性。近年来，由于其在特征提取的卓越容量，深入学习（DL）被出现为潜在的解决方案。它克服了使用浅架构提取的“手工制作”功能或功能的限制，但通常需要大量的昂贵，专业标记的数据 - 并不总是可获得的。结合具有域特定知识的DL可能允许开发即使具有小样本数据，也可以开发用于解码大脑活动的鲁棒方法。虽然已经提出了各种DL方法来解决EEG解码中的一些挑战，但目前缺乏系统的教程概述，特别是对于开放世界应用程序。因此，本文为开放世界EEG解码提供了对DL方法的全面调查，并确定了有前途的研究方向，以激发现实世界应用中的脑电图解码的未来研究。

translated by 谷歌翻译

Synthesizing Speech from Intracranial Depth Electrodes using an Encoder-Decoder Framework

Jonas Kohler , Maarten C. Ottenhoff , Sophocles Goulis , Miguel Angrick , Albert J. Colon , Louis Wagner , Simon Tousseyn , Pieter L. Kubben , Christian Herff

分类：机器学习

2021-11-02

语音神经调节物有可能为患有扰动或休闲症的人提供沟通。最近的进展已经证明了从放置在皮质表面上的电加电网的高质量文本解码和语音合成。在这里，我们研究了较少的侵入性测量模态，即立体定向脑电图（SEEG），其提供来自多个脑区的稀疏抽样，包括皮质区域。为了评估Seeg是否也可用于综合神经录音的高质量音频，我们采用了一种基于现代深度学习方法的经常性编码器 - 解码器框架。我们证明，尽管有限的训练数据，但是可以从这些微创录音来重建高质量的言论。最后，我们利用变分特征丢失来成功识别最具信息丰富的电极触点。

translated by 谷歌翻译

Towards Generating Real-World Time Series Data

Hengzhi Pei , Kan Ren , Yuqing Yang , Chang Liu , Tao Qin , Dongsheng Li

分类：机器学习 | 人工智能

2021-11-16

时间序列数据生成近年来越来越受到关注。已经提出了几种生成的对抗网络（GaN）的方法通常是假设目标时间序列数据良好格式化并完成的假设来解决问题。然而，现实世界时间序列（RTS）数据远离该乌托邦，例如，具有可变长度的长序列和信息缺失数据，用于设计强大的发电算法的棘手挑战。在本文中，我们向RTS数据提出了一种新的生成框架 - RTSGAN来解决上述挑战。 RTSGAN首先学习编码器 - 解码器模块，该模块提供时间序列实例和固定维度潜在载体之间的映射，然后学习生成模块以在同一潜在空间中生成vectors。通过组合发电机和解码器，RTSGAN能够生成尊重原始特征分布和时间动态的RTS。为了生成具有缺失值的时间序列，我们进一步用观察嵌入层和决定和生成解码器装备了RTSGAN，以更好地利用信息缺失模式。四个RTS数据集上的实验表明，该框架在用于下游分类和预测任务的合成数据实用程序方面优于前一代方法。

translated by 谷歌翻译

Supervising the Decoder of Variational Autoencoders to Improve Scientific Utility

Liyun Tu , Austin Talbot , Neil Gallagher , David Carlson

分类： (统计)机器学习 | 机器学习

2021-09-09

概率生成模型对科学建模具有吸引力，因为它们的推论参数可用于生成假设和设计实验。这要求学习的模型提供了对输入数据的准确表示，并产生一个潜在空间，该空间有效地预测了与科学问题相关的结果。监督的变异自动编码器（SVAE）以前已用于此目的，在此目的中，精心设计的解码器可以用作可解释的生成模型，而监督目标可确保预测性潜在表示。不幸的是，监督的目标迫使编码器学习与生成后验分布有偏见的近似，这在科学模型中使用时使生成参数不可靠。由于通常用于评估模型性能的重建损失，因此该问题仍未被发现。我们通过开发一个二阶监督框架（SOS-VAE）来解决这个以前未报告的问题，该框架影响解码器诱导预测潜在的代表。这样可以确保关联的编码器保持可靠的生成解释。我们扩展了此技术，以使用户能够在生成参数中折叠以提高预测性能，并充当SVAE和我们的新SOS-VAE之间的中间选择。我们还使用这种方法来解决在组合来自多个科学实验的录音时经常出现的缺失数据问题。我们使用合成数据和电生理记录来证明这些发展的有效性，重点是如何使用我们学到的表示形式来设计科学实验。

translated by 谷歌翻译