智能论文笔记

Assessing learned features of Deep Learning applied to EEG

Dung Truong , Scott Makeig , Arnaud Delorme

分类：机器学习

2021-11-08

卷积神经网络（CNNS）在许多计算机视觉相关任务中取得了令人印象深刻的性能，例如对象检测，图像识别，图像检索等这些成就受益于CNNS的出色能力，以学习具有深层神经结构深层的鉴别特征和迭代培训过程。这激发了EEG研究界，通过CNN进行EEG分类任务。但是，CNNS学习的功能不是立即解释的，导致对CNNS的内部工作机制缺乏了解。为了提高CNN解释性，应用CNN可视化方法以将内部特征转换为视觉上可察觉的模式，以进行CNN层的定性分析。在计算机视觉文献中提出了许多CNN可视化方法，以解释CNN网络结构，操作和语义概念，但对EEG数据分析的应用已经有限。在这项工作中，我们使用3种不同的方法来从原始EEG数据上培训的CNN中提取EEG相关功能：每个分类类别的最佳样本，激活最大化和反向卷积。我们将这些方法应用于高性能的深度学习模型，具有最先进的性能的eEG性别分类任务，并表明该模型具有θ频带的差异。我们表明CNN模型的可视化可以揭示有趣的EEG结果。使用这些工具，使用深度学习的EEG研究人员可以更好地识别学习的EEG功能，可能识别新的相关生物标志物。

translated by 谷歌翻译

EEG-based Cross-Subject Driver Drowsiness Recognition with an Interpretable Convolutional Neural Network

Jian Cui , Zirui Lan , Olga Sourina , Wolfgang Müller-Wittig

分类：机器学习 | 神经与进化计算

2021-05-30

在脑电图（EEG）的驾驶员的背景下，设计无校准系统仍然具有挑战性，因为EEG信号在不同的主题和录音会话之间显着变化。已经努力使用EEG信号的深度学习方法来利用精神状态识别。然而，现有工作主要将深入学习模型视为黑匣子分类器，而模型已经学习的是什么以及它们在脑电图数据中受到噪声的影响仍然是曝光的。在本文中，我们开发了一种新颖的卷积神经网络，可以通过突出显示包含分类重要信息的输入样本的本地区域来解释其决定。该网络具有紧凑的结构，利用可分离卷曲来处理空间序列中的EEG信号。结果表明，该模型在11个受试者上实现了78.35％的平均准确性，用于休假交叉对象嗜睡识别，其高于传统的基线方法为53.4％-72.68％和最先进的深层学习方法63.90％-65.78％。可视化结果表明，该模型已经学会了识别EEG信号的生物学可解释的特征，例如，α主轴，作为不同受试者的嗜睡的强指标。此外，我们还探讨了一些错误分类的样本背后的原因，具有可视化技术，并讨论了提高识别准确性的潜在方法。我们的作品说明了使用可解释的深度学习模型的有希望的方向，以从复杂的EEG信号发现与不同心理状态相关的有意义的模式。

translated by 谷歌翻译

FBDNN: Filter Banks and Deep Neural Networks for Portable and Fast Brain-Computer Interfaces

Pedro R. A. S. Bassi , Romis Attux

分类：人工智能 | 机器学习

2021-09-05

目的：提出使用深神经网络（DNN）的新型SSVEP分类方法，提高单通道和用户独立的脑电电脑接口（BCIS）的性能，具有小的数据长度。方法：我们建议与DNN结合使用过滤器组（创建EEG信号的子带分量）。在这种情况下，我们创建了三种不同的模型：经常性的神经网络（FBRNN）分析时域，2D卷积神经网络（FBCNN-2D）处理复谱特征和3D卷积神经网络（FBCNN-3D）分析复杂谱图，我们在本研究中介绍了SSVEP分类的可能输入。我们通过开放数据集培训了我们的神经网络，并构思了它们，以便不需要从最终用户校准：因此，测试主题数据与训练和验证分开。结果：带滤波器银行的DNN超越了类似网络的准确性，在没有相当大的边距（高达4.6％）的情况下，它们甚至更高的边距（高达7.1％）超越了常见的SSVEP分类方法（SVM和FBCCA）。在使用过滤器银行中的三个DNN中，FBRNN获得了最佳结果，然后是FBCNN-3D，最后由FBCNN-2D获得。结论和意义：滤波器银行允许不同类型的深神经网络，以更有效地分析SSVEP的谐波分量。复谱图比复杂频谱特征和幅度谱进行更多信息，允许FBCNN-3D超越另一个CNN。在具有挑战性的分类问题中获得的平均测试精度（87.3％）和F1分数（0.877）表示施工，经济，快速和低延迟BCIS建设的强大潜力。

translated by 谷歌翻译

MIN2Net: End-to-End Multi-Task Learning for Subject-Independent Motor Imagery EEG Classification

Phairot Autthasan , Rattanaphon Chaisaen , Thapanun Sudhawiyangkul , Phurin Rangpong , Suktipol Kiatthaveephong , Nat Dilokthanakul , Gun Bhakdisongkhram , Huy Phan , Cuntai Guan , Theerawit Wilaiprasitporn

分类：人工智能 | 计算机视觉 | 机器学习

2021-02-07

基于电动机图像（MI）的脑电脑界面（BCIS）允许通过解码神经生理现象来控制几种应用，这些现象通常通过使用非侵入性技术被脑电图（EEG）记录。尽管在基于MI的BCI的进展方面很大，但脑电图有特定于受试者和各种变化随时间。这些问题指出了提高分类绩效的重大挑战，特别是在独立的方式。为了克服这些挑战，我们提出了Min2Net，这是一个新的端到端多任务学习来解决这项任务。我们将深度度量学习集成到多任务AutoEncoder中，以从脑电图中学习紧凑且识别的潜在表示，并同时执行分类。这种方法降低了预处理的复杂性，导致EEG分类的显着性能改善。实验结果以本语独立的方式表明，MIN2Net优于最先进的技术，在SMR-BCI和OpenBMI数据集中分别实现了6.72％的F1分数提高，以及2.23％。我们证明MIN2NET在潜在代表中提高了歧视信息。本研究表明使用此模型的可能性和实用性为新用户开发基于MI的BCI应用，而无需校准。

translated by 谷歌翻译

Decision SincNet: Neurocognitive models of decision making that predict cognitive processes from neural signals

Qinhua Jenny Sun , Khuong Vo , Kitty Lui , Michael Nunez , Joachim Vandekerckhove , Ramesh Srinivasan

分类：机器学习

2022-08-04

在心理实验期间，使用选择反应时间数据观察人类决策行为。该数据的漂移扩散模型由维纳（Wiener）的第一邮箱时间（WFPT）分布组成，并通过认知参数描述：漂移速率，边界分离和起点。这些估计的参数是神经科学家的感兴趣，因为它们可以映射到决策过程的特征（例如速度，谨慎和偏见），并且与大脑活动有关。观察到的RT模式还反映了从神经动力学介导的试验到试验的认知过程的可变性。我们调整了基于SINCNET的浅神经网络体系结构，以使用每项实验试验中的EEG信号符合漂移扩散模型。该模型由SINCNET层，深度空间卷积层和两个单独的FC层组成，可预测每个试验的漂移速率和边界。 SINCNET层参数化了内核，以直接学习应用于脑电图数据以预测漂移和边界参数的带通滤波器的低和高截止频率。在训练过程中，通过最大程度地降低给定试验RT的WFPT分布的负模可能性函数来更新模型参数。我们为执行两项强制选择任务的每个参与者开发了单独的决策SINCNET模型。我们的结果表明，与训练和测试数据集中的中位数估计相比，漂移和边界的单试估计在预测RT方面的性能更好，这表明我们的模型可以成功地使用EEG特征来估计有意义的单试扩散模型参数。此外，浅层SINCNET体系结构确定了与证据积累和谨慎相关的信息处理的时间窗口以及反映每个参与者中这些过程的EEG频段。

translated by 谷歌翻译

Modeling cognitive load as a self-supervised brain rate with electroencephalography and deep learning

Luca Longo

分类：人工智能 | 机器学习

2022-09-21

衡量心理工作量的主要原因是量化执行任务以预测人类绩效的认知成本。不幸的是，一种评估具有一般适用性的心理工作量的方法。这项研究提出了一种新型的自我监督方法，用于从脑电图数据中使用深度学习和持续的大脑率，即认知激活的指标，而无需人类声明性知识，从而从脑电图数据进行了精神负荷建模。该方法是可培训的卷积复发性神经网络，该神经网络可通过空间保留脑电图数据的光谱地形图训练，以适合大脑速率变量。发现证明了卷积层从脑电图数据中学习有意义的高级表示的能力，因为受试者内模型的测试平均绝对百分比误差平均为11％。尽管确实提高了其准确性，但增加了用于处理高级表示序列的长期期内存储层并不重要。发现指出，认知激活的高级高水平表示存在准稳定的块，因为它们可以通过卷积诱导，并且似乎随着时间的流逝而彼此依赖，从而直观地与大脑反应的非平稳性质相匹配。跨主体模型，从越来越多的参与者的数据诱导，因此包含更多的可变性，获得了与受试者内模型相似的精度。这突出了人们在人们之间诱发的高级表示的潜在普遍性，这表明存在非依赖于受试者的认知激活模式。这项研究通过为学者提供一种用于心理工作负载建模的新型计算方法来促进知识的体系，该方法旨在通常适用，不依赖于支持可复制性和可复制性的临时人工制作的模型。

translated by 谷歌翻译

A Hybrid Brain-Computer Interface Using Motor Imagery and SSVEP Based on Convolutional Neural Network

Wenwei Luo , Wanguang Yin , Quanying Liu , Youzhi Qu

分类：机器学习

2022-12-10

The key to electroencephalography (EEG)-based brain-computer interface (BCI) lies in neural decoding, and its accuracy can be improved by using hybrid BCI paradigms, that is, fusing multiple paradigms. However, hybrid BCIs usually require separate processing processes for EEG signals in each paradigm, which greatly reduces the efficiency of EEG feature extraction and the generalizability of the model. Here, we propose a two-stream convolutional neural network (TSCNN) based hybrid brain-computer interface. It combines steady-state visual evoked potential (SSVEP) and motor imagery (MI) paradigms. TSCNN automatically learns to extract EEG features in the two paradigms in the training process, and improves the decoding accuracy by 25.4% compared with the MI mode, and 2.6% compared with SSVEP mode in the test data. Moreover, the versatility of TSCNN is verified as it provides considerable performance in both single-mode (70.2% for MI, 93.0% for SSVEP) and hybrid-mode scenarios (95.6% for MI-SSVEP hybrid). Our work will facilitate the real-world applications of EEG-based BCI systems.

translated by 谷歌翻译

EEG2Mel: Reconstructing Sound from Brain Responses to Music

Adolfo G. Ramirez-Aristizabal , Chris Kello

分类：计算机视觉

2022-07-28

从大脑对听觉和视觉刺激的响应中的信息检索通过在记录脑电图信号时呈现给参与者的歌曲名称和图像类别的分类显示了成功。以重建听觉刺激的形式进行信息检索也显示出一些成功，但是在这里我们通过对音乐刺激的重建足够好，可以独立地看到和识别来改进以前的方法。此外，为每个相应的脑电图记录的一秒钟窗口，对深度学习模型进行了对时间对齐的音乐刺激谱的培训，与先前的研究相比，这大大降低了所需的提取步骤。参与者的NMED-TEMPO和NMED-HINDI数据集被动地收听全长歌曲，用于训练和验证卷积神经网络（CNN）回归器。测试了原始电压与功率谱输入以及线性与MEL频谱图的功效，并将所有输入和输出转换为2D图像。通过训练分类器评估了重建光谱图的质量，该分类器的MEL光谱图的精度为81％，线性光谱图（10％的机会精度）的精度为72％。最后，在两种抗性的匹配到样本任务中，听众以85％的成功率（50％机会）歧视听觉音乐刺激的重建。

translated by 谷歌翻译

Visualizing and Understanding Convolutional Networks

Matthew D Zeiler , Rob Fergus

分类：

2013-11-12

Large Convolutional Network models have recently demonstrated impressive classification performance on the ImageNet benchmark (Krizhevsky et al., 2012). However there is no clear understanding of why they perform so well, or how they might be improved. In this paper we address both issues. We introduce a novel visualization technique that gives insight into the function of intermediate feature layers and the operation of the classifier. Used in a diagnostic role, these visualizations allow us to find model architectures that outperform Krizhevsky et al. on the ImageNet classification benchmark. We also perform an ablation study to discover the performance contribution from different model layers. We show our ImageNet model generalizes well to other datasets: when the softmax classifier is retrained, it convincingly beats the current state-of-the-art results on Caltech-101 and Caltech-256 datasets.

translated by 谷歌翻译

A multi-level interpretable sleep stage scoring system by infusing experts' knowledge into a deep network architecture

Hamid Niknazar , Sara C. Mednick

分类：机器学习

2022-07-11

近年来，深度学习显示了广泛区域的潜力和效率，包括计算机视觉，图像和信号处理。然而，由于缺乏算法决策和结果的解释性，用户应用程序仍然存在转化挑战。这个黑匣子问题对于高风险应用程序（例如与医疗相关的决策制定）尤其有问题。当前的研究目标是设计一个可解释的深度学习系统，用于对脑电图的时间序列分类（EEG）进行睡眠阶段评分，以此作为设计透明系统的一步。我们已经开发了一个可解释的深神经网络，该网络包括基于内核的层，该层是基于人类专家在视觉分析记录的视觉分析中用于睡眠评分的一组原理。将基于内核的卷积层定义并用作系统的第一层，并可用于用户解释。训练有素的系统及其结果从脑电图信号的微观结构（例如训练的内核）以及每个内核对检测到的阶段的效果，宏观结构（例如阶段之间的过渡）中解释了四个级别。拟议的系统表现出比先前的研究更大的性能，而解释的结果表明，该系统学习了与专家知识一致的信息。

translated by 谷歌翻译

Convolutional Neural Networks with A Topographic Representation Module for EEG-Based Brain-Computer Interfaces

Xinbin Liang , Yaru Liu , Yang Yu , Kaixuan Liu , Yadong Liu , Zongtan Zhou

分类：机器学习

2022-08-23

目的：卷积神经网络（CNN）在脑部计算机界面（BCI）领域表现出巨大的潜力，因为它们能够直接处理无人工特征提取而直接处理原始脑电图（EEG）。原始脑电图通常表示为二维（2-D）矩阵，由通道和时间点组成，忽略了脑电图的空间拓扑信息。我们的目标是使带有原始脑电图信号的CNN作为输入具有学习EEG空间拓扑特征的能力，并改善其分类性能，同时实质上保持其原始结构。方法：我们提出了一个EEG地形表示模块（TRM）。该模块由（1）从原始脑电图信号到3-D地形图的映射块和（2）从地形图到与输入相同大小的输出的卷积块组成。我们将TRM嵌入了3个广泛使用的CNN中，并在2种不同类型的公开数据集中测试了它们。结果：结果表明，使用TRM后，两个数据集都在两个数据集上提高了3个CNN的分类精度。在模拟驾驶数据集（EBDSDD）和2.83 \％，2.17 \％和2.17 \％\％和2.17 \％和2.00 \％的紧急制动器上，具有TRM的DeepConvnet，Eegnet和ShandowConvnet的平均分类精度提高了4.70 \％，1.29 \％和0.91 \％高γ数据集（HGD）。意义：通过使用TRM来挖掘脑电图的空间拓扑特征，我们在2个数据集上提高了3个CNN的分类性能。另外，由于TRM的输出的大小与输入相同，因此任何具有RAW EEG信号的CNN作为输入可以使用此模块而无需更改原始结构。

translated by 谷歌翻译

From Interpretable Filters to Predictions of Convolutional Neural Networks with Explainable Artificial Intelligence

Shagufta Henna , Juan Miguel Lopez Alcaraz

分类：机器学习

2022-07-26

卷积神经网络（CNN）以其出色的功能提取能力而闻名，可以从数据中学习模型，但被用作黑匣子。对卷积滤液和相关特征的解释可以帮助建立对CNN的理解，以区分各种类别。在这项工作中，我们关注的是CNN模型的解释性，称为CNNexplain，该模型用于COVID-19和非CoVID-19分类，重点是卷积过滤器的特征解释性，以及这些功能如何有助于分类。具体而言，我们使用了各种可解释的人工智能（XAI）方法，例如可视化，SmoothGrad，Grad-Cam和Lime来提供卷积滤液的解释及相关特征及其在分类中的作用。我们已经分析了使用干咳嗽光谱图的这些方法的解释。从石灰，光滑果实和GRAD-CAM获得的解释结果突出了不同频谱图的重要特征及其与分类的相关性。

translated by 谷歌翻译

LGGNet: Learning from Local-Global-Graph Representations for Brain-Computer Interface

Yi Ding , Neethu Robinson , Chengxuan Tong , Qiuhao Zeng , Cuntai Guan

分类：神经与进化计算 | 机器学习

2021-05-05

Neuropsychological studies suggest that co-operative activities among different brain functional areas drive high-level cognitive processes. To learn the brain activities within and among different functional areas of the brain, we propose LGGNet, a novel neurologically inspired graph neural network, to learn local-global-graph representations of electroencephalography (EEG) for Brain-Computer Interface (BCI). The input layer of LGGNet comprises a series of temporal convolutions with multi-scale 1D convolutional kernels and kernel-level attentive fusion. It captures temporal dynamics of EEG which then serves as input to the proposed local and global graph-filtering layers. Using a defined neurophysiologically meaningful set of local and global graphs, LGGNet models the complex relations within and among functional areas of the brain. Under the robust nested cross-validation settings, the proposed method is evaluated on three publicly available datasets for four types of cognitive classification tasks, namely, the attention, fatigue, emotion, and preference classification tasks. LGGNet is compared with state-of-the-art methods, such as DeepConvNet, EEGNet, R2G-STNN, TSception, RGNN, AMCNN-DGCN, HRNN and GraphNet. The results show that LGGNet outperforms these methods, and the improvements are statistically significant (p<0.05) in most cases. The results show that bringing neuroscience prior knowledge into neural network design yields an improvement of classification performance. The source code can be found at https://github.com/yi-ding-cs/LGG

translated by 谷歌翻译

Novel EEG based Schizophrenia Detection with IoMT Framework for Smart Healthcare

Geetanjali Sharma , Amit M. Joshi

分类：机器学习

2021-11-19

在神经科学领域，脑活动分析总是被认为是一个重要领域。精神分裂症（SZ）是一种严重影响世界各地人民的思想，行为和情感的大脑障碍。在Sz检测中被证明是一种有效的生物标志物的脑电图（EEG）。由于其非线性结构，EEG是非线性时间序列信号，并利用其进行调查，这是对其的影响。本文旨在利用深层学习方法提高基于EEG基于SZ检测的性能。已经提出了一种新的混合深度学习模型（精神分裂症混合神经网络），已经提出了卷积神经网络（CNN）和长短期存储器（LSTM）的组合。 CNN网络用于本地特征提取，LSTM已用于分类。所提出的模型仅与CNN，仅限LSTM和基于机器学习的模型进行了比较。已经在两个不同的数据集上进行了评估所有模型，其中数据集1由19个科目和数据集2组成，由16个科目组成。使用不同频带上的各种参数设置并在头皮上使用不同的电极组来进行几个实验。基于所有实验，显然提出的混合模型（SZHNN）与其他现有型号相比，拟议的混合模型（SZHNN）提供了99.9％的最高分类精度。该建议的模型克服了不同频带的影响，甚至没有5个电极显示出91％的更好的精度。该拟议的模型也在智能医疗保健和远程监控应用程序的医疗器互联网上进行评估。

translated by 谷歌翻译

From "Where" to "What": Towards Human-Understandable Explanations through Concept Relevance Propagation

Reduan Achtibat , Maximilian Dreyer , Ilona Eisenbraun , Sebastian Bosse , Thomas Wiegand , Wojciech Samek , Sebastian Lapuschkin

分类：机器学习 | 人工智能

2022-06-07

可解释的人工智能（XAI）的新兴领域旨在为当今强大但不透明的深度学习模型带来透明度。尽管本地XAI方法以归因图的形式解释了个体预测，从而确定了重要特征的发生位置（但没有提供有关其代表的信息），但全局解释技术可视化模型通常学会的编码的概念。因此，两种方法仅提供部分见解，并留下将模型推理解释的负担。只有少数当代技术旨在将本地和全球XAI背后的原则结合起来，以获取更多信息的解释。但是，这些方法通常仅限于特定的模型体系结构，或对培训制度或数据和标签可用性施加其他要求，这实际上使事后应用程序成为任意预训练的模型。在这项工作中，我们介绍了概念相关性传播方法（CRP）方法，该方法结合了XAI的本地和全球观点，因此允许回答“何处”和“ where”和“什么”问题，而没有其他约束。我们进一步介绍了相关性最大化的原则，以根据模型对模型的有用性找到代表性的示例。因此，我们提高了对激活最大化及其局限性的共同实践的依赖。我们证明了我们方法在各种环境中的能力，展示了概念相关性传播和相关性最大化导致了更加可解释的解释，并通过概念图表，概念组成分析和概念集合和概念子区和概念子区和概念子集和定量研究对模型的表示和推理提供了深刻的见解。它们在细粒度决策中的作用。

translated by 谷歌翻译

fMRI from EEG is only Deep Learning away: the use of interpretable DL to unravel EEG-fMRI relationships

Alexander Kovalev , Ilia Mikheev , Alexei Ossadtchi

分类：人工智能 | 机器学习

2022-10-23

The access to activity of subcortical structures offers unique opportunity for building intention dependent brain-computer interfaces, renders abundant options for exploring a broad range of cognitive phenomena in the realm of affective neuroscience including complex decision making processes and the eternal free-will dilemma and facilitates diagnostics of a range of neurological deceases. So far this was possible only using bulky, expensive and immobile fMRI equipment. Here we present an interpretable domain grounded solution to recover the activity of several subcortical regions from the multichannel EEG data and demonstrate up to 60% correlation between the actual subcortical blood oxygenation level dependent sBOLD signal and its EEG-derived twin. Then, using the novel and theoretically justified weight interpretation methodology we recover individual spatial and time-frequency patterns of scalp EEG predictive of the hemodynamic signal in the subcortical nuclei. The described results not only pave the road towards wearable subcortical activity scanners but also showcase an automatic knowledge discovery process facilitated by deep learning technology in combination with an interpretable domain constrained architecture and the appropriate downstream task.

translated by 谷歌翻译

Mental arithmetic task classification with convolutional neural network based on spectral-temporal features from EEG

Zaineb Ajra , Binbin Xu , Gérard Dray , Jacky Montmain , Stephane Perrey

分类：人工智能 | 计算机视觉 | 机器学习

2022-09-26

近年来，神经科学家一直对脑部计算机界面（BCI）设备的开发感兴趣。患有运动障碍的患者可能会受益于BCIS作为通讯手段和恢复运动功能。脑电图（EEG）是评估神经元活性的最常用之一。在许多计算机视觉应用中，深度神经网络（DNN）都具有显着优势。为了最终使用DNN，我们在这里提出了一个浅神经网络，该网络主要使用两个卷积神经网络（CNN）层，其参数相对较少，并且快速从脑电图中学习光谱时期特征。我们将该模型与其他三个神经网络模型进行了比较，其深度不同于精神算术任务，该模型使用了针对患有运动障碍的患者和视觉功能下降的患者进行的眼神闭合状态。实验结果表明，浅CNN模型的表现优于所有其他模型，并达到了90.68％的最高分类精度。处理跨主题分类问题也更加健壮：准确性的标准偏差仅为3％，而不是传统方法的15.6％。

translated by 谷歌翻译

EEG-based Emotional Video Classification via Learning Connectivity Structure

Soobeom Jang , Seong-Eun Moon , Jong-Seok Lee

分类：机器学习 | (统计)机器学习

2019-05-28

脑电图（EEG）是一种有用的方法，可以在多媒体消费期间隐式监控用户感知状态。基于EEG的监测的实际使用的主要挑战之一是在脑电图分类中实现令人满意的准确性。不同脑区之间的连接是脑电图分类的重要属性。但是，如何定义给定任务的连接结构仍然是一个打开问题，因为没有关于连接结构应该如何最大化分类性能的实践。在本文中，我们提出了一种基于EEG的情绪视频分类的端到端神经网络模型，其可以直接从一组RAW EEG信号提取适当的多层图形结构和信号特征，并使用它们执行分类。实验结果表明，与使用手动定义的连接结构和信号特征的现有方法相比，我们的方法能够提高性能。此外，我们表明，在一致性方面，图形结构提取过程可靠，并且在大脑中发生的情绪感知的角度来看，学习的图形结构具有很大的意义。

translated by 谷歌翻译

Ubi-SleepNet: Advanced Multimodal Fusion Techniques for Three-stage Sleep Classification Using Ubiquitous Sensing

Bing Zhai , Yu Guan , Michael Catt , Thomas Ploetz

分类：机器学习 | 人工智能 | 计算机视觉

2021-11-19

睡眠是一种基本的生理过程，对于维持健康的身心至关重要。临床睡眠监测的黄金标准是多核桃摄影（PSG），基于哪个睡眠可以分为五个阶段，包括尾脉冲睡眠（REM睡眠）/非REM睡眠1（N1）/非REM睡眠2 （n2）/非REM睡眠3（n3）。然而，PSG昂贵，繁重，不适合日常使用。对于长期睡眠监测，无处不在的感测可以是解决方案。最近，心脏和运动感测在分类三阶段睡眠方面变得流行，因为两种方式都可以从研究级或消费者级设备中获得（例如，Apple Watch）。但是，为最大准确性融合数据的最佳仍然是一个打开的问题。在这项工作中，我们综合地研究了深度学习（DL）的高级融合技术，包括三种融合策略，三个融合方法以及三级睡眠分类，基于两个公共数据集。实验结果表明，通过融合心脏/运动传感方式可以可靠地分类三阶段睡眠，这可能成为在睡眠中进行大规模睡眠阶段评估研究或长期自动跟踪的实用工具。为了加快普遍存在/可穿戴计算社区的睡眠研究的进展，我们制作了该项目开源，可以在：https://github.com/bzhai/ubi-sleepnet找到代码。

translated by 谷歌翻译

Striving for Simplicity: The All Convolutional Net

Jost Tobias Springenberg , Alexey Dosovitskiy , Thomas Brox , Martin Riedmiller

分类：

2014-12-21

Most modern convolutional neural networks (CNNs) used for object recognition are built using the same principles: Alternating convolution and max-pooling layers followed by a small number of fully connected layers. We re-evaluate the state of the art for object recognition from small images with convolutional networks, questioning the necessity of different components in the pipeline. We find that max-pooling can simply be replaced by a convolutional layer with increased stride without loss in accuracy on several image recognition benchmarks. Following this finding -and building on other recent work for finding simple network structures -we propose a new architecture that consists solely of convolutional layers and yields competitive or state of the art performance on several object recognition datasets (CIFAR-10, CIFAR-100, ImageNet). To analyze the network we introduce a new variant of the "deconvolution approach" for visualizing features learned by CNNs, which can be applied to a broader range of network structures than existing approaches.

translated by 谷歌翻译