跳转到主要内容

原始研究的文章

前面。数字。健康,2021年1月22日
个性化医疗秒。
卷2 - 2020 | https://doi.org/10.3389/fdgth.2020.608920

无人监督的脑电图工件检测和校正

纱丽Saba-Sadiya 1、2 *,Eric Chantland2,Tuka Alhanai3,Taosheng刘 2默罕默德·m·Ghassemi 1
  • 1人类扩张和人工智能实验室,计算机科学系,密歇根州立大学东兰辛,MI,美国
  • 2知觉神经影像实验室和关注,心理学系,密歇根州立大学东兰辛,MI,美国
  • 3计算机人工智能实验室,电子与计算机工程系,纽约大学阿布扎比,阿布扎比,阿拉伯联合酋长国

脑电图(EEG)用于诊断、监测、预测的许多神经系统疾病包括癫痫、昏迷、睡眠障碍、脑损伤,和行为异常。脑电图数据的主要挑战之一是其敏感性造成的非平稳噪声宽度生理、运动和相关设备的构件。现有解决方案工件检测是有缺陷的,因为他们需要专家手工探索和注释工件的数据段。现有解决方案工件修正或清除不足,因为他们假定工件的发病率和具体特征相似(即不同主题和任务。,“一刀切”)。在本文中,我们描述一个小说脑电图消声方法使用表示学习执行病人——和特定于任务的工件检测和校正。更具体地说,我们的方法提取58临床相关特性和合奏的无监督异常检测算法适用于识别脑电图工件所独有的一个给定的任务和课题。工件段然后传递给深encoder-decoder无监督网络工件校正。我们比较的性能分类模型训练和没有我们的方法和观察到的性能在使用我们的方法相对提高10%。我们的方法提供了一个灵活的端到端无人监督的框架,它可以应用于小说脑电图数据而不需要专家监督可以用于各种临床决策任务,包括昏迷预言和退行性疾病检测。通过我们的方法,代码和数据公开可用的,我们的工作提供了一个工具的直接的实用价值也可以作为未来的努力在这一领域的重要基础。

1。介绍

脑电图(EEG)设备是普遍的工具用于临床研究、教育、娱乐、和各种各样的其他领域(1)。然而,大多数脑电图应用程序仍受限于固有的低信噪比数据收集的脑电图设备。脑电图噪声来源包括运动构件,生理构件(例如,从汗水),和仪器构件(EEG设备本身导致的)。虽然研究人员已经开发出许多方法来识别这些工件的具体实例(2)的脑电图数据,大多数方法需要手动标记的工件段1或特殊的硬件,如Electrooculography电极放置在眼睛周围或大型数据集的模板,如独立分量头皮地图(3)。

人工注释工件的脑电图数据是有问题的,因为它是耗时的,甚至可能是站不住脚的,如果工件的具体资料在脑电图数据作为任务的函数,不同的主题,或实验试验在一个给定的任务对于一个给定的主题,因为他们经常这么做。这些现实很快规模工件注释问题的复杂性,使一个放之四海而皆准的工件检测方法不可行的使用许多实际用例。

即使工件可以被识别和完美的忠诚,他们简单的移除损坏的(例如,通过删除段)可能会引入二次分析并发症,使下游利用这些数据的方法的性能。例如,方法,依靠脑电图段的平稳性将被简单的切除工件段抱愧蒙羞。即使是最简单的方法,比如平均许多脑电图试验之前提取特征(4),可能不太有效如果工件发生与记录类型或者实验条件,从而增加的可能性降低II型错误和随之而来的实验能力。

在脑电图处理工件检测的一个重要挑战是,“神器”的定义取决于特定的任务。即给定脑电图段工件当且仅当它影响下游的表现方法,展现不相关的噪声的特征空间与这些方法有关。例如,肌肉运动签名混淆comma-prognostic分类,但有用的特性对睡眠阶段识别(5)。

检测工件的特定于任务的性质使他们特别适用于数据驱动的无监督方法作为唯一要求识别工件的工件使用这种方法相对罕见的。时,将我们的数据映射到特征空间相关的特定脑电图任务,工件应该是罕见的异常。事实上,许多先进的方法使用非监督方法的检测在特定情况下特定的工件类型。例如,眨眼阿加瓦尔等人所描述的是一个完全无监督算法脑电图工件检测算法(6)眨眼的有效检测。而现有方法为特定的工件类型提供性能优良,需要额外的进展广义工件检测方法,使没有假设任务,主题,或环境。

也有可能超越工件检测正确的脑电图试验通过消除工件的信号。脑电图工件去除是一个更一般的类的实例的降噪问题。消除噪声从信号数据科学探究的话题一直是自香农信息奠定了基础理论在1940年代(7);多年来,多个信号处理方法对这个问题已经找到了进入脑电图的研究。这样一个技术无处不在的脑电图加工工件去除是独立分量分析(ICA)。这个方法及其现代导数仍然在研究社区中流行的无监督工件校正。然而,ICA仍然需要脑电图专家审核分解信号和手动分类信号或噪声。此外,而ICA许多脑电图的应用无疑是一个非常宝贵的工具,它也有局限性,尤其深刻当通道的数量很低;ICA只能提取尽可能多的独立的组件有渠道,因此无法隔离所有独立噪声组件如果独立噪声组件和信号来源的总数超过了脑电图电极的数量(8)。

工件去除是一个特别常见的实践为特定的工件类型:电极”流行”。这些工件由于突然阻抗的变化,往往由于宽松的电极放置或坏的电导率(9,10)。不像肌肉和运动工件,电极流行非常本地化,通常只影响一个电极通道。通道内插替换损坏的信号通道的过程与一个插值从周围清洁通道。Patrichella等人表明,了解特定的电极位置(即每个主题的电极位置),以及它们之间的距离可以提高插值结果(11,12)。然而,这种类型的附加信息是很少,通常需要特殊的专用硬件。最近,Sadiya等人提出了一种基于深度学习卷积auto-encoder学习任务和科目的插值方法(13)。迭代阻塞通道的输入和使用原始数据作为地面真理,学会了如何插入通道模型self-supervised的方式,没有人类的注释。此外,该模型不仅能够学习的信息,如与电极位置,打最先进的模型,也可以使用转移学习以提高性能前所未有的任务和课题。

在本文中,我们扩展上述先进的方法在工件检测和拒绝通过建立端到端的管道一起解决检测和排斥问题不作任何假设有关的任务或工件类型。

我们的工件检测方法使用定量脑电图的集合特性相关的各种各样的任务包括昏迷预测(14),诊断hiv (15)、解码心理表征(16)、解码注意力部署(17),脑机接口设计(18)。无监督异常值检测算法利用这些特性来确定工件在脑电图中提取数据。这些无监督算法只需要估计频率工件的数据,可以发现任何工件类型,无论任务。保证我们的结果准确反映这些无监督异常探测器的能力我们精心挑选的算法与彼此有很大的不同(例如依赖数据分布的局部和全局特征)和探索了数百种不同的可能的配置。小节2.2.1提供了一个全面审查的特征提取过程。2.2.2小节我们与不同的异常检测算法的实验细节。

我们的工件校正方法使用深encoder-decoder网络正确的工件不局限于只有一个通道。具体来说,我们学习目标框架修改”肋骨插值”的任务。帧插值是填写丢失的帧的视频(19)。我们所知,这是第一次工作,需要这脑电图工件校正方法。该方法也是独一无二的,它不需要任何大型资料处理的模板系统的维护或注释数据类似于其他先进的工件切除方法(6)。模型架构以及具体的目标制定的2.3节中详细讨论。

这项工作中所使用的数据集将在2.1节中详细讨论。不同的实验结果,我们可以发现在第三节进行。最后,我们讨论我们的发现,他们的广泛影响,并在第四节我们的方法的局限性。

2。方法

在这篇文章中,我们提出一个端到端的预处理管道的自动识别、拒绝和删除/校正脑电图工件的使用特点和深度学习模型的目的是作为一个通用的脑电图预处理工具使用。开始,我们提供简要概述的数据和方法论的管道,呼唤的特定部分,每个组件的完整细节的管道进行了讨论。

图1我们提供一个可视化提出了预处理管道;我们的方法首先进行无监督检测58-dimensional时代脑电图段的特征空间(2.2节)。试验没有拒绝在这个初始阶段是用来训练旨在纠正工件的深encoder-decoder网络段(2.3节)。

图1
www.雷竞技rebatfrontiersin.org

图1。我们的方法论的方法。EEG数据首先划分为时代(参见一个1,一个2,一个3)。接下来,58特性提取和合奏的无监督异常检测方法(见使用B1,B2,B3)来识别脑电图artifact-ridden并要求插值(见的时代一个2B2)。然后artifact-ridden时代被窜改的合奏深encoder-decoder网络(见红色线C)。

虽然我们证明这种方法在一个特定的数据集(在下面描述),这是适用于任何脑电图(没有修改)预处理工作。提出的方法处理的顺序在我们提出的管道。

2.1。数据集

2.1.1。数据采集

我们的目标是证明无监督异常检测是成功地用于确定工件在脑电图数据,并通过表示这些工件可以纠正学习方法(见2.3节)。证明我们的方法的可行性,不仅是必要的地面真理工件注释还地面真理标签的所有试验,包括那些被注解为工件。当工件注释允许我们测试的无监督异常检测方法,试验标签允许我们确认纠正脑电图数据确实可以与常规数据用于下游分析任务(例如,训练一个分类模型)。不幸的是,通常可用数据集不包含拒绝试验,甚至当这些注释可用原始标签不包括审判2。因此,我们的工作在两个数据集进行验证,以下简称取向颜色收集的数据集,以前Saidya et al。20.)。我们在这里简要描述这些数据集;的数据集提供的额外信息补充材料

实验都是被动观看的任务。定向任务刺激包括面向6的光栅,任务刺激的颜色随机点在六种不同的颜色。刺激生成使用球型投手,在Matlab运行库(Mathworks)。数据收集使用32-electrode actiCHamp帽在1000赫兹。对于每个任务,我们收集的数据从七个科目(共有四个男性)~ 10000脑电图试验。所有的受试者正常或矫正到正常视力。专家的数据进行噪声试验的注释。充分注释和网上匿名数据集将可用。参与者给知情同意和补偿的速度15美元每小时。密歇根州立大学实验程序批准的机构审查委员会和遵守赫尔辛基宣言的原则。

2.2。无人监督的工件检测

基准不同的异常检测方法我们收集了一系列共同的特征用于脑电图研究在不同领域和应用不同的无监督异常检测算法。我们的主要目标是彻底调查的可行性为脑电图无监督工件拒绝。

2.2.1。特征提取

基于之前的工作Ghassemi et al。(21),我们回顾了脑电图文学和建造了一个宽容的几个常用的功能列表脑电图分类任务。总的来说,我们发现和提取58特性。提取这些功能的代码编写,允许并行计算和访问的可下载python 3.5包3。看到表1为所有58功能分解和引用。

表1
www.雷竞技rebatfrontiersin.org

表1。脑电图特征。

这些特性可以分为三个类别,测量的复杂性,脑电图活动的连续性,和连接。继续讨论我们的管道之前我们将提供高层次的直觉每个类别的包容。我们鼓励有兴趣的读者参考Ghassemi等人的以前的工作更详细讨论的具体特性(21)。

2.2.1.1。复杂性特性(n= 25)

这些特性测量脑电图信号的复杂性从信息理论的角度来看,与认知功能受损和退化性疾病的存在。因此我们的第一组特性的集合信息理论复杂性的措施。特别令人感兴趣的是前三个特性所示表1当他们在脑电图研究尤为突出:香农熵的与神经有关结果post-anoxic昏迷患者(14);分解的熵脑电图(称为小波信号部分波段信息数量)同样被用于心脏骤停的研究(36,37)。Tsalis熵是一个泛化的香农熵不独立的做出假设的数据通道(在香农熵)和已被证明是特别有用的描述复杂的脑电图数据(23)。

2.2.1.2。连续性特性(n= 27)

这些特性捕捉脑电图活动的规律和波动。破裂、峰值和不寻常的平均值和标准偏差的变化频率和电力领域的例子连续性特征与多种临床相关的任务。看到Hirsh等人深入审查的连续性和相关性的临床护理(38)。

2.2.1.3。连接特性(n= 6)

。这些特征反映了EEG信号的统计依赖活动两个或两个以上的通道。功能连通性网络建立正常的大脑功能的特性。我们利用丰富的文学从脑电图测量连接信号(39)提取功能,曾被用于设计大脑计算机接口(18)以及精神疾病、知觉和注意研究(见(15),(16)和(17),分别)。

2.2.2。异常检测方法

我们研究了一套十无监督工件检测算法;探索算法是受赵的工作等。40)。算法可以大体上分为两组:统计学习方法和表示方法;他们是更详细地描述“统计方法”和“表示基于学习的方法“下面的部分。每个方法测定的hyper-parameters随机探索hyper-parameter空间和选择产生最佳性能的设置的数据根据我们的工件的方法注释。

2.2.2.1。统计方法

统计方法基于统计识别异常措施从数据中提取,从而产生一种“异常分数”为每个审判。基于直方图异常值检测(HBOS)方法使用直方图动态本宽度检测集群和异常在不同特征维度。尽管简单的方法已被证明适用于各种各样的数据类型(41)。局部离群值因子(LOF)方法同样计算一个“离群值分数”;然而,而不是全球措施,它依赖于数据的局部密度的主要指标(42)。当地另一个流行的算法,Angle-Based异常探测器(ABOD),计算数据点的余弦相似性和他们的邻居,并使用这些分数产生的异常分数的方差(43)。最后,我们也训练一个类SVM检测器(OCSVM),一个典型的异常检测算法(44)。在该算法中,一个支持向量机训练在整个气候资料,然后每个实例得分是基于它的类边界的距离;的直觉是罕见的异常值有助于减少决策边界计算和更有可能学会了边界的边缘。

正如前面提到的,我们选择这些探测器不同统计测量他们所使用的类型。因此,意义也系综分类器训练进一步提高孤立点检测的精度。具体来说,我们培训了五百名在本地选择并行组合(LSCP)例外集合体(45与上述算法的不同组合)。

2.2.2.2。表示基于学习的方法

与统计方法不同,representation-learning-based异常探测器不只是计算featurized数据的统计特性。基于最基本的分类器使用auto-encoder(汽车)的深度学习架构学习数据的低维表示,使最好的重建原始信号;常见的常规数据的嵌入将优化点从而产生明显嘈杂的重建为离群值试验(46)。这个分类器可以被视为一种现代更新类似的典型使用方法的异常检测方法,如主成分分析重建,而不是训练深auto-encoder (PCA) (47)。一种更为复杂的方法使用变分Auto-Encoders (VAE)。这类算法试图确保学习嵌入捕获原始数据通过惩罚的结构分类器如果嵌入不遵循一个标准正态分布(48)。最后,我们还检查生成敌对的主动学习(迦勒)异常探测器(49),它使用生成对抗网络生成异常值。这种方法可以用来改善2.2.2.1描述的统计方法。我们还用原来的方法的延伸学习多个发电机(MGAAL)。

2.3。工件校正

如前所述,基于encoder-decoder深度学习的方法已被证明有用的通道插值(13)。在本节中,我们讨论这种方法的一个扩展,利用相同的框架构件校正。即给定一个脑电图数据段和一个孤立的工件我们移除损坏的部分和使用前的数据样本,进行填写结果无效。这个问题是相当于“肋骨插值“任务填写丢失的帧的视频(19)。

2.3.1。该模型

2.3.1.1。输入表示

通道内插模型提出了Saba-Sadiya et al。(13)代表了脑电图的时间序列二维拓扑有序数组。这反映了空间性质的脑电图通道插值问题;插入的值在不同的时间点被视为独立的。最好的作者的知识,这是一个标准的假设为脑电图插值算法。例如,Petrichella等人,Courellis等人计算的插值数据缺失的数据分别在每一个时间点(11,12)。然而,脑电图研究卷积神经网络解码和可视化显示性能得益于呈现输入列电极在时间中展开,这有助于学习的时间调节(50)。由于工件校正是首先完成差距的过程跨越时间我们决定离开Saba-Sadiya et al。(13),并使用一个二维数组表示的时间步数作为数组的宽度。

2.3.1.2。体系结构

最好的帧插值模型涉及计算对象轨迹和会计可能阻塞(例如,如果一个物体在另一个)。与这些“流计算”,之前和之后的堆栈帧丢失的图像卷积encoder-decoder可以生成现实中间的图片(19)。与视频、脑电图数据只有一个空间维度(见第2.3.1.1)而不是类似于当地的现象,如阻塞或物体运动;这些可能发生脑电图的变调和常被认为是主要全球在本质上(50)。因此,我们只关心一个卷积auto-encoder不利。该体系结构由以前讨论共享先进的插值算法对帧插值和频道(13,50)。

每一帧的插值是单独完成的,从而来预测n框架是必要的训练n网络。技术上这相当于培训一个整体模型,然而,通过将网络我们允许容易训练过程的并行化。确切地说,一系列的脑电图帧x1,x2、…xn在哪里xt是一个向量的所有通道值在时间吗t,假设系列是失踪的时间点之间的所有帧tbte,我们的网络就学会了预测xt从两个堆栈,xtbh,xtbh+ 1、…xtbxte,xte+ 1、…xte+h在哪里t∈(tb,te),h是一些小的正整数代表多少帧之前和之后失踪的部分可以感知。每个网络都是训练有素的预测的值在一个特定的值。每个网络需要相同的2h帧(失踪前半段后半)计算值在给定的框架。

2.4。模型验证方法

2.4.1。工件检测方法

工件检测方法的性能评估通过检查工件检测方法和专家之间的协议注释从两个数据集(颜色和方向)。更具体地说,该协议是测量使用f值和科恩Kappa(分别为第一和第二值在每个单元格)。我们比较我们的模型的性能对分类器的性能了解工件的具体数量;这个随机分类器预计卡巴0.172和0.029的f值。我们跑两个配置的检测算法,分别为每个主题和整个聚合数据。我们假设性能将下降在使用聚合配置,作为脑电图记录每个单独的设置可能会引入独特的工件(由于松散连接或科目的情况下,如汗)。

2.4.2。工件校正方法

优化工件的参数修正模型,我们生产试验的训练数据标记为工件自由的无监督工件检测方法(2.2.2节)和随机删除一段的中间试验。的h样品进行分割和删除h前它被用作输入样本为模型而删除部分地面真理(h是一个hyper-parameter优化训练集)。为了验证工件校正模型,所有的脑电图数据re-sampled到200赫兹。重建的部分共200名女士每一个。

2.4.3。端到端评估方法

我们运行了一个数量的测试来检查如果试验重建我们的工件校正方法可以用于提高下游脑电图任务的性能。更具体地说,我们训练两种支持向量机模型预测的审判的标签颜色省际层面:SVM训练使用原始数据,另一个被训练使用原始数据工件校正后。两个模型都验证使用5倍交叉验证,模型在测试集上的性能(μ、σ)。

我们也评估了我们的工件校正方法对下游的影响脑电图任务应用的时候出现干净的试验,只;这对于无意评价允许我们测试信号质量的退化的清洁部分由我们的方法处理。更具体地说,我们应用工件校正方法的20%清洁试验和使用结果数据来训练一个额外的支持向量机模型。

3所示。结果

本节提出了两个主要组件的结果在我们的管道,工件检测方法和工件校正方法2.1中描述的数据。

3.1。工件检测结果

表2,我们比较平均2.2.2节中描述的性能异常检测方法,应用于每一个主题分别。因此,每个值的均值算法在主题的表现。正如前面提到的,预期的性能基线了解工件的准确数字的随机分类器是卡巴0.172和0.029的f值。因此,以外的所有模型ABOD分类器的表现明显好于基线(一个跟踪t以及一个p= 0.05显著性水平)。

表2
www.雷竞技rebatfrontiersin.org

表2。比较不同的无监督异常检测方法,分别应用于每一个主题。

意料之中的是,离群值检测器是一个最好的LSCP系综分类器,执行16.86x比基线法,和1.03x比下一个最好的方法;表现最好的分类器的配置包括两个苏格兰哈里法克斯银行分类器和一个OCSVM。虽然很难解释系综分类器值得注意的是,这两个直方图分类器分化很明显;使用大量的直方图箱和一个刚性的离群值评分政策(托尔= 0.1),而另一个使用一个更小的箱子数量和更宽松的政策(托尔= 0.5)。一个简单auto-encoder学习算法是最好的表示,紧随其后的是主成分分析算法。我们推测,auto-encoder所能拥有更好的性能,如果有更多的数据为每个主题。看到我们的补充材料崩溃的审判和工件编号为每个主题。

表3,我们比较的性能异常检测方法在2.2.2节描述应用于主题聚合数据;即主题不单独考虑时的结果表2。相比,所示的结果表2对于大多数模型,性能下降。这不足为奇,因为无监督方法的基本假设是均匀的异常数据离群值。在这里,LSCP方法执行最好的测试方法。比较的结果表2,3提供发展的动力与异常检测方法。此外,也比较突出的无监督算法和特征提取可以成功地捕获普通脑电图工件和科目的特点。

表3
www.雷竞技rebatfrontiersin.org

表3。模型训练数据聚合的性能从所有的科目。

3.2。工件校正结果

3.2.1之上。网络优化

我们的第一步是优化网络hyper-parameter配置。这包括测试不同大小的层和卷积过滤器,以及探索不同hyper-parameters,如优化算法,辍学率和激活函数。训练网络我们跟着2.2.2节中讨论的方法:我们随机抽取104个样本数据,第一个和最后一个32个样本堆放和使用作为模型的输入,和样品的位置从剩下的40个样本作为地面真理。本质上我们是训练一个网络预测的值后删除40样本(200女士)使用之前和之后的32个样本段删除。表现最好的网络(最低损失)是不同的不同t20年代。最优拓扑重构样本是可用的补充材料作为参考的卷积U-net架构使用的类型。

3.2.2。端到端评估

表4我们比较SVM模型的分类精度5倍训练来执行一个下游试验类型的分类使用down-sampled EEG数据与三种不同配置的数据:(1)原始的脑电图数据,(2)工件的数据修正后段,和(3)数据后40“校正”的一个随机样本的20% non-artifact段。注意,虽然简单的这种类型的分析在实际使用脑电图研究(4)。

表4
www.雷竞技rebatfrontiersin.org

表4。的意思是简单的SVM分类器的精度。

性能仍然比较使用工件校正试验后,不包含任何工件。这是一个强烈的迹象表明模型确实能够学习如何重建原始脑电图信号。当使用修正后的试验与脑电图工件总体分类精度提高了10%,超过20%,标记为包含构件的试验。这些结果成功地证明我们的无监督的端到端工件校正管道加改善分析。

4所示。讨论

4.1。我们的研究结果的意义

在本文中,我们提出了一个端到端的管道的无监督工件检测和校正。我们的研究结果表明,数据驱动方法时可以非常有用的无监督异常检测应用于脑电图工件检测的问题。有趣的是,最好的分类器性能表现最佳(HBOS, OCSVM LSCP)是全球分类器;这可能表明,脑电图工件由全球特征更好的歧视。这支持了我们先前的观察,工件在任务特定的不相关的噪声和罕见的事件。值得注意的是,如在表3,我们训练的分类器能够学习科目的特点。

虽然准确性和协议之间的注释器和探测器是远非完美,科恩Kappa表现最佳的算法与两分的协议专家注释器在文献中报道的水平;例如,当被问及注释”,定期排放”(一个特定类型的工件)和“电记录的发作”注释器科恩Kappa的0.38和0.58,分别为(51)。我们的研究结果表明,广义的无监督异常检测方法是可行的脑电图工件检测。

4.2。的数据集

我们验证框架在两个新的数据集。测试工件校正算法对下游的影响分析是必要的地面真理工件注释以及知识的所有试验的标签,包括那些工件骑。不幸的是,公共数据集常常排除包含构件的试验。即使在极少数情况下,这些试验是可用的,标签经常被替换为一个特殊的标识符拒绝试验4。我们希望我们的数据集激励其他研究人员采取更全面的数据出版实践数据可用性可能是工件校正的主要限制因素研究。

4.3。无监督的力量的端到端方法

简单的分类器的精度工件去除后略有改善。有可能取代我们deep-learning-based工件去除组件与ICA工件去除算法(52)可能会产生更好的结果。然而,应该是两个重要的差别:首先,该方法避开许多固有弱点ICA (8)(如独立组件的数量被限制通道的数量,这是特别有问题的轻量级商业脑电图设置)。其次,独立分量解构本身是数据驱动的监督和管理,ICA方法仍然需要目视检查和分析分解信号的由人类专家。相比之下,我们的方法可以生效,无需人工干预,使其适用于在线脑电图应用程序或作为一个免费的第一步之前更彻底的分析。一般来说,毫无疑问超无监督的监督方法和我们完全承认管道提出了工作也不例外。因此有用的考虑无监督方法不是作为替代目前现有的算法,而是作为免费添加工具箱的脑电图研究员。有鉴于此,我们故意设计的端到端管道高度模块化;一位有经验的研究人员可以很容易地替代我们最后的组件与一个ICA工件去除算法,相比之下,研究者获得工件注释(例如通过使用专门的硬件数据采集期间)将能够使用他们的方法与我们的完全或避开第一个流程,仅适用于工件校正组件之前进行分析的过程。

4.4。限制

我们没有正式评估模型的重建性能因为(1)没有一个权威的文学基线,和(2),只要重建增强下游分类模型的能力执行预期的分类任务,重建是有效的和有价值的。有一些局限性,我们希望在未来的工作地址。首先,这个工件检测方法只能用于工件的频率足够低是离群值。而这确实是绝大多数的脑电图的用例,任务,如癫痫检测通常涉及长期的异常低的信噪比。此外,我们的工件校正网络的性能可能会受益于引入更复杂的组件体系结构。例如,引入时间依赖关系通过LSTM组件将保证纠正帧在时间t影响帧在时间t+ 1。最后,我们的方法是急需被验证在额外的任务和数据集。

尽管上述挑战,我们相信我们的工作展示了脑电图预处理管道的可行性,如果采用能够促进和加速往往脆弱的工件注释和删除的过程,因此可以非常有利于普通脑电图研究社区。

5。结论和未来的工作

脑电图的应用有很多不同,虽然这种影响组件的特性被归类为信号与工件的一部分,共同关心数据同质性是在这一领域的研究。基于这些数据科学的角度来看,这项工作我们将最先进的数据驱动的方法来构造一个端到端无人监督的管道一般工件检测和校正。我们介绍了两个新的数据集和证明了两分的工件检测组件的可靠性专家注释器与报道人类的水平。此外,我们演示了如何应用完整的管道共同下游的资料处理可以改善系统性能分析。管道利用广泛的手工制作的临床相关的特性,我们认为,将使用python包发布许多脑电图研究社区。

数据可用性声明

原始数据支持了本文的结论将由作者提供,没有过度的预订。

道德声明

涉及人类受试者的研究回顾和批准的人类研究保护程序IRB密歇根州立大学。参与者提供了他们的书面知情同意参与这项研究。

作者的贡献

SS-S:数据收集和注释,编码方法部分,和写作。EC:数据收集和注释,帮助方法的代码部分,文章评论。助教:算法设计和写作。TL:编码提供的实验和EEG设备用于数据收集。MG:文献综述,设计,提出的模型在方法部分,和写作。所有作者的文章和批准提交的版本。

资金

这项工作是支持格兰特DFI GR100335来自密歇根州立大学。

的利益冲突

作者声明,这项研究是在没有进行任何商业或财务关系可能被视为一个潜在的利益冲突。

确认

2.2.1分段是严重基于Ghassemi的内容(21),这是一个提出的论文作者之一,麻省理工学院在2018年。我们感谢苏珊博士Ravizza密歇根州立大学贷款我们她对脑电图数据收集和分析的专业知识。

补充材料

本文的补充材料在网上可以找到:https://www.雷竞技rebatfrontiersin.org/articles/10.3389/fdgth.2020.608920/full补充材料

脚注

1。^这可能是用作“模板”统计或基于规则的方法识别(和潜在的拒绝)的噪声数据时代。

2。^例如BCI比赛数据:http://bbci.de/competition/

3所示。^代码可以在:https://github.com/sari-saba-sadiya/EEGExtract

4所示。^对标准脑电图出版实践看到的一个例子BCI竞争数据集

引用

1。Siripornpanich V, Sampoon K, Chaithirayanon年代,Kotchabhakdi N, Chutabhakdikul N .增强大脑成熟通过正念小学教育孩子:定量脑电图研究。正念。(2018)9:1877 - 84。doi: 10.1007 / s12671 - 018 - 0930 - 3

CrossRef全文|谷歌学术搜索

2。Uriguen JA Garcia-Zapirain b .脑电图工件removal-state-of-the-art和指导方针。J神经英格。(2015)12:031001。1741 - 2560/12/3/031001 doi: 10.1088 /

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

3所示。Shamlo NB, Kreutz-Delgado K, Kothe C, Makeig s EyeCatch:数据挖掘超过一百万脑电图独立的组件构建一个完全自动化的eye-component探测器。:IEEE 2013年第35届国际会议在医学和生物工程协会(EMBC)(大阪)(2013)。5845 - 8页。

《公共医学图书馆摘要》|谷歌学术搜索

4所示。Cichy RM、拉米雷斯调频Pantazis d视觉信息编码在皮质列可以从脑磁图描记术数据解码人类吗?科学杂志。(2015)121:193 - 204。doi: 10.1016 / j.neuroimage.2015.07.011

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

5。Ghassemi MM,喜怒无常,雷曼LH、歌曲C,李问,太阳H, et al。你打盹,你赢了:生理网/计算2018年心脏病的挑战。:2018年心脏病学会议(CinC)计算,卷45(马斯特里赫特),(2018)。1 - 4页。doi: 10.22489 / CinC.2018.049

CrossRef全文|谷歌学术搜索

6。Agarwal M, Sivakumar r .眨眼:一个完全自动化的无监督算法,但在脑电图检测信号。:2019年第57届Allerton会议沟通,控制和计算(Allerton)(MN)蒙蒂塞洛(2019)。1113 - 21页。doi: 10.1109 / ALLERTON.2019.8919795

CrossRef全文|谷歌学术搜索

7所示。香农CE。沟通的噪音。Proc愤怒。(1949)37:10-21。doi: 10.1109 / JRPROC.1949.232969

CrossRef全文|谷歌学术搜索

8。Kumar Djuwari D, D, Palaniswami m .除ICA对人工制品的局限性。Conf Proc IEEE Eng地中海生物Soc。(2005)5:4685-8。doi: 10.1109 / IEMBS.2005.1615516

CrossRef全文|谷歌学术搜索

9。查克T, Chokroverty年代。脑电图、肌电图和Electro-Oculography:一般原则和基本技术。爱思唯尔有限公司(2009)。

谷歌学术搜索

10。布里顿JW,弗雷LC,老板霍普杰,科博P, Koubeissi MZ,列文我们,等。脑电图(EEG):一个介绍性的文字和阿特拉斯的正常与异常发现的成人,儿童和婴儿(互联网)。圣路易斯EK,弗雷LC、编辑。芝加哥:美国癫痫协会(2016)。

谷歌学术搜索

11。机构组织F, Petrichella年代,Vollere L, Ferreri Guerra, Maatta年代,Kononen M, et al .频道TMS-EEG插值:向一个精确的定量研究地形表示。:IEEE 2016年第38届国际会议在医学和生物工程协会(EMBC)(佛罗里达州)(2016)。p . 989 - 92。doi: 10.1109 / EMBC.2016.7590868

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

12。Courellis HS,小球队,鲍泽纳H, Cauwenberghs g .脑电图通道插值使用椭球测地线的长度。:2016年IEEE生物电路与系统会议(BioCAS)(上海)(2016)。540 - 3页。doi: 10.1109 / BioCAS.2016.7833851

CrossRef全文|谷歌学术搜索

13。刘Saba-Sadiya年代,Alhanai T, T, Ghassemi m .脑电图插值使用深encoder-decoder网络频道。:2020年IEEE国际生物信息学和生物医学会议(BIBM)(首尔)(2020)。

谷歌学术搜索

14。Tjepkema-Cloostermans M, van Meulen F, Meinsma G, van Putten M .脑复苏指数(CRI)心脏骤停后患者早期预后。暴击治疗。(2013)17:R252。doi: 10.1186 / cc13078

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

15。Uhlhaas P,歌手w .异常在精神分裂症神经振荡和同步。Nat转速>。(2010)11:100-13。doi: 10.1038 / nrn2774

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

16。Hipp J,恩格尔,西格尔m同步振荡在大规模的皮质网络预测感知。神经元。(2011)69:387 - 96。doi: 10.1016 / j.neuron.2010.12.027

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

17所示。锡安Golumbic E,根GB,施罗德CE、Poeppel d视觉输入增强选择性语音包络跟踪在听觉皮层“鸡尾酒会”。J >。(2013)33:1417-26。doi: 10.1523 / jneurosci.3675 - 12.2013

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

18岁。Ang KK,下巴ZY,张H,关c相互信息选择最佳的因为它使得基于脑电图的实验好像时空模式。模式Recogn。(2012)45:2137-44。doi: 10.1016 / j.patcog.2011.04.018

CrossRef全文|谷歌学术搜索

19所示。江H,阳光D, Jampani V,杨MH, Learned-Miller E, Kautz j .超级SloMo:高质量的多个视频中间帧插值估计。:2018年IEEE / CVF计算机视觉与模式识别会议(犹他盐湖城)(2018)。doi: 10.1109 / CVPR.2018.00938

CrossRef全文|谷歌学术搜索

20.刘Saba-Sadiya年代,Chantland E T。德科脑电图从被动观看。GitHub (2020)。网上:https://github.com/sari-saba-sadiya/DEPV

21。Ghassemi毫米。死后的生活:技术心脏骤停后昏迷的预测结果。剑桥,麻州:麻省理工学院(2018)。

谷歌学术搜索

22。香农CE,韦弗W。通信的数学理论。香槟市IL:伊利诺伊大学出版社(1998)。

谷歌学术搜索

23。Geocadin R, Muthuswamy J,谢尔曼D, Thakor N,汉利D早期电生理学和组织学的变化在全球脑缺血大鼠。Mov Disord。(2000)15:14-21。doi: 10.1002 / mds.870150704

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

24。Shin HC,贾X, Nickl R, Geocadin RG, Thakor Ast NV。subband-based信息衡量心脏骤停后脑电图在脑损伤和恢复。IEEE反式生物医学中。(2008)55:1985 - 90。doi: 10.1109 / TBME.2008.921093

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

25。奥本海姆AV,谢弗RW光碟。从频率到同态频率:倒频谱的历史。IEEE信号处理杂志。(2004)21:95 - 106。doi: 10.1109 / MSP.2004.1328092

CrossRef全文|谷歌学术搜索

26岁。狼,迅速JB, Swinney HL Vastano农协。从时间序列确定李雅普诺夫指数。phy D Nonlin苯酚的。(1985)16:285 - 317。0167 - 2789 . doi: 10.1016 / (85) 90011 - 9

CrossRef全文|谷歌学术搜索

27。Accardo, Affinito M, Carrozzi M,花束f使用脑电图仪的分析时间序列的分形维数。杂志Cybern。(1997)77:339-50。doi: 10.1007 / s004220050394

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

28。哦,上海,李年,金正日HN。一个新颖的脑电图特征提取方法使用Hjorth参数。Int J电子电气Eng。(2014)2:106-10。doi: 10.12720 / ijeee.2.2.106 - 110

CrossRef全文|谷歌学术搜索

29。heg R, Kantz h .改进虚假最近邻方法检测时间序列数据中的决定论。物理评论E。(1999)60:4970。doi: 10.1103 / PhysRevE.60.4970

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

30.通用电气,詹金斯通用、Reinsel GC Ljung通用。时间序列分析:预测与控制。新泽西州霍博肯:约翰威利& Sons (2015)。

31日。罗斯SM。介绍统计。剑桥,麻州:学术出版社(2017)。

谷歌学术搜索

32。斯特恩JM。阿特拉斯的脑电图。费城,宾夕法尼亚州:Lippincott威廉姆斯和威尔金斯(2005)。

谷歌学术搜索

33。Blinowska KJ, KuśR, Kamiński m .格兰杰因果关系和在多元信息流动过程。物理评论E。(2004)70:050902。doi: 10.1103 / PhysRevE.70.050902

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

34。斯塔姆C,诺尔特G, Daffertshofer a相位滞后指数:评估功能连通性的多通道脑电图和梅格常见来源减少偏见。攻读硕士学位大脑嗡嗡声。(2007)28:1178 - 93。doi: 10.1002 / hbm.20346

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

35。凯SM。统计信号处理的基础。上台北:Prentice Hall PTR (1993)。

谷歌学术搜索

36。Shin H,通年代,山下先生,贾X, Geocadin G, Thakor n .定量脑电图和心脏骤停后低温对脑复苏的影响。IEEE反式生物医学中。(2006)53:1016-23。doi: 10.1109 / TBME.2006.873394

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

37岁。贾X, Koenig M, Nickl R,甄G, Thakor N, Geocadin R .早期电生理学的标记预测功能结果在大鼠心脏骤停后与温度相关的操作。暴击治疗地中海。(2008)36:1909。doi: 10.1097 / CCM.0b013e3181760eb5

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

38。赫希LJ, LaRoche SM, N,加斯帕德杰拉德E, Svoronos,赫尔曼·圣等。美国临床神经生理学学会标准化危重病脑电图术语:2012版。中国Neurophysiol。(2013)30:1-27。doi: 10.1097 / WNP.0b013e3182784729

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

39岁。总值Schoffelen J, J .源连通性分析梅格和脑电图。攻读硕士学位大脑嗡嗡声。(2009)30:1857 - 1865。doi: 10.1002 / hbm.20745

CrossRef全文|谷歌学术搜索

40。李赵Y, Nasrullah Z Z热电偶:python工具箱为可伸缩的异常值检测。J马赫Res学习。(2019)20:1-7。

谷歌学术搜索

41岁。戈尔茨坦,Dengel。基于直方图异常分数(HBOS):快速的无监督异常检测算法。萨尔布吕肯:德国人工智能研究中心(2012)59 - 63。

谷歌学术搜索

42。Breunig MM, Kriegel H, Ng RT,桑德j . LOF:识别density-based局部离群值。SIGMOD矩形。(2000)29:93 - 104。doi: 10.1145/335191.335388

CrossRef全文|谷歌学术搜索

43。Kriegel H,舒伯特M, Zimek a Angle-based在高维数据异常值检测。:第14届ACM SIGKDD学报》国际会议上知识发现和数据挖掘(拉斯维加斯,NV) (2008)。444 - 52页。doi: 10.1145/1401890.1401946

CrossRef全文|谷歌学术搜索

44岁。Scholkopf B,普拉特JC, Shawe-Taylor J, Smola AJ,威廉姆森RC。估计一个高维分布的支持。神经第一版。(2001)13:1443 - 71。doi: 10.1162 / 089976601750264965

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

45岁。李赵Y, Hryniewicki可,Nasrullah Z, Z LSCP:本地选择性并行组合异常集合体。1:长效磺胺(卡尔加里,AB) (2019)。doi: 10.1137 / 1.9781611975673.66

CrossRef全文|谷歌学术搜索

46岁。Aggarwal CC,异常分析。:数据挖掘:教科书。可汗:施普林格国际出版(2015)。75 - 9页。doi: 10.1007 / 978 - 3 - 319 - 14142 - 8 - _8

CrossRef全文|谷歌学术搜索

47岁。害羞的ML来说,陈SC, Sarinnapakorn K, Chang LW。一种新颖的异常检测方案基于主分量分类器。AD-a465 712。科勒尔盖布尔斯,FL:迈阿密大学电子与计算机工程系(2003)。网上:https://books.google.com/books?id=iXEinQAACAAJ

谷歌学术搜索

48。一个J,曹。基于变分Autoencoder异常检测使用重建概率。(2015)。

谷歌学术搜索

49。李刘Y, Z,周C,江Y,太阳J,尹浩然,王。生成敌对的无监督异常检测的主动学习。:诉讼的IEEE工程知识和数据。(2019)。doi: 10.1109 / TKDE.2019.2905606

CrossRef全文|谷歌学术搜索

50。Schirrmeister RT、Springenberg JT fieder LDJ, Glasstetter M, Eggensperger K,尹浩然,Tangermann。深度学习与卷积神经网络脑电图解码和可视化。攻读硕士学位大脑嗡嗡声。(2017)38:5391 - 420。doi: 10.1002 / hbm.23730

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

51。哈尔福德JJ, Shiau D, Desrochers是的,咨询BJ,公元前院长,水域CG, et al。两分的协议识别电记录的癫痫在ICU脑电图记录和定期排放。中国Neurophysiol。(2015)126:1661-9。doi: 10.1016 / j.clinph.2014.11.008

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

52岁。荣格TP, Makeig年代,汉弗莱斯C, Lee TW部M, Iragui V, et al。删除脑电图仪的工件通过盲源分离。心理生理学。(2000)37:163 - 78。doi: 10.1111 / 1469 - 8986.3720163

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

关键词:脑电图、工件拒绝,大脑计算机接口,无监督学习,工件去除

引用:Saba-Sadiya年代,Chantland E,刘Alhanai T, T和Ghassemi毫米(2021)无监督脑电图工件检测和校正。前面。数字。健康2:608920。doi: 10.3389 / fdgth.2020.608920

收到:2020年9月22日;接受:2020年12月14日;
发表:2021年1月22日。

编辑:

约翰泰勒Loftus美国佛罗里达大学

审核:

Aishwarya Bandla新加坡国立大学,新加坡
阿曼达·克里斯汀Filiberto美国佛罗里达大学

版权©2021 Saba-Sadiya Chantland Alhanai,刘和Ghassemi。这是一个开放分布式根据文章知识共享归属许可(CC)。使用、分发或复制在其他论坛是允许的,提供了原始作者(年代)和著作权人(s)认为,最初发表在这个期刊引用,按照公认的学术实践。没有使用、分发或复制是不符合这些条件的允许。

*通信:纱丽Saba-Sadiya,sadiyasa@msu.edu

下载