Bootstrap

[数据集]EEG数据集汇总

目录

1. EEG简介

2. 可用数据集

2.1. A large and rich EEG dataset for modeling human visual object recognition

2.2. A multi-modal open dataset for mental-disorder analysis

2.3. An EEG motor imagery dataset for brain computer interface in acute stroke patients


1. EEG简介

脑电图(EEG)是一种用来记录大脑电活动的方法。它通过在头皮上放置电极来检测大脑皮层中神经元的电活动。这些电极会捕捉到神经元发出的微小电信号,并将其转换成图形形式,显示出脑电波的模式和频率。

脑电图通常用于诊断和研究各种神经系统疾病和异常,如癫痫、睡眠障碍、脑损伤、认知障碍等。它也可以用来评估大脑功能,研究睡眠模式、意识状态和注意力等认知过程。

通过分析脑电图,可以检测到不同类型的脑电波,如δ波(深睡眠)、θ波(轻度睡眠或放松状态)、α波(放松状态)、β波(警觉状态)和γ波(认知加工)。这些波形的特征和频率可以提供关于大脑功能和健康状况的重要信息。

2. 可用数据集

2.1. A large and rich EEG dataset for modeling human visual object recognition

(1)数据集介绍

人的大脑通过以毫秒规模运行的线性和非线性变换的多个阶段来实现视觉对象识别。为了预测和解释这些快速转化,计算神经科学家采用机器学习建模技术。但是,最先进的模型需要大量的数据才能正确训练,而到当今,缺乏广泛的大脑数据集,这些数据集广泛采样了视觉对象识别的时间动态。在这里,我们收集了一个庞大且丰富的时间分辨率脑电图对自然背景上对象图像的响应。该数据集包括10位参与者,每个参与者进行了82,160个试验,涵盖16,740个图像条件。

(2)论文网址:

A large and rich EEG dataset for modeling human visual object recognition - ScienceDirect

(3)下载链接:

https://osf.io/3jk45/

(4)参与者

十名健康成年人(平均年龄28.5岁,SD = 4; 8雌性,2名男性)都参加了正常视力或正常视力。

(5)刺激

所有图像均来自事物,一个在1854年对象概念中的自然背景上的12个或更多图像的数据库,其中每个概念(例如羚羊,草莓,T恤)属于27个高级类别之一(例如,动物,食物,衣服)。编码模型的构建涉及两个阶段:模型培训和模型评估。由于这些阶段中的每个阶段都需要一个独立的数据分区,因此我们将1854个对象概念分为非重叠的1654培训和200个测试概念受到约束,即27个高级类别中的相同比例必须保留在这两种情况下,这两种培训都必须保留在两种情况下。分区。然后,我们为每个训练分区概念选择了十张图像,并为每个测试分区概念选择了一个图像,从而产生了16,540个图像条件的训练图像分区(1654个培训对象概念×每个概念= 16,540个培训图像条件)和测试图像分区在200个图像条件(200个测试对象概念×每个概念图像= 200个测试图像条件)中。我们将培训和测试数据分区分别用于编码模型培训和测试。该实验具有正交目标检测任务,作为任务相关的目标刺激,我们使用了10个不同的图像“玩具故事”角色Buzz Lightyear。所有图像均为正方形。我们将它们重塑为500×500像素,用于EEG数据收集范式。对于使用DNN的建模,我们将图像重塑为224×224像素,并将其归一化。

(6)实验范式

该实验由RSVP范式组成具有正交目标检测任务,以确保参与者注意视觉刺激。所有10名参与者均完成了4次同等的实验会议,从而导致10个数据集由16,540个训练图像条件重复4次,200个测试图像条件重复80次,总共(16,540个培训图像条件×4培训图像重复)+(200个测试图像)条件×80测试图像重复)=每个数据集的82,160个图像试验。

一场会议包括19次跑步,所有活动都持续约500万。在前4个运行中,我们通过51个20张图像的快速序列序列向参与者展示了200个测试图像条件,每次运行总共4个测试序列×51个序列×每个序列= 4080图像试验。在以下15次运行中,我们显示了8270个训练图像条件(所有训练图像条件的一半,因为在不同的会话中显示了不同的一半),直到56个快速序列序列,共有20张图像,总共15个训练×56个序列每次运行×20图像每序列= 16,800个图像试验。

每个快速序列序列始于750ms的空白屏幕,然后将20张图像中的每一个以7°的视角呈现为100ms,刺激发作异步(SOA)为200ms,并以另外750ms结尾空白屏幕。在每个快速序列之后,最多有2s,在此期间,我们指示参与者首先眨眼(或进行任何其他运动),然后用按键报告Buzz Lightyear的目标图像是否出现在序列中。这减少了图像演示过程中眼睛眨眼和其他伪影的机会。图像以伪随机序列表示,目标图像以每次运行6个序列出现。在整个实验过程中,屏幕上存在一个中央公牛的眼睛固定目标,我们要求参与者不断凝视它。我们使用PsychToolbox(Brainard,1997)控制了刺激表现,并在实验会议期间记录了脑电图数据。

此外,我们在四个录音会议的开始和结束时收集了五分钟的静止状态数据,我们指示参与者固定在灰色背景上呈现的中央公牛的眼睛固定目标,以尽可能少眨眼,并避免其他面部或身体运动。我们没有进一步预处理或分析这些数据。

(7)脑电信号记录和预处理

我们使用64通道EasterCap记录了EEG数据,该宽度限制在标准10-10系统和BrainVision Actichamp放大器上排列的电极。我们以1000Hz的采样率记录了数据,同时执行在线过滤(在0.1Hz和100Hz之间)并引用(对FZ电极)。我们使用MNE软件包在Python中进行了离线预处理。我们将连续的脑电图数据分配到刺激发作前的200ms到刺激发作后的800ms的试验中,并通过减去每个试验的刺激前间隔的平均值和分别通道来应用基线校正。然后,我们下采样到100赫兹,我们选择了17个通道覆盖枕叶和顶叶皮层进行进一步分析(O1, Oz, O2, PO7, PO3, POz, PO4, PO8, P7, P5, P3, P1, PZ,P2,P4,P6,P8)。所有包含目标刺激的试验均未进一步分析,我们为每个训练图像条件随机选择并保留4个测量重复,并为每个测试图像条件进行80次测量重复。接下来,我们将多元噪声归一化独立应用于每个录制会话的数据。我们没有采用任何进一步的伪影校正方法。对于每个参与者,预处理导致了形状的EEG生物学训练(Biotrain)数据矩阵(16,540个训练图像条件×4条件重复×17 EEG通道×100 EEG通道×100 EEG时间点)和生物学测试(Biotest)(Biotest)数据矩阵(200)(200测试图像条件×80条件重复×17 EEG通道×100 EEG时间点)。我们分别使用了BioTrain and BioTest EEG数据进行编码模型培训和测试。

2.2. A multi-modal open dataset for mental-disorder analysis

(1)数据集介绍:根据世界卫生组织的数据,精神障碍患者,特别是抑郁症患者的数量已经过度增长,成为全球疾病负担的主要贡献者。随着人工智能等工具的兴起,利用生理数据探索精神障碍新的可能生理指标,为精神障碍诊断创造新的应用,成为新的研究热点。我们提出了一个多模态开放数据集的精神障碍分析。该数据集包括来自临床抑郁症患者和匹配的正常对照的EEG和口语数据记录,这些患者由医院的专业精神科医生仔细诊断和选择。EEG数据集包括使用传统的128电极安装的弹性帽和可穿戴的3电极EEG收集器收集的数据,用于普适计算应用。分别记录53名被试在安静状态下和完成Dot探针任务时的128电极脑电信号;记录55名被试在安静状态下的3电极脑电信号;记录52名被试在访谈、阅读和图片描述时的音频数据。

(2)论文网址:

A multi-modal open dataset for mental-disorder analysis | Scientific Data (nature.com)

(3)下载链接:

https://modma.lzu.edu.cn/data/index/

Multi-modal Open Dataset for Mental-disorder Analysis, Experimental Data 2014-2016 - ReShare

(4)参与者

        ①全脑128电极脑电实验:53名参与者包括总共24名门诊诊断为抑郁症的患者(13男11女; 16-56岁),以及29名健康对照(20男9女; 18-55岁)。

        ②3-电极脑电实验:55名参与者包括总共26名门诊诊断为抑郁症的患者(15男11女; 16-56岁)以及29名健康对照(19男10女; 18-55岁);

        ③口语实验录音:52名参与者包括总共23名诊断为抑郁症的门诊患者(16名男性和7名女性; 16-56岁),以及29名健康对照(20名男性和9名女性; 18-55岁)

(5)实验材料:

①全脑128电极脑电实验

任务1:静息状态

没有实验材料。参与者应保持安静,尽可能闭上眼睛。

任务2:点探针

我们呈现的数据集包括来自标准化的原生中国面部情感图片系统(CFAPS)25的面部图片。面部图像被选择并根据其效价分为恐惧,悲伤,快乐和中性情绪四组。随机选取两种不同效价的面部图像(一种属于情绪组,另一种属于中性组)。由情绪和中性面部图片组成的刺激对并排出现在屏幕上。两个面部图像之间的距离为12 cm,恒定视角为14.25°。 因此,我们获得了60个情绪中性的面孔对,包括20个恐惧中性,20个悲伤中性和20个快乐神经面孔。每种情绪的男性和女性图片的数量是相等的。图片大小为5.16 cm × 5.95 cm,所有非面部特征均已修剪。利用MATLAB软件对所有人脸图像的平均像素亮度、对比度和中心空间频率进行等值,并将图像转换为8位灰度图像。

②3-电极脑电实验

仅记录静息状态EEG;因此,未使用实验材料。但是,参与者应该保持安静,尽可能地闭上眼睛。

③口语实验录音

在实验设计中,考察了两个因素:说话风格和情绪效价。口语风格是指研究中涉及的三种口语模式:访谈、文字阅读和图片描述。他们每个人都有三种情绪效价:积极的,中性的,和消极的。不同情绪效价的语音顺序被随机分配,以抵消序列效应。实验语言为汉语,整个实验持续约25分钟。

2.3. An EEG motor imagery dataset for brain computer interface in acute stroke patients

(1)数据集介绍

脑机接口(BCI)是一种涉及与大脑部分直接通信的技术,近年来发展迅速;它已开始用于临床实践,例如用于患者康复。患者脑电图(EEG)数据集对于脑机接口的算法优化和临床应用至关重要,但目前还很少见。我们收集了50名急性中风患者的数据,这些患者使用无线便携式盐水EEG设备执行两项任务:1)想象右手运动和2)想象左手运动。该数据集由四种类型的数据组成:1)运动图像指令,2)原始记录数据,3)去除伪影和其他操作后的预处理数据,以及4)患者特征。这是第一个开放的数据集,以解决急性中风患者的左手和右手运动想象。我们相信,该数据集将非常有助于分析大脑激活和设计更适用于急性中风患者的解码方法,这将大大促进运动成像-BCI领域的研究。

(2)论文网址:

An EEG motor imagery dataset for brain computer interface in acute stroke patients | Scientific Data (nature.com)

(3)下载链接:

EEG datasets of stroke patients (figshare.com)

(4)参与者

该数据集由50名(受试者1-受试者50)年龄在30 - 77岁之间的急性缺血性卒中受试者的脑电图(EEG)数据组成。参与者包括39名男性和11名女性。脑卒中后1 ~ 30天。22名参与者右半球偏瘫,28名参与者左半球偏瘫。所有参与者最初都是右撇子。

每个参与者都坐在电脑屏幕前,一只胳膊放在膝盖上的枕头上或桌子上,他们执行电脑屏幕上给出的指令。在试验开始时,展示一张带有文字描述的图片,该图片用左手和右手传阅,持续2秒。我们要求被试将注意力集中在指导的手部运动想象上,同时将同侧手部运动的视频显示在电脑屏幕上,持续4s。接下来,休息2秒。

(5)数据收集和预处理:

脑电图数据是通过无线多通道脑电图采集系统(Zhentec NT1,Xi'an Zhentec Intelligence Technology Co.,中国有限公司)收集的。 EEG盖有根据国际10-10系统放置的电极,包括29个EEG记录电极和2个电摄影(EOG)电极。在FPZ位置。所有的EEG电极和接地电极都是基于高度吸收的多孔海绵,用3%NaCl溶液抑制了AG/AGCL半干EEG电极。 EOG电极由AG/AGCL电极和导电粘合水凝胶组成。共同模式排斥比为120 dB,输入阻抗为1GΩ,输入噪声小于0.4 µVRM,并且分辨率为24位。采集阻抗小于或等于20kΩ。采样频率为500 Hz。使用MATLAB(R2019 b)的EEGLAB工具箱对收集的数据进行预处理。我们对0.5 - 40 Hz的数据进行了平均去除法和时域滤波的基线去除。     


版权属于:熊sir

;