学习报告：mtclss：用于半监督儿科睡眠阶段识别的多任务对比学习策略-k8凯发旗舰

脑机接口与混合智能研究小组

更多动态

284

2023-07-16

本篇学习报告《mtclss: multi-task contrastive learning for semi-supervised pediatric sleep staging》来自期刊ieee journal of biomedical and health informatics，发表于2023年6月。

文章提出了一种用于半监督儿科睡眠阶段识别的多任务对比学习策略，简称为mtclss。具体来说就是，将信号进行自适应变换（旋转/降噪/加噪音/重新排序）以提升网络的表征学习能力。除此，还引入了损失函数的拓展，将对比学习用于半监督学习——既学习了少量有监督学习的数据，又提取了经过变化的信号。最终在实际儿科数据集上准确率达0.8，f1评分为0.78，kappa分数为0.74。同时还在公认的数据集上验证了实验的有效性。

方法的提出基于儿童睡眠障碍发病率持续增加的背景，而有监督睡眠分期方法往往存在数据异质性（复杂的类内方差）。例如，儿童的脑电图和成人的脑电图相比，α节律更慢。目前，很少自动睡眠分期关注于儿童睡眠，大多数睡眠阶段识别方法大量依赖于大量的标注睡眠数据，而儿科的睡眠数据稀缺。

实验范式和数据集：

实验主要采用了重庆第九人民医院的儿童睡眠数据集。有63个被试，年龄跨度从6岁到10.5岁，平均年龄是7.8岁。选取5%的数据作为标注数据，65%的数据作为未标记数据，剩下30%作为测试集用于评估模型。

同时还采用了sleepedf-20作为有监督方法和各种先进的半监督方法以验证方法的有效性。

实验方法：

图1 mtclss框架图

输入部分包括原始的eeg信号和经过转化的相应eeg信号，分别输入主干网络，并且将两者的特征输出进行对比学习。

半监督学习设置。数据集d分为有标注数据集d_l和无标注数据d_u 。d_l={(x_p, y_p), (x_{p 1}, y_{p 1}),…, (x_p, y_p)}，即d_l中每个数据都有相应标签。du={x_q, x_{q 1},…, x_q}。d_l的数量p远小于d_u数量q，两者数量构成训练集总量。loss值为有监督loss和无监督loss的加权总和。

信号转化识别。由于eeg信号不同于图像的结构，数据增强的时候需要考虑时间序列信号。研究过程中采用了旋转（rotation）、滤波（filtering）、降噪（noising）和重新排序（reordering）以及通道翻转和信号剪切等数据增强方法。实验对有标签数据和无标签数据执行旋转、滤波、降噪、重排操作得到变化后的信号，x_t和原始信号维度一样。然后应用多任务学习策略将信号转换识别任务附加到我们的睡眠分级框架中，促使网络更好地学习eeg表示。骨干网络通过以下损失函数进行训练，以识别四个转换任务：（其中，t代表上述四个转换任务的集合。trans（x_i，t）表示对原始信号x_i执行t，f_θ是我们的主干网络，参数为θ。l_ce表示标准交叉熵损失）

对比学习策略。原始信号x={x₁，x₂，x₃，…，x_n}通过上面介绍的变换任务进行变换，以生成n个信号对，这可以使骨干网络学习更多有用的eeg表示。对于每个x_i，我们测量x_t的特征相似性，以找到同源对，它们被视为正对，而其他的则被视为负对。与simclr类似，特征之间采用余弦相似性来寻找同源对，其定义为: