本篇学习报告《mtclss: multi-task contrastive learning for semi-supervised pediatric sleep staging》来自期刊ieee journal of biomedical and health informatics,发表于2023年6月。
文章提出了一种用于半监督儿科睡眠阶段识别的多任务对比学习策略,简称为mtclss。具体来说就是,将信号进行自适应变换(旋转/降噪/加噪音/重新排序)以提升网络的表征学习能力。除此,还引入了损失函数的拓展,将对比学习用于半监督学习——既学习了少量有监督学习的数据,又提取了经过变化的信号。最终在实际儿科数据集上准确率达0.8,f1评分为0.78,kappa分数为0.74。同时还在公认的数据集上验证了实验的有效性。
方法的提出基于儿童睡眠障碍发病率持续增加的背景,而有监督睡眠分期方法往往存在数据异质性(复杂的类内方差)。例如,儿童的脑电图和成人的脑电图相比,α节律更慢。目前,很少自动睡眠分期关注于儿童睡眠,大多数睡眠阶段识别方法大量依赖于大量的标注睡眠数据,而儿科的睡眠数据稀缺。
实验范式和数据集:
实验主要采用了重庆第九人民医院的儿童睡眠数据集。有63个被试,年龄跨度从6岁到10.5岁,平均年龄是7.8岁。选取5%的数据作为标注数据,65%的数据作为未标记数据,剩下30%作为测试集用于评估模型。
同时还采用了sleepedf-20作为有监督方法和各种先进的半监督方法以验证方法的有效性。
实验方法:
图1 mtclss框架图
输入部分包括原始的eeg信号和经过转化的相应eeg信号,分别输入主干网络,并且将两者的特征输出进行对比学习。
如图2所示,两种不同的策略方法分别应用于有标签数据和无标签数据。无标签数据只将原始数据和相对应的数据视为正对,通过xi和计算无监督交叉熵lu。而有标签数据除了其对应变换数据视为正对,还将同类数据以及同类数据的变换视为正对,用于计算有监督交叉熵ls。
图2 标记和未标记数据中的正对(实线)和负对(虚线)。
图3 mtclss整体策略
实验与结果:
实验采用了儿童睡眠数据集和sleep-edf两个数据集,并分别使用了有监督、mtclss和若干现有较为先进的半监督方法做了对比实验,除此还横向对比了若干睡眠分期方法,通过实验验证了mtclss的有效性,采用了准确率、各类的精度、f1-score等指标作为标准。实验结果如下所示。
感想与心得:
在本篇论文中,脑电信号的转化方法比较值得参考,可用于睡眠信号的数据增强。同时,本篇论文提出的基于半监督方法的睡眠分期方法比较地系统,在实验证明的逻辑方面也比较完备,值得学习。
撰稿人:杨叶泽盛
审稿人:李景聪