总结:
本文介绍了TUH EEG Corpus这个数据集,它由14000多名患者的25000多个EEG会话组成。包括丰富的元数据库、患者历史和医生的解释。它是大规模机器学习实验的理想选择。预计它将对自动解释eeg的临床工具的发展产生重大影响。
初步试验表明在3762个实验语料库上,使用无监督和部分监督的学习技术可以直接从数据中预测一些注释。比如基于HMM的系统能够成功地检测SPSW、GPED和PLED事件。检测率为76%,虚警率为12%。背景和伪影建模效果良好。但是由于只执行单通道处理,事件检测总体上还是可以继续提升。
作者希望通过合并一个后处理方案来继续提高性能,该方案可以跨信道汇集输出,并集成包含短期和长期频谱信息的功能。增加时间上下文并将通道标识与事件关联也将大大提高我们区分SPSW事件与GPED和PLED的能力。额外的后处理级别将用于确定epoch标签。