基于注意力机制的视频眼震图分类算法研究

周浩军; 赵晓丽; 高永彬; 李海波; 程若然

摘要

现有的良性阵发性位置性眩晕视频眼震图分类算法中存在以下不足：人工提取的特征主观性和局限性强；眼球的轴向转动特征提取困难；仅能区分正常人群和患者，或对简单的眼震进行分类。针对上述问题，本文提出一种基于注意力机制的视频眼震图分类算法。以轻量级模型3D MobileNetV2为基础网络进行特征提取，在全局细节特征、时空信息丰富的网络低层引入全局时空注意力模块，融合眼球震颤空间信息和帧间时序信息；在网络高层引入时空通道注意力机制，筛选高级语义特征。采用带有类别调制系数的交叉熵损失函数对网络进行训练，有效缓解了类别数量不平衡的问题。在复旦大学附属眼耳鼻喉科医院提供的66分类的视频眼震图数据集上进行实验，本文所提算法分类准确度达到90.08%，各类别的平均精准度、召回率、F1-score分别为90.50%,92.00%,90.40%，表明了所提的算法的优越性。

单位
上海工程技术大学

收藏分享被引浏览

更新时间：2021-11-09 08:06

基于注意力机制的视频眼震图分类算法研究

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友