摘要
肺炎支原体是造成人类呼吸系统疾病的主要原因。临床中,患者感染不同肺炎支原体症状极为相似,很难根据症状判别肺炎支原体类型并对症给药。因此,准确判别肺炎支原体菌株类型对于发病机理和疾病流行病学研究以及临床精准治疗具有重要意义。拉曼光谱具有快速、高效、无污染等优点,在生物医学领域逐渐得到越来越多研究者们的关注。一维卷积神经网络(1D-CNN)是一类包含卷积运算且具有深度结构的前反馈网络,在语音信号和振动信号分析等方面取得成功应用。提出一维卷积神经网络与拉曼光谱技术结合,针对肺炎支原体主要基因型M129型和FH型样本的拉曼光谱数据集,实现肺炎支原体菌株分类。利用光谱数据增强方法扩充原光谱数据集作为模型输入,训练一维卷积神经网络模型,解决由于小样本导致卷积神经网络数据饥渴问题;为了得到最好的肺炎支原体分类效果并加速学习过程,优化模型结构并确定最佳模型参数;拉曼光谱测量时常混有高斯噪声、泊松噪声和乘性噪声,为优化模型抗噪能力,将原光谱分别叠加高斯噪声、泊松噪声和乘性噪声,训练一维卷积神经网络模型并和LDA, KNN和SVM等传统算法进行比较。实验结果表明基于1D-CNN方法,对于叠加高斯噪声的光谱数据所建模型分类正确率为98.0%,叠加泊松噪声的光谱数据分类正确率为97.0%,叠加乘性噪声的光谱数据分类正确率为97.0%,分类正确率远高于基于LDA, KNN和SVM等传统算法所建模型分类正确率;同时构造叠加5, 15, 25, 35, 45和55 dBW不同强度噪声的光谱数据集,当噪声达到55 dBW时,1D-CNN模型仍能取得92.5%的分类正确率。因此,一维卷积神经网络结合拉曼光谱技术应用于肺炎支原体菌株类型分类是可行的,具有抗噪声能力强和分类正确率高的优点,该研究为肺炎支原体肺炎快速诊断提供新思路。
- 单位