摘要

红外光谱分析在自然科学、工程技术等诸多领域发挥着重要作用。随着计算机和人工智能技术的不断发展,对红外/近红外光谱分析提出了更高的要求。深度学习以人工神经网络为架构,通过对数据进行分层特征提取完成特征/表征学习,在解析数据细节特征方面具有独特的优势,在计算机视觉、语音识别、疾病诊断等多领域得到成功应用。尽管深度学习在图像、音频、文字分析方面获得了较好的效果,但是在红外/近红外光谱数据分析中的应用还十分有限。针对深度学习的卷积运算,首先将一维傅里叶变换(Fourier transform infrared spectroscopy, FTIR)红外光谱数据通过对称点模式(symmetrized dot patterns, SDP)变换为二维RGB彩色图像,然后将SDP变换得到的彩色图像数据作为VGG(oxford visual geometry group)深度卷积神经网络的输入进行深度学习,建立基于红外光谱数据的分类识别模型。对不同浓度甲烷(CH4)、乙烷(C2H6)、丙烷(C3H8)、正丁烷(C4H10)、异丁烷(iso-C4H10)、正戊烷(C5H12)、异戊烷(iso-C5H12)七种单组分烷烃及其混合气体SDP转化获得的224×224彩色(RGB)图像,呈现出显著差别,且更符合VGG卷积运算的数据格式。将SDP-VGG方法应用于气测录井中甲烷浓度范围的识别:气测录井气体为上述七组分烷烃气体的混合气体,其中主要成分甲烷的浓度范围按照<20%, 20%~40%, 40%~60%, 60%~80%, 80%~100%分为5类,不同七组分烷烃混合气体样本的红外光谱由红外光谱仪在波数范围为4 000~400 cm-1、间隔12 nm的条件下扫描获得。在未经过特殊预处理和特征提取的情况下,采用随机选择的4 500个样本,由SDP-VGG法建立的七组分混合气体甲烷浓度范围识别模型,对5种甲烷浓度范围的识别准确率达到91.2%,优于相同红外光谱数据所建立支持向量机(support vector machine, SVM)和随机森林(random forest, RF)模型的识别准确率88.7%和86.2%。研究表明, SDP结合深度学习可以准确提取红外光谱数据的关键特征,提高了红外光谱识别的准确率,是一种更为有效的红外光谱分析方法,具有广阔的应用前景。