基于SiPLS-SPA波长优选的血红蛋白定量分析研究

作者:高西娅; 张朱珊莹*; 卢翠翠; 蒙泳吉; 曹汇敏; 郑冬云; 张莉; 谢勤岚
来源:光谱学与光谱分析, 2023, 43(01): 50-56.

摘要

血红蛋白是人体的一项重要生理指标,浓度异常会导致人体产生各种疾病。红外光谱技术具有简单、无损、快速等优点,非常适合用于生理参数的定量分析。由于光谱背景复杂、有效信息弱,如何提取有效特征变量,构建精准定量模型是个难题。针对此问题,以血液样本和血红蛋白仿体溶液样本光谱数据为研究对象,采用SPXY法、 K_S法、 duplex法、等间隔划分法四种数据集划分方法划分数据并通过建模对比,优选出最佳数据集划分方法为SPXY法。遍历了SavitzkyGolay一阶求导滤波(S_G1)+小波变换、小波变换+S_G1、标准正态变量变换(SNV)+S_G1三种预处理方法,优选出SNV+S_G1预处理方法。结合串联思想,提出组合区间偏最小二乘法(SiPLS)与连续投影算法(SPA)串联的特征波长优选方法,构建SiPLS-SPA-PLS预测模型,用两组数据对模型进行验证,依据评价指标判断模型的优劣,并与全谱PLS, SPA-PLS和SiPLS三种定量模型相比较。实验结果表明:(1)使用SiPLS-SPA-PLS模型进行定量分析,血液样本的Rc,Rp, RMSEC和RMSEP值分别为0.993 6, 0.990 6, 0.199 2和0.184 6,仿体溶液样本的Rc,Rp, RMSEC和RMSEP值分别为0.998 9, 0.998 5, 1.848 9和2.007 4。相比全谱PLS, SPA-PLS, SiPLS三种定量模型,Rc和Rp值最大,RMSEC和RMSEP值最小,该模型最优,可以更精准地实现血红蛋白的定量分析。(2)SiPLS-SPA-PLS定量模型能更加准确地筛选最优波段,两种样本筛选出来的有效波段分别为血液(1 144~1 264, 1 606~1 798 nm)、仿体溶液(1 018~1 390, 1 600~1 700 nm),剔除掉仪器的影响因素,大致相同,此方法可以精准优选出特征波长。(3)该模型可以提取有效变量,去除无用噪声影响,血液样本从全谱的700个光谱变量中优选出28个,仿体溶液样本从全谱的1201个光谱变量优选出41个,提高检测速度和预测效率。该方法为血红蛋白快速精准检测提供了一种思路。

  • 单位
    生物医学工程学院; 中南民族大学; 医学信息分析及肿瘤诊疗湖北省重点实验室