血红蛋白定量分析的数据集划分及预处理方法研究

作者:张朱珊莹; 蒙泳吉; 曹汇敏; 张莉; 郑冬云; 谢勤岚
来源:中南民族大学学报(自然科学版), 2022, 41(04): 454-458.

摘要

采用近红外光谱法对血红蛋白进行定量分析时,数据集划分与预处理方法直接影响定量模型的预测精度.以120份不同浓度血红蛋白仿体溶液的光谱数据为研究对象,研究随机法、间隔划分法、KS法、Duplex法、SPXY法5种数据集划分方法对PCR、PLS定量分析模型预测精度的影响;研究27种预处理方法对PCR、PLS定量分析模型预测精度的影响,预处理组合时考虑组合顺序的影响因素.实验结果表明:PLS模型最优的数据集划分方法是SPXY法;PCR模型最优的数据集划分方法是间隔划分法. 27种预处理方法,PLS模型和PCR模型优选出的最佳预处理方式均为SG+DOSC.此时,PLS模型的RMSEP值为3.5532;PCR模型的RMSEP值为14.9032.研究结果为此类光谱数据的处理提供了一种思路和方法.

  • 单位
    中南民族大学; 医学信息分析及肿瘤诊疗湖北省重点实验室; 生物医学工程学院