摘要
准确的预测模型在光谱定量分析中起着非常重要的作用。针对小样本集空间信息匮乏、信息分布不均衡所造成的模型预测误差偏大的问题,基于传统多分布整体趋势扩散(MD-MTD)方法提出混合整体趋势扩散技术(Hybrid-MTD)构建虚拟样本空间,进一步扩充训练样本集,改善样本集空间的信息分布,从而显著降低模型的预测误差。分别利用全血样本的总胆固醇和甘油三酯光谱数据集进行对比实验验证。实验结果表明,基于添加虚拟样本后重构的数据集建立的偏最小二乘预测模型能够获得更低的平均预测均方差(MRmesp)。总胆固醇和甘油三酯的MRmesp分别为0. 41和0. 45 mmol/L。对比MD-MTD方法,误差分别降低了46. 7%和22. 4%。可见,所提出的Hybrid-MTD方法能够构建数量适宜的高质量的虚拟样本。填充后的样本集所对应的预测模型显著降低了预测误差,与现有的MTD方法相比具有更加优越的预测性能。混合整体趋势扩散技术在在血液光谱分析的应用有效提升了评估生理指标的质量,加快心血管疾病的筛查速度并降低其风险。
- 单位