基于近红外和化学计量学方法对金线莲快速鉴别及其多糖含量测定的研究

作者:张勋; 黄晓萱; 殷金可; 陈艳成; 林羽; 王晓颖*; 许文*
来源:中国现代应用药学, 2023, 40(19): 2702-2712.
DOI:10.13748/j.cnki.issn1007-7693.20223221

摘要

目的 建立近红外分析方法结合化学计量学算法对金线莲及其近缘品进行判别分析,进一步构建金线莲多糖含量快速预测模型。方法 采集金线莲药材及其近缘品台湾银线兰、血叶兰样品的近红外光谱。以分类准确性为指标优选光谱预处理方法,分别对比决策树、K-近邻算法、随机森林,偏最小二乘回归判别分析、线性判别分析和支持向量机等有监督模式识别算法对样品的分类效果,优选最优算法建立定性模型。应用紫外可见分光光度法结合苯酚硫酸法测定76批金线莲多糖的含量,分别应用支持向量机、极限学习机、决策树、随机森林、主成分回归和偏最小二乘回归等6种不同化学计量学方法关联金线莲多糖含量与近红外光谱,优选定量算法;经光谱预处理和波段选择,基于连续投影算法筛选波段变量数优化并建立金线莲多糖定量模型。结果 以SNV+SG+2ndD为光谱预处理方法结合支持向量机建立的近红外光谱判别分析模型分类准确性最高;基于径向基核函数算法结合混淆矩阵和ROC曲线评价模型的预测性能,模型性能均较优。此外,金线莲近红外原始光谱经SNV+SG+2ndD预处理,以7 000~4 000 cm–1为建模波段,变量数为97,应用连续投影-偏最小二乘构建的定量分析模型准确度较其他算法最高,为0.992。模型的校正集误差均方根为0.625,校正集相关系数为0.993,验证集误差均方根为0.767,验证集相关系数为0.992,预测偏差为8.467,预测集相对偏差<10%。结论 所建立的近红外支持向量机定性和连续投影-偏最小二乘定量模型准确、可靠,可鉴别金线莲真伪以及测定多糖含量,为实现金线莲质量的快速评价提供一种新的方法。

全文