摘要

本文构建了一种以更小样本数、更少化学特征进行在线近红外建模的方法,给出了确定建模样本数的计算方式,并证明了以本方法确定的样本数及较少特征构建的烟叶化学成分指标模型,识别率与原始全样本建模模型识别率基本一致。做法是基于800个样本的样本集,采用连续流动分析仪检测样本烟碱值,对其中700个建模样本光谱进行PCA分析,通过光谱主成分得分计算霍特林T!2分布,采用不同抽样比例对整体样本T!2统计量进行多次抽样,取最接近整体样本T!2统计量的抽样比例作为近红外建模样本数,最终得出当抽取样本量为259个时与总体700个样本的T!2值变异程度基本一致,从而确定建立近红外模型的样本统计量为259个左右。该方法确定的样本数量建立的近红外模型与行业标准方法测定值不存在显著差异,所建模型精度良好,该近红外光谱模型可以快速预测烟叶的常规化学成分含量。同时,该方法无需对样本所有常规化学成分指标进行检测,可以大大节省成本,并提高工作效率。