摘要

传统的贝壳检测方法对新旧贝壳的分类精度低,样品破坏程度大,稳定性差,而太赫兹光谱又缺乏可直接人工分辨的特征。为此,提出一种基于太赫兹时域光谱和机器学习的新旧贝壳识别方法。首先采用太赫兹时域光谱系统(THz-TDS)技术,研究新旧贝壳太赫兹时域光谱、频域光谱、折射率谱和吸收谱特性。然后使用主成分分析法(PCA)在满足所有主成分的累计贡献率达到80%以上的原则的前提下,提取光谱的特征数据。4种光谱分别提取4、4、5和4个主成分,最后使用Adaboost对主成分进行多维特征融合,将融合后的主成分作为支持向量机(SVM)模型的输入用于识别新旧贝壳的种类,其中通过3种核函数(Linear,Polynomial,Radial Basis Function)的对比分析,选出最佳核函数为Radial Basis Function。结果表明:在使用Radial Basis Function核函数,参数C为2.1、σ为4.4的情况下,PCA—Adaboost—SVM模型对新旧贝壳识别准确率可达到98%。通过与BP神经网络、偏最小二乘回归法(PLS)和主成分回归分析(PCR)方法的比较,PCA—Adaboost—SVM方法具有更高的准确性和更稳定的性能,同时也说明采用太赫兹时域光谱系统技术结合机器学习方法可以精准鉴别新旧贝壳种类。