摘要
太赫兹生物医学是当前光谱研究领域的前沿热点,其主要难点在于如何在有效避免水分干扰的同时,实现复杂生物体系组分的精准分析。太赫兹光谱产生于分子振动的信息,其吸收谱较弱,吸收峰严重重叠,且多组分复杂样品的太赫兹光谱往往不是各组分光谱的简单叠加,难以用传统的峰高、峰面积标定技术进行定量计算。但采用多元校正技术可以方便地实现太赫兹光谱的定量分析,使太赫兹光谱成为一种快速、简便且适用范围广泛的分析技术。以KCl和NaCl的无机盐混合体系为典型研究体系,两种组分的浓度范围均为0.1~2 mol·L-1,浓度间隔为0.1 mol·L-1。获取20组浓度配比不同的混合溶液的吸收系数和折射率,巧妙利用水溶液体系中无机金属离子的水合氢键作用,由此采集无机盐溶液体系的太赫兹时域光谱,提取各组分的特征信息,建立多尺度数据驱动的定量分析模型,有望实现水溶液中无机金属离子的定量分析。针对太赫兹光谱数据规模大、基质干扰强及数据关联复杂等特点,构建复杂二维小波变换、多变量筛选、贝叶斯数据挖掘、深度学习和数据关联性分析技术为一体的算法数据库,由此构建基于多尺度数据驱动的太赫兹光谱解析方法。论文依据正交实验的原则,构建具备良好数据结构特征的混合溶液数据集,引导后续的光谱解析方法准确提取无机金属离子水合氢键信息。在此基础上,发展自适应算法,寻找光谱数据变量与浓度间的关系,并采用变量筛选技术,从原始光谱数据中提取无机盐水合氢键的特征信息,最终构建浓度与特征信息之间的数据驱动模型。计算结果表明, KCl和NaCl组分的预测误差分别为8.0%和9.1%,能有效满足大部分应用的检测精度要求。多尺度数据驱动模型方法充分利用太赫兹光谱信号的时域和频域多尺度特性,实现数据预处理与多元校正的一体化运算以避免重要信息丢失,具备高度自适应特征。因此,基于数据驱动建模的太赫兹光谱分析新方法为太赫兹生物医学研究提供了新思路。
-
单位电子工程学院; 天津大学; 精密测试技术及仪器国家重点实验室