摘要

拉曼光谱是一种已广泛应用于化学、生物学和物理学的技术。然而拉曼光谱仪的电荷耦合器件很容易受到宇宙射线的影响,从而产生随机的窄带宽、高强度的spike。在真实样品中出现概率较低,约为千分之一,但一旦出现将严重降低信号对比度。该研究提出一种实用的spike剔除算法。该算法对中值滤波后的数据与原始数据作差,得到偏差数据。用分位数的方法将偏差数据从小到大排序,取中间99%数据作为真实数据作高斯分布拟合。根据spike强度高,稀疏的特性,以光谱中高强度数据的出现概率作为阈值标准剔除spike。最后以中值滤波结果带入原始数据代替spike,从而最大程度还原样本原始信息且不需任何调试参数。以加入不同强度spike的拉曼光谱作为验证对象,实验结果表明本算法对spike检测与去除的灵敏度可以高达99.5%。本算法同时适用于一维拉曼光谱、二维拉曼图像和三维拉曼数据立方体,且算法表现随着维度的增加而提高,一维spike剔除算法能检测超过最大峰强度40%的spike,而在三维拉曼数据立方体中,超过峰值20%的spike即能被检测出。用该算法对40 000条真实拉曼光谱进行处理,可以在不扭曲真实信号的情况下有效地剔除spike,进一步证明了算法的实用性。

  • 单位
    航天学院; 化学化工学院; 固体表面物理化学国家重点实验室; 厦门大学