摘要
土壤环境中部分样本重金属的浓度常处于痕量级别而低于检测方法的检测限(limit of detection/LOD),因此难以定量其浓度,此类含有低于检测限信息的土壤样本数据属于左删失数据,且该类数据常符合对数正态分布,目前为止对单指标删失数据的参数估计较为常见,但鲜有对二维删失数据相关性估计的报道,本文基于极大似然法(MLE),通过构建不同情形下的似然函数,提出了删失数据相关性估计的方法。分别研究了样本容量、删失比例、总体相关系数与干扰项等因素对估计值准确性的影响。同时,将MLE与替换法(通常将删失部分替换为LOD或LOD/2)和删除法(直接将删失部分删除)做对比,检测了MLE的精准度。以澳大利亚土壤普查数据作为实例对方法进行了实例应用。结果表明:(1)样本容量越大,研究中的MLE的结果越准确,当样本容量达到2000时,估计值具有较好的稳定性,且受删失比例影响较小。(2)MLE的相关系数估计值随删失比例(0%~90%)与总体相关系数变化程度较小,具有渐进无偏性和一致性。(3)添加干扰项对MLE的准确性影响较小,表明其具有较强的鲁棒性。(4)随着删失比例的提升,MLE精确性明显优于删除法和替换法。(5)实际数据的应用结果表明澳大利亚土壤普查数据中,Ag与Hg有着较高的相关性,Hg与Hf之间相关系数几乎为0。本研究方法有较好的估计性能,实现了土壤环境痕量物质信息的合理利用,为该领域删失数据的相关系数估计工作提供了可行的方法。
- 单位