摘要

入侵物种空间分布建模的核心数据源来源于物种多样性采样(物种出现点和未出现点),然而,大多数入侵物种标本库只记录物种出现点样本信息,缺乏对未出现点(负样本)位置的记录。因此,生成有效的入侵物种虚拟负样本是建立物种空间分布模型的关键。本文提出了一种基于地理环境相似度的虚拟负样本生成方法。首先利用主成分分析(PCA)方法对地理环境原始变量进行线性相关性建模,基于提取的主成分,采用K-means算法对入侵物种样本进行聚类分析并计算各样本的地理环境相似度。在此基础上,通过建立基于主成分的入侵物种相似性度量与可信度计算框架来识别虚拟负样本。以长江经济带入侵物种一年蓬(Erigeron annuus)数据集为例,分析了整个区域虚拟负样本的可信度。结果表明,与空间随机采样和单类支持向量机采样相比,用本研究提出的方法生成的样本数据建立的logistic回归和支持向量机预测结果更优,验证了该方法的可行性与有效性。基于地理环境相似度的虚拟负样本抽样策略有助于解决由于随机采样而引起的误采样到潜在入侵点的难题,同时负样本的可信度能有助于识别不同等级的入侵物种适应区。