摘要

针对传统关键数据提取模型提取准确率和召回率双低的问题,建立了一个新的船舶航线数据库关键数据提取数学模型。该模型首先需要构建一个分类器,利用分类器将数据库中的数据进行分类;然后将四叉树、R-树相结合构建一个复合型OR-树结构关键数据索引;最后利用建立好的关键数据索引在分类好的数据中提取关键数据。结果表明:与利用主成分分析或粗糙集理论建立的提取模型相比,利用本次构建的模型进行关键数据提取,提取准确率提高3.3%和9.4%,召回率提高6.2%和7.9%。

  • 单位
    宣化科技职业学院