摘要

随着互联网的迅速发展,数据越来越多,分析数据愈发困难。为给山西省职业教育大数据分析与决策平台提供大量且准确的数据,首先要将不同文本中的数据进行整理,其次将数据名称与已经命名好的指标进行匹配,进而实现数据与指标的匹配。基于此,本文采用了编辑距离算法,该算法以单个字符为单位进行编辑距离测算,通过计算从原字符串转换到目标字符串所需插入、删除和替换的数目,得到原字符串与目标字符串的相似度,进行字符串之间的匹配,进而解决了数据与指标匹配的问题。

  • 单位
    太原师范学院

全文