摘要

当前,利用非结构化数据进行信息提取是地理信息领域的研究热点。针对这一热点,本文提出了基于中心向量的KNN分类方法。首先,对向量空间模型的特征项选择及权重计算方法进行了改进;其次,利用KNN算法对非结构化数据进行了分类与排序;最后,以与郑州市相关的200篇网络资源为非结构数据语料库进行验证。实验表明:该方法能够有效地提取非结构数据的城市属性信息,计算效率较高,实用性较强。