向量空间模型是有代表性的信息检索模型之一,针对该模型存在的问题进行了研究和探讨。在仅用统计词频表示文档向量方面,引入知网作为语义知识库,提出基于概念的特征选择模型;在因词语的同义和多义,不能满足文档向量相互独立方面,提出潜在语义索引模型。实验验证了改进后的检索模型更能体现文本的内容,降低文本向量的维数,提高检索的准确率。