摘要

为构建一个面向幕墙企业和用户的产品营销和运维服务平台,本文设计并实现了面向幕墙的知识问答功能模块,此模块的主要内容包括基于爬虫的数据收集模块、用于知识库的构建与维护、敏感词过滤和基于Jieba分词等自然语言处理技术实现的数据预处理模块、基于Doc2Bow构建稀疏向量、文本相似度计算模块、知识问答功能实现模块。从而可以给用户提供问题的答案,比较迅速的满足用户的查询需求,节省用户在网页中寻找准确答案的时间,提高寻求答案的效率。

  • 单位
    南开大学滨海学院