摘要
文章采用Python爬虫技术采集“去哪儿网”“百度百科”等网站上的乐山市各个区县及对应景点信息,将采集到的数据进行整理成CSV文件格式,并导入Neo4j图数据库中,从而构建了一个旅游景点的知识图谱。同时根据景点数据制作问句模板,并将这些问句模板中的问句转换成FastText模型训练时需要的数据集格式。接着创建了一个FastText模型,对训练集进行训练,生成了一个问句意图识别的分类模型。最后采用Flask Web框架搭建了一个智能问答系统,实现用户输入问句,对此问句进行中文分词、去停用词等预处理,再进行命名实体识别和将问句传入意图识别模型进行意图识别,查询知识图谱中精确的答案返回给用户。
-
单位乐山师范学院