摘要

针对传统搜索引擎算法搜索内容需要占用大量人工劳动进行标记,反馈信息和用户搜索信息匹配度低,无法理解人类语言输入等缺点,文中结合自然语言算法对信息的整合过程及理解用户语言过程进行优化。通过建立语料库、提取文本特征信息和模型训练等方法,提出了适用于智能搜索引擎的新型检索算法。文中在CSI语料库、AWS爬虫数据等数据集中进行了测试,测试结果表明,该算法只需进行前期的人工干预和标记,便可以自行搜集专业信息并自行展开机器学习和训练,从而降低维护及使用成本。