摘要

该文介绍了分词算法与关联规则算法的相关理论,分析了数据仓库的设计过程,详细叙述了数据仓库的设计步骤以及感想。该系统是从对自然语言的分析来设计整个方案的,系统中包括了分词、权重计算、搜索最优答案和整理数据库等模块。其中分词算法采用了基于词典的双向分词算法;对权重的计算采用了TF-IDF算法;根据权重和关键词匹配搜索最优答案。该系统在准确性和智能性方面相对较高,并具有一定的参考价值。

  • 单位
    潍坊科技学院