摘要

Nutch是一个优秀的纯Java开发的分布式搜索引擎,但其中文分词采用的是机械分词算法,在遇到有歧义分词的句子时,分词效果不好。在此引擎上用BP神经网络改进中文分词算法,使得该引擎在中文分词上有一定的人工智能。

  • 单位
    江苏信息职业技术学院