浅析中文分词方法

作者:沈静
来源:漳州职业技术学院学报, 2016, 18(03): 45-48.
DOI:10.13908/j.cnki.issn1673-1417.2016.03.0009

摘要

中文分词是中文文本挖掘和信息处理的基础环节,而中文文本挖掘首先面临的是中文的分词问题。中文分词的方法主要有基于字符串匹配的分词方法、基于统计的分词方法和基于理解的分词方法三种,第一种分词方法简单、快捷,但对词典的完备性要求很高;第二种充分利用文本信息,但完备性较差;第三种还处于理论研究阶段。本文对现有的三种中文分词方法进行了研究和对比。

  • 单位
    漳州职业技术学院

全文