分析了几种常见分词算法的优缺点,简述了自动分词算法模型以及其应用领域,基于现有分词算法的局限,提出了一种基于字符串和统计分词算法相结合的自学习分词算法,并将此算法成功应用于科技项目查重系统中,实现便捷、快速、准确的一种有效检测手段,为进一步实现科研项目查重系统更智能化、更科技化打下基础。