为了更精准地在海量信息中检索目标,笔者在前人研究基础上提出了一种中文语句相似度的层次递进算法。中文语句相似度综合考虑了无序相似度及有序相似度两个因素:无序相似度通过中文语句切词后得到具有相同或相近词义的词语比例;有序相似度则是计算语句各成分位置词相似度。其中,还考虑了句型转换因素及语句语气参数的修正,如此层层递进得到中文语句的相似度。最后通过实验对比验证其合理性。