在基于Lucene全文检索技术的商品搜索系统中,利用文本相似度算法来计算商品信息和关键词的相似程度,并以此对商品搜索结果排序,但是排序结果往往不尽如人意。通过分析商品信息数据的结构特点以及商品词条存在同义词的情况,在部分文本相似度算法的基础上,结合同义词词林的原子词群分类,设计一个适合于计算商品信息相似度的算法,用于提高商品搜索排序结果的准确性。