摘要
本发明公开了一种基于编辑距离的字符串模糊匹配和查询方法,包括以下步骤:先按照段落中字符串的长度对查询串依次进行划分,得查询串子串集合,当段落内的字符串与查询串中的字符串相匹配时,则该字符串对应索引的原字符串的匹配度加上该字符串的长度,当该字符串的匹配度大于预设上界值时,且该位置列表中没有重复的元素时,则将该字符串添加到结果集合中,否则,则对该字符串进行编辑距离的验证;当该字符串的匹配度小于预设下界值时,则直接过滤掉该字符串;当该字符串的匹配度在预设下界值与预设上界值之间时,则对该字符串进行编辑距离验证,该方法能够反映不同长度段落对匹配结果不影响的不同,同时编辑距离验证操作次数较少。
- 单位