分析表明,医学中应用大量使用自然文本语言,为方便计算机分析,往往需要对其中的关键信息进去抽取,并将其表达文字规范化,从而使文本匹配成为广泛关注的技术问题。基于深度学习技术,阐述embedding表达的方案,迭代演进的数据扩展等,提出一种文本匹配的模型框架和数据扩展方法,通过多次少量的增量标注大幅度扩展可靠标签数据,使得模型的准确率大幅提升,从而满足应用要求。