为了提高唇语识别的精度,研究提出了改进的话题相关的统计语言模型。基于关键词的基础上,通过主题词来划分话题,采用改进的场景训练语料设计与参数估计方法,将不同的话题的场景训练语料表示为整个场景训练语料库的模糊子集,参数估计也利用不同的话题的模糊训练集获取。改进方法较好的缓解了普通语言模型训练语料不足而引入的数据稀疏的问题,对场景训练语料与话题之间的联系强度给出了定量描述。