摘要

利用隐马尔可夫模型建立一种在信息抽取过程中对规则进行数值编码的方法,用来提高信息抽取的效率.在对规则中的标记进行编码的过程中,利用此方法可使string匹配方法中O(n2)级的时间复杂度降低为O(n)级.采用学习的方式来进行规则的生成,这种规则学习的方式使系统的可移植性大大增强.