摘要

在大多数情况下,语言信息系统是不完备的,或者说存在某种程度的不完备,在各种实用的数据库中,属性值语言数据缺失的情况经常发全甚至是不可避免的。在语言调查与语言收集中,数据的缺失会带来很大的失误率,数据的缺失比例过大会导致数据不具有代表性和真实性,具有较大的估计偏差,甚至导致数据完全失去利用价值,因此对随机缺失的数据处理十分必要,首先,在对缺失语言数据进行处理前,了解语言数据缺失的机制和形式。其次,针对缺失的数据机制,确定追踪数据的方法,使得语言数据得到最大化的完善。