摘要
评价形容词在句子中做定语时,语义指向有多种可能性,计算机自动识别的难度较大。首先,基于500条样本语料的考察分析,把评价形容词定语的语义指向对象划分为定语中心语(36%)、主语(41%)、其他句子成分(23%)三种基本类型;然后,基于词义特征、句法模式、语义框架等,把三种基本类型拆解为十二种下位类型;接着,用机器可读的形式语言表示十二种下位类型,建立"评价形容词定语语义指向识别与抽取"规则簇;再次,选取1000条测试语料开展对比实验,评价对象抽取的准确率、召回率、F值均提升20%左右,三项评价指标均达到85%以上;最后,对系统匹配错误和未匹配的句子进行分析,提出做好中文评价对象抽取任务需要加强语言本体的深入研究。
-
单位许昌学院; 中国传媒大学