机场服务信息抽取方法研究

作者:吴彬林; 梁磊; 张彪; 缪杨帆; 李川
来源:现代计算机(专业版), 2016, (17): 9-15.

摘要

社交网络作为新的信息媒介具有海量、实时、语义丰富等属性,为机场的服务相关信息的获取提供广阔的平台,对提取文本数据进行分析以供机场服务部门改进服务具有重要意义。利用社交网络提供的搜索API获取与机场相关的数据,继而通过人工标注的方法,标出其中与机场服务的相关性。在标注后的数据上利用SVM分类算法进行训练,训练出一个二分类模型,针对数据分布极其不均匀的情况,提出对训练数据中的数据比例进行人为干预的方法,以提高模型的性能。该模型能够从与机场有关的社交数据中分类出与机场服务相关的数据,并且通过实验表明改进后的方法的准确性。