摘要
为更好地评价我国的交通运输基本能力与交通运输服务水平,提出了基于文本分析算法和情感分析算法的公众评议指数计算模型。针对我国交通运输客货运、重大事件、重大安全事故等方面的公众评议,基于共享交通平台、在线票务平台、出行服务平台、电子商务平台、社交媒体平台5类数据源上发布的交通运输相关内容并综合公众对于其提供的直接或第三方服务的评价、意见、投诉等,利用网络爬虫等方式收集数据,对数据进行了预处理并基于领域、内容、情感分析器对模型进行了训练。通过对不同的领域及内容赋予权重,将文本中的情感值和领域内容方向的权重相结合,得到相关评议指数。以马蜂窝平台中的问答数据为例,通过基于大数据的评议指数计算模型对客运相关企业进行了指数评议。分别验证了综合评议指数计算框架中提出的领域、内容、情感3个分类器的有效性。实例分析结果表明:该模型较传统指数计算模型,对于信息的挖掘更加深入,能够简单、高效地完成模型的训练并达到较高的分类准确率;在后续增量数据的补充过程中,可以克服因初始样本不足导致的信息不足问题,能够作为对传统评价指标的补充,在实际应用中具有可行性。
-
单位交通运输部规划研究院