摘要

大数据环境下,对上市公司风险事件相关的多源异构文本数据资源进行有效的挖掘和聚合,使其收敛于高质量的金融知识服务,对于提升证券投资分析、资产风险管理、证券市场监管等金融管理决策的效果和效率有着重要的意义。文章以文本挖掘、知识组织和知识服务等领域的理论、方法和技术为基础,构建了基于句子语义挖掘的上市公司风险事件知识聚合模型,该模型由数据采集与数据预处理模块、知识获取与知识组织模块、知识利用与知识服务模块所构成。文章通过构建并利用中文金融情感词典来提取上市公司风险事件相关的临时公告和新闻报道,应用LDA模型和BERT模型来挖掘句子的语义特征,并利用凝聚层次聚类算法来实现句子的聚类,然后选择重要度高的句子生成上市公司风险事件的主题报告。