摘要

在股权交易市场中,投资人对科学有效地发现新三板市场中,从事特定业务的公司集合的需求日益增长。新三板挂牌公司具有业务范围小、创新性高和交叉性强的特性,投资人依据主营业务找出业务相关或相似的公司集合,并进行对比分析是极为困难的工作。本文提出基于自动构建术语分类体系的方法,得到具有层次结构的公司划分结果,帮助投资人快速找到投资标的与理解公司间业务的关联。本文利用半监督方法从新三板公司年度报告的商业模式文本数据中抽取出业务术语,并根据术语相似度聚类建立术语分类体系,最后,利用公司所含业务术语决定所有公司划分的结果。本文的研究结果可以服务投资人发现股权交易市场中主流业务概念,明确概念与业务之间的映射关联,并作为选股的依据。