摘要

目前,各大金融机构在日常运营过程中,会产生大量非结构化的语音或文本数据,在这些数据中往往蕴含了用户对企业产品、营销活动等最真实的反馈信息。然而,运营部门对这些数据的分析、挖掘主要依赖人工处理,工作量大,时效性不高,基于文本挖掘技术的智能化分析与挖掘能力,不仅会显著降低运营部门的日常运营成本,还能大大提升公司营销活动、产品设计的运营水平。笔者首先分析了企业运营过程中产生的文本表达特征,提出基于用户数据否定窗口的用户关键意图抽取方法,对运营文本数据进行预处理,然后采用聚类算法对数据进行归类,并提出基于关键词连接矩阵的聚类合并算法,对聚类结果进行二次合并,最后提出基于关键词评分的聚类摘要自动提取模型,抽取类簇的描述信息。最后,使用62、双12等重大营销活动期间的网络客服对话数据对模型进行验证,取得良好的效果。