摘要

本发明公开了一种职位构图和自动聚类方法。此方法适用于大规模网络职位数据的分类。本发明首先预定义一套职位特征模板。然后从招聘网站中收集半结构化的职位样本数据,提取特征信息填充职位模板,并提取公司类型信息,同时利用网页链接信息构造职位网络。对职位网络采用随机游走采样得到样本路径,再利用语言模型训练节点的分布式表示。最后融合职位节点的分布式表示和结构化特征信息,采用K-means算法进行聚类。