摘要
本发明提供一种本土人格词典构建方法、系统、存储介质以及电子设备,涉及人格词典技术领域。本发明获取并预处理用户的社交媒体数据,获取每个词的语义向量表示;根据预处理后的社交媒体数据,采用统计学习方法获取第一人格描述词集;根据语义向量表示,采用深度学习算法获取第二人格描述词集;至少融合第一人格描述词集和第二人格描述词集,得到本土人格词典。本发明通过使用机器学习的方法自动抽取用户的社交媒体数据中最具代表性的词,减少了人为因素的影响,同时能够有效适应语义的演变,以及不同的语言;此外,本发明生成的本土人格词典规模能够根据具体情况具体调整,同时通过处理大规模社交媒体信息实现最全面普遍的人格描述。
- 单位