摘要
本文提出了一种依据多个来源的网络信息计算用户的人格特质的方法。对高校等能获取用户网络访问日志的机构,先收集用户一段时间内所访问的URL地址;然后使用爬虫技术提取用户访问网页的文本内容;使用情感词典计算各网站文本所体现的情感倾向;根据不同网站的特性给出网站在情感倾向上的不同权重,从而由各网站的情感倾向加权计算获得最终的人格特质评分。实验中以志愿者填写自我报告量表作为结果验证的基准数据。实验结果表明:志愿者在不同网站上表现出的人格特质不同,基于单一社交媒体的人格特质结果与真实情况有偏差。基于多源网络信息进行整体的、综合的人格特质计算方法,可以得到更准确的结果。
-
单位厦门医学院