本研究对存在网络伪健康信息的文章进行分析,利用python爬取微博及微信伪健康文章,采用LDA(隐含狄利克雷分布)主题模型和情感分析,挖掘其主题特征及不同情感倾向,最后基于健康信息质量评价体系构建伪健康文本主题模型,挖掘伪健康信息的文本和情感态度特征及两者潜在关联,为建立健康信息自动过滤机制、改善网络健康信息环境,提升健康信息质量提供有益参考。