摘要
目的基于网络检索词频分析"百度知道"中公众对先天性出生缺陷相关信息的需求。方法由妇产科专家与流行病学专家讨论后, 确定先天性出生缺陷相关检索词并制定检索策略, 采用Python 2.7进行网络爬虫检索, 在"百度知道"平台获得先天出生缺陷相关的提问句, 再使用R 4.0.2软件进行文本数据处理, 完成关键词的语义分析与词频统计分析, 并绘制词云图和极坐标图来描述关键结果。结果在"百度知道"平台中共检索到16 668条不重复的提问句, 语义词词频数为15 371, 其中, 先天出生缺陷相关疾病名称与症状词频数占35.02%。此外, 先天性心脏病相关词频构成比最高(26.09%)。出生缺陷检索词主题分析结果显示诊断和治疗语义词的平均词频数(49.55)明显高于病因及预防相关语义词平均词频数(12.47)。此外, 检查、原因、治疗、发育、遗传等关键词在七类系统畸形相关语义词中的出现频率均较高。结论我国公众对于先天性出生缺陷相关的疾病、及其病因、预防以及治疗方面的信息需求较高, 其中尤以先天性心脏病在疾病相关词频中占比最高。
-
单位公共卫生学院; 首都医科大学附属北京儿童医院; 首都医科大学