摘要

目的 建立并优化适合于脑血管病基因组学数据分析的生物信息流程,促进脑血管病多组学和精准医学研究的开展。方法 调研和梳理临床科研需求,参考脑血管病以及群体遗传领域基因组学、遗传学研究,总结常用分析方法。按照研究目标和分析内容的不同,对生物信息学流程进行模块化设计。依托中国国家卒中登记Ⅲ(Chinanationalstrokeregistry-Ⅲ,CNSR-Ⅲ)研究产生的基因组学数据,在高性能运算集群(浮点运算能力375万亿次/秒)进行分析流程的搭建、测试和优化。结果 本研究搭建的生物信息学分析流程,包括数据质控、关联分析、连锁分析、遗传变异注释、跨组学分析等多个模块。通过使用相应模块对上万例CNSR-Ⅲ样本的基因组学数据进行质控和分析,最终确认10 241例数据质控合格、无3度以内亲缘关系的全基因组测序样本用于全基因组关联分析。结论 结合脑血管病的特点,优化生物信息学分析流程,可以为脑血管病多组学研究提供数据保障,提升研究效率,为脑血管病风险评估、诊断与个体化治疗提供依据。