摘要
目的 利用带有缺失基因型观测的家族关联数据(correlated family data, CFD)和全基因组关联研究(genome-wide association study, GWAS)探索阿尔茨海默病的潜在致病基因及关联强弱。方法 研究人群来自华盛顿高地-英伍德哥伦比亚老龄化项目(Washington Heights-Inwood Columbia Aging Project, WHICAP),该项目收集了先证者的基因型信息,并通过调查访谈收集了先证者及其家庭成员的人口统计学信息。本研究纳入352名先证者和820名关联家庭成员共1172人,首先利用家族结构信息和孟德尔遗传定律估计家庭成员缺失基因型的概率分布,然后应用混合效应logistic回归模型,并利用极大似然估计和EM算法估计基因效应值。最后,将分析结果分别与仅用先证者信息的logistic回归模型和使用主成分校正的模型进行对比。结果 该GWAS+CFD研究新发现了7个显著的单核苷酸多态性(single nucleotide polymorphisms, SNP)位点,其中4个SNPs对应已知的基因位点,分别为rs7918428(DNAJC12,OR=2.362,P=1.82×10-9),rs6135509(MACROD2,OR=2.238,P=7.40×10-9),rs4750496(FRMD4A,OR=2.454,P=1.12×10-8), rs4721323(MAD1L1,OR=1.593,P=2.04×10-8),另外3个为新发现的SNP位点:rs764009(OR=2.321,P=2.23×10-8),rs7593443(OR=1.745,P=2.83×10-8)和rs2170560(OR=2.603,P=3.11×10-8)。相比于其他方法,本研究提出的方法能获得最小的基因膨胀系数(λ=1.007)。结论 本研究提出了一种新型混合效应logistic回归模型来进行带有缺失基因型观测的家族关联数据全基因组关联分析,通过加入多层随机效应有效控制了混杂因素,能显著提高检出遗传变异的能力。该方法发现了多个阿尔茨海默病的潜在致病风险位点,将有助于后续的疾病通路探索,也为疾病检测和治疗药物的研发提供了更多可能性。
关键词
阿尔茨海默病 /
家系研究 /
全基因组关联研究 /
缺失数据
中图分类号
R195.1
王敬元, 张翌玺, 宋倩倩, 梁宝生.
带有缺失基因型观测的家族数据全基因组关联研究. 中国卫生统计. 2024, 41(05): 705-708+714
{{custom_sec.title}}
{{custom_sec.title}}
{{custom_sec.content}}
基金
国家自然科学基金青年项目(11901013); 北京市自然科学基金青年项目(1204031); 中央高校基础研究基金(BMU2021RCZX023); 北京大学人民医院研究与发展基金临床医学+X培育项目(RDX2021-05)