一种强而有力的研究手段能够鉴定遗传变异和生物学特征之间的关联,改变科学家对复杂性疾病及其治疗方法的理解。
早在二十年前,罗伯特·克莱因(Robert J. Klein)等人就在《科学》(Science)杂志上发表了一篇具有里程碑意义的论文,描述了最早的全基因组关联研究(GWAS)之一。这种基因组学方法彻底改变了科学家识别个体遗传背景(基因型)和个体特征(表型)之间关联的能力,尤其是在疾病背景下。复杂性疾病——譬如糖尿病、关节炎、癌症和痴呆——构成了极大的公共卫生负担,是由遗传因素和环境因素间的相互作用引起的。通过了解复杂性疾病的遗传结构,科学家能够弄清楚引发这些疾病的生物学过程,定位相关组织,找到药物靶点和治疗方法,并识别出具有相似疾病风险特征的个体群体,以便进行精准干预。
遗传变异可以通过基因型分型或是测序技术进行分析,这些技术依赖于人类基因组参考序列。在全基因组基因型分型技术出现之前,复杂性疾病的遗传学研究主要集中在单个候选基因和单个遗传变异上,这限制了研究的发现潜力。全基因组连锁研究在有多个患病成员的家庭中,分析了散布在基因组中的少数遗传标记,但这类研究往往分辨率不足,结果的可重复性也不高。
尽管GWAS的概念已经被提出多年,也有早期研究识别出单核苷酸遗传变异和心脏病风险之间的联系,但克莱因及其团队在2005年发表的研究中首次报告了遗传变异和生物学特征之间存在统计学上显著的强关联。研究中,作者们利用全基因组基因型分型技术比较了96位年龄相关性黄斑变性(AMD)患者和50位无症状对照者基因组中超过10万个遗传变异的频率。
AMD是导致严重视力丧失的主要原因之一。预计到2040年,全球范围内AMD患者数量将达到2.88亿。早期AMD的生理病理学表现是眼球视网膜下出现细胞外脂质、矿物质和蛋白质沉积,这些沉积物被称作玻璃膜疣。研究表明,AMD具有较强的遗传特征,遗传因素可以解释高达71%的AMD严重性变异。这一遗传率高于大多数与年龄相关的复杂性疾病。在克莱因及其团队的研究发表前,AMD的遗传关联研究都是基于候选基因方法和家族连锁研究,但在识别致病基因方面取得的成果有限。
克莱因等人在他们的全基因组关联研究中发现了AMD风险与染色体上的编码补体因子H(CFH)基因内的遗传变异具有强关联。尽管研究中的样本量较少(AMD患者只有96人,对照者仅50人),但统计学上的关联性非常强,P值小于5 × 10?8——这是GWAS中广泛接受的显著性阈值。这一显著性水平体现了该遗传变异对AMD风险的影响很大。
CFH蛋白参与调控补体系统,该系统能起到抗感染作用。研究者在患有AMD的人类和小鼠的玻璃膜疣中都观察到了补体系统成分,这提示AMD可能是由异常的炎症活动引起的,包括不适当的补体激活。自克莱因及其团队的论文发表以来,全球最大的公共GWAS数据库GWAS Catalog又收录了30余篇AMD相关的研究。CFH基因所在基因组区域的疾病关联性目前已经被反复验证,P值低至惊人的4 × 10?421——这已经远远超过了2005年研究中报告的显著性水平,主要得益于大样本量带来的统计效能提升。
克莱因及其团队的论文不仅在AMD研究中具有开创性,也对整个复杂性疾病遗传学领域产生了深远影响。该研究促进了多个第一代GWAS的设计,尤其是威康信托病例对照联盟(WTCCC)计划,帮助定义了全基因组数据处理、分析和报告的金标准。研究者还更好地理解了整个基因组中遗传变异之间的关系,并进一步开发统计技术来推断未直接研究过的变异基因型。这些研究进展使得多个GWAS能够以荟萃分析的框架结合起来,进一步增加了统计学效力,并带来数十万项关于广泛复杂性疾病遗传关联的稳健发现。
国际合作是GWAS成功的基石。许多国际联盟因此而成立,每个都专注于特定表型,通过整合所有可用数据以促进最大化发现。大规模生物样本库(记录了包括基因组和表型数据在内的生物样本)的出现极大地增加了样本数量。这使得研究者能够在全球范围内对数以百万计的个体的全基因组数据进行荟萃分析。
尽管取得了这些进展,GWAS领域仍存在显著短板,即参与这些大型研究的人群多样性不足。当前,大规模全基因组测序使得研究相对少见的遗传变异成为可能,而将环境风险因素整合入GWAS分析中也有利于揭示基因和环境之间的相互作用。
过去二十年的GWAS使得科学家对复杂的人类疾病遗传风险因素有了更深入的理解。复杂性疾病可能由数千个具有小效应的遗传变异所驱动。识别这些变异,揭示相关的基因和通路,有助于提供有关健康和疾病的洞察。这使得药物靶点的识别成为可能,也有助于更好地理解如何调节这些基因、基因产物或通路以应对导致疾病的失调过程。将GWAS数据与人体组织的详细分子特征研究相结合,还可以靶向疾病发生和发展中特定的细胞种群。
GWAS的发现具有转化潜力,能够改善人类健康状况。这些生物学发现能够带来新的药物靶点以及“老药新用”的机会。事实上,具有人类遗传学证据的候选药物在临床试验中成功的可能性要比没有相关证据的药物高2.5倍。基于遗传学风险评估对患者进行分层能够进一步个性化地帮助个体匹配正确的治疗方案,这也被称作精准医学。
此外,GWAS能够支持预防性医学(而非反应性医学)的发展。遗传生物标志物能够用于识别出可能从干预措施中受益的个体,以延迟、阻止甚至预防疾病的发生。基于遗传风险评分的精准预防方法,结合临床或其他生物标志物时,可针对高风险个体进行定向筛查,以预防疾病或防止发展为严重并发症和其他共存慢性病。这些方法对于制定公共卫生战略而言也有重要价值。二十年来,GWAS持续深化了对复杂性疾病背后原因的理解,推动了临床转化路径的发展,从而实现了人类健康水平的实质性提升。
资料来源 Nature