科学家利用表观遗传疗法,在不改变DNA序列的前提下调控基因表达。
表观遗传变化不会改变遗传密码本身,但通过改变DNA在细胞内的组织方式,表观遗传修饰在调控基因表达方面发挥着重要作用。
分子生物学家、诺贝尔奖得主悉尼 · 布伦纳(Sydney Brenner)曾指出:“科学进步依赖于新技术、新思想和新发现,而且严格遵循这个次序。”基因治疗领域的发展印证了布伦纳的观点。地球上一些最常见的遗传性疾病,如镰状细胞病(SCD,常伴随剧烈疼痛发作和频繁住院)和地中海贫血,其分子病因早在20世纪50年代就已经被发现。尽管基因治疗的想法可追溯至1972年,但直到2023年,科学家基于技术(包括病毒基因疗法和CRISPR-Cas9基因编辑技术)的发展才成功推出针对这两种疾病安全且有效的药物。
表观基因组编辑也经历了类似的发展历程——科学家基于近期的技术突破才将过去数十年的发现转化为实际应用。表观基因组编辑是一种基因调控技术,通过改变基因表达来恢复病变细胞的生物平衡,而不改变DNA序列。这项新技术的应用范围极为广泛,多家新成立的和已发展成熟的生物技术公司都在探索这种所谓的表观基因组编辑技术,以治疗病毒感染、控制慢性疼痛、增强免疫功能、降低心脏病风险。
表观基因组编辑从学术概念发展成为治疗手段,经历了进展停滞期和快速整合期,其间不同领域的技术进步交汇在一起。
20世纪60年代:从“遗传”到“表观遗传”
“遗传”一词具有直观的含义,即存在于DNA中的东西。遗传密码的改变会导致生物体内可观察特征的变化。例如,区分SCD患者与未患此病的人就可以靠一个基因突变——它改变了血红蛋白的分子形态———来判断。
到20世纪80年代,其他类似的表观遗传现象陆续被发现。例如,在人类和其他哺乳动物中,20 000个基因中大约200个是“印记基因”:对于其中一些基因,只有从母亲那里继承来的拷贝是活跃的;对于另一些基因,只有从父亲那里继承来的拷贝是活跃的。科学家还发现基因携带着特定的分子标记,即组蛋白和DNA上的化学标记。但这些标记的具体功能尚不明确,且当时研究基因调控的大多数学者对此并不关注。
随着时间的推移,人们逐渐意识到:基因表达中的表观遗传差异可能与基因所携带的分子标记的差异有关。例如,在20世纪80年代,科学家发现失活的X染色体上大量存在表观遗传标记(具体而言是抑制了DNA向RNA转录的DNA甲基化标记),而活跃的X染色体却不具备这些标记。然而,这项研究被当时的多数学者视为一种小众现象。表观遗传过程的研究被看作冷门领域,表观遗传修饰则被视为基因组的一个奇特但不值得深入研究的“花边现象”。实际上,当时基因调控研究者之间流行着一个玩笑:如果你无法解释细胞核中某个东西的运行机制,将其归咎于染色质(当时人们对其认知不足,于是它就成了失败时的“万能借口”)就行了。
另一方面,表观遗传因素可在不改变基因序列的情况下,改变基因行为,进而影响细胞功能,甚至生物体的外在。自然界中存在许多表观遗传修饰导致生物体外在差异的例子。例如,查尔斯 · 达尔文(Charles Darwin)曾观察到所有三花猫都是雌性。我们现在已知其原因:在所有雌性哺乳动物身上,一种被称为X染色体失活的表观遗传过程会使得一条X染色体上的基因失活,同时保持另一条X染色体上的基因活跃。在三花猫身上,携带黑色毛发颜色基因的染色体在部分皮肤区域失活,而在其他皮肤区域,携带橘色毛发颜色基因的染色体会失活。换言之,橘色毛发斑块和黑色毛发斑块在基因层面完全相同,但在表观遗传层面却截然不同。
回顾历史,我们发现,表观遗传学被边缘化的根本原因可以追溯到科学发现史上的一次偶然事件。在2000年之前,对基因调控研究感兴趣的科学家——他们认为基因调控与表观遗传过程不同——主要是基于20世纪60年代在细菌中获得的理论和发现开展相关研究的,而现在我们知道,细菌调控基因的方式比人类简单得多。整个领域围绕关于细菌基因调控的研究建立起来,许多关于DNA转录、DNA结合蛋白及DNA调控元件的重大发现也随之产生。这些元件构成了基因调控的经典模型,但它们缺失了关键一环:表观基因组中DNA和染色质包装的非编码修饰。
然而,在20世纪末,基因调控研究领域经历了一次“顿悟时刻”。这一令人眼界大开的事件源于对一种名为“四膜虫”的单细胞生物中异常蛋白的研究,该蛋白被证实可以在组蛋白上添加化学标记。令所有人惊讶的是,科学家在另一种单细胞生物酵母中也发现了该蛋白的同源物,而研究表明该同源物是激活基因所必需的。短短四年内,研究者就发现了其他能在组蛋白上添加或去除化学标记并影响基因表达的蛋白质。突然之间,鲜为人知的表观遗传学登上了科学的主要舞台。
对于那些致力于研发药物的科学家而言,关键性转折出现在21世纪初。当时,人们发现果蝇体内一种能够调控表观遗传过程(即随机性基因沉默)的蛋白,其人类同源物是良性前列腺增生发展为转移性前列腺癌所必需的。这种蛋白也被证实能在染色质上添加化学标记,从而沉默相关基因。人们发现,这类现象如此普遍,以至于“表观基因组”一词被定义为特定基因或基因组上组蛋白化学修饰的总和,这些修饰与DNA“协作”决定基因的功能。
有关表观基因组及其如何影响基因调控的研究仍在进行中。然而,科学家未必需要完全理解整个过程才能加以利用:对表观基因组运作机制的不完全理解,并未阻碍其在分子药物设计中的应用。
一个令人意外的发现:疾病的遗传根源并不在基因本身?
SCD、冠状动脉疾病(CAD)和炎症性肠病(IBD)有什么共同点?答案令人惊讶:尽管它们影响不同的器官且症状各异,但这三种疾病同绝大多数已被研究过的人类疾病一样,其严重程度因人而异是由控制基因表达的基因变异所引起的。
为了理解表观基因组编辑技术的诞生背景,我们需要介绍一种科学家用于研究疾病遗传感染风险或保护因素的方法——全基因组关联研究(GWAS)。我们知道,SCD、CAD和IBD都具有遗传性,但即便拥有相同基因变异的人,其症状严重程度也会有所相同。例如,对于CAD和IBD这两种疾病来说,有实例表明,一些人因家族史会面临高感染风险,而另一些人似乎对这些疾病具有天然抵抗力。为了找出这些易感性和保护性区域在基因组中的位置,科学家在征得数千人的同意后读取了他们的DNA,并将其与特定疾病的相关状况进行比对。对于所研究的每一种疾病,研究者都找到了与疾病易感风险或保护因素相关的基因组子区域。令所有人深感困惑的是,90%的此类区域并不在基因本身。要知道,人类DNA中仅有5%真正能指示细胞制造蛋白质,其余部分曾被不礼貌地称为“垃圾DNA”。然而,这些被称为“垃圾”的区域中竟存在疾病标记,它们会对健康产生怎样的影响呢?
GWAS研究提出了这一问题,而表观基因组图谱给出了答案。通过研究近800种不同的人类细胞类型和组织,科学家发现,20%的DNA含有指示基因何时激活或关闭的指令。这种调控DNA的数量远超基因本身——堪比录音棚场景:一个仅由四位乐手组成的乐队,其输出的声音却需带有数百个控制杆和旋钮的调音台来调控。这如何帮助我们理解疾病的遗传机制呢?当科学家将疾病易感风险或保护标记的基因组图谱与调控元件图谱进行比对时,他们发现前者有90%竟位于后者之内!实际上,我们现在知道,心脏疾病、免疫系统疾病、代谢性疾病以及几乎所有其他疾病的遗传风险或保护因素,根源都在于基因开关状态的改变,而非基因本身的编码内容。CAD——全球发病率和死亡率最高的疾病——就是典型例证,其最主要的遗传原因正是一段调控DNA片段,它能对我们的血管系统产生复杂影响。个体间的差异并非在于蛋白质编码基因的DNA序列,而在于调控元件的DNA序列,该元件决定着某些蛋白质在何时何地制成。
我们距离揭开最精彩的篇章仅差最后一步——关于这一切如何汇聚催生新一代遗传医学。
在百年长卷中寻找一个词
我们的基因组非常庞大,这对药物研发来说可不是个好消息。如果大多数疾病由微小的个体基因变异引起,那么我们该如何在医学中利用这一点?即使我们能识别这些变异,又如何在细胞内进行干预呢?
在生物医学领域,许多推动医学进步的技术都是从自然界中借鉴来的。经典案例就是重组DNA技术,它为我们带来了治疗糖尿病的大规模生产型胰岛素和癌症免疫疗法。用于在活细胞内定位特定DNA子区域的技术同样借鉴于大自然。在20世纪60年代至70年代,科学家发现所有细胞(无论是细菌还是人类细胞)都含有一些特殊蛋白质,这些蛋白质能够根据基因序列识别特定的DNA片段。我们的基因组编码了1600种这样的蛋白质。1991年,科学家确定了人体细胞中最常见的此类蛋白质的原子级结构:它像一个分子级的毛毛虫,由两个或多个片段连接而成,每个片段精准识别DNA上的3个碱基。这意味着人们可以通过混合搭配这些片段来构建新型DNA结合蛋白,以定位调控的目标基因。2012年,詹妮弗 · 杜德纳(Jennifer Doudna)和埃马纽埃尔 · 卡彭蒂耶(Emmanuelle Charpentier)——二人后来获得了2020年的诺贝尔化学奖——也从自然界中获得灵感,发现了一种完全不同的方法用以实现相同目标。他们在细菌CRISPR免疫系统中发现了Cas9蛋白,它可以利用一小段RNA序列匹配一段20个碱基的DNA序列,进而精准定位目标基因。
所有基础研究的发展促成了一个重大突破:科学家现在可以用多种方法来设计一种能够定位细胞中任何DNA片段的蛋白。至此,表观基因组以令人瞩目的方式回归大众视野。
表观基因组编辑:“指挥”基因的行动
21世纪初,科学家将一种能与基因结合的人造蛋白与一种能在组蛋白上添加信息的蛋白融合在一起,注入细胞中,然后观察改变表观基因组是否会影响该基因的功能。早在2001年和2002年首批“表观基因组编辑器”诞生时,改变某个基因的表观基因组是否能按需激活或关闭该基因还完全是个未知数。令所有人惊喜的是,这种分子工具能够找到目标基因,重写其表观基因组,并使其沉默。
然而,第一代表观基因组编辑器等待了将近二十年才等到其他相关技术逐渐成熟。在这个过程中,递送技术至关重要,因为研究者需要确保表观基因组编辑器能够到达人体内的特定器官。目前存在多种递送方式。一种是利用一种无害的病毒将编码表观基因组编辑器的基因送至脊柱,在那里,这个分子“有效载荷”会找到并关闭负责将疼痛信号传递到大脑的基因。人们目前正在利用这种方法进行针对慢性、顽固性疼痛的临床试验。另一种方式是,递送病毒将表观基因组编辑器运送至大脑,该编辑器能增强维持正常脑电活动所需的基因的表达,并且已在治疗与严重持续性癫痫有关的小鼠遗传病模型中得到应用。新冠疫情使得“脂质纳米颗粒”(LNP)这个术语广为人知,如今LNP正被用于临床试验,以将可以沉默肝炎病毒活性的表观基因组编辑器递送至肝细胞。用于治疗神经退行性疾病和心血管疾病的表观基因组编辑器距离进入人体临床试验阶段也不远了。
许多人类疾病是由基因表达异常导致,而非基因本身的突变引起
在所有上述案例中,医学伦理要求临床试验聚焦于目前治疗方案不太多的严重疾病。然而,我们至少还需要两年时间才能得知这些早期临床试验的结果。希望在不久的将来,试验结果能够证明表观编辑是安全且有效的。这并非必然,但值得期待。那么,表观编辑的现实前景究竟如何?一个合适的预测依据是相信基因组编辑的力量。可以看到,在基因组编辑领域,强大的CRISPR-Cas9技术被用于直接修复导致遗传疾病的突变。这项技术表明,我们在一次纠正一个基因方面已取得显著进展。同时,它在对目标基因施加强烈的“二元”效应方面也表现卓越:编辑前,基因存在突变;编辑后,基因被彻底修复。表观基因组编辑技术则更像是一个调音台,既能产生分级效应,也能万箭齐发,同时靶向多个基因。
尽管表观基因组编辑技术仍需进一步发展,但已有足够多的数据预示:它未来可用于同时调控多个基因的表达,以创造更健康的细胞或器官。
在一个频繁出现像CRISPR-Cas系统这样的革命性发现(此前完全无人预料到)的领域,客观地预测未来极为困难。但有一点是确定的:遗传医学领域的技术进步不会放缓。表观基因组编辑技术对健康的影响极有可能乘上这股东风,大放异彩。
资料来源 The Scientist
______________________
本文作者费奥多尔·乌尔诺夫(Fyodor Urnov)是加州大学伯克利分校研究基因组与表观基因组编辑的教授和Tune Therapeutics(一家专注于表观遗传编辑技术的公司)的联合创始人。他在CRISPR基因治疗的临床应用中作出了开创性贡献