人类的基因组定序计划从1990年开始,在2003年宣告完成。这是人类探索生命的重大里程碑。经过20年的发展,已经成为推动医学及生命科学的关键。
DNA结构的发现
生物体是由细胞构成的。人体大约拥有60万亿个细胞,每个细胞的核心都含有一个重要的细胞核(除了红血球和血小板)。细胞核是调节细胞生命活动的控制中心,其中包含23对染色体(一半遗传自生父,一半自生母)。染色体是由五种不同的组蛋白缠绕长达2米的DNA(去氧核糖核酸)构成。
1953年英国科学家罗莎琳富兰克林(Rosalind Franklin)利用X光晶体绕射研究DNA,发现一个美丽的结构图。她将照片拿给25岁的华生(James Watson)看,华生与克里克(Maurice Crick)讨论后,提出DNA双螺旋结构模型,以及基因是遗传中心法则。1958年37岁的罗莎琳过世。1962年DNA双螺旋结构获得诺贝尔奖。
人的生命从一颗受精卵开始,细胞不断复制、分裂、再复制,过程中,人体所有细胞的细胞核中的染色体,都保持着相同的DNA。这些细胞能变化出人体各种不同的组织器官,这是由含有字母为ATCG的四种碱基排列组合的60亿个DNA编码精准控制的。
DNA携带了人类的遗传机制,可以制造出蛋白质的DNA成为基因。细胞核中的DNA可以转录为RNA,再经过转译过程,形成细胞中极为重要的蛋白质。这些蛋白质担任多种功能。蛋白质是遗传讯息的表现者,是建构皮肤、毛发、指甲和骨骼的主要结构性成分。 蛋白质也担任人体传送营养运输,制造酶、激素及抗体等功能。我们的身体60%是水分,20%是蛋白质,剩余20%由脂肪、醣类及矿物质等构成。
人类的基因组定序
人类的基因组定序计划(Human Genome Project)从1990年开始由美国能源部及国家卫生院(NIH)成立,英国、日本、法国、德国先后加入,1997年美国基因科技公司Celera也加入计划。2000年,美国总统克林顿牵着国家卫生院及Celera团队的手,宣布人类基因体计划即将完成,其基因组资料为人类共同财富,不允许专利,且对所有研究者公开。2003年4月人类的基因组定序基本完成。
在完成人类基因组定序之后,渐渐形成“基因组学”(Genomics),目标是了解人类基因组产生的各种功能。为了研究疾病及生命的表现来源,科学家进一步研究基因产生蛋白质的各种机制。澳大利亚生物学家Marc Wilkin于1994年提出“蛋白质组学”(Proteomics), 目标是研究基因组所表现的,所有执行各种功能的蛋白质。
人类蛋白质是由20个常见的氨基酸所组成。蛋白质通常不是单独存在,会与其他蛋白质结合,蛋白质的表现也因其折叠的立体结构而不同,因此研究蛋白质组的复杂度远超过基因组。2012年开始,国际蛋白质组学协会开始了一项人类蛋白质组图谱计划,目标是找出所有蛋白质组与人类染色体的关系。
蛋白质与疾病的关联
蛋白质组的鉴定技术可以利用特殊的质谱仪。质谱仪曾经在上个世纪作为研究化学元素周期表的工具。目前这个蛋白质组图谱计划正在进行。这些研究进展也引发了新的医药革命。例如研究疾病的机制,疾病的检测,早期诊断等。对于癌症,我们可以从血液中标记蛋白检测到它们对应的癌症。血液中的肌钙蛋白可以作为心肌梗塞的检测。许多蛋白质的新药,也能够针对不同的基因组病人做标靶治疗。
除了质谱仪,人工智能也被用来预测人体产生的几乎每一种蛋白质的结构。例如谷歌旗下的AlphaFold的深度学习系统,可以用来预测人体和其他有机体的35万种蛋白质的结构。理解蛋白质的结构和形状,对医药研究的发展非常重要。
发现蛋白质降解系统的诺贝尔化学奖得主Aaron Ciechanover指出,进入21世纪后,基因组序列及蛋白质组的分析,加上造影技术等突破,正带来人类的第三次医药革命。精准化、个体化、预测性、预防性等医疗的时代已经来临。在这些新的技术革命下,人类将克服许多疾病,也将出现新的疾病及问题,而人类的寿命将进一步增加。
三次医药革命
·第一次医药革命(1900-1950): 抗生素的发现和广泛使用 代表药物:盘尼西林、阿司匹林 ·第二次医药革命(1970-2000): 降血脂药的发现及合成 代表药物:他汀类药物 ·第三次医药革命(2000-): 基因组序列分析与编辑、蛋白质新药、干细胞、造影技术 (预测性、预防性、标靶药物、精确医疗)