人类基因组计划?对人类社会有什么影响?
人类基因组计划(HGP)是一个大规模、跨国和跨学科的科学探索项目。其目的是测定人类染色体(单倍体)所含的30亿个碱基对的核苷酸序列,从而绘制人类基因组图谱,识别其中所含的基因及其序列,达到破译人类遗传信息的最终目的。基因组计划是人类探索自身奥秘的重要一步,是人类科学史上继曼哈顿计划、阿波罗登月计划之后的又一伟大工程。到2005年,人类基因组计划的测序已经完成。其中,2001年人类基因组工作草案的发表(由公共基金资助的国际人类基因组计划和私人公司Celera基因组公司独立完成并单独发表)被认为是人类基因组计划成功的里程碑。
基因图谱的意义
它能有效地反映在正常或受控条件下表达的整个基因的时空图。通过这张图,我们可以知道一个基因在不同时间不同组织和水平的表达情况。我们还可以知道不同基因在一个组织中不同时间的不同表达水平,我们还可以知道不同基因在特定时间在不同组织中的不同表达水平。
人类基因组是一个国际合作项目:描述人类基因组的特征,对选定的模式生物的DNA进行测序和绘图,开发基因组研究的新技术,改善人类基因组研究中涉及的伦理,法律和社会问题,培养能够使用HGP开发的这些技术和资源进行生物研究的科学家,促进人类健康。
折叠并编辑本段中的其他材料。
折叠对人类疾病基因研究的贡献
与人类疾病相关的基因是人类基因组结构和功能完整性的重要信息。对于单基因疾病,“定位克隆”和“位置候选克隆”的新思路,使得大量引起亨廷顿舞蹈病、遗传性结肠癌、乳腺癌等单基因疾病的基因被发现,为这些疾病的基因诊断和基因治疗奠定了基础。目前,心血管疾病、肿瘤、糖尿病、神经精神疾病(老年痴呆症、精神分裂症)和自身免疫性疾病等多基因疾病是疾病基因研究的重点。健康相关的研究是HGP的重要组成部分。1997年,“肿瘤基因组解剖计划”和“环境基因组计划”相继提出。
折叠对医学的贡献
基因诊断、基于基因组知识的基因治疗和治疗、基于基因组信息的疾病预防、易感基因的识别、风险人群的生活方式和环境因素的干预。
折叠对生物技术的贡献
基因工程药物
分泌蛋白质类(多肽激素、生长因子、趋化因子、凝血和抗凝因子等。)和它们的受体。
(2)诊断和研究试剂工业
基因和抗体试剂盒,用于诊断和研究的生物芯片,疾病和药物筛选模型。
促进细胞、胚胎和组织工程
胚胎和成人干细胞,克隆技术,器官重建。
折叠对制药工业的贡献
筛选药物靶点:结合组合化学和天然化合物分离技术,建立高通受体和酶结合试验。基于知识的药物设计:基因和蛋白质产物的高级结构分析、预测和模拟——药物作用“口袋”。
个体化药物治疗:药物基因组学。
折叠对社会经济的重要影响
生物产业和信息产业是一个国家的两大经济支柱;发现新功能基因的社会和经济效益;转基因食品;转基因药物(如减肥药、增高药)
折叠对生物进化研究的影响
生物的进化史刻在每个基因组的“天书”上;草履虫是人类的亲戚——654.38+0.3亿年;人类是在300-400万年前由一种猴子进化而来的。人类第一次“走出非洲”——200万年的古猿;人类的“夏娃”来自非洲,20万年前——第二个“走出非洲”?
折叠的负面影响
《侏罗纪公园》不仅仅是一个科幻故事;种族选择性灭绝生物武器;基因专利战;遗传资源的掠夺战争;基因和个人隐私。
折叠编辑本段的应用实例
折叠病基因
人类基因组研究的一个关键应用是通过定位克隆找到生化功能未知的疾病基因。该方法包括通过对受影响家族的连锁分析来绘制包含这些基因的染色体区域,然后检查该区域以找到基因。
位置克隆很有用,但也很无聊。在1980年代早期首次提出这种方法时,希望实现定位克隆的研究人员必须生成遗传标记来跟踪遗传,行走染色体以获得覆盖该区域的基因组DNA,并通过直接测序或间接基因鉴定来分析大小约为1Mb的区域。1990年代中期,在人类基因组计划的支持下,随着人类染色体遗传和物理图谱的发展,前两个障碍被扫清了。然而,剩下的障碍仍然很难克服。
所有这些都将随着人类基因组序列草案的实用化而改变。公共数据库中的人类基因组序列使计算机快速识别候选基因成为可能,然后相关候选基因的突变检测需要借助基因结构信息。
现在对于孟德尔遗传性疾病,往往几个月就能实现在一个适当规模的研究群体中进行一次基因搜索。通过公众提供的基因组序列,已经直接定位并克隆了至少30个疾病基因。因为大多数人类序列是在过去12个月才获得的,所以许多类似的发现可能还没有发表。
此外,在许多情况下,基因组序列起着辅助作用,例如为良好的遗传连锁分析提供候选的微卫星标记。(2001,中国、上海和北京的科学家发现了遗传性牛奶阿桔必需的ⅱ型基因)
基因组测序也有助于揭示导致许多常见染色体缺失综合征的机制。在一些情况下,发现了重复缺失,这是由于在几乎相同的大染色体中复制的同源重量组合的不相等交换造成的。例子包括染色体22上的degeorge/Velocidal综合征区域和染色体7上的Williams-Beuren综合征的重复缺失。
基因组序列的可获得性也允许快速鉴定疾病基因的平行同源性,这是有价值的,原因有二。首先,旁系同源基因的突变会引起相关的遗传病。通过使用基因组序列发现的一个很好的例子是色盲(完全色盲)。
CNGA3基因是视锥光感受器环中编码GMP门控通道的亚单位,表明在一些色盲家系中存在突变。基因组序列的计算机搜索发现,侧枝同源基因编码相应的B亚基,CNG B3(EST数据库中没有出现)。CNGB3基因很快被其他家族认定为色盲的原因。另一个例子是早衰1和早衰2基因,它们的突变可能导致阿尔茨海默病的早期发生。
第二个原因是旁系同源物可以提供治疗的机会,例如,在患有镰状细胞病或β地中海贫血的个体中,试图重新激活胚胎中表达的血红蛋白基因,这是由β球蛋白基因突变引起的。
我们在网上人类孟德尔遗传数据库(OMIM)和SwissProt或TrEMBL蛋白质数据库中系统搜索了已知人类疾病基因的971个旁系同源物。我们鉴定了286个潜在的侧枝同源物(至少50个氨基酸匹配,在同一条染色体上的同一性超过70%但低于90%,在不同的染色体上的同一性低于95%)。虽然这种分析可以识别一些假基因,但89%的匹配显示新靶序列中一个以上外显子的同源性,这意味着它们中的许多是有功能的。这项分析显示了在计算机中快速识别疾病基因的潜力。
折叠药物靶
在过去的一个世纪里,制药业很大程度上依赖于有限的药物靶点来开发新的治疗方法。最近的大纲列出了483个药物靶点,算是解决了市面上所有的药物。了解所有人类基因和蛋白质将极大地扩大寻找合适的药物靶点。虽然只有少部分人类基因可以作为药物靶点,但可以预测这个数量将在几千个以上,这种前景将导致基因组研究在药物研发中的大规模发展。一些例子可以说明这一点:
⑴神经递质(5-HT)通过化学门控通道介导快速兴奋反应。先前鉴定的5-HT3A受体基因产生功能性受体,但其电导比体内小得多。交叉杂交实验和EST分析未能揭示已知受体的其他同源物。
然而,最近通过搜索低要求的人类基因组草图序列,在PAC克隆的染色体11的长臂上鉴定了一个推定的同源物。同源物在纹状体、尾状核和海马表达,后来获得全长cDNA。这个编码胺受体的基因被命名为5-HT3B。当与5-HT3A结合形成异二聚体时,它似乎负责大电导神经酰胺通道。鉴于胺途径在精神疾病和精神分裂症中的中心作用,一个主要的新治疗靶点的发现非常有趣。
⑵半胱氨酰白三烯的收缩和炎症作用,以前被认为是过敏反应的慢反应物质(SRS-A),是由特异性受体介导的。通过小鼠EST和人类基因组序列的重组,鉴定了第二种类似的受体CysLT2。这导致了一个基因的克隆,该基因与以前鉴定的唯一的其它受体具有38%的氨基酸同一性。这种新的受体,表现出对几种白三烯的高亲和力和结合力,被定位在与过敏性哮喘相关的染色体13上。该基因在气道平滑肌和心脏中表达。作为白三烯途径抗哮喘药物研发的重要靶点,新受体的发现起着重要作用。
⑶阿尔茨海默病老年斑中富含β淀粉样蛋白沉积。β淀粉样蛋白是由前体蛋白(APP)的蛋白水解产生的。一种酶是β-APP裂解酶,是跨膜天冬氨酸蛋白酶。对人类基因组草图序列的计算机搜索最近确定了BACE的一个新的同源序列,编码一个名为BACE2的蛋白质,它与BACE有52%的氨基酸序列同一性。它包含两个激活的蛋白酶位点和定位于染色体21的必要唐氏综合征区域,类似APP。这就提出了一个问题,过多的BACE2和APP是否会加速唐氏综合征病患者大脑中β-淀粉样蛋白的沉积。
鉴于这些例子,我们系统地确定了基因组序列中传统药物靶蛋白的侧链同源物。所使用的目标列表标识了SwissPrott数据库中的603个条目,并且具有唯一的访问代码。
基础生物学
一个例子是:解决了一个困扰研究者几十年的神秘话题:苦味的分子基础。人类和其他动物对某种苦味的反应是不同的(反应多态性)。最近,研究人员将这一特征映射到人类和小鼠身上,然后在G蛋白偶联受体的人类基因组序列草案上搜索相关区域。这些研究很快导致发现了这些蛋白质的一个新家族,这证明了它们几乎都在味蕾中表达。实验证实,培养细胞中的受体对特定的苦味底物有反应。
人类基因组图谱是全人类的财产,这一研究成果应该为全人类共享,造福全人类,这是参与人类基因组计划的各国科学家的认识。值得注意的是,目前,在人类基因组研究领域,一些私营公司正在争先恐后地为他们的成果申请专利。美国赛莱拉基因公司曾表示,想为一些研究成果申请专利,并有偿提供给制药公司。
发现了一些控制人类疾病的重要基因。
如肥胖基因和支气管哮喘基因。这些基因的新发现每年都有报道。这些基因的发现增强了人们对许多重要疾病机制的认识,促进了整个医学思想更快地从注重治疗转向注重预防。如湖南医科大学夏家辉教授5月28日发表1998克隆了人类神经性高频耳聋致病基因(GJB3),这在国内尚属首次。
在人类基因组计划的推动下,出现了几个全新的学科。如基因组学和生物信息学。
生物技术产业化。一些世界级的大公司已经将重点转向生命科学研究和生物技术产品。这一趋势也与人类基因组计划密切相关。
进步与未来
2000年6月26日,参与人类基因组计划的美、英、法、德、日、中六国科学家宣布,人类基因组草图已经完成。最终图谱要求用于测序的克隆能够忠实地代表常染色体的基因组结构,序列错误率小于万分之一。95%的常染色质区域被测序,每个缺口小于150kb。竣工图将于2003年完成,比计划提前了两年。
完成人类基因组序列完成图
⑴从当前物理图谱生成的克隆产生了完整的序列,覆盖了基因组96%以上的常染色质区域。已经实现了1Gb左右的完成序列。其余的已经勾画出来了,所有的克隆都有望达到8 ~ 10倍的覆盖率,大约是2001年的中期(99.99%的准确率),使用既定的、日益自动化的协议。
⑵检测另一个库以弥补缺口。使用FISH技术或其他方法分析没有闭合的缝隙大小。这样22,265,438+0条染色体。2003年完成。
⑶开发新的技术来填补很难填补的空白,大约有几百个。
基因组序列工作底稿:通过对染色体位置清晰的BAC连续克隆测序,覆盖4-5次(BAC克隆水平的覆盖不应少于3次),获得90%以上的基因组序列,错误率应小于65438±0%。工作框架图可用于理解基因组结构、识别和分析基因、定位和克隆疾病基因、发现SNP等。
素描的作用
1,草图,多种疾病相关基因被鉴定。
2.SNP(人与人之间的差异),草图为理解遗传基础和人类特征的进化提供了一个框架。
3.素描之后,研究人员有了研究调控区域和基因网络的新工具。
4.比较其他基因组可以揭示相同的调控元件,其他物种共享的遗传环境可以提供个体水平上的功能和调控信息。
5.草图也是研究基因组向细胞核三维压缩的一个切入点。这种压缩可能会影响基因调控。
6.在应用上,草图信息可以开发新的技术,如DNA芯片和蛋白质芯片,作为传统方法的补充。目前,这种芯片可以包含蛋白质家族的所有成员,这样就可以找到那些在特定疾病组织中有活性的成员。
2月1,20065438+2,20065438美国Celera公司和人类基因组计划分别在《科学》和《自然》上发表了人类基因组的详细图谱及其初步分析结果。其中,政府资助的人类基因组计划采用基因图谱战略,而Celera公司采用“猎枪战略”。到目前为止,两个不同的组织通过使用不同的方法实现了他们的共同目标:完成人类全基因组测序;而且,结果惊人的相似。人类全基因组测序的基本完成开辟了人类生命科学的新时代,对生命本质、人类进化、生物遗传、个体差异、发病机理、疾病预防、新药开发、健康长寿以及整个生物学等领域产生了深远的影响和重大意义,标志着人类生命科学新时代的到来。
无数的发现
1.分析表明,人类全基因组约为2.91Gbp,约有39000个基因;平均基因大小为27kbp;其中G+C的含量较低,仅占38%,而2号染色体的G+C含量最高。到目前为止,还有9%的碱基对序列没有确定。染色体19包含的基因最多,而染色体13包含的基因最少,等等。(详见cmbi特别报道:生命科学重大进展)。
2.目前已经发现并定位了26000多个功能基因,其中42%的基因是未知的。已知基因中,酶占10.28%,核酸酶占7.5%,信号转导占12.2%,转录因子占6.0%,信号分子占1.2%,受体分子占5%。发现和了解这些功能基因的功能对于基因功能和新药筛选具有重要意义。
3.基因数量少得惊人:有研究人员曾预测人类大约有654.38+0.4万个基因,但Celera公司将人类基因总数定在2638.3万到391.1.4万之间,不超过4万个,仅是线虫或果蝇基因数量的两倍。人类只有300个基因,但老鼠没有。这么少的基因就能产生这么复杂的功能,说明基因组的大小和基因的数量在生命进化中可能意义不大。这也说明人类的基因比其他生物更‘有效’,一些人类基因的功能和控制蛋白质产生的能力与其他生物不同。这将对我们目前的许多概念提出巨大挑战,并将为后基因组时代生物医学的发展提供新的非凡机遇。但由于基因剪切、EST数据库重复以及一些技术和方法上的错误,未来人类基因的数量可能会超过4万个。
4.人类单核苷酸多态性比例约为65,438+0/65,438+0,250 bp。不同人群只有1.4万个核苷酸的差异,人与人之间99.99%的基因编码是相同的。人们还发现,不同种族的人在基因上比同一种族的人更相似。在整个基因组序列中,人与人之间的变异只有万分之一,这说明人类不同物种之间并没有本质的区别。
5.人类基因组中有“热点”和“沙漠”。在染色体上,有基因聚集、密集分布的区域,也有只有“无用DNA”——不含或含极少基因的成分的大面积区域。基因组中大约有1/4个区域没有基因片段。在所有的DNA中,只有1%-1.5%可以编码蛋白质。在人类基因组中,98%以上的序列是所谓的“无用DNA”,有300多万个长片段重复序列。这些重复的“无用”序列绝不是无用的。它们必须包含人类基因的新功能和奥秘以及关于人类进化和差异的信息。经典分子生物学认为,一个基因只能表达一种蛋白质,但人体内有许多复杂的蛋白质,提示一个基因可以编码多种蛋白质,蛋白质比基因更重要。
6.男性的基因突变率是女性的两倍,人类大多数遗传病都是在Y染色体上进行的。所以男性可能在人类遗传中扮演更重要的角色。
7.人类基因组中约有200个基因来自插入人类祖先基因组中的细菌基因。这种插入基因在无脊椎动物中很少见,这意味着它是在人类进化后期插入到我们的基因组中的。可能是在我们人类免疫防御系统建立之前,寄生在体内的细菌在出生过程中与人类基因组进行了基因交换。
8.发现并准确定位了约140万个单核苷酸多态性,初步鉴定了30多个致病基因。随着进一步的分析,不仅可以确定危害人类生命健康的最严重疾病的致病基因,如遗传病、肿瘤、心血管疾病、糖尿病等。,还能找到个体化的防治药物和方法,同时对进一步了解人类进化有重要作用。
9.人类基因组编码的全套蛋白质(蛋白质组)比无脊椎动物编码的蛋白质组更复杂。人类和其他脊椎动物重新排列了蛋白质的结构域,形成了新的结构。也就是说,人类的进化和特征不仅取决于产生一种全新的蛋白质,还取决于对现有蛋白质的重新排列和扩展,从而实现蛋白质的种类和功能多样性。有人推测,一个基因平均可以编码2-10种蛋白质,以适应人类复杂的功能。
模式生物:酵母、大肠杆菌、黑腹果蝇、秀丽隐杆线虫、小鼠、拟南芥、水稻、玉米等模式生物的基因组计划也已完成或进展顺利。
目前,基因组学的研究出现了几个转变:一个是将已知基因的序列和功能联系起来的功能基因组学研究;二是基于作图的基因分离转向了基于序列的基因分离;第三,从研究病因到探索发病机制;第四,从疾病诊断到疾病易感性研究。
在后基因组时代,如果对已完成基因组测序的整个物种进行对比分析,我们希望在全基因组尺度上了解基因组和蛋白质组的功能意义,包括基因组的表达和调控,基因组的多样化和进化,以及基因及其产物在生物体生长、发育、分化、行为、衰老和治疗过程中的作用机制,因此必须开发新的算法,充分利用超级计算机的超级计算能力。
2006年5月8日,美国和英国科学家在《自然》网络版上发表了人类最后一条染色体1。
在人体所有22对常染色体中,染色体1包含的基因数量最多,达到3141,是平均水平的两倍。* *拥有超过2.23亿个碱基对,也是最难破译的。一支由150名英美科学家组成的团队花了10年才完成了1号染色体的测序。
科学家不止一次宣布人类基因组计划完成,但都没有全文发表。这一次,生命之书更加准确,覆盖了人类基因组的99.99%。解读人类遗传密码的“生命之书”宣告完成,历时16年的人类基因组计划的最后一章书写完毕。
2.疾病基因的定位和克隆
人类基因组计划的直接动机是解决包括肿瘤在内的人类疾病的分子遗传问题。6000多种大面积危害人类健康的单基因遗传病和多基因遗传病及相关基因,代表了人类基因结构和功能完整性的重要组成部分。因此,疾病基因的克隆在HGP占据核心地位,也是计划实施以来最引人注目的部分。
在基因和物理作图的驱动下,形成了对疾病基因的定位、克隆和鉴定的研究,传统的从表位到蛋白质到基因的途径转向了“反向遗传学”或“定位克隆”的新思路。随着人类基因组图谱的形成,3000多个人类基因被精确定位在染色体的各个区域。未来,一旦定位了疾病位点,就可以从局部基因图谱中选择相关基因进行分析。这种被称为“位置候选克隆”的策略将大大提高寻找疾病基因的效率。
3.多基因疾病的研究。
目前,人类疾病的基因组学研究已经进入多基因疾病的难点。由于多基因疾病不遵循孟德尔遗传规律,从一般的家族遗传连锁分析很难有所突破。这方面的研究需要在群体和遗传标记的选择、数学模型的建立和统计方法的改进等方面下功夫。最近,一些学者提出通过比较基因表达谱来识别疾病状态下基因的激活或抑制。事实上,癌症基因组解剖项目(CGAP)代表了这方面的一种尝试。
前景
1,生命科学产业的形成
由于基因组研究与制药、生物技术、农业、食品、化学、化妆品、环境、能源和计算机等行业密切相关,更重要的是基因组研究可以转化为巨大的生产力,一批国际大型制药公司和化工公司大规模投入巨资进行基因组研究,形成了一个新的产业板块,即生命科学产业。
2.功能基因组学
人类基因组计划目前总体发展趋势如何?一方面,结构基因组学在成功做出遗传图谱和物理图谱后,正朝着完成染色体完整核酸序列图谱的目标前进。另一方面,功能基因组学已经提上日程。人类基因组计划已经开始进入从结构基因组学到功能基因组学的过渡和转化过程。在功能基因组学的研究中,可能的核心问题有:基因组表达及其调控、基因组多样性、模式生物的基因组研究等。
2)蛋白质组学研究。
蛋白质的组学研究是从整体水平研究蛋白质的水平和修饰。目前正在研发标准化、自动化的二维蛋白质凝胶电泳系统。首先用自动化系统提取人体细胞的蛋白质,然后用色谱仪对各段蛋白质进行部分分离,再用质谱仪进行分析,在蛋白质数据库中通过特征分析识别产生的多肽。
蛋白质组研究的另一个重要内容是建立蛋白质相互关系的目录。生物大分子之间的相互作用构成了生命活动的基础。已在T7噬菌体(55个基因)中成功地实现了组装基因组成分的详细作图。如何在模式生物(如酵母)和人类基因组的研究中建立自动化方法,了解不同的生化途径,是一个值得探讨的问题。
3)生物信息学的应用
目前,生物信息学已广泛应用于基因发现和预测。然而,更重要的是利用生物信息学来发现基因的蛋白质产物的功能。越来越多的蛋白质编码单位在模式生物中被鉴定出来,这无疑为寻找基因和蛋白质的同源关系以及家族的分类提供了极其有价值的信息。同时,生物信息学的算法和程序也在不断完善,使得不仅从一级结构,而且从估计的结构中寻找同源关系成为可能。但是,计算机模拟得到的理论数据需要通过实验来验证和修正。
⑵基因组多样性研究
人类是一个多态的群体。不同群体和个体在生物学特性和对疾病的易感性和抗性上的差异,反映了进化过程中基因组与内外环境相互作用的结果。对人类基因组多样性的系统研究将对理解人类的起源和进化以及生物医学产生重大影响。
1)进行人类DNA重测序。
可以预见,人类第一次基因组测序完成后,必然会出现各种人种和群体的重测序和精细基因分型的热潮。将这些资料与人类学和语言学的资料结合起来,将有可能建立一个全人类的数据库资源,从而更好地了解人类历史及其自身的特点。此外,基因组多样性的研究将成为疾病基因组学的主要内容之一,群体遗传学将日益成为生物医学研究的主流工具。有必要在基因组水平上对常见多因素疾病(如高血压、糖尿病和精神分裂症)相关基因和癌症相关基因进行大规模的重新测序,以确定其变异序列。
总之,模式生物基因组计划为人类基因组的研究提供了大量的信息。未来模式生物的研究方向是将人类基因组中85438+百万个编码基因中的大部分转化为具有已知生化功能的多组分核心机制。酶这一人类进化保守性的核心机制,以及它们的紊乱导致疾病的各种方式的知识,只会来自于对人类自身的研究。
通过功能基因组学的研究,人类最终将能够了解哪些进化机制实际上已经发生,并考虑进化过程可能具有哪些新的潜力。解决发育问题的新途径可能是将蛋白质功能域和调控序列结合起来,建立新的基因网络和形态发生途径。换句话说,未来的生物科学不仅可以了解生物体是如何形成和进化的,还可以产生构建新生物体的潜力。这个计划在人类科学史上树立了一个新的里程碑!这是改变世界、影响人类生活的壮举。随着时间的推移,它的重大意义会越来越明显。
堆叠版