什么是人类基因组计划?结果显示,人类有多少基因?这些基因只能表达等量的蛋白质吗?为什么?

人类基因组计划很长。看后面。

目前已经发现并定位了26000多个功能基因,其中42%的基因是未知的。已知基因中,酶占10.28%,核酸酶占7.5%,信号转导占12.2%,转录因子占6.0%,信号分子占1.2%,受体分子占5.3%。发现和了解这些功能基因的功能对于基因功能和新药筛选具有重要意义。

至于蛋白质的数量,肯定是不一样的,因为一个基因最多对应一个mRNA。至于mRNA,翻译前会通过切割连接形成很多,然后翻译成肽链。经过不同亚基的折叠、修饰、组合,种类会更多。有些蛋白质有相同的肽链,不同的活性金属会变成不同的蛋白质。所以蛋白质的数量远远大于基因的数量。

人类基因组计划简介

人类基因组计划(human genome project,HGP)由美国科学家于1985年首次提出,并于1990年正式启动。来自美国、英国、法国、德国、日本和中国的科学家参与了这项耗资30亿美元的人类基因组计划。按照这个计划,2005年,人体内约65438+万个基因的编码将全部解锁,同时绘制出人类基因的图谱。换句话说,就是要揭开组成人体65438+万个基因的30亿个碱基对的秘密。人类基因组计划、曼哈顿原子弹计划和阿波罗计划并称为三大科学工程。

1986年,诺奖得主雷纳托·杜尔贝科发表短文《癌症研究的转折点:人类基因组测序》(Science,231:1055-1056)。指出要想对肿瘤有更多的了解,必须从现在开始关注细胞的基因组。.....从哪个物种开始努力?要想了解人类的肿瘤,就要从人类开始。.....对DNA的详细了解将极大地促进人类肿瘤研究。"

什么是基因组?基因组是一个物种中所有基因的整体组成。人类基因组有两层含义:遗传信息和遗传物质。要揭示生命的奥秘,就要从整体层面研究基因的存在、结构和功能以及基因之间的关系。

人类基因组计划的目的

为什么选择人类基因组进行研究?因为人类是“进化”过程中最高级的生物,对它们的研究有助于认识自我,掌握生老病死规律,诊治疾病,了解生命起源。

测量人类基因组DNA的30亿个碱基对的序列,找到人类所有的基因,找出它们在染色体上的位置,破译人类所有的遗传信息。

在人类基因组计划中,还包括对大肠杆菌、酵母、线虫、果蝇、小鼠五种生物基因组的研究,这五种生物被称为人类的五大“模式生物”。

HGP的目的是解码生命,了解生命的起源,了解生命生长发育的规律,了解物种和个体差异的原因,了解疾病的发生机制和长寿、衰老等生命现象,为疾病的诊断和治疗提供科学依据。

[编辑此段]HGP的诞生和开始

人类基因组的研究在70年代就有了一定的雏形,80年代在很多国家都有了一定的规模。

1984犹他州阿尔塔,White R和Mendelssohn M受美国能源部(DOE)委托,召开小型专业会议,讨论确定人类全基因组DNA序列的意义和前景(Cook Deegan RM,1989)。

1985年5月,在加州圣克鲁斯,提出了确定人类基因组全序列的动议,形成了美国能源部“人类基因组计划”草案。

1986年3月,在新墨西哥州圣达菲讨论了这个计划的可行性,然后DOE宣布实施这个计划。

1986年,遗传学家麦克库西克五世提出从全基因组水平研究遗传的科学叫“基因组学”。

1987年初,美国能源部和美国国立卫生研究院为HGP拨款约550万美元(全年65438+6600万美元)。

65438-0988年,美国国家人类基因组研究中心成立,沃森J为首任主任。

1990 10 10月1日,经美国国会批准,HGP正式在美国上市。总体计划是在15年投入至少30亿美元进行全人类基因组分析。

1987,意大利国家研究委员会* * *开始研究HGP,其特点是技术多样(YAC,杂交细胞,cDNA等。)和区域集中度(基本限于Xq24-qter区域)。

HGP于2月在英国开始,1989。其特点如下:帝国癌症研究基金会和美国国家医学研究委员会(ICRP-MRC)均负责国家协调和资金监管,剑桥附近的桑格中心专注于积累线虫基因组方面的经验和提高大规模DNA测序技术;同时建立了“英国人类基因组资源中心”,进行YAC文库筛选与克隆、特定细胞系、DNA探针、基因组DNA、c DNA文库、比较生物基因组DNA序列、信息分析等。可谓“资源集中,全国统筹”。

6月1990法国* * *和中国HGP开始。科研部委托国家医学科学院制定HGP,其特点是关注全基因组、cDNA和自动化。人类多态性研究中心(CEPH)成立,对全基因组YAC重叠群、微卫星标记(遗传图谱)和CEPH家系(80个三代多个体)的构建产生了重大影响,是世界著名的基因组研究经典材料。

1995年,德意志联邦共和国* * *和美国开始了迅速产生的HGP,相继成立了资源中心和基因扫描定位中心,开始了染色体21的大规模测序。

1990年6月,采用欧洲人类基因组研究计划,主要资助23个实验室,用于资源中心的建立和运行。还有丹麦王国、俄罗斯联邦、日本、大韩民国、澳大利亚等等。

1994年,中国由、强伯钦、和杨发起。最初,在国家自然科学基金和863高技术计划的支持下,先后开展了“中国人基因组中若干位点的基因结构研究”和“重大疾病相关基因的定位、克隆、结构和功能研究”。南方基因中心成立于上海1998,北方人类基因组中心成立于北京1999,中国科学院遗传研究所成立于1998。1999年7月在国际人类基因组注册,完成了人类3号染色体短臂上一个30Mb区域的测序任务,约占整个人类基因组的1%。

人类基因组计划由美国于1987年发起,中国于1999年9月积极参与这一研究项目,承担了1%的任务,即人类3号染色体上约3000万个碱基对的测序。因此,中国成为参与这一研究计划的唯一发展中国家。2000年6月26日,人类基因组工作草案完成。由于人类基因测序和基因专利可能带来巨大的商业价值,各国政府和一些企业都在积极投入这项研究。比如AMGE公司在1997转让了一个与中枢神经系统疾病相关的基因,获利3.92亿美元。

[编辑本段]HGP的研究内容

HGP的主要任务是人类DNA测序,包括下图所示的四个谱图,以及测序技术、人类基因组序列变异、功能基因组技术、比较基因组学、社会、法律和伦理研究、生物信息学和计算生物学、教育和培训。

1,遗传图谱

也称为连锁图,它以具有遗传多态性的遗传标记(一个基因座有一个以上的等位基因,在群体中出现的频率高于1%)为“路标”,以遗传距离(减数分裂事件中两个基因座之间交换重组的百分比,1%的重组率称为1cM。遗传图谱的建立为基因鉴定和基因定位创造了条件。意义:6000多个遗传标记已经能够将人类基因组划分为6000多个区域,这样连锁分析就可以找到某个致病或表型基因与某个标记接近的证据,从而可以将该基因定位在这个已知区域,进而可以对该基因进行分离和研究。对于疾病来说,找到并分析基因是一个关键。

1代标记:经典的遗传标记,如ABO血型标记、HLA标记。70年代中后期,限制性片段长度多态性(RFLP),位点数为105,DNA链被限制性内切酶特异性切割。由于DNA一个“点”的变异,可以产生不同长度的片段(等位基因片段)。通过凝胶电泳可以显示多态性,通过片段多态性信息与疾病表型的连锁分析可以找到致病基因。比如亨廷顿舞蹈症。但每次消化2-3个片段,信息有限。

第二代标记:1985,小卫星核心和可变数目串联重复序列(VNTR)可提供不同长度的片段,重复单位长度为6至12个核苷酸。微卫星标记系统于1989年发现并建立,重复单位长度为2~6个核苷酸,又称短串联重复序列(STR)。

第三代标记:1996 MIT的Lander ES提出了SNP的遗传标记体系。每个核苷酸的突变率为10-9,人类基因组中双列标记的数量可达300万个,平均每1250个碱基对就有一个左右。由3~4个相邻标记组成的单倍型有8~16个。

2.自然地图

物理图谱是指关于组成基因组的所有基因的排列和间距的信息,是通过测量组成基因组的DNA分子而绘制出来的。绘制物理图谱的目的是将关于基因的遗传信息及其在每条染色体上的相对位置进行线性系统的排列。DNA的物理图谱是指DNA链的限制性片段的排列顺序,即限制性片段在DNA链上的位置。由于限制性内切酶在DNA链上的切割是基于特定的序列,不同核苷酸序列的DNA消化后会产生不同长度的DNA片段,从而形成独特的消化图谱。因此,DNA的物理图谱是DNA分子结构的特征之一。DNA是一个非常大的分子,限制性内切酶产生的用于测序反应的DNA片段只是其中非常小的一部分。这些片段在DNA链中的位置关系是首先要解决的问题,所以DNA的物理图谱是测序的基础,也可以理解为指导DNA测序的蓝图。广义来说,DNA测序是从制作物理图谱开始的,这是测序的第一步。有很多方法可以制作DNA的物理图谱。这里,我们选择一种常见而简单的方法——标记片段的部分酶解来说明作图原理。

通过部分酶水解确定DNA物理图谱包括两个基本步骤:

(1)完全降解:选择合适的限制性内切酶对待测DNA链(放射性同位素标记)进行完全降解,降解产物经凝胶电泳分离后自行显影,得到的图谱为组成DNA链的限制性片段的数量和大小。

(2)部分降解:用示踪同位素标记待测DNA的一条链,然后用同一种酶对DNA链进行部分降解,即通过控制反应条件使DNA链上酶的缺口随机断裂,避免所有缺口断裂完全降解。部分酶解产物也进行了电泳分离和自显影。对比以上两步的放射自显影图谱,根据片段大小和两者的差异,可以排出限制性片段在DNA链上的位置。以下是确定组蛋白基因的DNA物理图谱的详细描述。

一个完整的物理图谱应该包括人类基因组不同载体的DNA克隆片段的重叠群图谱、限制性内切酶大片段的切割点图谱、DNA片段或特定DNA序列(STS)的标志图谱、广泛存在于基因组中的特征序列(如CpG序列、Alu序列、等容线)的标记图谱、人类基因组的细胞遗传学图谱(即染色体的区域、条带和亚带,或以染色体长度的百分比来标记),最后,

基本原理是将无法启动的庞大DNA“断裂”,然后拼接。Mb、kb、bp作为图谱距离,DNA探针的STS(序列标签位点)序列作为路标。在1998年,完成了具有52,000个序列标签位点(STS)的连续克隆的物理图谱,覆盖了人类基因组的大部分区域。构建物理图谱的主要内容之一是将含有STS对应序列的DNA克隆片段连接成重叠的“重叠群”。包含以“YAC”为载体的人类DNA片段的文库已包括构建了具有高度代表性的片段重叠群,总覆盖率为100%。近年来,开发了更可靠的BAC、PAC或粘粒文库。

3.序列图

随着基因图谱和物理图谱的完成,测序成为重中之重。DNA序列分析技术是一个包括DNA断裂、碱基分析和DNA信息翻译的多阶段过程。通过测序获得基因组的序列图。

大规模测序的基本策略

逐个克隆的方法:亚克隆测序和在连续克隆系中装配预定的BAC克隆(公共结构域测序计划)。

全基因组鸟枪法:在一定作图信息的基础上,直接将基因组分解成小片段进行随机测序,绕过大片段连续克隆的构建,由超级计算机(美国Celera公司)进行组装。

4.基因图谱

基因图谱是基于识别基因组中包含的蛋白质编码序列,并结合基因序列、位置和表达模式等信息的图谱。识别人类基因组中2%~5%长度的所有基因的位置、结构和功能,最重要的方法是通过基因的表达产物mRNA追溯到染色体的位置。

其原理是所有的生物性状和疾病都是由结构或功能蛋白质决定的,所有已知的蛋白质都是由mRNA编码的,这样就可以通过逆转录酶将mRNA合成为cDNA或部分cDNA片段称为EST,或者根据mRNA的信息人工合成cDNA或cDNA片段,然后将稳定的cDNA或EST作为分子杂交的“探针”来识别与转录相关的基因。EST(表达序列标签)是以PolyA互补oligo-T或克隆载体的相关序列为引物,对mRNA尾侧数百bp进行测序得到的。2000年6月,EMBL有4,229,786个无害环境技术。

基因作图的意义在于它能有效地反映整个基因在正常或受控条件下表达的时空图。通过这张图,我们可以知道一个基因在不同时间不同组织和水平的表达情况。我们还可以知道不同基因在一个组织中不同时间的不同表达水平,我们还可以知道不同基因在特定时间在不同组织中的不同表达水平。

人类基因组是一个国际合作项目:描述人类基因组的特征,对选定的模式生物的DNA进行测序和绘图,开发基因组研究的新技术,改善人类基因组研究中涉及的伦理,法律和社会问题,培养能够使用HGP开发的这些技术和资源进行生物研究的科学家,促进人类健康。