全基因合成方法
全基因合成技术已经非常成熟,一般的做法是设计合成重叠的单链寡核苷酸,通过重叠延伸PCR拼接全长。网上有很多关于全基因合成方法的信息,单个全基因合成相关的专利就有上百个。常见的有重叠延伸PCR(OE-PCR),双重不对称PCR(DA-PCR) [2],聚合酶链式反应(PCR) [3],连接酶链式反应(LCR) [4],从内到外热力学平衡(TBIO)。说实话,这些方法我都没仔细研究过。它们叫什么名字并不重要,永远都是一样的:PCR,基于某些重叠的短引物,通过聚合酶逐渐延伸生长片段。
合成全基因最简单的方法是什么?
当然让DNA合成公司合成。我们只需要提供DNA序列信息。他们会合成dsDNA并克隆到通用载体上,一般会提供测序信息以保证合成的正确性。这无疑是最简单方便的方法。而且现在整个基因合成很便宜,1bp用测序不到一美元。
既然DNA合成公司这么方便,为什么还要自己合成呢?
①公司合成慢,一般需要1-2周。如果遇到特殊序列,比如对大肠杆菌毒性极大的编码序列,周期就不好说了(我做了一个核酸酶,合成公司一个月没做出来,我自己一个星期就搞定了)。
②不自由。通常,携带目的基因的重组载体由合成公司提供。获得后,需要用酶切割。如果基因含有酶切位点,就需要避免。当然这些一般都不是什么大问题,但是你真的没有办法。
(3)如上所述,全基因合成一般用于异源基因表达,异源表达的对象大多是酶,可能需要构建大量的突变体来研究酶的性质。合成公司只提供了一个序列,突变体还得通过设计引物来重构。如果全基因自行合成,通过替换含有突变的引物,可以同时获得各种突变体,在构建含有大量突变的突变体时更有优势。
序列需要保密,毕竟你是最可靠的。
总有人喜欢自己丰衣足食。在本文中,我要介绍自我综合的方法,并介绍两种方法:
基于“桥接”PCR的1一次性拼接方法
这种方法依靠引物之间的相互退火,相互延伸作为模板,所以需要的引物总是一正一负。首先将整个基因序列打断成短寡核苷酸,一般不超过59bp,因为一般引物合成都是以59bp为分水岭,超过59bp价格和时间成本会高很多。寡核苷酸与3’端的互补序列退火,形成有缺口的双链产物,然后缺口被DNA聚合酶补充,形成有缺口的DNA双链产物。该产物通过Taq DNA连接酶连接,形成完整的双链产物,可以作为模板进行PCR扩增,获得目的基因,也可以将带有缺口的DNA双链直接作为模板进行PCR扩增。
2基于逐步扩展的逐步方法
在这种方法中,只有最后一个引物是反向的,其他的都是正向的,并且正向引物之间有重叠的序列。倒数第二寡核苷酸和倒数第二寡核苷酸通过末端互补序列相互退火。在第一个PCR循环后,双链被延伸,延伸的双链和倒数第二个oligo继续退火和延伸,如此等等,直到全长序列被合成。理论上一个PCR循环只能延伸一个引物,n个oliogs至少需要经历n个PCR循环。由于只有一个延伸末端,引物设计比方法1简单,引物数量不需要偶数。
1.设计PCR引物。
可以使用自动设计工具,也可以手动设计,后面会详细介绍。如果是手动设计的,建议用SnapGene(且不说这个软件的强大,要知道网上有很多破解版,不装自己去百度)。复制完整基因序列后,首先调出“Preferences”面板,找到“Primer”选项,将3’端的最短匹配长度和最低Tm分别设置为10bp和40。
因为3’-末端错配对本文的整个基因合成方法非常不利,如果这两个设置太低,很难设计引物,可以适当提高到12bp,45℃。否则只能优化密码子后重新设计。
引物长度预设为59bp,重点是重叠区的设计,一般要根据重叠区的Tm来确定。不同重叠区域之间的Tm平衡非常重要。Tm不超过3℃,建议将Tm设置在55-58℃之间。需要注意的是,对于本文的第一种方法,引物的数量必须是偶数,从序列开始一条一条的,下一条寡核苷酸的起点是前一条重叠区的终点,上面是直的,下面是反的。如果最后一个数字是奇数,应调整最后几个引物的长度,组成一个反向引物。
对于第二种方法,从序列的开始处拉向前的方向,并且所有其余的是反向的,直到结束,或者可以从结束处拉反向的方向,并且其余的是向前的,直到开始。这种方法不关心引物的数量。
通过PCR获得全长产物。
一般需要两轮PCR。第一轮加入少量引物,推荐50uL体系中0.5-1pmol/ oligo和10-15个循环获得全长模板。本轮PCR推荐的DNA聚合酶要同时失去3’-5’和5’-3’核酸外切酶活性,会破坏重叠区域的Tm平衡。第二轮以1uLPCR产物为模板,加入20pmol全长上下游引物,20-25个循环获得目的基因。这一轮PCR要用高保真的DNA聚合酶。
3.克隆入表达载体。
通过同源重组、限制性内切酶连接等方法将目的基因插入载体,转化大肠杆菌或其他宿主感受态细胞,获得单克隆。建议在全基因合成前,必须为克隆/表达载体设计同源臂或限制性位点,并直接添加到全基因序列中,否则应单独设计引物添加同源臂或限制性位点。
4.测序和鉴定
阳性克隆经PCR鉴定并测序。正确的克隆可用于下游表达和纯化。
优化器:/gems,打不开。
GeneDesign [12]:来自基因组研究。论文里的链接是:/tools/104.html,肯定会打开的。这是我自己写的一个工具,包括密码子分析和优化,基因自动转化成寡核苷酸,生成参考实验方案。产生的寡聚物具有均匀的长度,并且重叠区域具有相同的Tm值。Tm计算公式为:Tm = 64+0.41×GC-528/n,具体请参考我的PCR引物设计方法。生成的oligo可以一键复制,格式为oligo+序列号+空格+Tab+序列(5'-3 '),可以直接导入SnapGene。
我的程序输出的引物可以被SnapGene识别。点击菜单栏中的“引物”工具,点击“从列表中导入引物”选项,选择从剪贴板中导入序列。
可以检查每个引物是否完全覆盖目标序列,引物的“头尾”是否冲突等等。
用GFP作为靶序列进行测试:
①找到NCBI绿色荧光蛋白的序列,粘贴到文本框中。首先,分析密码子偏好性;
大肠杆菌的稀有密码子用红色标记,说明GFP天然基因中有很多稀有密码子,可以先进行密码子优化。
②寡聚物的生成方式有两种。默认为方法1。如果引物具有高相似性,将提示您使用方法2。
点击生成寡核苷酸按钮,会弹出总碱基数的统计信息,然后输出寡核苷酸序列号和序列,同时生成实验方案按钮和复制按钮。一键复制后可以导入到SanpGene分析中。
③基因分析
GFP基因完全覆盖,甚至有引物,引物之间的Tm基本一致(因为程序和SnapGene的Tm算法不一致,在SnapGene上只能看到基本一致。
(4)生成实验方案
一般体外总基因合成一次不超过1000bp。如果一次性合成太长,会增加出错的概率。我推荐800bp分段,程序会根据你输入的序列长度推荐分段数。
希望这个工具可以帮助你完成整个基因合成,我还写了一个辅助载体构建的工具,后面会介绍。
参考
[1] Prodromou,c .和Pearl,L. (1992)递归PCR:全基因合成的新技术。蛋白质工程。, 5, 827–829.
[2]桑德胡,G.S,阿莱夫,R.A .和克莱恩,B.C. (1992)双重不对称PCR:合成基因的一步构建。生物技术,12,14–16。
[3]斯特梅尔,W.P .,克莱姆里,a .,哈,K.D .,布伦南,T.M .和海尼克,H.L. (1995)来自大量寡脱氧核糖核苷酸的基因和完整质粒的单步组装。基因,164,49–53。
[4] Au,L.C .,Yang,F.Y .,Yang,W.J .,Lo,S.H和Kao,C.F. (1998)通过基于的方法进行基因合成:在大肠杆菌中使用合成基因高水平生产瘦素-L54。生物化学。生物物理学。共同决议, 248, 200–203.
[5] Gao,x .,Yo,p .,Keith,a .,T.J .和Harris,T.K. (2003)基于热力学平衡的内-外(TBIO) PCR的基因合成:一种用于高保真组装较长基因序列的引物设计的新方法。核酸研究,31,e143。
[6]熊亚生,姚清辉,彭,李瑞辉,李,陈,范海辉,程,郑志明,李,于(2004)一种简单,快速,高保真,低成本的基于PCR的长基因序列两步DNA合成方法。核酸研究,32,e98。
[7] Young,l .和Dong,Q. (2004)两步全基因合成法。核酸研究,32,e59。
[8] Hoover,D.M .和Lubkowski,J. (2002) DNAWorks:设计用于基于PCR的基因合成的寡核苷酸的自动化方法。核酸研究,30,e43。
[9] Rouillard,J.-M .,Lee,w .,Truan,g .,Gao,x .,Zhou,x .和Gulari,E.(2004) Gene2oligo:用于体外基因合成的寡核苷酸设计。核酸研究,32,w 176–w 180。
[10] Rydzanicz,r .,Zhao,X.S .和Johnson,P.E. (2005)装配PCR oligo maker:一种设计寡脱氧核苷酸的工具,用于构建用于RNA生产的长DNA分子。核酸研究,33,W521–W525。
[11] Jayaraj,s .,Reid,r .和Santi,D.V. (2005) GeMS:用于设计合成基因的高级软件包。核酸研究,33,3011–3016。
[12] Richardson,S.M .,Wheelan,S.J .,Yarrington,R.M .和Boeke,J.D. (2006)基因设计:数千碱基合成基因的快速自动化设计。基因组研究,16,550–556。