植物油体蛋白的表达和纯化系统研究

植物油体表达系统的研究进展

和贾的* *

中国农业科学院生物技术研究所,北京100081。

介绍了植物种子中油质蛋白的结构特征及其编码基因的调控,阐述了利用植物油体表达系统这一新型植物生物反应器生产目的蛋白的研究进展及前景。

关键词:油体;油体蛋白;表达系统;植物生物反应器;目标蛋白

现有的外源基因表达系统主要包括细菌、丝状真菌、酵母、哺乳动物细胞、动物乳腺、昆虫(昆虫细胞、昆虫杆状病毒和昆虫全体)和植物表达系统(植物全体、病毒载体和油体)。这些外源基因表达系统在表达量、表达产物的分离纯化、活性、成本等方面各有优缺点。从近年来的研究进展来看,植物表达系统大规模生产各种目的蛋白仍受到诸多因素的限制,其中表达水平低和提取纯化成本高是主要的限制因素。植物油体表达系统将目的蛋白的编码基因插入油质蛋白编码基因的3’端,利用油质蛋白启动子驱动目的蛋白和油质蛋白在转基因植物的油体中特异性表达。获得转基因植物种子后,将种子粉碎,离心分离油相和水相,回收上层油体部分,可以去除种子中大部分非目的成分,从而显著降低近年来目的蛋白的分离纯化成本。作为一种新型的植物生物反应器,它为转基因植物最终生产外源蛋白提供了一种新的途径。

1油体

植物种子中储存的营养物质主要包括蛋白质、脂肪和碳水化合物。脂类一般以三酰甘油(tag)的形式存在,荷荷巴除外,它储存蜡酯。种子中的标签分子并不相互聚合,而是分散成许多小而稳定的亚细胞液滴,称为油体。油体作为生物体内最小的细胞器,有其自身的结构和特点。

1.1油体尺寸

油体为球形,直径0.5-2.5μm,大小因植物种类不同而异,受营养和环境影响。即使是同一粒种子,不同组织中油体的大小也是不同的。从生物学角度看,油体的大小主要由两个因素决定:(1)种子萌发时为脂肪酶催化的tag提供最大的表面;(2)消耗最少的油体蛋白和磷脂,pl)。如果油体直径小于0.2μm,可以为脂肪酶催化提供较大的表面,但需要大量的pl和油质蛋白。相反,如果油体直径大于2.5μm,虽然节约了pl和油质蛋白的量,但由于表面积小,脂肪酶不能在种子萌发和幼苗生长过程中通过快速水解脂类提供植物生长所需的能量。

1.2机油成分

油体的组成包括:(1)92%-98%中性脂质,以tag为主,约占95%,还有少量的二酰甘油(dag)和游离脂肪酸;(2)1%-4%磷脂(pl):主要是磷脂酰胆碱,约占60%-70%,还有少量磷脂酰丝氨酸、磷脂酰乙醇胺、磷脂酰肌醇;(3)1%-4%油体蛋白:其中90%为油质蛋白,少量为caleosin和细胞色素c还原酶。脂肪酶和酰基脂肪酶仍存在于一些植物(如蓖麻和大豆)成熟种子的油膜中。在花粉粒油中没有检测到油质蛋白,在橄榄和鳄梨果实的皮层油中也没有检测到油质蛋白。由于这些油体中的脂质并不用于长期储存,murphy和vance提出油质蛋白可能是储存器官的油体所特有的,但n?Sted等人发现油质蛋白存在于顶端油体内。

1.3油体基本结构

根据tzen等人提出的油结构模型,油体内部是液体标签,外部是由单个磷脂分子及其镶嵌蛋白——油质蛋白组成的半单元膜。这种半单位膜的基本单位由13个pl分子和1个油质蛋白分子组成(图1)。Pl占油面的80%,剩下的20%是油质蛋白。每个pl分子的两个疏水酰基面对内部疏水的标签基质并与标签分子相互作用。pl的亲水头基面向细胞质。油质蛋白分子中间的疏水区形成约11nm的手柄结构,占油质蛋白分子的2/5,延伸到pl的疏水酰基部分和油体内的标签。这部分是由68-74个氨基酸组成的发夹结构,发夹结构的顶端是由三个脯氨酸和一个丝氨酸组成的“脯氨酸结”(图1)。剩余的3/5部分油质蛋白分子覆盖在油体表面,防止外界磷脂酶作用于磷脂半单元膜。等电聚焦结果表明,油体的等电点为5.7-6.6,即ph值为中性时,油体表面带负电。植物种子长期储存后,油体结构保持稳定,不会相互聚合。一般认为,油体表面电荷和油质蛋白的存在是维持油体结构稳定的主要因素。最近的研究结果表明,油体表面主要镶嵌着油质蛋白和少量的其他蛋白质,如caleosin,所以油体作为植物中最小的细胞器,其结构可能比上述模型更复杂。油质蛋白和caleosin是目前已经研究的两种油体蛋白。

2油体蛋白

2.1 oelosin及其结构特征

油质蛋白最初是在芥末中发现的。目前,许多植物(如芝麻、油菜、向日葵、胡萝卜、玉米、大豆、拟南芥和棉花)油质蛋白的基因序列和氨基酸序列已有报道。油质蛋白是一种高度疏水的碱性小分子量蛋白质,分子量为15-26kd,主要在种子中表达。一般认为oelosin是油体所特有的。最近发现油体附近的内质网中存在约5%的oelosin,在根尖油体中也有发现。Oelosin在内质网上合成,并由与内质网结合的核糖体合成。油质蛋白嵌在油体表面,对维持油体的稳定非常重要。一方面在空间上阻碍油体分子间的聚合,另一方面油质蛋白被认为是种子萌发时脂肪酶与油体的结合位点。某种植物中含量最高的油质蛋白的抗体也能识别同科分子量相近的油质蛋白,如十字花科19-20kd,菊科20kd,豆科24kd。不仅如此,不同主体之间的油质蛋白也可以有这种交互反应。

来自不同植物的油质蛋白具有相同的结构特征,并且它们都具有三个基本结构域,即在(1)n-末端由40-60个氨基酸组成的两亲性区域(亲水和亲脂)。这个区域分布在油体面向细胞质的一侧。(2)中间由68-74个氨基酸组成的高度疏水区。根据该区域氨基酸残基的极性分布,tzen和huang推测它是延伸到tag矩阵中的反式平行β-折叠结构,顶部有一个由3个脯氨酸和1个丝氨酸组成的“脯氨酸结”。这个区域,尤其是“脯氨酸结”,在不同来源的油质蛋白中高度保守,因此从进化的角度来说,它可能对植物具有重要意义。(3)C-末端33-40个氨基酸构成α-螺旋结构域。这个结构域是亲水亲油的,其带正电荷的基团面对pl层带负电荷的部分(磷脂酰丝氨酸、磷脂酰肌醇、游离脂肪酸等。),带负电的部分朝向油面(图2)。对于每个油质蛋白分子,约20%的氨基酸残基嵌入pl层,30%浸入tag,其余50%暴露在油表面。油质蛋白二级结构的生化分析支持岑的模型。Lacey等人提出了新的油质蛋白二级结构模型:即油质蛋白中间的疏水区是由“脯氨酸结”连接的两个独立的α-螺旋结构,这个“脯氨酸结”形成180度的旋转角;n端为β折叠结构;C端是亲水亲油的α螺旋结构,上述两个模型还需要进一步的实验验证。

2.2油质蛋白基因及其表达调控

发现裸子植物中只有一种油质蛋白,被子植物中的油质蛋白基因常以基因家族的形式存在,一株植物中常存在几种油质蛋白异构体(表1)。每种异构体在植物中的表达量、部位和速度都是不同的。如玉米中18kd油质蛋白的表达量仅为16kd的18%-20%,菜籽油中20kd油质蛋白的表达量仅为20kd的10%。

油质蛋白基因表达调控的特点;

(1)油质蛋白基因主要受发育调节,并在种子成熟期间表达。油质蛋白基因受水分胁迫、茉莉酸、aba和渗透稳定剂(如山梨醇)的诱导。例如,在aba诱导油菜中的20k多曙红基因后0-4小时检测到mrna和蛋白质的积累。用渗透稳定剂(如山梨醇)处理65438±0h后,检测到mrna,3-6h检测到油质蛋白的积累。Abre(aba-responsive element)基序序列(t/c acgtggc)存在于油菜和拟南芥油质蛋白基因的启动子区,受aba特异诱导。(2)油质蛋白基因的表达具有组织特异性,主要在种子的胚(盾形和下胚轴)和糊粉层中表达。de-oliveira等人和robert等人报道在花粉中发现了一种特殊类型的油质蛋白。在来源于油菜小孢子培养的球形胚和心形胚中均可检测到20kd的油质蛋白,心形胚中也可检测到相应的mrna,表明油质蛋白在种子发育早期有表达。(3)在油质蛋白基因的5′上游区还存在其他调控序列,如水稻油质蛋白基因上游区的一个谷物贮藏蛋白基因的调控元件catgcang。存在于油菜油质蛋白启动子中的aatgcatg序列与控制豆科基因种子特异性表达的保守序列ry基序序列(catgcatg)高度同源。Caca(taacaca)序列存在于拟南芥油质蛋白基因的启动子中,是豆科植物种子蛋白中常见的序列。(4)尽管油质蛋白基因是组织特异性表达的,但在其5′端没有信号肽序列,相应地在其N-端也没有信号序列。推测油质蛋白基因内部可能存在一些序列,或者油质蛋白可以形成某种构象将其定位于油表面,如油质蛋白中间部分的缺失严重影响其在油体上的定位,而其N端或C端的缺失影响很小或没有影响。“脯氨酸结”中的三个脯氨酸突变为亮氨酸的实验证明,“脯氨酸结”是油质蛋白在油体内定位所必需的。油质蛋白中间的疏水区可能是油质蛋白内质网的定位信号,但在体外,“脯氨酸结”的突变并不影响油质蛋白内质网的定位。

2.3 caleosin

用不同的方法分离了多种植物油体蛋白,发现除了油质蛋白外,还有少数其他蛋白。在1998中,陈等用免疫标记法首次在芝麻油中鉴定出另外三种种子蛋白sop1、sop2和sop3。经氨基酸序列测定,发现sop1与水稻中的一种钙结合蛋白同源,故将其命名为caleosin。Caleosin广泛存在于高等植物中,在藻类和真菌中也有类似的蛋白质。不同来源的caleosin表达特征不同。如水稻caleosin主要在胚形成后期表达,在aba或水分胁迫诱导的幼苗和营养生长组织中均可表达。像水稻钙蛋白一样,芝麻钙蛋白似乎只在种子中表达。在干旱条件下,拟南芥可以被aba诱导检测caleosin同源蛋白mrna。已知高等植物中的caleosin蛋白分为三个结构域:(1)n端亲水区,含有一个与ca2+结合的ef手。在大肠杆菌中表达的Ef-hand融合蛋白可以在体外与ca2+结合。从芝麻油中分离的Caleosin1也能与ca2+结合。(2)中间疏水区,包括N端的胞外膜定位区和与之相邻的富含脯氨酸区。已知这种结构只存在于芝麻、水稻、拟南芥等一些高等植物中。(3)c端亲水区。大多数植物中caleosin的C-末端亲水区通常包括四个激酶磷酸化位点。不同来源的caleosin的结构和生物学功能尚不清楚,推测其可能参与油脂生物合成、细胞内运输和脂类代谢。

3植物油体表达系统

3.1油质蛋白目的蛋白表达载体的构建

如上所述,所有的油质蛋白都有三个结构域,三个结构域加起来大概是15kd,但是油质蛋白的分子量很大(15-26kd),多余的1-11kd以c端或n端延伸的形式存在。不同来源的油质蛋白的核苷酸序列在N-末端和C-末端之间有很大不同,除了中间的疏水区是高度保守的。这使人们认为,将外源小分子量蛋白编码基因插入油质蛋白基因的5’端或3’端,构建油质蛋白启动子驱动的“油质蛋白目的蛋白”植物表达载体,转化受体植物,不会影响油质蛋白在植物油中的定位。由于油质蛋白在种子中特异性表达,并包埋在油体表面,因此在转基因植物中,目的蛋白以融合蛋白的形式与油质蛋白一起在油体中特异性表达。

3.2植物油体表达系统的优势

3.2.1融合蛋白易于分离油质蛋白,表达为种子特异性蛋白,包埋在油体表面。外源基因插入油质蛋白的N-末端和C-末端形成融合蛋白并没有改变油质蛋白的特性。因此,通过粉碎转基因植物种子→液体提取→离心并回收上层油相,可将融合蛋白与细胞中的其他成分分离,可去除90%以上的种子蛋白。当插入到融合蛋白中的目标蛋白是酶时,油质蛋白-融合蛋白可以直接用作酶,并且可以在酶促反应后回收,并用于下一个酶促反应(作为固定化酶)。一般重复使用2-3次后,仍保持较强的酶活性。如果融合蛋白是无活性的,目标蛋白应该从油质蛋白上切下来。因此,需要在目的蛋白和油质蛋白基因之间引入一个蛋白酶切割位点,油质蛋白基因常用作溶血素。融合蛋白消化后,尽量把两者分开。

3.2.2融合蛋白可在种子中长期稳定保存。成熟种子中水解酶的活性降低,因此融合蛋白可以在种子中长期稳定保存而不被降解。根据van rooijen和moloney的研究,油质蛋白-gus(β-葡萄糖醛酸糖苷酶)融合蛋白在4℃下储存超过65438±0年,未发生降解。

3.2.3种子易于运输,有利于工业化生产中种子成熟过程中95%以上的水分蒸发,比植物其他部位更易于运输,为目的蛋白的大量生产带来便利。

3.2.4目前加工机械适用于种子破碎和油脂分离,如粮食加工用水磨研磨,而乳品工业中分离乳制品的设备可用于液体提取后离心分离油脂。

3.2.5提高农产品附加值。分离目标蛋白后的油脂仍可用作食用油或工业用油,目标蛋白可大大提高农产品的附加值。

3.3用植物油表达表达的外源蛋白。

1991年,lee等人首次报道了玉米油质蛋白基因转入油菜。玉米油质蛋白mrna只存在于转基因植物的成熟种子中,表达量为种子总蛋白的65438±0%,90%的表达产物位于油体内。来自单子叶玉米的油质蛋白基因在转基因菜籽油体中的正确转录、翻译和定位表明来自单子叶植物的油质蛋白基因中有足够的信息使其在双子叶植物中发挥作用。Holbrook等在1996用基因枪轰击油菜胚,在短期表达检测中发现油质蛋白-gus融合蛋白正确定位在油体内,进一步验证了lee等的实验结论,Vanrooijen和moloney将gus基因插入拟南芥油质蛋白基因的3′端,构建了油质蛋白启动子驱动的植物表达载体,通过农杆菌介导法转化油菜。在转基因植物中,80%的gus活性位于油体内。实验还发现,油质蛋白-gus融合蛋白本身具有β-葡萄糖醛酸糖苷酶的活性,不需要将gus从油质蛋白上切下来。由于融合蛋白与油体结合在一起,可以多次作为固定化酶使用。1995中,parmenter等人构建了由拟南芥油质蛋白启动子驱动的油质蛋白-水蛭素融合蛋白的表达载体,并转化了油菜。经免疫荧光检测,融合蛋白定位于油体表面,表达量占种子总蛋白的65438±0%。将水蛭素从油质蛋白蛋白酶中分离出来,得到具有生物活性的水蛭素。发现油质蛋白-gus融合蛋白虽然具有生物活性,但油质蛋白-水蛭素融合蛋白没有水蛭素的特异性抗凝血酶活性,必须用酶将其从融合蛋白上切下。1997刘等利用植物油体表达系统在转基因油菜中成功表达了瘤胃真菌木聚糖酶。

3.4受体作物和目标蛋白的选择

受体作物应该是含油量高、易于遗传转化的作物。目标蛋白的选择要考虑:(1)分子量不能太大,以免影响融合蛋白在油面的正确定位。目前油体表达的最大目的蛋白是67kd的gus;(2)目的蛋白应该是亲水性的,特别是当目的蛋白需要从融合蛋白上切下时;(3)功能明确,基因序列已知;(4)价格昂贵,具有良好的商业价值,能显著提高农产品的附加值。

基于以上考虑,本实验室选择油菜和棉花作为受体。为了研究植物油体表达系统的适用性,我们选择了C端需要酰胺化才能具有生物活性的降钙素作为目的蛋白。目前,已经获得了第四代转基因棉花品系和转基因油菜植株。转基因油菜的Pcr检测证明降钙素基因已经整合到油菜基因组中。通过pcr-southern和western检测,证明目的基因已经整合到棉花中,并在油中表达。转基因植物中目标蛋白的表达和生物活性的检测正在进行中。“一种新的鲑鱼降钙素类似物及利用植物油体表达系统生产外源蛋白的方法”已申请国家专利(另文报道)。

4前景和问题

外源蛋白如gus、水蛭素、木聚糖酶、降钙素等的成功表达。用油体表达系统,特别是用固定化酶技术,无疑使人们看到了它在工业生产目的蛋白中的应用前景。但是,作为一种新型的植物生物反应器,仍有许多问题需要进一步研究和探讨,包括:(1)如何进一步提高蛋白表达量,降低目的蛋白分离纯化的成本。当油质蛋白-融合蛋白无生物活性时,这一问题更加突出,目标蛋白酶消化、分离纯化成本高,将严重影响这一体系的实际应用。(2)已知有些蛋白质只有经过糖基化和酰胺化后才具有生物活性。目的蛋白在油体表达系统中能否被糖基化和酰胺化,糖基化和酰胺化的程度需要更多的实验研究。油体表达系统的局限性在于对目的蛋白的分子量、亲水性和疏水性有一定的要求。没有一个表达系统是万能的。如何充分利用不同表达系统的优势,表达合适的目的蛋白,造福人类,是今后需要进一步研究的课题。

摘自:农业生物技术2003,11(5):531-537。