分子生物学研究法-基因功能研究技术
第六章 分子生物学研究法 (下)基因功能研究技术
随着越来越多的基因组序列相继被测定,人类对生物本质的认识已经发生了重大变化。但是,海量序列信息也向我们提出了新的挑战。如何开发利用这些序列信息,如何通过生物化学、分子生物学等方法研究基因的功能,从而进一步了解生物体内各种生理过程,了解生物体生长发育的调节机制,了解疾病的发生、发展规律,给出控制、减缓甚至完全消除人类遗传疾病,是新时期生物学家所面临的主要问题。转录组测序技术、原位杂交技术、基因芯片技术为研究单个或多个基因在生物体某些特定发育阶段或在不同环境条件下的表达模式提供了强有力的手段。用基因定点突变(site-directed mutagenesis)技术、基因敲除技术、RNAi技术可以全部或部分抑制基因的表达,通过观察靶基因缺失后生物体的表型变化研究基因功能。酵母单杂交、双杂交技术,四分体技术等都是研究蛋白质相互作用、蛋白质-DNA相互作用等的重要手段。随着分子生物学技术的发展,研究者可以在活细胞内和细胞外研究蛋白质之间的相互作用,为认识信号转导通路、蛋白质翻译后修饰加工等提供了丰富的技术支持。本章将主要介绍研究基因功能的各种分子生物学技术和方法。
6. 1 基因表达研究技术 6. 1. 1转录组测序
6.1.1 转录组分析和RNA-Seq
转录组(transcriptome),广义上指在某一特定生理条件或环境下,一个细胞、组织或者生物体中所有RNA的总和,包括信使RNA(mRNA)、核糖体RNA(rRNA)、转运RNA(tRNA)及非编码RNA(non-coding RNA或sRNA);狭义上特指细胞中转录出来的所有mRNA的总和。基因组-转录组-蛋白质组(genome-transcriptome-proteome)是中心法则在组学框架下的主要表现形式。通过特定生理条件下细胞内的mRNA丰度来描述基因表达水平并外推到最终蛋白质产物的丰度是目前基因表达研究的基本思路。
转录组研究的基本方法包括基因芯片技术(gene chip)和转录组测序技术。
我们将在6.4节详细叙述基因芯片技术,这里主要讨论转录组测序技术的原理和应用。
基于传统的Sanger测序法对转录组进行研究的方法主要包括:表达序列标签(expressed sequence tag,EST)测序技术,基因表达系列分析技术(serial analysis of expression,SAGE)。EST测序数据是目前数量最多,涉及物种最广的转录组数据,但测序读长较短(每个转录本测定400 bp-500 bp),测序通量小,测序成本较高,而且无法通过测序同时得到基因表达丰度的信息。有人使用SAGE测序法,将不同转录本3’端第一个CATG位点下游14 bp长的短标签序列来标识相应的转录本。由于标签序列较短,可以将多个标签串联测序,使SAGE法相对于EST测序在通量上大大提高。但过短的序列标签使得序列唯一性降低,即使改进过的LongSAGE用21 bp标签测序,仍然有约一半的标签无法被准确注释到基因组上。
高通量测序技术(high-throughput sequencing),又名二代测序(second-generation sequencing)或深度测序(deep sequencing),可以一次性测序几十万甚至几百万条序列,是传统测序技术的一次。主要有Roche公司研发的454测序平台和Illumina公司的Solexa测序平台(表61)。
表 61 454和Illumina高通量测序平台比较
读取长度(bp) 单次测序数据量 测序周期 测序成本 454 约700 700 Mb 23小时 较高 Illumina 50-150 600 Gb 7-14天 低 -
-
虽然都是基于“边合成边测序(sequencing by synthesis,SBS)”,但是454和Illumina的实现方法有很大的不同。454系统采用焦磷酸测序(pyrosequencing)原理,如图61a所示,在DNA 聚合酶的作用下,按照T、A、C、G顺序加入的单个dNTP与模板的下一个碱基配对,同时释放一个分子的焦磷酸(PPi),在
ATP
硫酸化酶的作用下,PPi
和腺苷酰硫酸
-
(adenosine-5’-phosphosulfate,APS)结合形成ATP,在萤光素酶的催化下,ATP和萤光素结合形成氧化萤光素,产生可见光,被CCD捕捉。而Illumina系统
1
(图61b)采用带有萤光标记的dNTP,其3’羟基末端带有可被化学切割的部分,每个循环反应只允许掺入一个碱基,由激光扫描反应板表面,读出这一轮反应新加的萤光信号,从而判定碱基种类。之后,经过化学切割恢复3’端粘性,进行下一轮聚合反应。从上述描述中不难看出,随着反应的进行,已有萤光信号会使新的荧光难以准确分辨,因此该方法的测序读长较短,测序错误主要是碱基替换。而454则由于缺少终止反应的元件,相同碱基的连续掺入常会带来“插入-缺失”类型的测序错误。
利用高通量测序技术对转录组进行测序分析,对测序得到的大量原始读长(reads)进行过滤、组装及生物信息学分析的过程被称为RNA-Seq。对于有参考基因组序列的物种,需要根据参考序列进行组装(reference assembly),对于没有参考序列的,需要进行从头组装(de novo assembly),利用大量读长之间重叠覆盖和成对读长(pair-end reads)的相对位置关系,组装得到尽可能完整的转录本,并以单位长度转录本上覆盖的读长数目(reads per kilo-base gene per million bases,RPKM)作为衡量基因表达水平的标准(图62)。在实际组装过程中,图中红色标示区域覆盖度过低,且读长缺乏相对位置信息的区域,其可信度较低,应当剔除,保留两侧序列。
现以棉花转录组学数据为例,简单分析不同组织或纤维不同发育时期基因表达情况(表6-2)。Illumina平台测序得到26.86Gb数据,经过从头组装总共获得了42,773条非重复序列,平均长度1,054碱基。每个不同组织中分别有23,265至26,427个转录本。转录组数据不但能用来分析不同组织中转录本数量,还被用于分析特定转录本在某个组织中的表达强度(表6-3)。RNA-Seq还可以用于转录本结构、转录本SNP检测、非编码区功能鉴定以及挖掘低丰度转录本等研究。
-
-
2
表6-2 陆地棉6个组织的RNA-Seq数据分析
Q20
组织样读长品
数
1
基因 基因 0
(nt) 778 786 775 776 753 746 1054
(%N5总数 长度
碱基数 ) 7350 5750 3950 2850 2860 2160
开花后04790735930498.8222天胚珠 298 天胚珠 210 花 叶 根 茎 总计
1
22 7 7 86 2 0 99 3 5 51 0 0 68 6 5 46 2 8
13427706 3
开花后55302239766697.842352
4804936037397.822326786 238 254 024
54191403497.8225287943871494491.7823904971344741791.782408332322686141810 04920
Q20,测序准确率达到99%。
表6-3棉花组织特异性转录因子表达强度分析
3
序列标基识 58528 Unigene58563 Unigene58582 Unigene58458 Unigene55872 51911 Unigene58446 57837 580 B3 B3 RPKM 序列标基RPKM 0.65.40 51 0.44.0.43.24 60 0.36.13 74 0.31.0.24.09 01 0.18.0.17.20 62 0.16.34 92 0.14.因 根 茎 识 -L 因 根 茎 UnigeneMYB81.0.UnigenFAR86 16 e85367 1 56.0.UnigenHD-53.0.Unigen66 29 e51008 HB 45.0.UnigenMIKDof 54 00 e18073 C 41.0.Unigen02 00 e29146 ZIP 00 49 Dof 56 00 e521 MYB 15 71 H 19 e58698 B3 28.0.UnigenUnigenebHL36.0.UnigenNAC 40 37 e62109 MYB 04 45 H 27 00 e52681 P UnigenebHL20.0.UnigenbZIUnigeneS1F20.0.UnigenG2-a-L 25 68 e531 L UnigeneB3 15.0.UnigenbHL4
55579 71 13 e486 H 00 49 转录组组装过程中,同一个非重复序列上复盖有来自根、茎等不同组织的读长,不同读长数目通过归一化转变为RPKM值,进而筛选得到组织特异表达的转录因子。
6. 1. 2 RNA的选择性剪接技术
RNA的选择性剪接是指用不同的剪接方式(选择不同的剪接位点组合)从一个mRNA前体产生不同的mRNA剪接异构体的过程。一般将选择性剪切分为如下几类:平衡剪切、5’选择性剪切、3’选择性剪切、外显子遗漏型剪切及相互排斥性剪切(图6-3)。一般用RT-PCR的方法研究一个基因是否存在选择性剪切。首先以cDNA两端特异引物或来自不同外显子的引物序列在不同组织来源的RNA样品中进行扩增,观察PCR产物大小是否存在差异。一旦发现差异,即可通过序列分析来判断这种差异是否来自于选择性剪切。图6-4为拟南芥中发现的有选择性剪切的5个转录因子基因的物理图谱。选择性剪接使一个基因翻译为多种蛋白质序列,是基因表达多样性的重要表现形式。分析人类基因组数据发现,有60%的基因在表达过程中可通过选择性剪切产生各种形式的mRNA。最新的研究表明,果蝇的Dscam基因最多可能够产生38,016种不同形式的剪切体(图6-5)。由于选择性剪切与细胞生理、发育调节以及肿瘤的发生、转移等有密切关系,阐明基因的选择性剪切机制是了解动植物个体发育和基因功能的重要环节。因此,发现新的可变剪切异构体,确定每个异构体的独特功能和生物学意义并阐明其调节机制,是功能基因组时代的一个重要特征。
6. 1. 3 原位杂交技术
原位杂交( In Situ Hybridization,ISH) 是用标记的核酸探针,经放射自显影或非放射检测体系,在组织、细胞、间期核及染色体上对核酸进行定位和相对定量研究的一种手段,通常分为RNA原位杂交和染色体原位杂交两大类。RNA
5
原位杂交用放射性或非放射性(如地高辛、生物素等)标记的特异性探针与被固定的组织切片反应,若细胞中存在与探针互补的mRNA分子,两者杂交产生双链RNA,就可通过检测放射性标记或经酶促免疫显色,对该基因的表达产物在细胞水平上做出定性定量分析(图6-6)。
荧光原位杂交(fluorescence in situ hybridization,FISH)技术首先对寡核苷酸探针做特殊的修饰和标记,然后用原位杂交法与靶染色体或DNA上特定的序列结合,再通过与荧光素分子相耦联的单克隆抗体来确定该DNA序列在染色体上的位置(图6-7)。FISH技术不需要放射性同位素,实验周期短,检测灵敏度高,若用经过不同修饰的核苷酸分子标记不同的DNA探针,还可能在同一张切片上观察几种DNA探针的定位,得到相应位置和排列顺序的综合信息。
6. 1. 4 基因定点突变(site-directed mutagenesis)技术
定点突变是重组DNA进化的基础,该方法通过改变基因特定位点核苷酸序列来改变所编码的氨基酸序列,常用于研究某个(些)氨基酸残基对蛋白质的结构、催化活性以及结合配体能力的影响,也可用于改造DNA元件特征序列,修饰表达载体,引入新的酶切位点等。由于迄今尚未建立能精确预测特定氨基酸残基变化对整个蛋白结构及活性影响的模型,选择氨基酸突变的位点存在一定的盲目性。因为即使知道了该蛋白的三维结构,人们仍然无法了解某个氨基酸残基对其高级结构的影响。少数几个氨基酸残基的改变,有时根本不影响靶蛋白的功能,有时影响了靶蛋白的活性位点,有时还能从根本上改变整个蛋白的高级结构。所以,基因的定点突变是我们进一步了解蛋白质的结构与功能关系的重要手段。
最早在20世纪70年代初进行小噬菌体ΦX174单链基因组易突变位点图谱分析工作时认识到基因定点突变的可能性。在人工成功合成寡聚核苷酸、获得高品质DNA聚合酶和DNA连接酶的基础上,科学家建立了体外寡核苷酸介导的DNA突变技术(图6-8)。PCR技术的出现大大促进了定点突变技术的发展,简化了实验操作程序,提高了突变效率。科学家主要采用两种PCR方法,重叠延伸技术和大引物诱变法,在基因序列中进行定点突变。
图6-9阐述了重叠延伸介导的定点诱变机制。首先将模板DNA分别与引物对1
6
(正向诱变引物FM和反向引物R2)和2(正向引物F2和反向诱变引物RM)退火,通过PCR1和2反应扩增出两种靶基因片段。FMR2和RMF2片段在重叠区发生退火,用DNA聚合酶补平缺口,形成全长双链DNA,进行PCR3扩增。最后,用引物F2和R2扩增出带有突变位点的全长DNA片段(PCR4)。
大引物诱变法首先用正向突变引物(M)和反向引物(R1),扩增模板DNA产生双链大引物(PCR1),与野生型DNA分子混合后退火并使之复性,第二轮PCR中加入正向引物(F2),与PCR1中产生的一条互补链配对,扩增产生带有突变的双链DNA(图6-10)。由于F2的退火温度显著高于第一轮PCR所使用的引物M和R1,因此,可以忽略引物M和R1在本轮反应中所造成的干扰。获得定点突变PCR产物以后,一般需进行DNA序列分析以验证突变位点。
与经典定点突变方法相比,PCR介导的定点突变方法具有明显的优势:1、突变体回收率高,以至于有时不需要进行突变体筛选;2、能用双链DNA作为模板,可以在任何位点引入突变;3、可在同一试管中完成所有反应;4、快速简便,无需在噬菌体M13载体上进行分子克隆。所以,PCR介导的定点突变方法已成为定点突变的主要技术。
6. 2 基因敲除技术 6. 2. 1 基本原理
经典遗传学(Forward genetics)是从一个突变体的表型出发,研究其基因型,进而找出该基因的编码序列。在后基因组时代,大规模基因功能的研究正成为生命科学研究的热点,现代遗传学(Reverse genetics,反向遗传学)首先从基因序列出发,推测其表现型,进而推导出该基因的功能。基因敲除(gene knock-out)又称基因打靶,该技术通过外源DNA与染色体DNA之间的同源重组,进行精确的定点修饰和基因改造,具有专一性强、染色体DNA可与目的片段共同稳定遗传等特点。
1985年,科学家利用同源重组将一段外源质粒p△β117插入到人类染色体DNA β-珠蛋白位点,首次在哺乳动物细胞中进行基因打靶并获得成功。目前,在胚胎干细胞中进行同源重组已经成为遗传修饰基因组位点的常规技术。通过对这些基
7
因敲除生物个体的表型分析,鉴定或推测该基因的生物学功能。
基因敲除分为完全基因敲除和条件型基因敲除(又称不完全基因敲除)两种。完全基因敲除是指通过同源重组法完全消除细胞或者动物个体中的靶基因活性,条件型基因敲除是指通过定位重组系统实现特定时间和空间的基因敲除。噬菌体的Cre/Loxp系统、Gin/Gix系统、酵母细胞的FLP/FRT系统和R/RS系统是现阶段常用的四种定位重组系统,尤以Cre/Loxp系统应用最为广泛。
1.完全基因敲除
实验中一般采用取代型或插入型载体(图6-11)在ES细胞中根据正-负双向选择(positive-negative selection, PNS)原理(图6-12)进行完全基因敲除实验。正向选择基因neo通常被插入载体靶DNA功能最关键的外显子中,或通过同源重组法置换靶基因的功能区。neo基因有双重作用,一方面形成靶位点的插入突变,同时可作为正向筛选标记。负向选择基因HSV-tk(human semian virus-thymidine kinase)则被置于目的片段外侧,含有该基因的重组细胞不能在选择培养基上生长。如果细胞中发生了随机重组,负向选择基因就可能被整合到基因组中,导致细胞死亡。由于基因转移的同源重组自然发生率极低,动物的重组概率约为10-2~10-5,植物的概率为10-4~10-5,即使采用双向选择法也很难保证一次就从众多细胞中筛选出真正发生了同源重组的胚胎干细胞,必须用PCR及Southern杂交等多种分子筛选技术验证确实获得了目的基因被敲除的细胞系。
2.条件型基因敲除
对于许多有重要生理功能的基因来说,完全基因敲除往往导致胚胎死亡,有关该基因功能的研究便无法开展。而条件型基因敲除,特别是应用Cre/LoxP和FLP/FRT系统所开展的组织特异性敲除,由于其可调节性而受到科学家的重视。构建条件型基因敲除打靶载体时,常将正向选择标记neor置于靶基因的内含子中,并在靶基因重要功能域两侧内含子中插入方向相同的LoxP位点(图6-13)。当实验中需要消除靶基因活性时,与带有Cre重组酶基因的ES细胞杂交,Cre重组酶就能把两个LoxP位点中间的DNA片段切除,导致靶基因失活。标记基因两侧也常常带有LoxP序列,因为许多时候即使标记基因位于内含子中也会阻断靶基因的转
8
录。一旦出现这种情况,可以用Cre重组酶表达质粒转染中靶ES细胞,通过LoxP位点重组将neo抗性基因删除。
以Cre/loxp系统为基础,可以在动物的一定发育阶段和一定组织细胞中实现对特定基因进行遗传修饰。利用控制Cre表达的启动子活性或所表达的Cre酶活性具有可诱导性的特征,人们常常通过设定诱导时间的方法对动物基因突变的时空特异性进行人为控制,以避免出现死胎或动物出生后不久即死亡的现象。
6. 2. 2 高等动物基因敲除技术
胚胎干细胞(ES细胞)分离和体外培养的成功奠定了哺乳动物基因敲除的技术基础。真核生物基因敲除的技术路线主要包括构建重组基因载体,用电穿孔、显微注射等方法把重组DNA导入胚胎干细胞纯系中,使外源DNA与胚胎干细胞基因组中相应部分发生同源重组,将重组载体中的DNA序列整合到内源基因组中并得以表达,主要实验流程及筛选步骤如图6-14所示。
利用Neo基因替换目的基因外显子IV至外显子VI区段,得到肠碱性磷酸酶(Intestinal Alkaline Phosphatase,IAP)基因敲除的ES细胞,用显微注射或电穿孔法将IAP基因敲除的ES细胞注入早期胚胎的囊胚腔中,诱导胚胎分化,获得嵌合体胚胎后与野生型纯合体胚胎回交,获得由ES细胞分化产生的IAP基因敲除小鼠,实验证明,纯合小鼠体内检测不到IAP蛋白,而该基因的敲除导致小鼠变胖(图6-15)。在条件型基因敲除实验中,首先构建带有S6基因的LoxP打靶载体的ES细胞,经过杂交筛选,获得纯合体小鼠;再与带有肝组织特异性、受INF-α诱导的Mx-Cre转基因小鼠杂交,删除neo和外显子3-5,得到肝组织特异性敲除S6基因小鼠后发现,[3H]胸腺嘧啶不能掺入S6基因敲除小鼠肝组织,细胞不能进入S期,不能正常增殖(图6-16)。
一般来说,动物基因敲除时用显微注射胚胎干细胞命中率较高,技术难度相对大些。电穿孔法命中率比显微注射低,但操作相对简单易行。
因为同源重组常常发生在某一条染色体上,要得到稳定遗传的纯合体基因敲除模型,至少需要两代以上的遗传。除了基因敲除法,还有人用基因捕获的方法通过随机插入突变破坏靶基因表达(图6-17)。基因捕获载体包括一个无启动子的
9
报告基因(通常为neor基因),当该基因插入到ES细胞染色体某个部位,利用所在位点的转录元件得到表达时,该ES细胞就获得在含G418的选择性培养基上生长的能力。可通过分析标记基因侧翼cDNA或染色体DNA序列来获得靶基因的相关信息。
由于受整合位点附近染色质区的影响,转基因整合具有显著的位置效应,基因5’端启动子和增强子区,3’端终止子区都会对转基因的整合产生影响,这是某些打靶载体选择组织特异性启动子的原因之一。外源转基因的有效表达有时还取决于其是否有内含子,因为内含子中存在的转录元件可影响mRNA的剪切以及启动子与内含子间的相互作用。另外,内含子可能含有能开放染色体功能域的序列,还可能通过影响核质成分、位置等来影响基因表达强度。
除了研究基因功能之外,基因敲除技术还被广泛应用于建立人类疾病的转基因动物模型,为医学研究提供遗传学数据,为遗传病的治疗、为生物新品种的培育奠定新基础。
6. 2. 3 植物基因敲除技术
由于动植物细胞结构显著不相同,植物细胞基因敲除常采用不同于动物细胞的策略。T-DNA插入失活技术是目前在植物中使用最为广泛的基因敲除手段。T-DNA插入失活就是利用根瘤农杆菌T-DNA介导转化,将一段带有报告基因的DNA序列标签整合到基因组DNA上,如果这段DNA插入到目的基因内部或附近,就会影响该基因的表达,从而使该基因“失活”。由于该基因内部或附近插入了一段已知序列的DNA,可据此设计引物,用PCR方法将被破坏的靶基因序列分离出来(图6-18A)。若将靶基因(假定编码区为900个碱基对)两端的引物LP、RP及插入载体上的引物LB加入同一反应体系中进行PCR,理论上能得到三种类型的条带(图6-18B)。野生型植株中,只有LP和RP引物配对扩增出来的靶基因条带;如果实验材料来自纯合型基因敲除植株,那么,只有靶基因一端的引物可以与LB引物配对完成PCR扩增;如果实验材料来自杂合型基因敲除植株,那么,PCR扩增后会同时出现两种条带。
T-DNA无专一整合位点,在植物基因组中发生随机整合,所以,只要突变株的
10
数目足够大,从理论上就可能获得任何一个功能基因都发生突变的基因敲除植物库。拟南芥基因组冗余序列少,基因密度高,几乎每一个DNA插入都会导致某个基因功能的丧失,结合已完成的拟南芥基因组信息,人们很容易筛选到新的功能基因。已经用T-DNA插入失活方法建立了拟南芥大规模基因敲除突变体库,研究人员可以方便地在多个数据库中检索到感兴趣基因的突变体,再开展深入的表型分析和功能研究。
6. 3 蛋白质及RNA相互作用技术 6. 3. 1 酵母单杂交系统
酵母单杂交系统(yeast one-hybrid system)是上个世纪90年代中期发展起来的新技术,可识别稳定结合于DNA上的蛋白质,可在酵母细胞内研究真核生物中DNA-蛋白质之间的相互作用,并通过筛选DNA文库直接获得靶序列相互作用蛋白的编码基因。此外,该体系也是分析鉴定细胞中转录因子与顺式作用元件相互作用的有效方法。
酵母单杂交的基本原理如图6-19所示,首先将已知的特定顺式作用元件构建到最基本启动子(minimal promoter,Pmin)的上游,把报告基因连接到Pmin下游。然后,将编码待测转录因子cDNA与已知酵母转录激活结构域(transcription activation domain, AD)融合表达载体导入酵母细胞,该基因产物如果能够与顺式作用元件相结合,就能激活Pmin启动子,使报告基因得到表达。
目前,酵母单杂交体系主要被用于确定某个DNA分子与某个蛋白质之间是否存在相互作用,用于分离编码结合于特定顺式元件或其他DNA位点的功能蛋白编码基因,验证反式转录因子的DNA结合结构域,准确定位参与特定蛋白质结合的核苷酸序列。由于该方法的敏感性和可靠性,现已被广泛用于克隆细胞中含量极低且用生化手段难以纯化的那部分转录因子。常用的酵母单杂交体系基本选用HIS3或LacZ作为报告基因,虽然有的体系将带有报告基因的载体直接整合于酵母染色体上,在大部分的实验中报告基因都位于质粒DNA上。图6-20是利用酵母单杂交体系和已知的顺式作用元件DRE从拟南芥cDNA文库中筛选转录因子的基本流程。实验中如果将不同的未知基因与酵母GAL4的DNA结合结构
11
域相融合,通过检测位于GAL4顺式作用元件下游的报告基因的表达状况,还可以鉴定出该转录因子是否具有转录激活功能。
6. 3. 2 酵母双杂交系统(Yeast two-hybrid system)
该体系巧妙地利用真核生物转录因子的组件式结构(modular)特征,因为这些蛋白往往由两个或两个以上相互的结构域构成,其中DNA结合结构域(binding domain,BD)和转录激活结构域AD是转录激活因子发挥功能所必须的。单独的BD能与特定基因的启动区结合,但不能激活基因的转录,而由不同转录因子的BD和AD所形成的杂合蛋白却能行使激活转录的功能。实验中,首先运用基因重组技术把编码已知蛋白的DNA序列连接到带有酵母转录因子(常为GAL1、GAL4或GCN1)DNA结合结构域编码区(BD)的表达载体上。导入酵母细胞中使之表达带有DNA结合结构域的杂合蛋白,与报告基因上游的启动区相结合,准备作为“诱饵”捕获与已知蛋白相互作用的基因产物。此时,若将已知的编码转录激活结构域(AD)的DNA分别与待筛选的cDNA文库中不同插入片段相连接,获得“猎物”载体,转化含有“诱饵”的酵母细胞。一旦酵母细胞中表达的“诱饵”蛋白与“猎物”载体中表达的某个蛋白质发生相互作用,不同转录因子的AD和BD结构域就会被牵引靠拢,激活报告基因表达。分离有报告基因活性的酵母细胞,得到所需要的“猎物”载体,就能得到与已知蛋白相互作用的新基因(图6-21)。
6. 3. 3 蛋白质相互作用技术
1、等离子表面共振技术
该技术是将诱饵蛋白结合于葡聚糖表面,将葡聚糖层固定于纳米级厚度的金属膜表面。当有蛋白质混合物经过时,如果有蛋白质同“诱饵”蛋白发生相互作用,那么两者的结合将使金属膜表面的折射率上升,从而导致共振角度的改变。而共振角度的改变与该处的蛋白质浓度成线性关系,由此可以检测蛋白质之间的相互作用(图6-22)。该技术不需要标记物和染料,安全灵敏快速,还可定量分析。缺点是需要专门的等离子表面共振检测仪器。
12
图6-23应用SPR技术研究COI1蛋白与JAZ1蛋白之间的相互作用。研究人员首先在葡聚糖芯片表面固定1000共振单位的茉莉酸(JA)信号通路负因子JAZ1蛋白,当体系中同时有茉莉酸-异亮氨酸(JA-Ile)及COI蛋白存在时,可以检测到最高达380共振单位的SPR反应信号。加入一种在结构和功能上与茉莉酸甲脂(MeJA)非常相似的名为冠毒素(COR)的细菌毒素,也能使COI1和JAZ1发生相互作用。
2、免疫共沉淀技术(Co-Immuno Precipitation,CoIP)
该技术的核心是通过抗体来特异性识别候选蛋白。首先,将靶蛋白的抗体通过亲和反应连接到固体基质上,再将可能与靶蛋白发生相互作用的待筛选蛋白加入反应体系中,用低离心力沉淀或微膜过滤法在固体基质和抗体的共同作用下将蛋白复合物沉淀到试管的底部或微膜上。如果靶蛋白质与待筛选蛋白发生了相互作用,那么,这个待筛选蛋白质就通过靶蛋白与抗体和固体基质相互作用而被分离出来(图6-24)。
免疫共沉淀实验中常用pGADT7和pGBKT7质粒载体分别以融合蛋白形式表达靶蛋白,体外转录、翻译后将产物混合温育,分别用Myc或HA抗体沉淀混合物,过柱后再用SDS-PAGE电泳分离,检测两个靶蛋白之间是否存在相互作用(图6-25)。实验表明,棉花乙烯合成酶基因ACS2与钙离子依赖性蛋白激酶CDPK1之间存在相互作用,而该蛋白与CDPK32及CRK5没有发生相互作用。ACO1与这三个蛋白都没有发生相互作用(图6-26)。
3、GST及GAD融合蛋白沉降技术
该技术利用GST对谷胱甘肽偶联的琼脂糖球珠的亲和性,从混合蛋白质样品中纯化得到相互作用蛋白(图6-27)。GST沉降试验通常有两种应用:确定探针蛋白与未知蛋白间的相互作用,确证探针蛋白与某个已知蛋白之间的相互作用。与此相类似,实验中把GAD与PIF3的不同区段相连接成为钓饵,研究该重组蛋白在体外与光敏素B (phyB)、其缺失N-37位氨基酸的突变体或光敏素A (phyA) 的相互作用情况。研究发现,光敏素B (phy B)能与PIF3发生强烈的相互作用(超
13
过30%的光敏素B能被PIF3沉淀下来),但缺失N-37位氨基酸的phy B突变体以及光敏素A (phy A)只能与PIF3发生较弱的相互作用,约5%的光敏素A,或约10%的N-37位氨基酸缺失突变光敏素B能被沉淀下来(图6-28)。
4、细胞内蛋白质相互作用研究—荧光共振能量转移法(FRET)
FRET现象是21世纪初叶发现的。FRET荧光能量给体与受体之间通过偶极-偶极耦合作用以非辐射方式转移能量的过程又称为长距离能量转移,有三个基本条件:
(1)给体与受体在合适的距离(1~10 nm);
(2)给体的发射光谱与受体的吸收光谱有一定的重叠(这是能量匹配的条件);
(3)给体与受体的偶极具有一定的空间取向(这是偶极-偶极耦合作用的条件)。
FRET需要有两个探针,即荧光给体和荧光受体,要求给体的发射光谱与受体的吸收光谱有部分重叠,而与受体的发射光谱尽量没有重叠。常用的探针有三种:荧光蛋白,传统有机染料和镧系染料。
荧光蛋白是一类能发射荧光的天然蛋白或突变体,常见的有绿色荧光蛋白(GFP)、蓝色荧光蛋白(BFP)、青色荧光蛋白(CFP)和黄色荧光蛋白(YFP)等。不同蛋白的吸收和发射波长不同,可根据需要组成不同的探针对。
传统有机染料是指一些具有特征吸收和发射光谱的有机化合物组成的染料对。常见的有荧光素、罗丹明类化合物和青色染料Cy3、Cy5等,该类染料分子体积较小,种类较多且大部分为商品化的分子探针染料,因此被广泛应用。
镧系染料一般与有机染料联合使用,分别作为FRET的给体或受体,检测的准确性和信噪比较之传统染料有提高。
研究蛋白质间相互作用时,FRET一般与荧光成像技术联用,将蛋白标记上荧光探针,当蛋白间不发生相互作用时,其相对距离较大,无FRET现象,而蛋白发生相互作用时,其相对距离缩小,有FRET现象发生(图6-29),可根据成像照片的色彩变化直观地记录该过程。
14
6. 3. 4 染色质免疫共沉淀技术(Chromatin Immuno Precipitation,ChIP)
是一项新发展的研究活体细胞内染色质DNA与蛋白质相互作用的技术,其主要实验流程是:在活细胞状态下固定蛋白质-DNA复合物,并通过超声或酶处理将其随机切断为一定长度的染色质小片段,然后通过抗原抗体的特异性识别反应,沉淀该复合体,从而富集与目的蛋白相结合的DNA片段,通过对目的片段的纯化及PCR检测(图6-30),获得该蛋白质与DNA相互作用的信息,包括具体的DNA序列特征,位置,结合时间、亲和程度以及对基因表达的影响等(图6-31)。
ChIP技术不仅可以用来检测体内转录因子与DNA的动态作用,还可以研究组蛋白的各种共价修饰与基因表达的关系,定性或定量检测体内转录因子与DNA的动态作用。如果能将你所研究的目的蛋白定位到染色质DNA上某个或某些功能基因的启动子区或附近,对于确定你所感兴趣的蛋白质的生物学功能可能会是一次质的飞跃。
6. 3. 5 RNAi(RNA interference, RNA干涉)技术及其应用
RNAi技术利用双链小RNA高效、特异性降解细胞内同源mRNA从而阻断靶基因表达,使细胞出现靶基因缺失的表型。研究发现,对线虫注射外源双链RNA(double-stranded RNA)可诱发与该RNA高度同源的基因序列的特异性“沉默”。现在已经知道,RNAi是一个多步骤反应过程,包括对触发物的加工、与目标mRNA的结合以及目标mRNA的降解。至今已在果蝇、锥虫、涡虫、线虫等许多动物及大部分植物中陆续发现了RNAi效应。
双链RNA是RNAi的触发物,引发与之互补的单链RNA(ssRNA, single-stranded RNA)的降解。经过Dicer(一种具有RNAase III活性的核酸酶)的加工,细胞中较长的外源双链RNA(30个核苷酸以上)首先被降解形成21~25个核苷酸的小分子干扰核糖核酸(siRNA,short interfering RNA),并有效地定位目标mRNA。因此,siRNA是导致基因沉默和序列特异性RNA降解的重要中间媒介。较短的双链RNA不能被有效地加工为siRNA,因而不能介导RNAi。siRNA具有特殊的结构特征,即5’端磷酸基团和3’端的羟基,其两条链的3’端各有
15
两个碱基突出于末端。由siRNA中的反义链指导合成一种被称为RNA诱导的沉默复合体(RISC)的核蛋白体,再由RISC介导切割目的mRNA分子中与siRNA反义链互补的区域,从而实现干扰靶基因表达的功能(图6-32)。siRNA还可作为特殊引物,在依赖于RNA的RNA聚合酶的作用下,以目的mRNA为模板合成dsRNA,后者又可被降解为新的siRNA,重新进入上述循环。因此,即使外源siRNA的注入量较低,该信号也可能迅速被放大,导致全面的基因沉默。
在哺乳动物细胞内,较长的dsRNA会导致非特异性基因沉默,只有大约21-25个核苷酸的siRNA才能有效地引发特异性基因沉默。非哺乳动物细胞可以利用较长的双链RNA直接诱导产生RNAi而无须合成siRNA,因此,设计非哺乳动物细胞RNAi实验的步骤比较简便,只要通过目的基因体外转录得到所需要的dsRNA,再通过浸泡、注射或转染靶细胞即可实现RNAi。
6. 4 基因芯片及数据分析
应用传统的实验方法如RT-PCR或Northern印迹杂交法研究基因的表达规律,受电泳泳道数量的,每次一般只能研究很少量的靶基因。随着功能基因组学研究的不断深入,迫切需要能同时监测大量靶基因表达的实验手段,以期迅速准确地在基因组水平上阐述不同生物组织或细胞中各种转录本的变化规律。基因芯片(DNA chip),又称DNA微阵列(DNA microarray)技术就是在这种情况下应运而生的。
6. 4. 1 基因芯片技术原理
基因芯片是一种小型分析装置,能够快速和精确地研究生物体、组织、器官或细胞内基因组的遗传信息。制作基因芯片时,可用机械臂将大量已知或未知序列的DNA片段点在玻璃片(通常为2×2厘米2)、金属片或尼龙膜上,再经过物理吸附作用使之固定化。也可以直接在玻璃板或金属表面进行化学合成,从而得到寡聚核苷酸芯片。将芯片与待研究的cDNA或其它样品杂交,经过计算机扫描和数据处理,便可以观察到成千上万个基因在不同组织或同一组织不同发育时期或不同生理条件下的表达情况(图6-33)。荧光标记的cDNA与芯片上相匹配的DNA
16
序列发生杂交反应,使得芯片上的点呈现出荧光信号,荧光信号的强度和基因表达的丰度成正相关。基因芯片这种微型化装置具有巨大的容量,使科学家能在一个实验中分析整个基因组的变化。用基因芯片进行研究一般包括五个步骤:生物学问题的提出、样品制备、生化反应、检测、数据模型分析。
6. 4. 2 基因芯片的点制过程
1、简易基因芯片
制作简易基因芯片时,使用机械臂把DNA片段点在玻璃片或尼龙膜上,再经过物理吸附作用(85℃)烘烤或化学处理使DNA分别固定在载体上。将芯片与待研究的cDNA或其它样品杂交,经过计算机扫描和数据处理,便可以观察到大规模的基因群在不同组织或同一组织不同发育时期或不同生理条件下的表达情况(图6-34)。简易芯片上的基因数量少(一般不超过2,000),主要用于研究小部分特定的基因表达状态。简易芯片一般可以用手工制作或者机械手点样。
2、大规模基因芯片
大规模基因芯片通常涉及基因组规模与数量(一般大于10,000个基因),可采用接触式点样、非接触式点样或者半导体技术制备样品。其主要工作流程如下:
(1)经大规模PCR扩增获得cDNA片段;
(2)用机械手将PCR产物点在合适的介质上,变性、固定; (3)分别从不同器官、组织或细胞中分离mRNA,反转录生成cDNA; (4)用不同的荧光染料标记不同的cDNA样本; (5)将标记后的cDNA与点好的芯片进行杂交; (6)激光扫描芯片杂交结果,计算机处理; (7)分析杂交数据。
6. 4. 3 基因芯片数据分析
基因芯片数据分析包括两部分,数据可靠性分析和生物学意义分析。 数据可靠性分析。因为用基因芯片进行杂交分析,每次实验结果都会有些变化,
17
因为包括靶DNA浓度、探针浓度、杂交双方的序列组成、盐浓度以及温度等许多因素影响了杂合双链的形成和稳定性。因此,需要进行重复试验以确保数据的准确。主要的方法是通过两次平行杂交反应,将每个基因在两个反应中的表达水平做成对应散点图,只要绝大多数基因的杂交结果都在45度斜线附近,就说明实验结果是可靠的(图6-35)。
为了保证基因芯片数据的可靠性,芯片中还需要加上多个持家基因(housekeeping genes)作为内对照。持家基因,如呼吸作用的酶类和细胞骨架蛋白基因等,是维持细胞正常生长发育的必须基因,其表达水平在细胞内基本不变。数据处理时,认为持家基因的反应信号在两种组织中不变,依此确定其它基因表达信号的相对变化。
生物学意义分析。主要指通过分析芯片杂交数据,研究差异表达基因的生物学意义。通常,在芯片中某一器官或发育时期可能有成百上千个差异表达基因。例如,基因芯片分析植物根部可能有400多个特异表达的基因,如果要将这些基因的来龙去脉都搞清楚,可能要追溯超过4000篇以上的文献(假设1个基因需要查阅10篇文献)。这种不捡重点的方法耗时耗力,所获得的结果也往往不一定有意义。因此,首先将差异表达基因定位于不同的生化代谢途径,统计每条生化代谢途径中固有的基因数量和被基因芯片定位的差异表达的基因数量,可以计算出特定器官或特定发育阶段表达有显著差异的代谢途径。
图6-36是11,832个棉花cDNA的玻璃芯片杂交图谱的差异表达基因聚类分析,发现有超过700个基因在棉花纤维伸长期特异性高表达。将这些基因定位到不同代谢途径中并经过统计分析发现,乙烯合成、细胞骨架和脂肪酸合成及延伸是三个在纤维细胞中特异性表达的代谢途径(表6-4)。在后续生物学研究中,以这些最具代表性的代谢途径为突破口,阐述了这些途径在纤维细胞发育中的重要性。
表6-4 用途径分析法研究基因芯片数据中可能具有生物学意义的代谢途径 生物体代谢途径
芯片中被定位的基因数
总数
2914
定位的差异 表达基因数
162
P值
Q值
18
乙烯合成 细胞骨架
脂肪酸合成及延伸 糖胺降解 抗坏血酸代谢 油菜素内脂合成
5 75 16 63 6
3 10 9 4 8 2
0.0016 0.0077 0.0080 0.0099 0.0217 0.0397
0.0295 0.0376 0.0376 0.0376 0.0522 0.0629
6. 5 利用酵母鉴定靶基因功能
酿酒酵母作为单细胞真核生物,具有和动植物细胞相似的结构特征,包括细胞核,内质网,高尔基体,线粒体,过氧化物酶体,细胞骨架等,而且其细胞生长发育过程和动植物细胞也有很高的相似性,很多基因在酵母和动植物细胞中是高度保守的。而且,酵母细胞很容易进行生物化学和分子生物学操作,因此,酵母是基因功能研究中常用的模式生物。
6. 5. 1 酵母的遗传学和分子生物学简介
酿酒酵母(Saccharomyces cerevisiae)有稳定的单倍体和二倍体细胞,是最早完成基因组DNA全序列测定的真核生物。鉴于其快速生长能力、无性繁殖能力以及简便的平板影印能力,它是生命科学领域里广泛应用的模式生物之一。理论上,与任何一种遗传学特征相对应的不同物种的结构基因都可以通过质粒文库的互补作用而在酵母缺失突变体中得到鉴定。导入酵母细胞中的DNA既能以自主复制的形式存在,也可能以被整合到基因组的方式存在。酵母中转化DNA的整合重组主要通过同源重组方式进行,整合效率较高。
酵母细胞的直径大约有5 µM,在光学显微镜下可以观察它的许多重要特征。酿酒酵母细胞是以出芽方式生长的。出芽的细胞被称为母细胞,产生的芽就成为子细胞(图6-37)。新生的芽从酵母细胞周期一开始就出现,直到细胞周期结束才从母细胞上分离下来。由于酵母细胞的全部生长都集中在芽上,而且这种生长贯穿整个细胞周期,所以通过观察芽的大小就可以粗略估计哪个细胞处于某种生长发育阶段。当培养基中营养元素耗尽时,酵母细胞会停止生长而滞留在特定生
19
长发育阶段,因此,可以通过观察显微镜下酵母细胞的出芽频率确定酵母的营养状态。
酵母单倍体和二倍体细胞在形态上有相似性,但也存在重要的差异。首先,二倍体细胞的直径大约是单倍体的1.3倍。其次,二倍体细胞呈长形或卵圆形而单倍体细胞通常接近圆形。第三,二倍体细胞和单倍体细胞的出芽方式不同。每个酵母细胞衰老前一般出芽20次,在母细胞表面以一定的方式连续出芽。单倍体细胞按照沿轴线的方向出芽,新芽与前一个芽紧密相连。二倍体细胞按极性方向出芽,新芽可以出现在长形细胞的任何一端。
酵母细胞有三种交配型MATa,MATα以及由这两种细胞相互交配形成的第三种交配型MATa/α。MATa/α不能与MATa和MATα中任何一种细胞交配。一般而言,MATa和MATα为单倍体,MATa/α为二倍体,但有例外。带有不同突变的单倍体细胞之间发生交配可以将不同的突变基因组合在同一个细胞中,为研究基因之间的相互关系提供了良好的实验材料。
野生型酵母属于原养型,只要培养基中有足够可利用的碳源和氮源,酵母细胞就能合成自身需要的各种营养物质。酵母首选碳源是葡萄糖,但也能利用其它很多种糖类。如果碳源适宜,酵母细胞首选通过酒精发酵产生能量。酵母细胞是条件性厌氧菌,在有氧和无氧状态下都能生存。
二倍体酵母细胞在低氮、无发酵性碳源的条件下(营养缺乏,“饥饿”条件)能通过减数形成单倍体孢子。此时,每个单倍体细胞在遗传背景上完全相同,从单个孢子来源的所有细胞都带有一套相同的染色体DNA。这些单倍体细胞中的某些重要基因发生突变后,因为不存在等位基因,很容易导致酵母细胞生长发育异常而发生表型变化。图6-38以酵母亮氨酸合成基因为例介绍了二倍体细胞通过减数形成单倍体细胞的过程。
6. 5. 2 酵母基因转化与性状互补
利用Yip(整合型质粒)可以对酵母基因组中的任意基因进行精确的敲除(置换),并通过孢子繁殖中的四分体分析技术进行观测和研究。带有致死突变位点和可能的外源功能互补基因的酵母二倍体细胞在饥饿条件下形成四分体孢子,将这
20
四个孢子用酵母四分体分离系统分开,如果所引入的外源基因具备互补突变位点的功能,含有突变基因的单倍体可以存活,否则就不能存活。图6-39中将多个棉花KCS基因(编码超长链脂肪酸合成酶)克隆到含有URA3筛选标记的表达质粒上,用带有URA3筛选标记的表达质粒替换带有TRP1筛选标记的质粒,实验发现,KCS12和KCS6基因都能完全互补野生型的表型,KCS13和KCS2虽然没有导致野生型的表型,但仍能使酵母细胞恢复生长,表明这些KCS基因都具备与elo2或elo3相似功能。
6. 5. 3 外源基因在酵母中的功能鉴定
将外源基因克隆于酵母表达载体上,转化野生型或突变酵母菌株,通过观察酵母的表型变化或分析细胞中化学成分的变化即可推测该基因的生物学功能。例如,在酵母细胞中表达外源基因与绿色荧光蛋白基因的融合蛋白后,可通过荧光显微镜观察荧光所在的亚细胞区域,从而了解该基因产物在细胞中的定位。野生型酵母细胞中18碳不饱和脂肪酸主要是C18:1,这些细胞不能产生含有两个或多个双键的不饱和脂肪酸,若将棉花中可能编码ω-6脂肪酸脱氢酶的基因转入野生型酵母细胞中,诱导该基因的表达,然后用气相色谱和质谱技术分析细胞的脂肪酸组成,在带有棉花基因的酵母细胞中可能出现C18:2不饱和脂肪酸,证明该基因编码了有功能的ω-6脂肪酸脱氢酶(图6-40)。因为酵母细胞中有与动植物细胞比较接近的蛋白质转录后修饰系统,许多在大肠杆菌中不产生功能蛋白质的动植物基因在酵母中表达后往往具有生物学功能。
6. 6 其它分子生物学技术 6. 6. 1 凝胶滞缓实验
凝胶滞缓试验(Electrophoretic Mobility Shift Assay,EMSA),是体外分析DNA与蛋白质相互作用的一种特殊的凝胶电泳技术。其基本原理是,蛋白质与DNA结合后将大大增加分子质量,而凝胶电泳中DNA朝正电极移动的距离与其相对分子质量的对数成正比,因此,没有结合蛋白的DNA片段跑得快,而与蛋白质形成复合物的DNA由于受到阻滞而跑得慢。历史上,该技术首次为大肠杆菌乳糖阻
21
遏物与其DNA结合位点的相互作用提供了动态数据。实验中,当特定的DNA片段与细胞提取物混合后,若该复合物在凝胶电泳中的迁移速率变小,就说明该DNA可能与提取物中某个蛋白质分子发生了相互作用。这一方法简单、快捷,是分离纯化特定DNA结合蛋白质的经典实验方法。
在EMSA试验中,用放射性同位素标记待检测的DNA片段(即探针DNA),然后与细胞提取物共温育,形成DNA-蛋白质复合物,将该复合物加到非变性聚丙烯酰胺凝胶中进行电泳。通常用32P标记DNA分子,而不标记蛋白质。电泳结束后,用放射自显影技术显现具放射性标记的DNA条带位置。如果细胞蛋白提取物中不存与同放射性标记的DNA探针相结合的蛋白质,那么所有放射性标记都将出现在凝胶的底部;反之,将会形成DNA-蛋白质复合物,由于受到凝胶阻滞的缘故,放射性标记的DNA条带就会出现在凝胶的不同部位(图6-41A)。
此外,EMSA还被用于研究与蛋白质相结合的DNA序列的特异性。在DNA-蛋白质复合物中加入超量的非标记竞争DNA分子,如果它与标记的探针DNA结合同一种蛋白质,由于竞争DNA(非标记)远远多于探针DNA(标记),绝大部分蛋白质会与竞争DNA结合,探针DNA则可能处于自由状态,凝胶电泳的放射自显影图上的阻滞条带就会显著变弱。相反,如果竞争DNA不能与探针DNA所结合的蛋白质发生相互作用,那么,探针DNA将仍旧与其结合蛋白形成复合物,阻滞条带强度不发生变化。另外,通过设计一系列引入一个或数个突变碱基的放射性标记探针,我们可以运用EMSA来评估这些突变对探针DNA与结合蛋白相互作用的影响,进而确定该探针DNA分子中与蛋白质直接发生相互作用的关键性碱基(图6-41B)。
6. 6. 2 噬菌体展示技术
噬菌体是细菌病毒的总称,英文为Bacteriophage,来源于希腊文“phagos”,有“吞噬”之意。噬菌体可在脱离宿主细胞的状态下保持自己的生命,但一旦脱离了宿主细胞,它们就既不能生长也不能复制,因为大多数的噬菌体只能利用宿主核糖体、合成蛋白质的因子、各种氨基酸及能量代谢体系进行生长和增殖。噬菌体可被分为溶菌周期和溶源周期两种不同的类型。在溶菌周期,噬菌体将其感染的宿主细胞转变成为噬菌体的“制造厂”,产生出大量的子代噬菌体颗粒。实验
22
室常将只具有溶菌生长周期的噬菌体叫作烈性噬菌体。而溶源生长周期是指噬菌体DNA被整合到宿主细胞染色体DNA上,成为它的一个组成部分,感染过程中不产生子代噬菌体颗粒。具有溶源周期的噬菌体被称为温和噬菌体。
噬菌体展示技术是将基因表达产物与亲和选择相结合的技术,其基本原理是将编码“诱饵”蛋白(你研究中所发现的任何感兴趣的蛋白质)的DNA片段插入噬菌体基因组,并使之与噬菌体外壳蛋白编码基因相融合。该重组噬菌体侵染宿主细菌后,复制形成大量带有杂合外壳蛋白的噬菌体颗粒,直接用于捕获靶蛋白库中与“诱饵”相互作用的蛋白质(图6-42)。噬菌体次要结构蛋白pIII和主要结构蛋白(外壳蛋白)pVIII均可作为载体来展示外源多肽。pIII基因融合时表达强度低(每个噬菌体上有不超过5个拷贝),与pVIII基因融合时,表达强度高(每个噬菌体外壳上可能有2,700-3,000个拷贝)。在pIII和pVIII基因的信号肽与成熟蛋白质编码区之间都有单一的克隆位点便于外源基因插入,表达的融合蛋白被分泌到细胞间质并由宿主蛋白酶切除信号肽,融合蛋白被作为结构外壳蛋白呈现到病毒粒子的表面。
直接法亲和筛选是将靶蛋白质分子耦联到固相支持物上,文库噬菌体与固相支持物温育后洗去未结合的噬菌体,即获得与所筛选蛋白有亲和性的噬菌体。间接法亲和筛选是将生物素标记的蛋白质分子与文库噬菌体温育后铺在含有链亲和素(能与生物素相结合)的平皿上,洗去未结合的噬菌体,保留在平皿上的就是结合状态的噬菌体。洗脱结合状态噬菌体后感染细菌,扩增噬菌体,开始新一轮的筛选,连续几次亲和纯化反应后就能选择性富集并扩增结合靶蛋白的噬菌体。
6. 6. 3 蛋白质磷酸化分析技术
细胞的生长发育、周期、基因表达、蛋白合成以及神经功能、肌肉收缩等都离不开蛋白质特异性磷酸化,因此,由蛋白激酶和蛋白磷酸酯酶所催化的蛋白质可逆磷酸化过程,是生物体内一种普遍且重要的调节方式,控制着众多的生理生化反应和生物学过程。许多复杂的细胞信号转导系统还涉及到由多个蛋白激酶所催化的磷酸化级联反应。通常蛋白激酶催化ATP或GTP的γ磷酸基团转移到底物蛋白的丝氨酸、苏氨酸或酪氨酸残基上,促使底物蛋白发生磷酸化,而蛋白质
23
磷酸酯酶则能催化底物蛋白发生去磷酸化(图6-43)。此外,底物蛋白的组氨酸、赖氨酸、精氨酸、天冬氨酸、谷氨酸和半胱氨酸残基上也能发生可逆磷酸化。
实验室研究蛋白质磷酸化主要包括底物蛋白磷酸化和蛋白激酶活性检测,一般采用双向电泳及质谱分析等检测底物蛋白磷酸化。由于细胞内可能有多达上千个蛋白激酶,体内检测某个蛋白激酶活性非常困难,科学家常用体外激酶活性分析法来检测蛋白激酶活性。该方法能十分可靠地鉴定某个蛋白激酶对底物的磷酸化作用,筛查激酶的特异性底物。蛋白激酶体外磷酸化活性分析如图6-44所示,主要分为获取底物蛋白或待检测蛋白激酶和进行蛋白质体外磷酸化反应两步。可以直接从组织中提取目的蛋白(包括底物蛋白及待检测蛋白激酶),也可由原核或真核表达载体诱导表达目的蛋白。如图6-45所示,将体外表达的棉花钙离子依赖性蛋白激酶CDPK1与乙烯合成酶基因ACS2置于蛋白质体外磷酸化实验体系中,研究发现,有钙离子存在时,ACS2能被有效地磷酸化,ACO1及SUS蛋白则不能被磷酸化。
6. 6. 4 蛋白质免疫印迹实验(Western Blotting)与抗备
1.蛋白质免疫印迹实验(Western blotting)。是分子生物学中最常用的蛋白质研究技术,是二十世纪70年代末80年代初在蛋白质凝胶电泳和固相免疫测定基础上发展起来的一种技术,为检测样品中是否存在蛋白抗原提供了一种可靠的方法。免疫印迹法的基本原理是被测蛋白只能与标记的特异性抗体相结合,而这种结合不改变该蛋白在凝胶电泳中的相对分子质量。免疫印迹法具有高效、简便、灵敏等特点,能被用于测定抗原的相对丰度或与其它已知抗原的关系,也是评价新抗体特异性的一种有用方法。
免疫印迹程序可分为五个步骤:1、蛋白样品的制备;2、SDS-PAGE电泳分离样品; 3、将已分离的蛋白转移到尼龙或其它膜上,转移后首先将膜上未反应的位点封闭起来以抑制抗体的非特异性吸附;4、用固定在膜上的蛋白质作为抗原,与对应的非标记抗体(一抗)结合;5、洗去未结合的一抗,加入酶偶联或放射性同位素标记的二抗,通过显色或放射自显影法检测凝胶中的蛋白成分(图5-46)。
2.抗备。免疫学研究中,利用抗原分子刺激机体,使其产生免疫学反应,
24
由机体的浆细胞合成并分泌的能与抗原分子特异性结合的一组免疫球蛋白被定义为抗体。由于抗原分子通常是由多个抗原决定簇组成的,由单一抗原决定簇刺激机体,由一个B淋巴细胞克隆接受该抗原所产生的抗体就被称为单克隆抗体(monoclonal antibody),而由多种抗原决定簇产生的一组含有针对各个抗原决定簇的混合抗体,就被称为多克隆抗体(polyclonal antibody)。制备技术主要分为:1、抗原准备。对于某个特定的蛋白质,常有多种抗原形式,包括形成特异性藕联多肽、重组表达该蛋白全长或部分以及重组表达的融合蛋白等。2、动物选择。实践中供免疫用的动物主要是哺乳动物,常选择家兔、绵羊、山羊、小鼠等。动物选择常依据抗体的用途和需用量决定,如需大量制备抗体,多采用体型较大的动物。如期望获得直接用于标记诊断的抗体,则应采用与诊断目标相同的动物,而如需获取间接的标记诊断用抗体,则必须采用异源动物。3、动物免疫。针对不同的动物及要求抗体的特性等不同,需采用不同的免疫剂量、免疫周期来对动物进行免疫。以小鼠为例,首次的免疫剂量为50-400 μg/次,免疫周期间隔为5-7天,在一定的范围内,抗体的效价随免疫剂量增加而提高,而较长的免疫周期有利于获得较高效价的抗血清。4、效价检测。不同抗原分子,不同免疫动物的选择,以及不同的免疫方法,其效价往往不同。可用试管凝集法、琼脂扩散实验、酶联免疫吸附试验(ELISA)等检测抗体效价。5、采集血清,纯化抗体。如果抗体鉴定效价达到要求,则杀死实验动物,采集全部血清,利用藕联在支持物上的含特异性抗原决定簇的分子来纯化抗体。6、获得抗体并进行纯度及特异性鉴定。
图6-47是多克隆抗备的一个应用实例。针对陆地棉一个甲基化酶DOMAINS REARRANGED METHYLASE 1/2 (DRM1/2)。抗原制备时采用是特异性藕联多肽的方案,首先克隆出陆地棉DRM1/2的全长核酸序列并找到读码框将其翻译为蛋白序列,对该蛋白进行亲/疏水性、抗原活性及蛋白结构预测等分析,选取最可能暴露于蛋白表面并抗原活性较高的亲水性片段作为备选的多肽片段。根据所选多肽片段序列合成一段多肽并藕联在有助于产生抗体的分子上。实验中用家兔作为免疫动物,共免疫8次,周期为5-7天,首次免疫剂量为0.5-1 mg/kg,后续加强免疫剂量为0.2-0.5 mg/kg/次。得到的抗体经纯化后用ELISA鉴定其效价并采用重组表达了DRM1/2特异性蛋白片段的大肠杆菌蛋白作为正对照检验了该抗体的
25
特异性。两个抗体分别稀释,000倍,仍然有较强的杂交信号,表明抗体效价高,特异性强,可满足后续蛋白质印迹实验需求。在4个不同的棉花材料蛋白样品中,利用该抗体进行了蛋白质印记实验,发现了在不同样品中该蛋白丰度有差异,在样品1中该蛋白表达丰度最高而在样品3中丰度最低。
影响免疫印迹成败的一个主要因素是抗原分子中可被抗体识别的表位性质。所以在选择抗体(一抗)时要考虑所选抗体是否能识别凝胶电泳后转印到膜上的变性蛋白,还有所选抗体是否会引起交叉反应。第二个影响因素是蛋白原液中抗原的浓度。对于中等分子量的蛋白质(50 kDa左右)其浓度需大于0.1 ng才能被检出。如果要检测更低量的蛋白质,样品要做进一步的纯化。
用于检测的二级抗体一般分三种:
1、放射性标记的抗体。最早的Western blotting都采用这种方法,这也是迄今为止定量最准确的方法。由于使用放射性同位素,有一定的危险性,现在已逐渐被非放射性检测系统所取代。
2、与酶偶联的抗体。主要包括辣根过氧化物酶和碱性磷酸酯酶,如果选用辣根过氧化物酶标记的二抗,就可以用化学发光法检测。当有过氧化氢存在时,辣根过氧化物酶催化鲁米诺氧化即可发光,在暗室用x光胶片曝光法可以检测到信号。如果选用碱性磷酸酶标记的二抗和溴氯吲哚磷酸盐/硝基氮蓝四唑(BCIP/NBT)做底物,能在酶结合部位产生肉眼可见的黑紫色沉淀,产生清晰的条带,而且几乎没有背景。反应可被EDTA所终止。
3、与生物素偶联的抗体。生物素是可溶性的维生素,能与抗生物素蛋白高亲和力结合,后者再与报道酶相结合,以确定抗生物-生物素-靶蛋白复合物的位置并进行定量分析。
6. 6. 5 细胞定位及染色技术
真核生物具有非常复杂的亚细胞结构,每种亚细胞结构或细胞器均含有特定的蛋白质。蛋白质在组织及细胞内的亚定位,一直是细胞生物学和分子生物学研究的核心问题,因为了解特定蛋白质的定位,才有可能了解其生物学功能。研究细胞定位可采取多种方法,最常用的是荧光蛋白标记和免疫荧光法。
26
最常用的可能是绿色荧光蛋白(GFP),它由238个氨基酸组成,有两个吸收峰,最大吸收峰在395 nm,另外一个在475 nm,前者由紫外光激发,后者由蓝光激发。发射光也有两个峰值,分别是509 nm和540 nm;呈绿色或黄绿色荧光。将绿色荧光蛋白的编码序列与目的基因启动子融合形成嵌合基因,或者将绿色荧光蛋白编码序列与目的蛋白编码序列融合,构成融合基因,通过花序浸染法、基因、显微注射法、愈伤组织转化法、细胞转染等技术,转染植物或动物细胞,由于融合基因与目的基因的表达模式相同(使用相同的表达元件),通过荧光显微镜观察GFP在组织或亚细胞中的分布就相应确定了目的蛋白在细胞中的定位(图6-48)。
免疫荧光技术是将免疫学方法(抗原抗体特异结合)与荧光标记技术结合起来研究特异蛋白抗原在细胞内定位的方法。用针对特异蛋白抗原的荧光标记抗体作为分子探针检测细胞或组织内的相应抗原,由于所形成的抗原抗体复合物上含有荧光素,利用荧光显微镜观察标本,确定荧光所在细胞或组织,从而对抗原蛋白进行定位(图6-49)。
27
思考题
1、 写出用RNA-seq技术进行转录组学分析的原理。 2、 写出RNA原位杂交的主要实验过程及应用。 3、 简述基因芯片技术对分子生物学研究的意义。
4、 说出免疫共沉淀(Co-IP)实验的原理与过程,比较酵母双杂交技术和免疫共沉淀技术在研究蛋白质相互作用方面的优缺点。
5、 简述RNAi技术技术原理以及在分子生物学领域应用的前景。 6、 写出基因定点突变的原理与实验过程。
7、 说出经典遗传学(Forward genetics)与现代遗传学(反向遗传学,Reverse genetics)的异同。
8、 假设某哺乳动物基因可能编码了脂肪酸脱氢酶,请在酵母细胞中设计试验研究该基因的功能。
9、 蛋白质Pull-down实验原理与主要步骤。 10、染色质免疫共沉淀(ChiP)技术原理与基本过程。 11、什么是完全基因敲除和条件型基因敲除。 12、酵母单、双杂交系统的基本原理与应用。 13、说出凝胶滞缓实验的原理与应用。
14、一个二倍体酵母细胞存在两对不相关的等位基因Aa和Bb(大写字母代表野生型酵母基因,小写字母代表突变基因),请列出该二倍体细胞可能产生哪些不同基因型的四分体细胞。
28
因篇幅问题不能全部显示,请点此查看更多更全内容