五一七教育网
您的当前位置:首页植物的功能基因组学研究进展

植物的功能基因组学研究进展

来源:五一七教育网
遗传HEREDITAS(Beijing)22(1):57~602000

综述植物的功能基因组学研究进展

李子银,陈受宜

(中国科学院遗传研究所植物生物技术开放实验室,北京100101)

摘要:基因组研究计划包括以全基因组测序为目标的结构基因组学和以基因功能鉴定为目标的功能基因组学两方面的内容。目前基因功能鉴定的方法主要有:基因表达的系统分析(SAGE)、cDNA微阵列、DNA(基因)芯片、蛋白组技术以及基于转座子标签和T-DNA标签的反求遗传学技术等。本文对上述各种技术的优缺点以及它们在植物基因功能鉴定中的应用进行了综述。

关键词:功能基因组学;SAGE;cDNA微阵列;DNA芯片;蛋白组;反求遗传学中图分类号:Q943

文献标识码:A

文章编号:0253-9772(2000)01-0057-60

ProgressinFunctionalGenomicsinPlantsLIZi2yin,CHENShou2yi(InstituteofGenetics,ChineseAcademyofSciences,Beijing,100101China)

Abstract:Thegenomeprojectscomprisethestructuralgenomicsfocusingondeterminingthecompletesequencesofthegenomeandthefunctionalgenomicsfocusingonelucidatingthebiologicalfunctionofgenes.Therapidlye2volvingtoolsforfunctionalgenomicsresearchincludeSerialAnalysisofGeneExpression(SAGE),cDNAmicroar2ray,DNA(orgene)chips,proteomeprojectandthereversegeneticstechniquebasedonthewell2establishedtrans2

2DNAtaggingsystems.Inthispaper,theadvantagesanddisadvantagesofsuchtechniquesandposontaggingandT

applicationofthesetechniquesinplantfunctionalgenomicsresearcharereviewedandfutureprospectivearealsopresented.

Keywords:Functionalgenomics;SAGE;cDNAmicroarray;DNAchips;Proteome;Reversegenetics

以拟南芥和水稻为代表的植物基因组研究已取得了迅速的进展,到目前为止,占拟南芥基因组(100Mb)近三分之一的DNA序列已被测定并在GenBank数据库中登记注册,预期到2001年通过全球合作将完成拟南芥全基因组的序列测定工作。随着植物基因组计划的实施和进展,GenBank中累积了大量的未知功能的DNA序列,如何鉴定出这些基因的功能将成为基因组研究的重点课题,因此,基因组研究应该包括两方面的内容:以全基因组测序为目标的结构基因组学

(structuralgenomics)和以基因功能鉴定为目标的功能基因组

物功能基因组学的研究目前也已经受到重视,在1998年12月出版的最新一期PlantCell(10:1771)和PlantPhysiol.(118:

713)上均编发了关于植物功能基因组学研究的编者按,并由

〔2〕

Bouchez和Hofte(1998)综述了植物尤其是拟南芥功能基因

组学研究的现状,本文在此基础上综述了目前植物功能基因组学研究中使用的主要技术手段以及最新的研究进展。

1基因功能的含义

基因的功能主要包括:生物化学功能,如作为蛋白质激

学(functionalgenomics)研究,后者往往又被称为后基因组

(postgenome)研究。

酶对特异的蛋白质进行磷酸化修饰;细胞学功能,如参与细胞间和细胞内的信号传递途径;发育上的功能,如参与形态建成等。目前,获得一段DNA序列的功能信息的最简单的方法是将该DNA序列与GenBank中公布的基因序列进行同源性比较,如利用BLASTn和BLASTx两种软件分别进行核苷酸和氨基酸序列同源性比较等。同源性比较的结果大体可以分为如下类型:与生化和生理功能均已知的基因具同源性;与

功能基因组研究的内容是利用结构基因组所提供的信息,发展和应用新的实验手段系统地分析基因的功能

〔1〕

。目

前人类和酵母的功能基因组研究已经全面展开,尤其是对已完成全基因组测序的酵母来说,其功能基因组研究任务更加紧迫。植物的基因组研究虽然起步较晚,但由于吸取了人类基因组研究中积累的一些经验,所以进展也相当迅速,对植

收稿日期:1999-01-04;修回日期:1999-04-28

作者简介:李子银(1971-),男,博士生,专业方向:植物分子遗传。

58遗传HEREDITAS(Beijing)2000

22卷生化功能已知的基因具同源性,但该基因的生理功能未知;与其它物种中生化和生理功能均未知的基因具同源性;虽与生化和生理功能均已知的基因具同源性,但对该基因功能的了解尚不深入,仍停留在表观现象上。上述同源性检索分析方法仅仅为该DNA片段的功能提供了间接的证据,对基因功能的直接证据还需要实验上的数据。Bouchez和Hofte(1998)

〔2〕

片段进行了全序列测定,结果发现拟南芥基因组中平均每

4.8Kb就有一个基因存在,而且54%的基因与GenBank中已

知功能的基因有同源性,56%的基因可以与GenBank中的

EST相对应,大约20%的基因在该染色体片段上以基因家族

的形式存在。另外,在该染色体片段发现5种重复成分:非编码区中的重复DNA序列、反逆转座子成分、叶绿体DNA片段、散布重复的基因家族成员,以及串联重复的基因家族成员,这些重复成分约占所测序列的19%左右。基因组序列测定所面临的困难是如何将基因的编码序列与内含子、基因间的间隔序列区分开来,通常的做法是将所获得的基因组序列与GenBank中的EST或cDNA序列进行对比以寻找外显子序列,但是对那些在GenBank中检索不到同源基因的基因组序列,就必须依赖特殊的计算机软件进行分析了,常用的计

8〕

算机分析软件主要有用于人类基因组研究的GRAIL软件〔

将所需要的实验证据归纳如下:(1)通过研究基因的时空表达模式确定其在细胞学或发育上的功能,如在不同细胞类型、不同发育阶段、不同环境条件下以及病原菌侵染过程中

(2)研究基因在亚细胞mRNA和/或蛋白质的表达的差异等。

内的定位和蛋白质的翻译后等。(3)利用基因敲除

(knock-out)技术进行功能丧失(loss2of2function)分析或通过

基因的过量表达(转基因)进行功能获得(gain2of2function)分

(4)通过比较研析,进而研究目的基因与表型性状间的关系。

究自发或诱发突变体与其野生型植株在特定环境条件下基因表达的差异来获取基因功能的可能信息。

〔9,10〕

和植物基因组研究的NetPlantGene软件,这两个分析软件

在互联网中均可免费使用,其网址如下:GRAIL:http://comp2

bio.orn1.gov/tools/index.shtml;NetPlantGene:http://cbs.dtu.dk//services/NetGene2/。对植物来说,基因组测序计划还面临

植物的表达序列标记(expressedsequencetag,EST)与基因组大规模测序2

通过从cDNA文库中随机挑取的克隆进行测序所获得的部分cDNA的5′或3′端序列称为表达序列标记(EST),一般长

300~500bp左右,利用EST作为标记所构建的分子遗传图谱

3~5〕被称为转录图谱。目前植物EST计划主要集中在拟南芥〔6〕

和水稻〔上,其他植物的EST相对较少,截止到1998年12月

另一个困难,就是植物前体mRNA的剪接机制尚未完全阐明,因而即使利用计算机软件也很难从基因组序列中推测出基因的编码序列(外显子)。植物前体mRNA剪接的机制还因物种而异,如单子叶植物和双子叶植物前体mRNA的剪接方式就有差别。另外前体mRNA的选择性剪接(alternative

splicing)方式可能也存在于植物中并对植物的发育起重要作

底,在美国国家生物技术信息中心(NCBI)数据库中公布的各种植物EST的数目总和已达几万条(见表1)。这些EST不仅为植物基因组遗传图谱的构建提供了大量的分子标记,而且来自不同组织和器官的EST也为基因的功能研究提供了有价值的信息,此外,EST计划还为基因的鉴定提供了候选基因

(candidates)。EST计划的一个不足之处在于通过随机测序有

用。对植物前体mRNA剪接机制的研究目前只在拟南芥中有

11〕

报道〔,并积累了一些资料如拟南芥的内含子长度平均只有

200bp左右,平均每个基因只有少数几个内含子等。因此在大

力开展基因组测序的同时,还必须加强对植物前体mRNA剪接机制的研究。

时难以获得那些低丰度表达的基因和那些在特殊环境条件下(如生物胁迫和非生物胁迫)诱导表达的基因,因此为了弥补EST计划的不足,必须开展基因组测序计划。通过分析基因组序列能够获得基因组结构的完整信息,如基因在染色体上的排列顺序,基因间的间隔区结构,启动子的结构以及内含子的分布等。

7〕

最近,Bevan等(1998)〔对拟南芥第4染色体上的1.9Mb

3植物基因的功能分析方法

基因的时空差异表达是植物发育、分化、衰老和抗逆等生

命现象的分子基础。基因在不同组织、不同器官以及不同环境条件下的差异表达特征,为基因的功能提供了重要的信息。

〔12〕

Velculescu等(1997)将在特定组织或细胞内转录的所有基

因及其表达丰度称为转录组(transcriptome),因此在转录水平上进行的基因表达差异分析实际上就是进行转录组研究。经典的减法杂交(subtractivehybridization),差示筛选(differential

screening),cDNA代表差异分析(representativedifferenceanaly2sis,RDA)以及mRNA差异显示(differentialdisplay)等技术已被

表1

植物

NCBI数据库dbEST中公布的植物EST的数目

EST数目376183519220400275214341327966

植物白菜番茄高粱马铃薯大麦烟草小麦

EST数目5363461078575624

拟南芥水稻大豆3玉米油菜棉花芥菜

广泛用于鉴定和克隆差异表达的基因,但是这些技术不能胜任对大量的植物基因进行全面、系统的分析,于是,基因表达的系统分析(serialanalysisofgeneexpression,SAGE)、cDNA微阵列(cDNAmicroarray)和DNA芯片(DNAchip)等能够大规模地进行基因差异表达分析的技术应运而生。

3.1

基因表达的系统分析(SAGE)

SAGE技术的主要理论依据是:来自cDNA3′端特定位

(截止至1998年12月底,31999年12月)

置的一段9~11bp长的序列能够区分基因组中95%的基

1期李子银等:植物的功能基因组学研究进展

59

因。这一段基因特异的序列被称为SAGE标签(SAGEtag)。通过对cDNA制备SAGE标签并将这些标签串联起来,然后对上述串联起来的SAGE标签进行测序不仅可以显示各SAGE标签所代表的基因在特定组织中是否表达,还可以根据各

SAGE标签所出现的频率作为其所代表的基因表达丰度的指

13〕标〔。应用SAGE技术的一个必要前提是GenBank中必须有

体或转基因重组体与野生型个体间双向电泳蛋白图谱的差异进行对比分析就可以对目的基因的功能进行分析。在植物

19〕

上该技术已被用来分离新的基因,Damerval等(1998)〔分析

了玉米Opaque2基因的近等基因系之间的双向电泳蛋白图谱的差异,结果鉴定克隆了一个新的转录激活因子基因。对水稻盐胁迫处理和ABA处理前后的双向电泳蛋白图谱进行的对比分析同样克隆了几个与水稻耐盐性相关的胚胎晚期

20,21〕丰富蛋白(lea)基因〔。

足够的某一物种的DNA序列资料,尤其是EST序列资料。目前该技术在人类

〔14〕

和酵母

〔12〕

基因组研究中已得以应用,但是

尚未用于植物基因组研究。SAGE技术的不足是不能够检测出稀有转录物。

3.2

cDNA微阵列和DNA芯片技术

cDNA微阵列和DNA芯片都是基于reverseNorthern杂交

3.4反求遗传学研究

传统的遗传学或称为正向遗传学(forwardgenetics)主要

研究自发或诱发突变体中某一突变性状的遗传行为,如控制突变性状的基因的数目及其在染色体上的位置、突变性状在后代中的传递规律等。反求遗传学(reversegenetics)是在已知基因序列的基础上研究基因的生物学功能,一般通过创造功能丧失(loss-of-function)突变体并研究突变所造成的表型效应。在微生物和小鼠中可以通过同源重组的方法用突变的基因取代野生型基因创造功能丧失突变体进行反向遗传学研22〕究,但在植物中很难进行同源重组试验〔,不过植物中有成

以检测基因表达差异的技术。二者的基本思路都是首先把

cDNA,或EST,或基因特异的寡聚核苷酸固定在固相支持物

上,并与来自不同细胞、组织或整个器官的mRNA反转录生成的第一链cDNA探针进行杂交,然后用特殊的检测系统对每个杂交点进行定量分析,理论上杂交点的强度基本上反映了其所代表的基因在不同细胞、组织或器官中的相对表达丰度。这两项技术的优点是可以同时对大量基因,甚至整个基因组的基因的表达差异进行对比分析。cDNA微阵列技术是Schena等(1995)

〔15〕

熟的转座子标签(transposontagging)系统和T-DNA标签系统,而且目前已经获得了拟南芥、金鱼草、番茄、玉米和水稻等植物的转座子插入诱变的突变体群体,以及T-DNA插入诱变了的拟南芥突变体群体。从这些突变体群体中筛选出特异基因被突变了的植株,并对突变株进行表型分析将有助于揭示目的基因的生物学功能。筛选突变体的常用方法是利用PCR技

23〕24〕术,这是在果蝇〔和线虫(C.elegans)〔中发展起来的比较成

发展起来的,其主要优点是:灵敏度极高,

mRNA丰度低至10万分之一仍能被检测出;使用几种不同颜

色的荧光染料标记探针,这样在同一张阵列膜上进行一次杂交实验就可以同时分析不同细胞间或不同环境胁迫下基因表达的差异。cDNA微阵列技术的主要不足是成本非常高,如需要机器人点膜和特殊的信号检测分析系统,点在玻璃片上的array不能重复使用等。最近,Desprez等(1998)

〔16〕

熟的方法,其基本思路是根据目的基因的序列设计一个引物,再根据插入元件(转座子或T-DNA)的序列设计第二个引物,用上述引物对突变体群体进行PCR扩增,由于只有目的基因插入转座子或T-DNA的突变体才有PCR扩增产物,这样根据扩增产物的有无就可以很容易地从数以千计的突变

25〕体群体中筛选出所需要的突变体。该技术已经在矮牵牛〔、26,27〕28~35〕玉米〔和拟南芥〔等植物中得以成功应用。但是对数以

和胡玉欣

等(中科院遗传所,私人交流)分别发展了利用尼龙膜作固相支持物和使用同位素标记探针进行杂交的cDNA表达阵列技术,从而降低了成本,但检测的灵敏度却降低了(万分之一)。DNA芯片技术是Affymetrix公司率先研制出来的,该技术利用结合化学手段在玻璃固相支持物上原位合成大量的基因特异的寡聚核苷酸,并与荧光标记的探针进行杂交,再利用特殊的检测系统进行信号分析,就可以获得基因的时空差异表达谱,最近Ramsay(1998)

3.3

〔17〕

千计的材料进行PCR反应工作量十分巨大,为克服这一困

33〕难,Winkler等(1998)〔设计了利用DNA混合池(pooling)进行

对DNA芯片技术的原理突变体筛选的实验程序,结果只需要进行36个PCR反应就可以从由6000个突变体组成的群体中筛选出单个的突变株,大大减轻了筛选的工作量,同时这些突变体的DNA样品及构建的DNA池也可以向其他研究者免费提供。当然,要对基因组中所有的基因进行功能分析所需要的突变体的数目也是十分可观的,理论上,要达到95%的概率使基因组中每一个基因均因插入元件而致突变,则所构建的突变体群体中个体的数量至少应为该植物基因总数的5倍左右。

在进行反求遗传学研究时,有时筛选出来的突变体在正常生长条件下并不表现出突变的表型效应,这种情况一方面可能是由于突变的表型效应需要在特定的生长环境中才能得以表现出来,如拟南芥的钾离子通道基因突变体Akt1只有

35〕在缺钾的培养条件下才表现出突变的表型效应〔。另一方

和应用进行了较全面的介绍,这里不再赘述。

蛋白组(proteome)研究

转录不是基因表达的最终结果,基因功能的实现最终是以蛋白质的形式体现的,因此,在转录水平上所获取的基因表达的信息有时并不足以揭示该基因在细胞内的确切功能。蛋白组指的是由基因组表达产生的总蛋白质的统称,由英文单词protein的前半部加上单词genome的后半部组合而成。蛋白质双向电泳是目前蛋白组研究的首选技术

〔18〕

,但是

该技术在以下方面尚需改进:分辨率和可重复性;蛋白质斑点的自动定量检测系统,以及蛋白质N端和内部氨基酸序列测定技术等。

利用蛋白质双向电泳技术对基因敲除(knock-out)突变

60遗传HEREDITAS(Beijing)2000

22卷面,植物基因组中有些基因是以基因家族的形式存在的,即存在基因冗余,这样只要基因家族中有一个成员未发生插入突变,该基因的表达就能够补偿其他家族成员由于发生突变所造成的功能丧失效应。因此,对植物的家族基因的功能进行反求遗传学研究时必须对该基因家族中的各个成员均已发生插入突变的突变株进行表型分析,才能揭示该基因家族的生物学功能。

植物的功能基因组学研究才刚刚开始,上述的各种技术手段都各有优缺点,随着植物基因组研究的进展和深入,在完善现有的研究手段的同时,还必须发展一些新的基因功能的研究技术,同时加强国际间的学术和材料交流,建立全球共享的植物基因组数据库系统,以最终阐明植物基因组的结构与功能。另外,进一步的研究应从模式植物拟南芥的基因组研究转向作物的基因组研究,为作物的遗传改良作出贡献。

withacomplementaryDNAmicroarrays〔J〕.Science,1995,270:467~470.

〔16〕DesprezT,etal.DifferentialgeneexpressioninArabidopsisseedlings

monitoredusingcDNAarrays〔J〕.PlantJ,1998,14:3~652.〔17〕RamsayG,etal.DNAchips:state2oftheart〔J〕.NatureBiotechnol2

ogy,1998,16:40~44.

〔18〕Humphery2SmithI,etal.Proteomeanalysis:genomicsviatheoutput

ratherthantheinputcode〔J〕.JProteinChem,1997,16:537~544.

〔19〕DamervalC,etal.Characterizationofnovelproteinsaffectedbythe

o2mutationandexpressedduringmaizeendospermdevelopment

〔J〕.MolGenGenet,1998,257:354~361.

〔20〕MoonsA,etal.Molecularandphysiologicalresponsestoabscisicacidandsaltsinrootsofsalt2sensitiveandsalt2tolerantindicarice

varieties〔J〕.PlantPhysiol,1995,107:177~186.

〔21〕MoonsA,etal.Antagonisticeffectsofabscisicacidandjasmonatesonsaltstress2inducibletranscriptsinriceroots〔J〕.PlantCell,

1997,9:2243~2259.

参考文献:

〔1〕HieterP,BoguskiM.Functionalgenomics:it’sallhowyoureadit

〔J〕.Science,1997,278:601~602.〔2〕BouchezD,HofteH.Functionalgenomicsinplants〔J〕.PlantPhysi2ol.,1998,118:725~732.〔3〕HofteH,etal.Aninventoryof1151expressedsequencetagsobtained

bypartialsequencingofcDNAsfromArabidopsisthaliana〔J〕.PlantJ,1993,4:1051~1061.

〔22〕PuchtaH,etal.Fromcentimorganstobasepairs:homologousre2combinationinplants〔J〕.TrendsPlantSci,1996,1:340~348.

〔23〕BallingerDG,etal.TargetedgenemutationinDrosophila〔J〕.Proc

NatlAcadSciUSA,19,86:9402~9406.〔24〕ZwaalRR,etal.Target2selectedgeneinteractioninCaenorhabditis

elegansbyusingafrozentransposoninsertionbank〔J〕.ProcNatl

AcadSciUSA,1993,90:7431~7435.

〔4〕NewmanT,etal.Genesgalore:asummaryofmethodsforaccessing

resultsfromlarge2scalepartialsequencingofanonymousArabidopsis

cDNAclones〔J〕.PlantPhysiol,1994,106:1241~1255.

〔25〕KoesR,etal.TargetedgeneinactivationinpentuniabyPCR2based

selectionoftransposoninsertionmutants〔J〕.ProcNatlAcadSci

USA,1995,92:8149~8153.

〔26〕BensenRT,etal.CloningandcharacterizationofthemaizeAn1

J〕.PlantCell,1995,7:75~84.gene〔

〔5〕CookeR,etal.FurtherprogresstowardsacatalogueofallArabidop2s2

isgenes:analysisofasetof5000non2redundentESTs〔J〕.PlantJ,

〔27〕MenaM,etal.DiversificationofC2functionactivityinmaizeflower

development〔J〕.Science,1996,274:1537~1540.

1996,9:101~124.

〔6〕YamamotoK,SasakiT.Large2scaleESTsequencinginrice〔J〕.Plant

MolBiol,1997,35:135~144.

〔28〕KrysanPJ,etal.IdentificationoftransferredDNAinsertionswithin

Arabidopsisgenesinvolvedinsignaltransductionandiontransport

〔7〕BevanM,etal.Analysisof1.9Mbofcontiguoussequencefromchro2

mosome4ofArabidopsisthaliana〔J〕.Nature,1998,391:485~488.

〔J〕.ProcNatlAcadSciUSA,1996,93:8145~8150.

〔29〕MckinneyEC,etal.Sequence2basedidentificationofT2DNAinser2

tionmutationsinArabidopsis:actinmutantsact2-1andact4-1

〔8〕UberbacherEC,etal.LocatingproteincodingregionsinhumanDNA

sequencesusingamultiplesensor2neuralnet2workapproach〔J〕.ProcNatlAcadSciUSA,1991,88:11261~11265.

〔J〕.PlantJ,1995,8:613~622.

〔30〕

AzpirozLeehanR,etal.T-DNAinsertionmutagenesisinAra2bidopsis:goingbackandforth〔J〕.TrendsGenet,1997,13:152~156.

〔9〕HebsgaardSM,etal.SplicesitepredictioninArabidopsisthaliana

DNAbycombininglocalandglobalsequenceinformation〔J〕.Nucleic

AcidsRes,1996,24:3439~3452.

〔10〕TolstrupN,etal.AbranchpointconsensusfromArabidopsisfoundby

non2circularanalysisallowsforbetterpredictionoftheacceptorsites

〔31〕MartienssenRA,etal.Functionalgenomics:probingplantgene

functionandexpressionwithtransposons〔J〕.ProcNatlAcadSci

USA,1998,95:2021~2026.

〔J〕.NucleicAcidsRes,1997,25:3159~3163.

〔11〕BrownJWS.Arabidopsisintronmutationsandpre2mRNAsplicing

〔J〕.PlantJ,1996,10:771~780.〔12〕VelculescuVE,etal.Characterizationoftheyeasttranscriptome〔J〕.Cell,1997,88:243~251.〔13〕VelculescuVE,etal.Serialanalysisofgeneexpression〔J〕.Scien2ce,1995,270:484~487.〔14〕PolyakK,etal.Amodelforp532inducedapoptosis〔J〕.Nature,

1997,3:300~305.〔15〕SchenaM,etal.Quantitativemonitoringofgeneexpressionpatterns

〔32〕WismanE,etal.Knock2outmutantsfromanEn-1mutagenezied

Arabidopsisthalianapopulationgeneratephenylpropanoidbiosyn2

thesisphenotypes〔J〕.ProcNatlAcadSciUSA,1998,95:12432~12437.

〔33〕WinklerRG,etal.Systematicreversegeneticsoftransfer2DNA2tagg2

edlinesofArabidopsis〔J〕.PlantPhysiol,1998,118:743~750.〔34〕GillilandLU,etal.Detectionofdeleteriousgenotypesinmultigen2

erationalstudiesI.DisruptionsinindividualArabidopsisactingene

〔J〕.Genetics,1998,149:717~725.

〔35〕HirschRE,etal.AroleforAKT1potassiumchannelinplantnu2

trition〔J〕.Science,1998,280:918~921.

因篇幅问题不能全部显示,请点此查看更多更全内容