RNA分析的几个热点领域及主要技术路线

DNA,RNA和蛋白质是三种重要的生物大分子,是生命现象的分子基础。基因组DNA中的基因通过转录为mRNA并进一步翻译为蛋白质,很多种类的蛋白质在最终发挥功能时又经历磷酸化、糖基化、酶原激活等翻译后修饰。DNA的遗传信息决定生命的主要性状,而mRNA在信息传递中起很重要的作用。其它两大类RNA,rRNA和tRNA,同样在蛋白质的生物合成中发挥不可替代的重要功能。因此mRNA、rRNA、tRNA在遗传信息由DNA传递到表现生命性状的蛋白质的过程中举足轻重。目前国内外在mRNA的表达研究上如火如荼,这对于后基因组时代阐明基因的功能至关重要。

但RNA在生命活动中的重要作用远不止如此:很多种类的病毒直接以RNA为遗传信息携带者,如SARS和AIDS等;而很多其它种类的不编码蛋白质的RNA分子在生命活动中起其它重要作用,如大分子生物加工和基因表达调控等。下面简要列举一些重要的RNA分子及其生物学意义:

snRNA参与mRNA剪接、snoRNA参与rRNA成熟加工、gRNA参与RNA编辑、SRP-RNA参与蛋白质的分泌、端粒RNA参与DNA端粒合成并影响细胞的寿命、tmRNA参与破损mRNA蛋白质合成的终止等。

snoRNA(核仁小分子RNA):rRNA加工(切割和修饰)

Lin-4:发育控制反义RNA(antisenceRNAfordevelopmentcontrol)

rps14:核糖体生物合成反义RNA(antisenceRNAforribosomebiogenesis)

dsRNA(双链RNA):基因沉默(genesilence)

Xist(Xi-specifictranscript)&其反义RNATsix:X染色体失活

尚有很多RNA的功能还未鉴定,如很多scRNA(细胞质小分子RNA)、用沉降系数命名的7S,10SRNA等。一些生物催化剂如核酶和转肽酶也是RNA。

国内中山大学和上海生命科学院等在这些非编码RNA的研究中做了大量工作,在国际上也占有一席之地。

RNA的种类可能还远不止这些,每种RNA的功能也远不止上面提到的那么简单。随着研究的深入,更多种类的RNA和RNA的功能在被诠释。因此生命科学中的一个新的学科RNA组学(RNomics)正在兴起。

勿容质疑的现实是:在所有种类RNA功能等的研究中,mRNA的表达研究是最主要的热点。特定生物的基因在不同发育阶段、不同生理病理条件、不同细胞类型中的表达不尽相同,了解基因表达的开放与否和表达水平高低对阐明基因的功能至关重要。mRNA表达研究的传统技术如Northern、原位杂交和定量RT-PCR等低通量技术适于少量基因的表达研究。但我们知道:参与任何一个生命过程的基因种类都有很多,因此低通量技术已经不适合大量基因表达的研究,高通量研究基因表达的技术应运而生,在这些技术中,DD-PCR和SSH技术操作复杂,假阳性率很高;因此近二十年来发展起来的DNA微阵列技术尤其是全基因组DNA微阵列技术目前成为获得基因表达信息的最好技术平台,该技术可以在尽可能短的时间内筛选出参与一个生命过程的所有的基因的表达数据。

DNA微阵列技术主要有两种:cDNA微阵列和寡核苷酸微阵列。在cDNA微阵列中,每个基因的探针为cDNA或基因的一段PCR产物;这种探针设计策略很难特异区分诸如RNA剪接体、重叠基因和G蛋白偶联受体等同源基因。寡核苷酸微阵列技术又包括两种:约70mer的寡核苷酸微阵列和Affymetrix25mer寡核苷酸基因芯片(Genechip)。在70mer微阵列中,每个基因的探针为该基因的一段70mer的特异寡核苷酸片段。在Affymetrix基因芯片中,每个基因都有10-20个特异探针(PM探针),每个探针为25mer的寡核苷酸片段;每个探针还有对应的错配(MM)探针。探针特异性由大到小的排序为:25mer>70mer>cDNA。因此,Affymetrix基因芯片技术可以保证基因表达检测的最好特异性。由于MM探针可以有效扣除总杂交信号中的背景信号,得到真正的杂交信号,因此Affymetrix基因芯片技术还可以保证基因芯片检测的高灵敏度,这里的高灵敏度指可以检测到低丰度表达的基因,也同时指低丰度表达的基因的表达水平发生变化时可以被检测出来。目前看来,Affymetrix基因芯片技术可以保证基因表达检测的最好特异性、最高灵敏度、最好的重复性和可靠性及最好的定量分析。因此Affymetrix基因芯片技术得到的基因表达信息基本没有必要通过定量RT-PCR、原位杂交和Northern等技术来验证。

当然,Affymetrix基因芯片技术的局限性在于该技术依赖基因组序列信息。如果一个物种的基因组序列信息已知,Affymetrix就可以通过生物信息学等设计代表每一个基因的特异的探针。尽管Affymetrix芯片涉及的物种已经居全球首位(Affymetrix公司目前能提供的芯片物种信息见本刊后面的专题介绍),由于很多生物没有基因组序列信息,高通量研究这些生物的基因表达信息还只能依赖构建cDNA文库并制作cDNA微阵列,这样得到的基因表达信息需要通过定量RT-PCR、原位杂交和Northern等技术来验证。

基因芯片得到的基因表达数据很丰富,通过生物信息学可以得到其中最具有价值的信息,比如哪些基因可能与研究者研究的生理或病理现象直接相关。对于这些重要基因的功能的研究,下一步的技术包括RNAi(本刊中有多篇专题介绍),基因敲除和转基因技术等。而基因功能的最终阐明需要结合蛋白质(组)的研究等。

最后需要指出的是,不同细胞类型在不同生理或病理条件下或在不同的发育阶段,其基因表达情况不尽相同,如果采取匀浆技术获得含多种类型细胞的组织中的mRNA并杂交基因芯片,那么得到的数据无法精确解释每一类细胞的基因表达情况。建立细胞类型特异性的基因表达数据对研究生命现象的分子机理很重要,可以通过激光显微切割(lasermicrodissection,LMD,详见本刊专题介绍)技术将一个组织中不同类型的细胞进行分离,从不同细胞类型中分别得到各自的mRNA,然后分别杂交基因芯片。当然,LMD技术对建立细胞特异性的蛋白质表达数据信息也至关重要。