产品简介 技术流程 样本要求 案例分析 FAQ

全长转录组测序(Iso-seq)是指利用三代测序技术对生物体内完整的RNA分子(包括5'末端到3'poly A尾的全长序列)进行测序,RNA分子无需打断,测序可直接获得完整序列。通过全长转录组测序能够更精准地得到转录本信息,可鉴定更多可变剪接位点、新基因和新的异构体、融合基因等。



全长转录组测序揭示玉米转录组的复杂性


Unveiling the complexity of the maize transcriptome by single-molecule long-read sequencing

1

研究背景

       

玉米(Zea mays)是世界上重要的粮食作物,也是研究植物转录调控的模式生物。玉米基因组序列早在2009年就已公布,随后利用EST(Expressed Sequence Tag)和二代RNA-seq测序数据对玉米基因组进行了注释。但由于测序读长较短无法提供转录本的全长序列,因而限制了对玉米转录组可变剪切事件的鉴定和新转录本的发现。

2

研究方案



材料   选取了不同发育阶段的6种玉米组织材料进行研究,包括根、花粉、胚、胚乳、未成熟的雌穗、未成熟的雄穗。

建库   6种玉米组织分别构建6种插入片段文库(<1, 1-2, 2-3, 3-5, 4-6 和>5 kb)。

测序   PacBio RS II上机共测47个SMRT cells。


3

研究思路


4

研究结果

    新基因和新的isoform分析

测序数据下机后经过过滤质控得到全长转录本序列为1,553,692条,再经过质控处理得到643,330个高质量的冗余的转录本序列,其中606,145个序列(94.2%)能够比对到玉米RefGen_v3参考基因组上。将冗余序列进行聚类得到了111,151个非冗余的isoform,其中829个来源于转座子,剩余的isoform来源于26,943个基因,涵盖了玉米参考基因组RefGen_v3注释的70%的基因。测序得到的57%的isoform来自已知基因位点的新isoform,17%的isoform来自于已知基因的已知isoform,3%的isoform来源于2,253个新基因。

    可变剪接分析

本研究进一步分析统计了玉米不同组织内可变剪接的发生情况。从整体上看,内含子保留(intron-retention)类型的可变剪接在不同组织中所占比例最高,大约有40%。其次是3'可变剪接(alternative 3'-splicing),而外显子跳跃(exon skipping)在不同组织内发生的频率都是最低的。此外,不同玉米组织内的可变剪接类型存在显著的差异。 

    LncRNA鉴定与特征分析

本研究中鉴定得到了867个新的lncRNA,平均长度为1.1 kb。分析发现lncRNA表达具有明显的组织特异性,不同组织内lncRNA种类和数量存在显著的差异。对lncRNA的产生位置进行统计分析发现,58%的lncRNA来自基因间区,21%来自基因反义链,15%来自正义链,5%来自内含子区域。

  

    可变剪切与甲基化联合分析

本研究利用已发表的甲基化数据结合PacBio全长转录组数据综合分析甲基化对RNA可变剪接的影响。研究结果发现CHG甲基化在剪接受体位点(acceptor site)显著富集,而CG甲基化水平在供体位点(donor site)处明显升高。并且进一步分析发现剪接受体位点的CHG甲基化水平与可变剪接发生频率呈现负相关,这表明高水平的CHG甲基化可能会抑制可变剪接发生。

5

研究结论


本研究利用三代测序技术对玉米不同组织内的全长转录本进行了测序分析,研究者在已有的玉米基因组B73 RefGen_v3注释之外发现了大量新基因和新的转录异构体,进一步对不同组织进行差异分析,鉴定到了许多组织特异性的转录本和可变剪接事件。结合已发的甲基化测序数据,作者发现可变剪接位点的甲基化水平与可变剪接事件紧密相关。本研究完善了玉米转录组的注释,揭示了玉米转录组的复杂性。


6

参考文献


Wang B, Tseng E, Regulski M, et al. Unveiling the complexity of the maize transcriptome by single-molecule long-read sequencing[J]. Nature Communication, 2016,7, 11708.


Q  全长转录组测序如何取样?

A  主要依据研究目的而定。通常,如果想获得某物种比较全面的转录本信息,建议采集不同组织样本提取RNA,等量混合测序,得到尽可能全面的表达转录本。如植物,建议取根、茎、叶、花、果实等;如动物,建议取肝脏、肾脏、肠、皮肤等部位;如果只针对某个组织部位进行组织特异性全长转录组分析,则可只对该组织取样,也可以取该组织不同的发育时期样品提取RNA,等量混合分析。

什么物种适合全长转录组测序?

A 有参考基因组和无参考基因组的物种均适合。

Q  如何选择全长转录组测序数据量?

A 基于PacBio Sequel平台,如果是想获得转录组中高表达基因,可选择1个文库测1-3个Cell (5~15G数据),如果想获得更多极低丰度基因,建议1个文库测3个Cell以上。

同时,也需要参考研究物种转录组复杂性,如多倍体物种,基因数量一般相对较多,在参考上述情况后,需适量增加数据量。


在线客服

>>

安诺基因在线客服

客服1 客服2 客服3

电话:400-8986-980