全长转录组建库全新升级,Connect全长转录组让你的数据利用更高效!
2020.11.05

近年来基于PacBio Sequel/Sequel II测序平台的全长转录组测序,因其长读长优势,不需要打断和拼接,可以直接得到完整的全长转录本信息,已被越来越多地用于构建/完善参考物种的基因集。


转录本的平均长度一般在2 k左右,而Sequel II的平均polymerase reads长度能达到80 k左右,提升的读长使全长转录组的插入序列测序的平均pass数能达到将近50,如下表所示:


表1 普通全长转录组的MeanLen和MeanPass统计

1604883120862367.jpg

PacBio官方给出的数据显示,当序列的覆盖度达到40时,准确度能达到QV50,当覆盖度达到10时,准确度也能达到QV30。

1604883131355358.jpg

图1 PacBio官方序列覆盖度和序列准确性关系图

可以看到,由于全长转录组的序列较短,在达到一定覆盖度后准确率就有保障,用多出的读长继续循环测同一片段,从一定程度上来说是对增加的读长的一种浪费。

另外,对三个普通全长转录组(平均数据量21 G)的测序饱和度进行统计发现,数据远没有达到饱和。如果想要达到更高的测序饱和度,需要更多的测序数据量,但这对于客户来说,意味着更多测序经费的投入,同样性价比不高。

1604883143348186.jpg

图2 普通全长转录组测序饱和度分析

那么,有没有一种方法可以同时解决上述两个问题,即充分利用增加的读长来提高测到的转录本数量,增加测序饱和度?可以尝试安诺全新推出的Connect全长转录组!

为了充分利用Sequel II测序平台HiFi测序模式下相比之前增加的数据量,安诺研发了Connect全长转录组产品,在建库过程中将多个转录本首尾相连构建SMRTbell文库;通过CCS测序,一条CCS序列可以拆分得到多条转录本,大幅提升Sequel II测序全长 reads 的获得率。

1604883154357246.jpg

3 Connect全长转录组建库流程图


1604883170420790.jpg

图4 典型的Connect全长转录组文库结构

(N表示不同的转录本序列)

与普通全长转录组相比,Connect全长转录组的一个CCS序列由几个转录本首尾相连而成,所以预期MeanLen会增加,而Mean pass会降低。如下表2所示,Connect全长转录组实测数据平均 Mean pass数是普通全长转录组的50%,而序列平均MeanLen是普通全长转录组的2.5倍,与预期结果相符。

1604883180210980.jpg

图5 各样本插入片段序列长度密度分布图

(bar1-bar4表示为Connect全长转录组,bar5-bar7为普通全长转录组)

表2 Connect全长转录组与普通全长转录组数据比对

1604883190741834.jpg

取同样20万ZMWs的数据分析,Connect全长转录组的全长reads数是普通全长转录组的3.4倍。

3 Connect全长转录组与普通全长转录组的全长序列数

1604883202455104.jpg


1604883213510196.jpg

图6 Connect和普通全长转录组的全长序列倍数展示

对科研用户来说选择Connect全长转录组可以在相同数据量下获得更多的全长序列和转录本信息,提高产品的性价比,有利于客户构建更全面的物种参考基因集,同时为实现全面和精准的转录本结构分析和定量分析做好参考基础。

Connect全长转录组不仅连接不同的转录本,更将客户与需求紧密连接,同一条序列可以测到更多的转录本,充分利用增加的读长来满足客户对于转录本后续精准分析的需求。

如需了解更多Connect全长转录组产品信息,请咨询安诺基因当地销售经理~