与其他高通量测序技术类似,10x Genomics单细胞转录组测序数据的各项主要指标需要经过统计和质控,以便评价测序数据的整体质量。在众多的指标中,关于测序饱和度(sequencing saturation)流传着多种说法:“饱和度高于70%数据才够用”,“增加数据量就能增加饱和度”,“增加捕获细胞数必须增加测序数据量才能保证测序饱和度”……这些言之凿凿的说法,有时候却彼此矛盾,给10x Genomics技术的初学者带来了不少困扰。
Cell Ranger分析结果展示,红色方框中就是今天的主角!
1. 什么是测序饱和度?
测序饱和度是反映当前测序量与文库复杂度相关性的指标,其大小主要取决于测序深度和文库复杂度。
测序饱和度受测序深度影响。一般来说,测序reads越多,被检测到的独特转录本就越多。如下图所示,被检测到的基因数会随着测序深度的增加而增加,但当测序深度达到一定程度,被检测到基因数量的增加程度逐渐变缓,直到不再随测序深度增加而增加即达到饱和。最终可检测到的基因数量取决于细胞类型。
测序饱和度还受文库复杂度的限制。通常来说,不同类型的细胞含有不同数量、不同类型的RNA,因此不同类型细胞建成的文库中也包含着不同数量、不同类型的转录本,即文库复杂度存在差异。复杂度高的文库中转录本的数量和类型更多,检测一个新转录本所需的额外reads数量也就更多,即增加饱和度需要测定的reads更多。
10x Genomics单细胞转录组文库测序深度与每细胞检测到基因中位数的关系图
注:原代细胞类型(如PBMC和小鼠胚胎神经元) 转录本类型少,相同reads数量下检测到的转录本类型少,且较少reads数量就能达到饱和;细胞系(如 hek293t 和3t3)转录本类型多,相同reads数量下测到的转录本类型多,很难达到饱和。
2. 测序饱和度是如何算出来的呢?
3. 测序饱和度多少才合适呢?
安诺单细胞测序技术总览
作为国内单细胞测序技术整体解决方案的提供商,目前安诺优达单细胞多组学研究具有全面的产品,覆盖三大组学(基因组、转录组、表观组),拥有丰富的项目经验、合作单位100+、物种经验50+、多篇高分文章IF累计350+,能够有针对性并准确服务于不同的研究领域及研究策略,使得科研工作者可以更深入地了解细胞间的异质性。我们已备好单细胞多组学研究解决方案,期待与您一起,探索生命之美。