三代人重测序应用场景一 解析人类神经系统类疾病致病机理
2022.05.17

随着测序技术的迅猛发展,人重测序的应用变得广泛且高效。但二代测序因其短读长特性,无法准确识别跨度大或复杂度较高的染色体变异,导致很多引起疾病的变异检测率不足。以PacBio平台为代表的三代测序技术以其超长读长、无GC偏好性、覆盖度均一等优势可以轻松获取基因组高GC和重复序列区域的信息,同时在HiFi模式下可以得到既长又准确的reads,可全面挖掘人类基因组的各种变异信息,对疾病诊断、治疗具有重要意义。


那么三代测序技术是如何在人类疾病方向一展身手呢?为此,小编通过几篇文献案例来介绍三代测序技术在人类神经系统类疾病方向的应用场景。

 

解析大片段结构变异(SV)


结构变异(structural variations,SV)通常指基因组上变异长度大于50 bp的序列和位置关系变化,根据其变异类型不同又分为缺失(Deletion)、插入(Insertion)、扩增(Duplication)、倒位(Inversion)和易位(Translocation)等。结构变异是造成物种表型差异的一个重要原因,人类基因组上的SV与各类疾病,特别是癌症的发生、发展紧密相关,如精神分裂症、白血病、乳腺癌和卵巢癌等。通过三代测序可实现对人类基因组上的SV准确检出。


01HiFi测序助力神经发育障碍诊断


Long-read genome sequencing for the molecular diagnosis of neurodevelopmental disorders[1]


发表期刊Human Genetics and Genomics Advances


发表时间:2021年4月


材料选择:6组Trio家系(先证者及其父母)


测序策略


测序策略1.png


研究背景


神经发育障碍(NDDSs)由多种遗传性或者获得性病因导致的可影响认知、运动和社会适应能力的脑功能障碍性疾病。全基因组重测序和全外显子测序是研究NDDs致病机制的传统方式。然而,多数NDDs的变异信息不能被二代测序的短读长有效检出。

 

研究结果


研究者利用PacBio Sequel II平台对6组Trio家系进行HiFi测序,通过变异检测分析,发现平均每个家系约有56,000个SV。通过注释分析,研究者在6号先证者中鉴定到CDKL5基因中L1介导的插入变异。该插入片段长度为6,993 bp,包括三个部分,包含L1HS移动元件的逆转录转座子(4,272 bp)、PPEF1基因中一个内含子序列(2,602 bp)和CDKL5基因重复的第三外显子(TSD)及其周围内含子序列(119 bp)。而插入变异引起的TSD重复可能会导致移码和CDKL5基因功能丧失。CDKL5基因与早期婴儿癫痫性脑病相关(EIEE2, MIM:300672),包括智力障碍、发育迟缓和癫痫。此外,研究者进行了技术性验证,通过Sanger测序分析证实插入变异的存在;通过转录物分析确认了该变异会导致CDKL5功能的丧失。


图1.png

 

图1 6号先证者中6993 bp的插入变异


突变区域单体型分型


单体型(Haplotype),也称单倍型,是指个体组织中,完全遗传自父本或母本的一套遗传信息。也指位于染色体上某一区域的一组相关联的SNP等位位点组合。单体型分型(Phasing),即从无序的未定相的基因型数据确定两条单倍体DNA序列(单体型)的过程。人类两两SNP 之间的距离平均在1.5 kb,而二代测序由于测序序列长度在500bp以下,因此在进行单体型分型时会有不准确甚至无法分型的情况。而三代测序技术可凭借其超长读长(15-30kb)可跨越多个SNP位点,从而进行准确的单体型分型。


02HiFi测序揭示综合征性智力障碍的致病性结构变异


Pathogenic 12-kb copy-neutral inversion in syndromic intellectual disability identified by high-fidelity long-read sequencing[2]


发表期刊Genomics


发表时间:2021年1月


材料选择:Trio家系先证者(II-2)及其父母(I-1和I-2)


测序策略


测序策略2.png


研究背景


一对双胞胎女孩(II-2和II-3)自5个月时起出现发育迟缓,眼睑严重下垂和癫痫发作,临床症状符合伴有畸形相、上睑下垂及颈椎融合的智力发育障碍(IDDDFP)。双胞胎的哥哥(II-1)及其父母(I-1和I-2)表型正常。研究者对家系进行全外显子测序,并未找到致病变异。

 

研究结果


研究者利用PacBio Sequel II平台对Trio家系(II-2、I-1和I-2)进行HiFi测序,使用pbsv软件检测Trio数据中的SV。研究者在3号染色体上发现一个12 kb的倒位变异,该倒位涉及BRPF1基因的前两个外显子和CPNE9基因的后四个外显子,这两个基因都被倒位变异破坏,可能导致基因功能丧失。而BRPF1基因异常会导致IDDDFP。研究者通过Southern印记分析发现倒位变异仅在先证者II-1和II-2中检测到。

 

接着,研究者想探究该倒位变异是遗传自父亲还是母亲,使用WhatsHap对变异区域进行单体型分型。基于SNP和Indel数据将先证者的HiFi数据被分成22,363个单倍型块。其中,12kb的倒位位于先证者中一个321kb的单体型块内。研究者进行了Trio家系的分型比较,基于特异的snp位点, G_A_C_A_A这5个snp证实了12kb倒位遗传自母亲。


图2.png


图2 变异区域单体型分型


STR分析


短串联重复序列(short tandem repeat,STR),也称微卫星DNA(microsatellite DNA),指人基因组上由2~6个核苷酸串联重复片段构成的序列。由于核心单位重复数目在个体间呈高度变异性并且数量丰富,构成了STR基因座的遗传多态性。STR异常扩增是脆性X综合征、亨廷顿舞蹈症等神经系统遗传性突变疾病的病因。

 

03三代测序解析SAMD12重复序列异常扩增导致BAFME致病变异


Detecting a long insertion variant in SAMD12 by SMRT sequencing: implications of long-read whole-genome sequencing for repeat expansion diseases[3]


发表期刊Journal of Human Genetics


发表时间:2019年3月


材料选择:1名BAFME患者和3名正常家系样本(III-2、II-2、II-7和III-6)


测序策略


测序策略3.png


研究背景


Ishiura等首次利用GWAS连锁分析和三代测序报道了良性家族性成人肌阵挛癫痫(BAFME)的致病变异为SAMD12基因“TTTCA/TTTTA”五核苷酸重复序列的高度异常扩增[4]。研究者基于Ishiura等前人研究,对家系中1名患者样本(III-2)和3名对照样本(II-2,II-7,III-6)进行三代测序。


研究结果


通过注释以及与对照样本特有位点筛选,研究者在III-2中检测到1,540个特异性SV。其中,6个SV位于BAFME1连锁区域(8q24),在该连锁区域内的SAMD12基因的4号内含子中发现了4,661 bp的杂合重复序列插入变异。接着研究者通过RepeatMasker分析发现,4661 bp插入片段序列中95.41%的序列为低复杂度串联重复序列,由GA或富含A的序列组成;另外(AAAAT)n占3.95%。最后,研究者利用southern分析确认插入变异存在。该研究再次证实了SAMD12基因内含子区五核苷酸重复序列高度异常扩增是BAFME的致病原因。


图3.jpg


图3 SAMD12基因的4661 bp插入片段


安诺基因持续打造三代人重测序优势产品,以高品质服务助力人基因组研究实现关键突破。安诺提供丰富的生信分析服务,不仅有全变异检测注释分析和多样本变异整合筛选的高级分析,还包括STR分型与有害性分析、突变区域单体型分型和HLA分型等众多个性化分析。


作为国内基因组平台型企业,安诺优达配备了系列仪器设备,三代PacBio(4台Sequel IIe+7台Sequel II+11台Sequel)为您的科研之路保驾护航;专业的生物信息分析团队,丰富的项目分析经验,让您的数据分析之途无忧。安诺优达已与中国农业大学、中科院遗传与发育所、中国海洋大学、中国农业科学院、福建农林大学等多家科研院所开展了深度合作,助力基因组文章发表于Cell、Nature、Nature Genetics、Nature Plants、Nature Communications、Molecular Plant、Communications Biology和The Plant Journal等多个国际高水平期刊。


参考文献


[1] Hiatt SM, Lawlor JMJ, Handley LH, et al. Long-read genome sequencing for the molecular diagnosis of neurodevelopmental disorders[J]. Human Genetics and Genomics Advances. 2021,8(2): 100023.

[2] Mizuguchi T, Okamoto N, Yanagihara K, et al. Pathogenic 12-kb copy-neutral inversion in syndromic intellectual disability identified by high-fidelity long-read sequencing[J]. Genomics. 2021, 113(1): 1044-1053.

[3] Mizuguchi T,Toyota T, Adachi H, et al. Detecting a long insertion variant in SAMD12 by SMRT sequencing: implications of long-read whole-genome sequencing for repeat expansion diseases[J]. Journal of Human Genetics. 2019, 64: 191-197.

[4] Ishiura H, Doi K, Mitsui J, et al. Expansions of intronic TTTCA and TTTTA repeats in benign adult familial myoclonic epilepsy[J]. Nature Genetics. 2018, 50(4): 581.