产品和服务

安诺基因

公司建立了包含PromethION、PacBio Sequel、NovaSeq 6000、HiSeq X等

新一代测序仪的高通量测序平台,并与Illumina联合开发了

新一代桌面测序仪NextSeq 550AR,可以对DNA、RNA等不

同分子类型的样本进行测序分析,具备检测大批量样本的能力。

新闻中心
安诺优达单体型基因组组装新品发布,为基因组学提供全新的分析思路和方案

基因组组装技术的应用极大地推动了基础生命科学和医学研究领域的发展。传统的基因组组装策略由于忽略同源染色体之间的差异,不可避免的会遇到嵌合体基因组,无法区分同源染色体的等位基因表达的差异,同源染色体修饰差异等。为了打破这种局限性,单体型基因组组装技术顺势而生,现已成为高精确基因组组装和精准位点筛选的突破性技术。


为了深入地探究单体型基因组组装技术在物种进化、分子育种和遗传病研究上的应用,解析等位基因遗传表达机制和遗传调控机理,安诺优达推出单体型基因组组装技术,现已将此技术应用在多倍体、高杂合的基因组组装和人常染色体遗传病分子靶标筛选等领域。为了促进学术交流,加强新技术的应用,2022年6月18日安诺优达线上举办了“单体型基因组组装技术新品发布会”。

 

1655779030341980.png


在本次新品发布会上,首先由安诺优达CEO李志民先生和PacBio中国区总经理吴应光先生进行了开场致辞,对基因组技术的发展创新,新产品的广泛应用及未来两公司的深入交流合作表达了高度期许。


新品发布环节中,安诺优达李营博士为大家分享了新产品的相关内容,三种单体型基因组组装方案及实测数据。安诺优达根据二倍体、四倍体的倍性差异和有无亲本数据分别提出ADPA、AUPPA和ATPA方案。


1655779042609482.png

 

ADPA(有亲本二倍体单体型组装方案)是基于双亲本二代数据获取特异k-mer,并利用k-mer对HiFi序列进行分型,之后使用Hi-C挂载到染色体水平。除contig N50之外,单体型块的平均长度block N50也是重要评估指标,block N50越长越好,contig N50/block N50越接近1,分型准确性越高。安诺优达的实测数据表明,ADPA的block N50高于其他方法约18%-172%,虽然method A的block N50与ADPA接近,但是contig N50/block N50最低。


在解决部分物种难以获得准确的亲本序列的问题上,安诺优达提出AUPPA(无亲本二倍体单体型组装方案):初步组装后,将序列回比获得SNP,利用SNP和Hi-C对组装后的contig进行分型,之后使用Hi-C挂载。安诺优达实测数据发现,AUPPA的block N50最高,超过其他三个方法11倍!AUPPA的contig N50/block N50和switch error也表现优秀。


为了解决同源度高不易组装的问题,安诺优达开发了基于近缘二倍体物种的ATPA(同源四倍体单体型组装方案)分型方案:利用双亲本或研究物种的近缘二倍体物种的基因组,利用reads在基因组中的SNP信息对序列进行初步分型,结合深度信息再次对未分型数据再次分型后组装,然后使用Hi-C挂载,从而达到4套同源染色体的拆分。测试数据表明,高度同源四倍体的染色体间存在差异,等位基因形成模式仍然有待深入研究。


安诺优达实测数据表明,在获得高质量二倍体单体型基因组的方法上,ADPA最优,AUPPA次之。异源/同源四倍体都可以实现较好分型,但是近缘二倍体对同源四倍体分型(ATPA)是必需的。


新品发布环节结束后,进入了专家报告环节,由中国农业科学院作物科学研究所的周美亮研究员进行线上主持。


北京林业大学的钮世辉教授带来了题为《超大基因组装注释策略及面临的挑战》的报告分享。钮教授介绍了油松超大基因组组装注释过程中遇到的一些难题及解决方法,并表示油松基因组的组装象征着我们已经具备高质量组装任何超大基因组的能力。然而,针叶树基因结构注释比基因组组装有更大的挑战。其中主要原因是针叶树中具有大量超大内含子,平均长度是被子植物的20倍,也给基因结构注释带来了严峻挑战。最后,钮教授指出超大复杂基因组项目仍面临的一些挑战:多倍体物种复杂基因组的正确分型组装与基因注释等,不断发展的新测序技术和组装技术在解决这些关键问题上正发挥着越来越重要的作用。

 

1655779064603357.png


中国科学院植物研究所的焦远年研究员带来了题为《被子植物基因组解析的进化研究》的报告分享。植物是陆地生态系统的主体,生物多样性是长期进化的产物。而被子植物类群物种丰富且多样性很高,被子植物的起源和快速分化是进化生物学家关注的热点问题,也是难点。焦远年研究员表示,多倍化是新性状起源、生物多样性形成以及作物驯化和改良的重要原因之一。焦远年研究员介绍了本人及团队主导并参与的陆地植物代表性物种的基因组测序和研究工作。焦远年研究员表示,基因组测序为植物进化、新性状起源、作物驯化和改良等提供了极其重要的数据基础;高质量基因组(单倍型、T2T、单细胞)将为更全面、更准确、更有趣的生命现象研究提供可能;越来越多的物种基因组解析可以让我们充分认识基因组进化特征和规律,进而理解物种进化的过程和未来发展;大数据时代下,进化研究也将真正深入到生命科学领域的各个研究方向。

 

1655779075144947.png


广州医科大学附属第三医院的范勇研究员带来了题为《单细胞测序技术在生殖遗传领域的研究与应用》的报告分享。首先介绍辅助生殖技术面临的挑战,单细胞测序技术可以助力辅助生殖,在降低生殖缺陷,生殖和遗传相关疾病的筛查、诊断和治疗方面有非常重要的作用。接着介绍了单细胞测序技术在辅助生殖中的单基因病筛选、精子发生发育、胚胎单细胞转录组调控机制、胚胎单细胞表观修饰及着床发育等方向的成功研究应用案例。最后展望了单细胞测序技术未来在肿瘤、微生物、神经科学和免疫学中的应用前景。

 

1655779084306097.png


华南农业大学的夏瑞教授带来了题为《岭南水果荔枝的起源和演化历史及开花调控》的报告分享。夏瑞教授结合多种测序技术和组装技术,获得了完整的 “妃子笑”荔枝基因组,大小为470 Mb,含有15条假染色体。后续利用改进的单倍型组装技术,获得了两套单独的单倍型基因组,并发现13,517对等位基因在不同组织中存在差异表达。极早熟荔枝种质倾向比对到一个单倍型基因组上,可能起源于云南野生荔枝群落;迟熟荔枝倾向比对到另一个单倍型上,起源于海南野生荔枝群落;而早熟荔枝则来源于极早熟荔枝和迟熟荔枝的杂交。对荔枝开花相关基因的分析发现,存在特异的基因扩增事件和COL基因3.7kb的序列缺失可能与荔枝花期调控有重要关系。关于荔枝基因组和驯化历史的结果将加速荔枝及其它相关无患子科植物的基础研究和遗传改良。

 

1655779094352856.png


PacBio公司的资深生物信息科学家Wilson Cheng带来了题为《5-base HiFi Sequencing-Accuracy,Read Length & Methylation Calling》的报告分享。Wilson介绍了PacBio HiFi测序可通过检测酶动力学,在进行DNA测序时直接对碱基修饰进行检测。HiFi测序可检测DNA上的5mC甲基化修饰,无需特殊的文库制备流程,如重亚硫酸盐处理或特殊的分析流程。测试数据证明,HiFi测序的5mC检测与其它甲基化检测方法的结果高度一致,且通过HiFi 5mC 还能够获得单倍型的甲基化信息。此外,Wilson还向我们展示了HiFi数据在人类细胞系、人类罕见病、非人类脊椎动物和植物上检测5mC的优秀表现。

 

 1655779104532746.png


中国中医科学院中药研究所的徐江副研究员带来了题为《药用生物分型基因组研究》的报告分享。药用生物是天然药物的主要来源。由于物种众多,基因组特性差异较大,对其基因组的解析构成挑战。徐江研究员分别以灵芝和黄花蒿为代表,介绍了不同方法在解决不同特性基因组分型过程中的应用。首先以灵芝为例,介绍了使用多种关键技术(PacBio+Bionano+Hi-C)解决灵芝单体型基因组装以及基于单体型对灵芝酸合成途径的解析;其次以黄花蒿为例,介绍了基于组装的两个株系4套单体型在青蒿素生物合成途径等问题的应用;徐江研究员认为灵活采用多种技术有助于基因组分型,单体型基因组的研究能够大大促进药用生物的解析,为药用生物产业的科学发展提供支撑。

 

1655779125923107.png


最后中国海洋大学的包立随副教授带来了题为《单体型基因组与复杂性状的解析》的报告分享。变异与性状是生命科学领域中永恒的议题,探索并理解其互作关系是发育、进化、疾病研究中的核心问题。包立随教授分别从以下三个方面介绍了单体型基因组学应用在变异介导的复杂性状研究领域展现出的巨大潜力。首先是斑点叉尾鮰的适应性性状解析,讲述了单体型基因组组装在雌雄序列分型上的独有优势,以及在性染色体与性别决定基因的定位与进化研究中的应用;其次是扇贝的性染色体进化,通过8种主要扇贝科物种染色体水平组装解析了扇贝的性别决定基因等问题;最后以癌症的复杂结构变异为例,介绍了通过偶联复杂变异的单体型定相技术,可加深对染色体重排与癌症发生机制的理解。包立随教授通过上述三个研究案例,向大家梳理了单体型基因组技术的发展如何助力后基因组时代复杂性状的研究。


1655779138309565.png

 

本次会议安诺优达提出的单体型组装方案可以实现准确且便捷的分型。未来,单体型组装技术可以更好地解决等位基因表达差异、染色体重排、单体型特异性插入等问题,并为加速基因编辑发展提供有效方案。我们期待未来安诺优达能够在基因组测序和组装技术上不断开拓和创新,加速推动基因组组装技术在生命科学和医学研究领域上的更广泛应用。



更多 >>
合作文章|解析三代结构变异与三维基因组在胰腺癌中的动态景观

2022年5月15日,国家癌症中心、中国医学科学院肿瘤医院王成锋教授团队联合安诺优达在知名学术期刊Advanced Science(IF: 16.806)在线发表了题为“Dynamic Interplay between Structural Variations and 3D Genome Organization in Pancreatic Cancer”的研究文章。安诺优达为本研究提供三代SMRT长读长建库测序分析和Hi-C建库测序分析服务。安诺优达三维基因组大项目分析团队苑赞、赵玥以作者身份全程参与了本研究中三代结构变异与三维基因组动态变化分析方案的设计、生物信息学分析和稿件修改工作。



图片1.png

研究摘要


研究者对胰腺癌中通过三代技术鉴定到的染色质结构变异图谱进行了系统描述,重点研究了胰腺癌中的复杂染色质结构变异与高阶染色质构象变化之间的动态联系,发现了涉及两个胰腺癌关键驱动基因CDKN2A和SMAD4的大规模基因组结构重排,并从一维线性和三维互作角度阐明了它们对致癌基因MIR31HG、MYO5B等表达的影响。

研究背景


染色体的结构和数量重排,统称为结构变异(Structural variation, SV),在很大程度上贡献了人类基因组的遗传多样性,与癌症遗传学、罕见病和进化遗传学有着高度的相关性。SVs不仅能影响基因的剂量,还能调节基因调控的基本机制。SVs可以改变调控元件的拷贝数,或通过破坏染色质的高阶组织(如拓扑关联结构域-TAD)来修改三维基因组。由于这些位置效应,SV可以影响远离SV断点的基因的表达,从而导致疾病。

 

胰腺癌是世界上最致命的恶性肿瘤之一,其中约90% 是起源于胰管上皮的胰腺导管腺癌(pancreatic ductal adenocarcinoma, PDAC)。在解读基因组结构变异对胰腺癌潜在致病进展的研究中考虑SVs对3D基因组和基因表达调控的影响很有必要。

研究结论


本研究选取了两株源自人胰腺导管上皮的胰腺癌细胞系(PANC1和 BxPC3)并选择永生化正常胰腺导管上皮细胞系(HPDE6C7)作为对照。


研究者在PDAC细胞系中鉴定到2万多SVs,其中多数SVs为插入和缺失突变(INS/DEL)。此外还对SVs在三维染色质结构Compartment、CDB(contact domain boundary)中的富集做了系统统计。


图片2.png 



因为TAD边界的存在,TAD内的SV一般会将扰动范围限制在所在TAD区域内,Cross-CDB SVs对染色质高级结构的扰动范围将会至少涉及CDB两端的TAD。染色质拓扑结构域边界需要CTCF结合在相应的染色质位置,再综合cohesin等染色质结构蛋白形成。TAD边界DNA的缺失一般会引起TAD边界的消失,进而使消失边界两端的TAD发生融合现象。


本研究在胰腺癌中观察到了这个规律,Cross-CDB SVs相对于其他区域的SVs更显著的和TAD融合现象相关。例如PANC1中的一个Cross-CDB Deletion不仅涉及CDKN2A(多重肿瘤抑制基因)的缺失,而且造成了所在区CDB的消失和两端TAD的融合。在胰腺癌的发生机制的研究中一般会强调CDKN2A的lost所造成的影响,进一步分析发现大约 90% PDAC中的CDKN2A失活与其附近的MIR31HG表达的上调相关,这可能涉及CDKN2A 纯合缺失造成的相邻基因组区域TAD融合异常表达调控有关。研究者还观测到有些非纯合Cross-CDB SVs所涉及的CDB并未消失,这显示了生物学样本内的异质性。

 

图片3.png


图片4.png


近一半的胰腺导管癌有SMAD4蛋白表达缺失,研究者在BxPC3样本中发现了SMAD4所在基因组位置有一个大的缺失突变,反常的是缺失突变两端的DNA区的染色质交互几乎没有,按照常理缺失位置临近的两端区域之间的交互应该增强。作者对这个异常进行进一步研究发现,这里的Deletion还关联了chr18比较复杂的大规模染色结构质重排。这个染色质结构重排可能是由三处大的Deletion涉及的染色体碎裂引起。研究者利用Hi-C辅助基因组组装的相关原理模拟了chr18重排后的染色质排布。这提示了利用多种技术手段 (三代、Hi-C)综合分析染色质一维、三维结构的重要性。



图片5.png


图片6.png


此研究项目应用了安诺优达自主开发的多组学可视化软件Annoroad-OMIC-Viz(https://github.com/Spartanzhao/Annoroad-OMIC-Viz)。文章的部分分析代码上传到了github(https://github.com/Spartanzhao/code_for_Advanced_Science_pancreatic_cell_Line_Hi-C)。点击原文链接即可直接跳转到文章页面。


国家癌症中心、中国医学科学院肿瘤医院王成锋教授和军事医学研究院陈河兵副研究员为论文的共同通讯作者,中国医学科学院肿瘤医院胰胃外科主治医师杜永星、博士生顾宗廷和李宗泽为论文的共同第一作者,安诺优达基因科技公司为本研究提供了相应的技术支持。北京大学李程研究员和中国医学科学院基础医学研究所陈阳研究员给予了重要的指导和帮助。该研究得到了国家自然科学基金和中国医学科学院医学与健康科技创新工程的支持。

 


安诺优达三维基因组


安诺优达作为国内早期提供三维基因组建库、分析和大项目服务的公司,积累了丰富的经验,2022年合作见刊的医学类三维基因组文章已有3篇。如有项目意向欢迎联系我们,期待我们的三维基因组大项目团队能够与更多的研究者深度合作,共同推动项目成果发表。



[1]l Yang Q, Jiang N, Zou H, Fan X, Liu T, Huang X, Wanggou S, Li X. Alterations in 3D chromatin organization contribute to tumorigenesis of EGFR-amplified glioblastoma[J]. Comput Struct Biotechnol J. 2022 Apr 8;20:1967-1978. doi: 10.1016/j.csbj.2022.04.007. PMID: 35521558; PMCID: PMC9062087.

[2]l Xia Y, Liu X, Mu W, Ma C, Wang L, Jiao Y, Cui B, Hu S, Gao Y, Liu T, Sun H, Zong S, Liu X, Zhao Y. Capturing 3D Chromatin Maps of Human Primary Monocytes: Insights From High-Resolution Hi-C[J]. Front Immunol. 2022 Mar 3;13:837336. doi: 10.3389/fimmu.2022.837336. PMID: 35309301; PMCID: PMC8927851.

[3]l Du Y, Gu Z, Li Z, Yuan Z, Zhao Y, Zheng X, Bo X, Chen H, Wang C. Dynamic Interplay between Structural Variations and 3D Genome Organization in Pancreatic Cancer[J]. Adv Sci (Weinh). 2022 May 15:e2200818. doi: 10.1002/advs.202200818. Epub ahead of print. PMID: 35570408.



更多 >>
登顶Cell!北京林业大学联合安诺优达完成染色体水平的油松基因组组装和甲基化研究

2021年12月,北京林业大学生物科学与技术学院联合安诺优达在国际知名期刊Cell(IF:41.582)在线发表了题为“The Chinese pine genome and methylome unveil key features of conifer evolution”的研究文章,研究者对油松进行了染色体水平的基因组组装和注释,绘制了油松基因组的染色体甲基化图谱,为油松独特适应性和发育研究、生殖生物学研究及基因组辅助育种进化和基因组学研究提供了重要参考。安诺优达深度参与了本次研究,包括PacBio三代测序、Hi-C辅助组装以及RNA-seq、WGBS等多组学测序及该基因组的组装、注释等研究。





研究背景




针叶树在世界森林生态系统中占主导地位,是种植最广泛的树种之一。针叶树基因组属于大型基因组,存在高度重复序列(70%-80%),因此基因组组装难度较高。


研究者利用PacBio测序、Hi-C辅助组装等技术,组装获得了25.4 Gb染色体水平的油松基因组。通过使用来自760个生物样本的大规模RNA-seq数据来辅助基因结构注释,揭示油松基因组扩展、生殖过程和适应性进化的多重基因组特征和分子机制,给针叶树进化研究提供了新思路,为今后进一步开展针叶树适应与发育研究提供了数据参考。





材料选择




35年生无性系优良油松的新芽





测序策略




DNA测序策略

Illumina NovaSeq 6000,DNA小片段文库,103 X

PacBio Sequel II基因组测序,103 X

Illumina NovaSeq 6000,Hi-C文库

RNA测序策略

Illumina测序,构建RNA文库




技术路线




1640847651913249.png




研究结果




油松染色体基因组组装和注释


研究者首先通过Illumina测序,对油松基因组大小进行评估,随后利用PacBio测序数据进行自校正和组装,成功构建出24.4 Gb(96.1%,12条染色体)的油松高质量的染色体水平基因组。


针叶树中的基因通常多于二倍体被子植物,基因复制导致了许多基因家族的扩张。在基因复制的不同类别中,油松的旁系同源主要来源于分散重复(DSD),很少来自全基因组复制(WGD),油松发生近期全基因组复制事件概率较低。

1640847663125241.png

图1 油松高质量基因组组装


长内含子的独特基因空间结构


油松的基因组存在大量的长内含子,总内含子/外显子长度与基因组的大小呈正相关,基因表达水平的差异与基因长度和内含子数有关。长基因的RNA剪接和DNA甲基化检测结果表明,几乎所有CG和CHG位点都发生了甲基化,DNA甲基化可能参与了长内含子的准确识别。

1640847673812727.png


图2 油松基因组的基因空间结构和复杂性展示


油松的适应进化


通过功能富集分析发现了3,623个显著扩张的家族基因,主要参与生物和非生物胁迫反应。通过鉴定油松中的转录因子(TF)和转录调节因子(TR)家族,发现对低温高度敏感的AP2/ERF基因家族成员可能在油松的低温适应中发挥关键作用。在候选基因编码酶鉴定中,萜烯合成相关基因在不同树龄的油松中有明显的表达模式,新形成的针叶可能是萜烯的主要合成部位。

1640847686112419.png

图3 油松中萜烯的合成途径


针叶树生殖发育的独特调控网络


被子植物中具有很多调节开花的关键基因,但油松中缺少很多同源基因。FT/TFL1-like基因是被子植物中调节开花的关键基因,但油松中仅有2个拷贝,但在其他针叶树中一般有4-6个拷贝。研究者在拟南芥中做了转基因验证,过表达了这两个基因,转基因植株表现出明显的晚开花表型。


通过对油松基因组中12个高表达的MADS-box基因的酵母双杂交检测,发现两个AGL6-like基因(PtDAL1PtDAL14)在油松中有不同的表达模式,其中PtDAL14在生殖器官中特异性表达,与其他MADS-box转录因子蛋白相互作用,表明AGL6-like基因可能作为MADS-box转录因子之间相互作用的桥梁,从而形成互作网络。最后研究者提出了一个控制油松雌雄球果发育的模型,为今后针叶树生殖发育研究提供了一张蓝图。

1640847695369806.png

图4 油松中12个MADS-box家族转录因子的表达及蛋白互作模型


油松近期的LTR-RT的爆发和稳定的甲基化维持系统


从染色体层面看,基因组甲基化水平与油松的TE覆盖率显著相关,研究发现携带TE的基因区域的平均甲基化水平远高于不携带TE的基因区域,但TSS和TES区域的平均甲基化水平始终较低。DNA甲基化对于TE基因组的扩张产生了影响,但未有证据表明,油松甲基化程度随树龄的增加而下降。LTR-RTs代表了大部分TEs,不平等重组(UR)是植物中一种重要的LTR-RT清除机制,针叶树的UR率可能比被子植物小型基因组低得多,SGS3-RDR6-RdDM通路可能是针叶树中主要的DNA甲基化途径。

1640847705895708.png

图5 油松中DNA甲基化及转座子扩张





研究结论




研究者构建了当前大型基因组中连续性最好的高质量染色体水平的油松基因组。研究发现转座子的不断扩张和缓慢清除是导致针叶树基因组巨大的重要原因,具有超长内含子的大基因往往表达水平较高。与被子植物相比,油松具有独特的生殖系统。油松基因组的构建为其独特适应性和发育研究、生殖生物学研究及基因组辅助育种进化和基因组学研究提供了重要参考。




作为国内基因组行业知名企业,安诺优达拥有实力强大的测序服务平台,配备系列先进仪器设备,三代PacBio(2台Sequel IIe+7台Sequel II+10台Sequel)为您的科研之路保驾护航;专业的生物信息分析团队,丰富的项目分析经验,让您的数据分析之途无忧。安诺基因已与中国农业大学、中科院遗传与发育所、中国海洋大学、中国农业科学院、福建农林大学等多家科研院所开展了深度合作,助力基因组文章发表于CellNatureNature GeneticsNature Plants等多个国际高水平期刊。

图片




参考文献

[1] Niu S.H., Li J., Bo W.H., Yang W.F., Zuccolo A.,Giacomello S., ChenX., Han F.X., Yang J.H., Song Y.T., Nie Y.M., Zhou B.,Wang P.Y., Zuo Q., Zhang H., Ma J.J., Wang J., Wang L.J., Zhu Q.Y., ZhaoH.H., Liu Z.M., Zhang X.M., Liu T., Pei S.R., Li Z.M., Hu Y., Yang Y.H., LiW.Z., Zan Y.J., Zhou L.H., Lin J.X., Yuan T.Q., Li W., Li Y., Wei H.R. & WuX.The Chinese pine genome and methylome unveil key features of coniferevolution[J]. Cell, 2022, 185(1):1-14.



更多 >>
Nature Genetics项目文章|茶树单体型基因组组装揭示茶树的演化史

2021年7月15日,由福建农林大学、中国农业科学院(深圳)农业基因组研究所等多家单位共同合作在国际顶级期刊Nature Genetics上发表“Haplotype-resolved genome assembly provides insights into evolutionary history of the tea plant Camellia sinensis”的文章,该研究利用自主开发的新算法破译了高杂合铁观音的基因组组装难题,并在此基础上阐释了等位特异性表达应对”遗传负荷”的机制及茶树群体进化和驯化历史,为茶树育种改良提供了新见解。安诺优达为本次研究提供二代和PacBio三代建库测序服务。


1628587344983304.jpg


文章名称:Haplotype-resolved genome assembly provides insights into evolutionary history of the tea plant Camellia sinensis

发表时间:2021年7月15日

发表杂志:Nature Genetics

研究物种:茶树(Camellia sinensis

影响因子:38.330


研究背景




茶叶作为一种全球性的经济作物,有很强的保健作用。茶树是无性繁殖的,这种方式可以有效地维持因有性重组而分离或丢失的有价值的基因型。然而,这种繁殖方式也会积累大量有害突变,导致“穆勒棘轮”效应,致使作物遭受损失。
茶树是二倍体,含有15对同源染色体,嵌合式的基因组组装(筛选同源染色体中的一份拷贝作为代表组装到染色体水平)可能会错过重要选择性状的等位变异,而分型组装(不同亲本的两套同源染色体同时组装到染色体水平)能更完整地呈现二倍体基因组的全部遗传信息。本文通过对中国乌龙茶品种铁观音及几个主要的茶树品种和近缘物种进行测序及单体型组装,探索地理上不同的茶树群体之间的遗传多样性,为深入了解茶树的驯化史和进化史提供依据。


样本选择




山茶植株芽、根、茎、花、幼叶和成熟叶


测序策略




DNA:

PacBio Sequel II平台基因组测序 114X

Illumina NovaSeq 150 bp双端测序,DNA小片段文库

Illumina NovaSeq,Hi-C文库 99.4X

RNA:

PacBio Sequel II平台,Iso-Seq文库


研究思路





1628587410851325.jpg



研究结果




1. 基因组组装与注释

图片
铁观音的基因组大小约为3.15 Gb,杂合度为2.31%。利用PacBio长读长对原始数据进行组装得到初始contig,大小为5.41 Gb。将Khaper算法过滤产生的单倍体组装结果挂载到15个染色体(图1),得到单倍体参考基因组(monoploid reference genome),大小为3.03 Gb。同时利用ALLHiC算法得到铁观音单体型基因组(haplotype-resolved genome),大小为5.98 Gb。共线性分析显示它们的基因顺序高度一致。


1628587430423383.jpg

图1 铁观音基因组组装和质量评估
(a)单倍体参考基因组circos图,呈现15条染色体特征;(b)Hi-C热图呈现15条染色体组装质量;(c)LAI(LTR Assembly Index)评估铁观音基因组和已发表茶树基因组组装质量;(d)铁观音单倍体参考基因组和单体型基因组的共线性比较


2. 等位基因特异性表达

图片
利用铁观音不同组织的全基因组测序,分离得到14,691个等位基因(图2),其中1,528个基因存在一致性的等位特异性表达(consistent allele-specific expression,  ASEGs),即一个等位基因在所有组织和样本中的表达都高于另一等位基因。基因富集分析显示这些基因参与核糖体等多个生物学基本过程,与克服有害突变的潜在机制相关。同时还发现了386个非一致的ASEGs,它们在不同组织的等位基因之间存在特异性表达。其中几个基因与挥发性有机化合物的生物合成有关,包括黄酮和黄酮醇等的生物合成途径,这与植物的适应性演化相关。结果表明,在铁观音基因组中,一致性的ASEG明显多于不一致的ASEG(1,528 vs 386),这一趋势与杂交水稻的结果正好相反,即在杂交水稻中,不一致的ASEG远远大于一致性的ASEG。这种现象或许可以用杂种优势理论中的显性效应解释,长期无性繁殖的茶树利用优势等位基因应答不断积累的遗传负荷,以保持个体的适应度。

1628587448466984.jpg

图2 茶树单倍型基因组等位不平衡
(a) 两个单倍型序列的比对(10 Mb非重叠的窗口);(b)等位基因CDS序列比较;(c)等位基因的选择压力分析;(d)等位基因的非同义替换位点数目分布;(e)等位特异性表达基因(ASEGs)在茶树叶片中的表达情况;(f)举例说明一致性的ASEGs(CsSRC2);(g)举例说明非一致的ASEGs(CsGGPS1


3. 茶树遗传变异和群体结构分析

图片
通过对161份茶树种质资源重测序数据分析,发现样本主要分为三类(图3),分别为大理茶,大叶茶和小叶茶,与茶树的形态学分类一致。另外大叶茶可以分类古大叶茶和栽培大叶茶;而小叶茶依据地理分布可分为四个亚组,分别为SSJ(陕西,四川,江西,ZJNFJ(浙江和福建北部,SFJ(福建南部,HHA(湖北,湖南和安徽。TreeMix分析发现这些茶树之间存在显著的基因流动,表明种内基因交流频繁,其中一些与有记录的茶树杂交育种历史相吻合。

1628587465745855.jpg

图3 茶树群体系统进化与群体结构分析
(a)重测序样本的地理分布;(b)群体系统发育树;(c)PCA主成分分析;(d)群体遗传结构分析(k=7)


4. 大叶茶和小叶茶的进化史和驯化史

图片
对14种山茶属植物的21株单株进行了全基因组测序,通过群体遗传分析发现大叶茶和小叶茶具有不同的进化史。在Gelasian epoch时期(259-181万年前),剧烈的气候变化很可能导致了整个茶树物种(包括大叶茶和小叶茶)的群体收缩;两个变种分化后,仅小叶茶在Last Glacial Maximum时期(2.65-1.9万年前)可能由于温度骤降出现了再一次的群体收缩,但随后适应了环境的小叶茶迅速扩张,群体规模得到恢复。该分析表明,大叶茶和小叶茶分化后的进化史不同(图4)。
通过对大叶茶和小叶茶驯化基因的分析,发现它们的驯化过程是并行的(即独立驯化),这些驯化基因参与了一系列重要的生物学过程且受人工选育的偏好性影响。基于KEGG分析,在大叶茶驯化早期以参与氧化石墨烯苷转运、糖苷转运通路为主,后期品种改良主要集中在合成生物碱和芳香化合物等。例如,研究人员鉴定到CsXDH基因在大叶茶品种改良阶段受到强烈的人工选择,该基因编码黄嘌呤脱氢酶,是咖啡因合成通路的重要基因。而小叶茶品种的早期驯化与植物抵御相关,改良过程主要集中在花发育的调控和对一氧化氮的响应,已有研究表明,NO的积累可以加速γ-氨基丁酸的消耗从而帮助植物抵御冷胁迫,这表明筛选耐寒的品种也是人工选育的重要目标。

1628587482602658.jpg

图4 大叶茶和小叶茶的平行驯化
(a)平行驯化模式图;(b)全基因组的选择性清除信号;(c-f)重要基因的人工选择信号(XDH,CM,F3’H,BAS1,DWF4);(g)人工选择基因的表达情况


小结




本研究成功组装了两套铁观音基因组(单倍体参考基因组和单体型基因组)。通过对等位基因特异性表达的分析,预测显性效应可能是铁观音应对遗传负荷的重要机制。通过对茶树种群水平的遗传分析,揭示了该物种的进化和人工驯化历史。该成果为利用组学分析和分子生物学技术挖掘功能基因、解析其背后的遗传调控机制,开展基于大数据驱动的基因组智能设计育种奠定了坚实的理论基础,同时也为缩短育种周期、提高育种效率、降低育种成本提供了科学依据。

安诺优势



作为国内基因组行业知名企业,安诺基因拥有实力强大的测序服务平台,配备系列先进仪器设备,三代PacBio(1台Sequel IIe+7台Sequel II+10台Sequel)为您的科研之路保驾护航;专业的生物信息分析团队,丰富的项目分析经验,让您的数据分析之途无忧。安诺基因已与中国农业大学、中科院遗传与发育所、中国海洋大学、中国农业科学院、福建农林大学等多家科研院所开展了深度合作,助力基因组文章发表于NatureNature PlantsNature CommunicationsMolecular PlantCommunications BiologyThe Plant Journal等多个国际高水平期刊。


参考文献:

Zhang X, Chen S, Shi L, et al. Haplotype-resolved genome assembly provides insights into evolutionary history of the tea plant Camellia sinensis [published online ahead of print, 2021 Jul 15]. Nat Genet. 2021;10.1038/s41588-021-00895-y. 

更多 >>