产品和服务

安诺基因

公司建立了包含PromethION、PacBio Sequel、NovaSeq 6000、HiSeq X等

新一代测序仪的高通量测序平台,并与Illumina联合开发了

新一代桌面测序仪NextSeq 550AR,可以对DNA、RNA等不

同分子类型的样本进行测序分析,具备检测大批量样本的能力。

新闻中心
合作文章|解析三代结构变异与三维基因组在胰腺癌中的动态景观

2022年5月15日,国家癌症中心、中国医学科学院肿瘤医院王成锋教授团队联合安诺优达在知名学术期刊Advanced Science(IF: 16.806)在线发表了题为“Dynamic Interplay between Structural Variations and 3D Genome Organization in Pancreatic Cancer”的研究文章。安诺优达为本研究提供三代SMRT长读长建库测序分析和Hi-C建库测序分析服务。安诺优达三维基因组大项目分析团队苑赞、赵玥以作者身份全程参与了本研究中三代结构变异与三维基因组动态变化分析方案的设计、生物信息学分析和稿件修改工作。



图片1.png

研究摘要


研究者对胰腺癌中通过三代技术鉴定到的染色质结构变异图谱进行了系统描述,重点研究了胰腺癌中的复杂染色质结构变异与高阶染色质构象变化之间的动态联系,发现了涉及两个胰腺癌关键驱动基因CDKN2A和SMAD4的大规模基因组结构重排,并从一维线性和三维互作角度阐明了它们对致癌基因MIR31HG、MYO5B等表达的影响。

研究背景


染色体的结构和数量重排,统称为结构变异(Structural variation, SV),在很大程度上贡献了人类基因组的遗传多样性,与癌症遗传学、罕见病和进化遗传学有着高度的相关性。SVs不仅能影响基因的剂量,还能调节基因调控的基本机制。SVs可以改变调控元件的拷贝数,或通过破坏染色质的高阶组织(如拓扑关联结构域-TAD)来修改三维基因组。由于这些位置效应,SV可以影响远离SV断点的基因的表达,从而导致疾病。

 

胰腺癌是世界上最致命的恶性肿瘤之一,其中约90% 是起源于胰管上皮的胰腺导管腺癌(pancreatic ductal adenocarcinoma, PDAC)。在解读基因组结构变异对胰腺癌潜在致病进展的研究中考虑SVs对3D基因组和基因表达调控的影响很有必要。

研究结论


本研究选取了两株源自人胰腺导管上皮的胰腺癌细胞系(PANC1和 BxPC3)并选择永生化正常胰腺导管上皮细胞系(HPDE6C7)作为对照。


研究者在PDAC细胞系中鉴定到2万多SVs,其中多数SVs为插入和缺失突变(INS/DEL)。此外还对SVs在三维染色质结构Compartment、CDB(contact domain boundary)中的富集做了系统统计。


图片2.png 



因为TAD边界的存在,TAD内的SV一般会将扰动范围限制在所在TAD区域内,Cross-CDB SVs对染色质高级结构的扰动范围将会至少涉及CDB两端的TAD。染色质拓扑结构域边界需要CTCF结合在相应的染色质位置,再综合cohesin等染色质结构蛋白形成。TAD边界DNA的缺失一般会引起TAD边界的消失,进而使消失边界两端的TAD发生融合现象。


本研究在胰腺癌中观察到了这个规律,Cross-CDB SVs相对于其他区域的SVs更显著的和TAD融合现象相关。例如PANC1中的一个Cross-CDB Deletion不仅涉及CDKN2A(多重肿瘤抑制基因)的缺失,而且造成了所在区CDB的消失和两端TAD的融合。在胰腺癌的发生机制的研究中一般会强调CDKN2A的lost所造成的影响,进一步分析发现大约 90% PDAC中的CDKN2A失活与其附近的MIR31HG表达的上调相关,这可能涉及CDKN2A 纯合缺失造成的相邻基因组区域TAD融合异常表达调控有关。研究者还观测到有些非纯合Cross-CDB SVs所涉及的CDB并未消失,这显示了生物学样本内的异质性。

 

图片3.png


图片4.png


近一半的胰腺导管癌有SMAD4蛋白表达缺失,研究者在BxPC3样本中发现了SMAD4所在基因组位置有一个大的缺失突变,反常的是缺失突变两端的DNA区的染色质交互几乎没有,按照常理缺失位置临近的两端区域之间的交互应该增强。作者对这个异常进行进一步研究发现,这里的Deletion还关联了chr18比较复杂的大规模染色结构质重排。这个染色质结构重排可能是由三处大的Deletion涉及的染色体碎裂引起。研究者利用Hi-C辅助基因组组装的相关原理模拟了chr18重排后的染色质排布。这提示了利用多种技术手段 (三代、Hi-C)综合分析染色质一维、三维结构的重要性。



图片5.png


图片6.png


此研究项目应用了安诺优达自主开发的多组学可视化软件Annoroad-OMIC-Viz(https://github.com/Spartanzhao/Annoroad-OMIC-Viz)。文章的部分分析代码上传到了github(https://github.com/Spartanzhao/code_for_Advanced_Science_pancreatic_cell_Line_Hi-C)。点击原文链接即可直接跳转到文章页面。


国家癌症中心、中国医学科学院肿瘤医院王成锋教授和军事医学研究院陈河兵副研究员为论文的共同通讯作者,中国医学科学院肿瘤医院胰胃外科主治医师杜永星、博士生顾宗廷和李宗泽为论文的共同第一作者,安诺优达基因科技公司为本研究提供了相应的技术支持。北京大学李程研究员和中国医学科学院基础医学研究所陈阳研究员给予了重要的指导和帮助。该研究得到了国家自然科学基金和中国医学科学院医学与健康科技创新工程的支持。

 


安诺优达三维基因组


安诺优达作为国内早期提供三维基因组建库、分析和大项目服务的公司,积累了丰富的经验,2022年合作见刊的医学类三维基因组文章已有3篇。如有项目意向欢迎联系我们,期待我们的三维基因组大项目团队能够与更多的研究者深度合作,共同推动项目成果发表。



[1]l Yang Q, Jiang N, Zou H, Fan X, Liu T, Huang X, Wanggou S, Li X. Alterations in 3D chromatin organization contribute to tumorigenesis of EGFR-amplified glioblastoma[J]. Comput Struct Biotechnol J. 2022 Apr 8;20:1967-1978. doi: 10.1016/j.csbj.2022.04.007. PMID: 35521558; PMCID: PMC9062087.

[2]l Xia Y, Liu X, Mu W, Ma C, Wang L, Jiao Y, Cui B, Hu S, Gao Y, Liu T, Sun H, Zong S, Liu X, Zhao Y. Capturing 3D Chromatin Maps of Human Primary Monocytes: Insights From High-Resolution Hi-C[J]. Front Immunol. 2022 Mar 3;13:837336. doi: 10.3389/fimmu.2022.837336. PMID: 35309301; PMCID: PMC8927851.

[3]l Du Y, Gu Z, Li Z, Yuan Z, Zhao Y, Zheng X, Bo X, Chen H, Wang C. Dynamic Interplay between Structural Variations and 3D Genome Organization in Pancreatic Cancer[J]. Adv Sci (Weinh). 2022 May 15:e2200818. doi: 10.1002/advs.202200818. Epub ahead of print. PMID: 35570408.



更多 >>
项目文章|人脑研究风云再起,小胶质细胞研究新进展

2022年3月,中国科学院动物学研究所干细胞与生殖生物学国家重点实验室焦建伟老师、王雁玲老师及北京大学杜鹏老师、靳蕾老师在知名期刊Cell Stem Cell(IF: 24.633)在线发表了题为“Decoding the temporal and regional specification of microglia in the developing human brain”的研究文章,通过对人类胚胎各脑区的小胶质细胞的单细胞转录组分析,全面地揭秘了发育阶段人脑小胶质细胞的区域特异性和状态转换的时空动力学,并在和小鼠联合分析中,比较了两物种间状态转换的保守性和分子差异。安诺优达为本次研究提供了10X单细胞转录组测序服务。


图片1.png


研究背景


在脑部发育和神经炎症领域,作为中枢神经系统(CNS)的天然免疫细胞——小胶质细胞发挥着重要的作用,然而卵黄囊组织中相同红髓系祖细胞的小胶质细胞在四个脑区(大脑皮层、间脑、中脑和小脑)的发育路径、状态转换、相关功能特征等领域的研究尚不清楚。


在小鼠的scRNA-seq研究中,小胶质细胞高度异质性和发育相关复杂性的特点已得到证实。此次研究者以人类胚胎不同脑区的小胶质细胞为研究对象,首次发现小胶质细胞在早期胚胎发育中的状态转变,并评估了不同物种之间状态转换的保守性和分子差异。


实验材料


人类胚胎Carnegie Stage (CS) 12卵黄囊和头部组织;

不同孕期的不同脑区包括大脑、间脑、中脑、小脑。


测序策略


10x Genomics单细胞转录组测序


研究思路


图片2.png


研究结果


小胶质细胞单细胞转录组图谱的构建


研究者使用10X单细胞转录组测序技术构建了人类胚胎脑部小胶质细胞的单细胞转录组图谱,根据分选出的CD45+CD33+ 细胞,对卵黄囊、头部组织、在多个原肠胚形成周的大脑不同解剖位置多位置成分进行分析,识别出20个cluster,成功定义起源、增殖、免疫应答和神经元基因富集四大类小胶质细胞。源于卵黄囊的早期小胶质祖细胞,在人类CS12胚胎的头部表现出细胞增殖、免疫反应和神经系统发育三个明显的分化潜能。


图片3.png

图1 人脑不同发育区域小胶质细胞的scRNA序列和小胶质祖细胞的早期发育


两个小胶质细胞区域规范的发育轨迹——神经元基因富集和免疫


在大脑发育的不同阶段,富含神经元基因的小胶质细胞早在GW8短暂地出现过;免疫小胶质细胞也在后期(GW23左右)表现出其区域特异性。


因此通过Monocle2和URD进行拟时间分析,重现同组CS12原始髓系祖细胞的神经元基因富集和免疫相关小胶质细胞的发育轨迹,结果表明来自CS12卵黄囊和头部(C2/C3)的小胶质祖细胞首先开始增殖,形成不同周期阶段(C6/C9/C10)的小胶质细胞,从而向免疫和神经元基因富集两种分化方向过渡。


图片4.png

图2 小胶质细胞区域特异性的发育轨迹


免疫相关区域特异性小胶质细胞的独特特征


研究者进一步对两类区域特异性小胶质细胞进行探索。富含免疫或神经元基因富集的小胶质细胞携带转录组信息不同,这可能与中枢神经系统早期发育四个脑区的各种功能和动态微环境有关。为更准确分析胎儿中枢神经系统早期发育小胶质细胞的状态转换,使用FACS和10x单细胞转录组测序,从Cor区分离并富集CD45IntCD11Bpos阳性细胞,最后获得25891个小胶质细胞,从而利用新发现的亚群更全面地构建了大脑皮层小胶质细胞的高分辨率发育图谱。


胎儿小胶质细胞的区域特异性和状态转换之间也表现出了明显的潜在联系。干扰人类小胶质细胞内稳态基因可使人类小胶质细胞从相对静息状态退出,过渡到激活状态。经典稳态基因SLC2A5与CNS疾病相关的基因的高表达共同诱导激活了免疫相关的小胶质细胞簇,从而揭示出胎儿脑部特异性的小胶质细胞的独特特征。



图片5.png

图3 区域特异性小胶质细胞的独特特征


图片6.png


图4 区域特异性的胎儿小胶质细胞静息——激活状态改变


人和小鼠发育中状态转换存在保守性和分子特征差异


选用小鼠卵黄囊(E8.5)、头部组织(E9.5)及大脑Cor组织(E10.5-P20)的Cd45intCd11bpos细胞进行单细胞转录组测序,人类小胶质细胞通过激活CX3CR1、TMEM119和P2RY12/13的表达,在GW8开始获得内稳态。诱导典型的小胶质细胞激活基因,可使其在GW23被沉默,这代表人类胚胎活动状态的转变。小鼠中静息相关基因的诱导主要发生在E13.5,直至小鼠出生这些基因才出现减少,小胶质细胞进入活跃期。因此发育的小胶质细胞在静息——激活状态转换是保守的,但分子特征是不同的。


巨噬细胞相关基因方面,LYVE1、MRC1和F13A1在人类早期YS或head中的表达最高,然后逐渐降低。相比之下,小鼠Lyve1、Mrc1和F13a1基因表达在E10.5中高度富集,在早期胚胎发育中下降。人类 CS12-Head在转录组水平上与小鼠E10.5最相似。大多数其他细胞类型可以合并,人类和小鼠的几种细胞类型和发育途径也是保守的。


进一步DEGs的分析表明,人和小鼠小胶质细胞间在物种特异性基因的表达、功能亚类上存在确定性的差异。基因集富集分析(GSEA)显示,人类的细胞粘附分数、细胞因子相互作用、MAPK信号通路和Toll样信号通路更丰富。此外,研究者还鉴定出了PT-MG、AR-MG、CM-MG、MiR-MG和SP-MG集群中的人类和小鼠DEG。




图片7.png


图5 人和小鼠小胶质细胞在发育中状态转换的保守性


图片8.png

图6 人和小鼠小胶质细胞分子特征的差异


总结

作者通过对发育中的人类胚胎各脑区的小胶质细胞的单细胞转录组分析,并结合实验验证,首次定义并描述了区域规范和状态转换相关的小胶质细胞的发育轨迹;在神经元基因富集相关的小胶质细胞中,重新鉴定出了几个具有区域特异性的相关亚类;在免疫相关的小胶质细胞中,它们在中枢神经系统发育的后期表现出区域特异性,同时它们也出现了静息——激活状态的改变;此外,人和小鼠小胶质细胞在发育中状态转换具有保守性,但存在分子差异。


参考文献

Yanxin Li, Zhongqiu Li, Min Yang, etal.Decoding the temporal and regional specification of microglia in the developing human brain[J]. Cell Stem Cell,2022.



更多 >>
登顶Cell!北京林业大学联合安诺优达完成染色体水平的油松基因组组装和甲基化研究

2021年12月,北京林业大学生物科学与技术学院联合安诺优达在国际知名期刊Cell(IF:41.582)在线发表了题为“The Chinese pine genome and methylome unveil key features of conifer evolution”的研究文章,研究者对油松进行了染色体水平的基因组组装和注释,绘制了油松基因组的染色体甲基化图谱,为油松独特适应性和发育研究、生殖生物学研究及基因组辅助育种进化和基因组学研究提供了重要参考。安诺优达深度参与了本次研究,包括PacBio三代测序、Hi-C辅助组装以及RNA-seq、WGBS等多组学测序及该基因组的组装、注释等研究。





研究背景




针叶树在世界森林生态系统中占主导地位,是种植最广泛的树种之一。针叶树基因组属于大型基因组,存在高度重复序列(70%-80%),因此基因组组装难度较高。


研究者利用PacBio测序、Hi-C辅助组装等技术,组装获得了25.4 Gb染色体水平的油松基因组。通过使用来自760个生物样本的大规模RNA-seq数据来辅助基因结构注释,揭示油松基因组扩展、生殖过程和适应性进化的多重基因组特征和分子机制,给针叶树进化研究提供了新思路,为今后进一步开展针叶树适应与发育研究提供了数据参考。





材料选择




35年生无性系优良油松的新芽





测序策略




DNA测序策略

Illumina NovaSeq 6000,DNA小片段文库,103 X

PacBio Sequel II基因组测序,103 X

Illumina NovaSeq 6000,Hi-C文库

RNA测序策略

Illumina测序,构建RNA文库




技术路线




1640847651913249.png




研究结果




油松染色体基因组组装和注释


研究者首先通过Illumina测序,对油松基因组大小进行评估,随后利用PacBio测序数据进行自校正和组装,成功构建出24.4 Gb(96.1%,12条染色体)的油松高质量的染色体水平基因组。


针叶树中的基因通常多于二倍体被子植物,基因复制导致了许多基因家族的扩张。在基因复制的不同类别中,油松的旁系同源主要来源于分散重复(DSD),很少来自全基因组复制(WGD),油松发生近期全基因组复制事件概率较低。

1640847663125241.png

图1 油松高质量基因组组装


长内含子的独特基因空间结构


油松的基因组存在大量的长内含子,总内含子/外显子长度与基因组的大小呈正相关,基因表达水平的差异与基因长度和内含子数有关。长基因的RNA剪接和DNA甲基化检测结果表明,几乎所有CG和CHG位点都发生了甲基化,DNA甲基化可能参与了长内含子的准确识别。

1640847673812727.png


图2 油松基因组的基因空间结构和复杂性展示


油松的适应进化


通过功能富集分析发现了3,623个显著扩张的家族基因,主要参与生物和非生物胁迫反应。通过鉴定油松中的转录因子(TF)和转录调节因子(TR)家族,发现对低温高度敏感的AP2/ERF基因家族成员可能在油松的低温适应中发挥关键作用。在候选基因编码酶鉴定中,萜烯合成相关基因在不同树龄的油松中有明显的表达模式,新形成的针叶可能是萜烯的主要合成部位。

1640847686112419.png

图3 油松中萜烯的合成途径


针叶树生殖发育的独特调控网络


被子植物中具有很多调节开花的关键基因,但油松中缺少很多同源基因。FT/TFL1-like基因是被子植物中调节开花的关键基因,但油松中仅有2个拷贝,但在其他针叶树中一般有4-6个拷贝。研究者在拟南芥中做了转基因验证,过表达了这两个基因,转基因植株表现出明显的晚开花表型。


通过对油松基因组中12个高表达的MADS-box基因的酵母双杂交检测,发现两个AGL6-like基因(PtDAL1PtDAL14)在油松中有不同的表达模式,其中PtDAL14在生殖器官中特异性表达,与其他MADS-box转录因子蛋白相互作用,表明AGL6-like基因可能作为MADS-box转录因子之间相互作用的桥梁,从而形成互作网络。最后研究者提出了一个控制油松雌雄球果发育的模型,为今后针叶树生殖发育研究提供了一张蓝图。

1640847695369806.png

图4 油松中12个MADS-box家族转录因子的表达及蛋白互作模型


油松近期的LTR-RT的爆发和稳定的甲基化维持系统


从染色体层面看,基因组甲基化水平与油松的TE覆盖率显著相关,研究发现携带TE的基因区域的平均甲基化水平远高于不携带TE的基因区域,但TSS和TES区域的平均甲基化水平始终较低。DNA甲基化对于TE基因组的扩张产生了影响,但未有证据表明,油松甲基化程度随树龄的增加而下降。LTR-RTs代表了大部分TEs,不平等重组(UR)是植物中一种重要的LTR-RT清除机制,针叶树的UR率可能比被子植物小型基因组低得多,SGS3-RDR6-RdDM通路可能是针叶树中主要的DNA甲基化途径。

1640847705895708.png

图5 油松中DNA甲基化及转座子扩张





研究结论




研究者构建了当前大型基因组中连续性最好的高质量染色体水平的油松基因组。研究发现转座子的不断扩张和缓慢清除是导致针叶树基因组巨大的重要原因,具有超长内含子的大基因往往表达水平较高。与被子植物相比,油松具有独特的生殖系统。油松基因组的构建为其独特适应性和发育研究、生殖生物学研究及基因组辅助育种进化和基因组学研究提供了重要参考。




作为国内基因组行业知名企业,安诺优达拥有实力强大的测序服务平台,配备系列先进仪器设备,三代PacBio(2台Sequel IIe+7台Sequel II+10台Sequel)为您的科研之路保驾护航;专业的生物信息分析团队,丰富的项目分析经验,让您的数据分析之途无忧。安诺基因已与中国农业大学、中科院遗传与发育所、中国海洋大学、中国农业科学院、福建农林大学等多家科研院所开展了深度合作,助力基因组文章发表于CellNatureNature GeneticsNature Plants等多个国际高水平期刊。

图片




参考文献

[1] Niu S.H., Li J., Bo W.H., Yang W.F., Zuccolo A.,Giacomello S., ChenX., Han F.X., Yang J.H., Song Y.T., Nie Y.M., Zhou B.,Wang P.Y., Zuo Q., Zhang H., Ma J.J., Wang J., Wang L.J., Zhu Q.Y., ZhaoH.H., Liu Z.M., Zhang X.M., Liu T., Pei S.R., Li Z.M., Hu Y., Yang Y.H., LiW.Z., Zan Y.J., Zhou L.H., Lin J.X., Yuan T.Q., Li W., Li Y., Wei H.R. & WuX.The Chinese pine genome and methylome unveil key features of coniferevolution[J]. Cell, 2022, 185(1):1-14.



更多 >>
Nature Genetics项目文章|茶树单体型基因组组装揭示茶树的演化史

2021年7月15日,由福建农林大学、中国农业科学院(深圳)农业基因组研究所等多家单位共同合作在国际顶级期刊Nature Genetics上发表“Haplotype-resolved genome assembly provides insights into evolutionary history of the tea plant Camellia sinensis”的文章,该研究利用自主开发的新算法破译了高杂合铁观音的基因组组装难题,并在此基础上阐释了等位特异性表达应对”遗传负荷”的机制及茶树群体进化和驯化历史,为茶树育种改良提供了新见解。安诺优达为本次研究提供二代和PacBio三代建库测序服务。


1628587344983304.jpg


文章名称:Haplotype-resolved genome assembly provides insights into evolutionary history of the tea plant Camellia sinensis

发表时间:2021年7月15日

发表杂志:Nature Genetics

研究物种:茶树(Camellia sinensis

影响因子:38.330


研究背景




茶叶作为一种全球性的经济作物,有很强的保健作用。茶树是无性繁殖的,这种方式可以有效地维持因有性重组而分离或丢失的有价值的基因型。然而,这种繁殖方式也会积累大量有害突变,导致“穆勒棘轮”效应,致使作物遭受损失。
茶树是二倍体,含有15对同源染色体,嵌合式的基因组组装(筛选同源染色体中的一份拷贝作为代表组装到染色体水平)可能会错过重要选择性状的等位变异,而分型组装(不同亲本的两套同源染色体同时组装到染色体水平)能更完整地呈现二倍体基因组的全部遗传信息。本文通过对中国乌龙茶品种铁观音及几个主要的茶树品种和近缘物种进行测序及单体型组装,探索地理上不同的茶树群体之间的遗传多样性,为深入了解茶树的驯化史和进化史提供依据。


样本选择




山茶植株芽、根、茎、花、幼叶和成熟叶


测序策略




DNA:

PacBio Sequel II平台基因组测序 114X

Illumina NovaSeq 150 bp双端测序,DNA小片段文库

Illumina NovaSeq,Hi-C文库 99.4X

RNA:

PacBio Sequel II平台,Iso-Seq文库


研究思路





1628587410851325.jpg



研究结果




1. 基因组组装与注释

图片
铁观音的基因组大小约为3.15 Gb,杂合度为2.31%。利用PacBio长读长对原始数据进行组装得到初始contig,大小为5.41 Gb。将Khaper算法过滤产生的单倍体组装结果挂载到15个染色体(图1),得到单倍体参考基因组(monoploid reference genome),大小为3.03 Gb。同时利用ALLHiC算法得到铁观音单体型基因组(haplotype-resolved genome),大小为5.98 Gb。共线性分析显示它们的基因顺序高度一致。


1628587430423383.jpg

图1 铁观音基因组组装和质量评估
(a)单倍体参考基因组circos图,呈现15条染色体特征;(b)Hi-C热图呈现15条染色体组装质量;(c)LAI(LTR Assembly Index)评估铁观音基因组和已发表茶树基因组组装质量;(d)铁观音单倍体参考基因组和单体型基因组的共线性比较


2. 等位基因特异性表达

图片
利用铁观音不同组织的全基因组测序,分离得到14,691个等位基因(图2),其中1,528个基因存在一致性的等位特异性表达(consistent allele-specific expression,  ASEGs),即一个等位基因在所有组织和样本中的表达都高于另一等位基因。基因富集分析显示这些基因参与核糖体等多个生物学基本过程,与克服有害突变的潜在机制相关。同时还发现了386个非一致的ASEGs,它们在不同组织的等位基因之间存在特异性表达。其中几个基因与挥发性有机化合物的生物合成有关,包括黄酮和黄酮醇等的生物合成途径,这与植物的适应性演化相关。结果表明,在铁观音基因组中,一致性的ASEG明显多于不一致的ASEG(1,528 vs 386),这一趋势与杂交水稻的结果正好相反,即在杂交水稻中,不一致的ASEG远远大于一致性的ASEG。这种现象或许可以用杂种优势理论中的显性效应解释,长期无性繁殖的茶树利用优势等位基因应答不断积累的遗传负荷,以保持个体的适应度。

1628587448466984.jpg

图2 茶树单倍型基因组等位不平衡
(a) 两个单倍型序列的比对(10 Mb非重叠的窗口);(b)等位基因CDS序列比较;(c)等位基因的选择压力分析;(d)等位基因的非同义替换位点数目分布;(e)等位特异性表达基因(ASEGs)在茶树叶片中的表达情况;(f)举例说明一致性的ASEGs(CsSRC2);(g)举例说明非一致的ASEGs(CsGGPS1


3. 茶树遗传变异和群体结构分析

图片
通过对161份茶树种质资源重测序数据分析,发现样本主要分为三类(图3),分别为大理茶,大叶茶和小叶茶,与茶树的形态学分类一致。另外大叶茶可以分类古大叶茶和栽培大叶茶;而小叶茶依据地理分布可分为四个亚组,分别为SSJ(陕西,四川,江西,ZJNFJ(浙江和福建北部,SFJ(福建南部,HHA(湖北,湖南和安徽。TreeMix分析发现这些茶树之间存在显著的基因流动,表明种内基因交流频繁,其中一些与有记录的茶树杂交育种历史相吻合。

1628587465745855.jpg

图3 茶树群体系统进化与群体结构分析
(a)重测序样本的地理分布;(b)群体系统发育树;(c)PCA主成分分析;(d)群体遗传结构分析(k=7)


4. 大叶茶和小叶茶的进化史和驯化史

图片
对14种山茶属植物的21株单株进行了全基因组测序,通过群体遗传分析发现大叶茶和小叶茶具有不同的进化史。在Gelasian epoch时期(259-181万年前),剧烈的气候变化很可能导致了整个茶树物种(包括大叶茶和小叶茶)的群体收缩;两个变种分化后,仅小叶茶在Last Glacial Maximum时期(2.65-1.9万年前)可能由于温度骤降出现了再一次的群体收缩,但随后适应了环境的小叶茶迅速扩张,群体规模得到恢复。该分析表明,大叶茶和小叶茶分化后的进化史不同(图4)。
通过对大叶茶和小叶茶驯化基因的分析,发现它们的驯化过程是并行的(即独立驯化),这些驯化基因参与了一系列重要的生物学过程且受人工选育的偏好性影响。基于KEGG分析,在大叶茶驯化早期以参与氧化石墨烯苷转运、糖苷转运通路为主,后期品种改良主要集中在合成生物碱和芳香化合物等。例如,研究人员鉴定到CsXDH基因在大叶茶品种改良阶段受到强烈的人工选择,该基因编码黄嘌呤脱氢酶,是咖啡因合成通路的重要基因。而小叶茶品种的早期驯化与植物抵御相关,改良过程主要集中在花发育的调控和对一氧化氮的响应,已有研究表明,NO的积累可以加速γ-氨基丁酸的消耗从而帮助植物抵御冷胁迫,这表明筛选耐寒的品种也是人工选育的重要目标。

1628587482602658.jpg

图4 大叶茶和小叶茶的平行驯化
(a)平行驯化模式图;(b)全基因组的选择性清除信号;(c-f)重要基因的人工选择信号(XDH,CM,F3’H,BAS1,DWF4);(g)人工选择基因的表达情况


小结




本研究成功组装了两套铁观音基因组(单倍体参考基因组和单体型基因组)。通过对等位基因特异性表达的分析,预测显性效应可能是铁观音应对遗传负荷的重要机制。通过对茶树种群水平的遗传分析,揭示了该物种的进化和人工驯化历史。该成果为利用组学分析和分子生物学技术挖掘功能基因、解析其背后的遗传调控机制,开展基于大数据驱动的基因组智能设计育种奠定了坚实的理论基础,同时也为缩短育种周期、提高育种效率、降低育种成本提供了科学依据。

安诺优势



作为国内基因组行业知名企业,安诺基因拥有实力强大的测序服务平台,配备系列先进仪器设备,三代PacBio(1台Sequel IIe+7台Sequel II+10台Sequel)为您的科研之路保驾护航;专业的生物信息分析团队,丰富的项目分析经验,让您的数据分析之途无忧。安诺基因已与中国农业大学、中科院遗传与发育所、中国海洋大学、中国农业科学院、福建农林大学等多家科研院所开展了深度合作,助力基因组文章发表于NatureNature PlantsNature CommunicationsMolecular PlantCommunications BiologyThe Plant Journal等多个国际高水平期刊。


参考文献:

Zhang X, Chen S, Shi L, et al. Haplotype-resolved genome assembly provides insights into evolutionary history of the tea plant Camellia sinensis [published online ahead of print, 2021 Jul 15]. Nat Genet. 2021;10.1038/s41588-021-00895-y. 

更多 >>