Hi-C辅助组装“疑无路”,柳暗花明需此文
2018.09.05

Hi-C辅助组装是将已有的二代、三代或光学图谱辅助组装的基因组草图序列进行染色体群组的划分,确定各序列在染色体上的顺利和方向,使基因组组装提升到染色体水平的技术。这篇文章将带你对Hi-C辅助组装进行深入的了解。


1.什么是Hi-C技术?

Hi-C(High-throughput chromosome conformation capture)技术是由染色体构象捕获技术发展而来,基于近距离连接反应原理,结合生物素标记筛选和高通量测序技术,通过交联、酶切、连接等步骤,实现全基因组范围内染色体交互的高通量检测,并利用生物信息分析方法,研究全基因组范围内整个染色质DNA在空间位置上的关系,获得高分辨率的染色体三维结构信息,从而获得全基因组范围内染色质之间的空间交互信息。


图1 Hi-C技术原理[1]


2.Hi-C辅助组装的应用

Hi-C辅助组装可以更完整的组装基因组,既通过获得基因组染色体区域之间的相互作用关系,包括染色体内或染色体间的联系,对基因组草图Contig/Scaffold进行聚类、排序和定向,从而实现了染色体水平基因组组装。染色体水平基因组为染色体间互作关系、全基因组重测序分析,染色体进化分析,表观基因组学研究和杂交育种性研究提供了基础。


3.影响Hi-C辅助基因组的因素

基于相同Hi-C数据和不同长度Contig N50数据进行挂载比较分析发现,Contig的长度越长,组装的效果越好。同时基于相同Contig N50数据下,结果显示Hi-C的有效数据量所占比例越高,基因组组装效果越好[1]。基因组草图Contig/Scaffold的连续性和有效数据量对基因组辅助组装效果至关重要。除此之外,基因组大小及复杂度、基因组组装数据质量等同样会对Hi-C数据组装结果具有重要的影响。


4.Hi-C辅助组装样本的要求

1)动物细胞

每管5×106个细胞,最多分装25×106个,细胞不可经过核酸染色步骤,交联前处于活性状态,冷冻细胞需活化后在进行交联。

2) 动物组织

动物组织细胞分散建议使用物理操作方法。

1g动物组织/文库,建议交联2-3g。

3) 血液样本

血液必须为新鲜血样,交联后需用1.5mL离心管盛装,10mL/文库,不包括禽类、鱼类等有细胞核血液样本。

4) 植物组织

样品为活体植株或交联后组织。植物干枯、冷冻、非生长条件介质运输,均会改变植物基因组的三维结构,另外,植株取样部位必须无病害,无明显蜡质,2-3g/文库。

5) 微生物

使用原始细胞,不能使用原生质体,交联过程要在超净工作台完成,2×108/文库。


5.如何读懂Hi-C辅助组装结题报告


图2 Hi-C辅助组装流程图解读


6.如何确定端粒和着丝粒位点序列

着丝粒在多细胞真核生物中位于高度重复的卫星DNA序列之中,其自身序列也为多重复序列;而端粒是构成真核生物染色体末端的重要DNA序列,主要结构是串联重复序列,端粒和着丝粒都有着高度重复序列的特性尤其是着丝粒可为上百万碱基对的高度重复序列,测序存在较大的困难,区分方法首先通过数据库对有着特定的串联重复序列的端粒进行预测,特异序列在Hi-C互作热图上会表现出某些特性[2],通过Hi-C数据进行挂载,对串联重复序列进行染色体定位,如果刚好位于染色体两端,则认为是端粒序列。


7.区分XY或ZW型性染色体的难点

由于XY或ZW本身就是一对同源染色体,其同源性很高,从基因草图组装过程中就不容易区分,加之de novo一般基于overlap进行分析,对于同源性较高的基因序列,软件无法进行有效区分,而是简单的连接,造成后期Hi-C挂载难度更大,增加了Hi-C对于XY或ZW的准确区分难度。


8.Hi-C是否能够检测不同染色体之间的互作关系

基因组Hi-C辅助组装,不仅可以确定同一条染色体内部的互作关系,而且可以检测出不同染色体间的互作关系。


参考文献:

[1] BurtonJN, Adey A, Patwardhan RP, et al. Chromosome-scale scaffolding of denove genome assemblies based on chromatin interactions. Nat biotechnol. 2013,31(12): 1119-25.

[2] BarutcuA R, Lajoie B R, Mccord R P, et al. Chromatin interaction analysis reveals changes in small chromosome and telomere clustering between epithelial and breast cancer cells.[J]. Genome Biology, 2015, 16(1):214.

在线客服

>>

安诺基因在线客服

客服1 客服2 客服3

电话:400-8986-980