产品简介 技术流程 样本要求 案例分析 FAQ


技术简介.png


Hi-C技术源于染色体构象捕获技术,利用高通量测序技术,结合生物信息分析方法,研究全基因组范围内整个染色质DNA在空间位置上的关系,获得高分辨率的染色质三维结构信息。基于Hi-C数据中染色质片段间的交互强度呈现出随距离衰减的规律,Hi-C可以用于基因组组装,将杂乱的基因序列组装到染色体水平。


优势.png


Hi-C辅助基因组组装优势.png




应用领域.png



Hi-C辅助基因组组装应用领域.png




技术路线.png



Hi-C辅助基因组组装技术路线.png



产品参数.png


Hi-C辅助基因组组装产品参数.png

样本要求.png


Hi-C辅助基因组组装样本要求.png


基于染色体相互作用的植物基因组组装策略:拟南芥案例


De Novo Plant Genome Assembly Based on Chromatin Interactions: A Case Study of

Arabidopsis thalianat


基于染色体相互作用的植物基因组组装策略:拟南芥案例.png


1

设计思路


设计思路.png


 

2

研究结果


Hi-C将scaffold归类到不同染色体上

为了把scaffold归到不同的染色体组,遵循染色体之内的相互作用频率高于染色体之间。由de novo组装获得的1705个scaffold(总长度112.61Mb,N50=341.63kb)用于染色体水平的Hi-C组装。拟南芥Ler生态型的两个技术重复Hi-C reads比对到scaffolds上,计算scaffolds之间的相互作用reads对数。根据scaffolds之间的相互作用强弱,用Lachesis软件包将scaffolds划分到5条染色体。99.10%的scaffolds归到5条染色体中的一条,只有少数相互作用及弱的未能成功归到染色体中(图1);1.01Mb没有归类的序列中,大多数属于5个HindIII酶切位点的scaffold,这样的scaffold不能产生充足的相互作用信号。哥伦比亚(Col)生态型的基因组序列作为参考来评估scaffold归类效果。共有1350个scaffolds(97.19%)正确归类到染色体上,表明Hi-C能将序列正确地划分到不同染色体中,包括跨越着丝粒的区域。


图1 Hi-C用于拟南芥ler的scaffold归类结果.png


图1 Hi-C用于拟南芥ler的scaffold归类结果


Hi-C辅助基因组组装效果与高密度遗传图谱比较

为了进一步验证,本文将此结果与之前基于高密度遗传图谱的组装结果相比较,遗传图谱中238个scaffolds被定位到染色体上,用Hi-C辅助组装有236个scaffold被成功归类到染色体上,两种方法的一致性高达97%(图2)。


图2 Hi-C归类效果与遗传图谱比较.png


图2 Hi-C归类效果与遗传图谱比较


染色体内的scaffold排序与定向

同一条染色体内的scaffolds根据相互作用强弱(相互作用强的挨着近)排序与定向,大部分的scaffolds能够成功排序与定向(n=551),包括大多数着丝粒间隙区域。总scaffold长度的6.4%成功归到染色体上,但是不能排序和定位,这其中大多数(892/894)scaffold少于15个HindIII酶切位点,在用Lachesis软件包排序时被过滤掉。如图3,Hi-C获得的排序结果与哥伦比亚(Col)生态型高度吻合。大多数的错误排序发生在4号染色体,这可能由于Ler生态型发生了染色体重排(相对于Col)。


用遗传图谱232个scaffolds能够正确定位,Hi-C的方法221个scaffolds能够成功排序与定向,其中220个和遗传图谱的结果一致(图4)。

 

图3 Hi-C排序scaffolds效果.png 


图3 Hi-C排序scaffolds效果


图4 Hi-C排序、定向scaffolds效果与遗传图谱比较.png


图4 Hi-C排序、定向scaffolds效果与遗传图谱比较


4

研究结论


和传统的遗传图谱相比,Hi-C辅助基因组组装有很高的敏感度和特异性。在用遗传图谱组装的过程中,遗传标记探针用于鉴定细胞分裂中突触染色体的遗传交互,这决定了scaffold之间的相邻关系。基于遗传图谱的基因组组装灵敏度受限于scaffold长度、群体大小、多态性标记的密度和重组基因型的比例。在Hi-C辅助组装中,scaffolds相邻关系的构建基于染色质相互作用强弱,Hi-C能够获取所有染色质的相互作用关系,因此Hi-C能组装更多的scaffold。此外,Hi-C 获得的读取片段作为标记,其长度是SSR或者SNP标记的4-5倍,必然导致Hi-C组装比传统遗传图组装有更高的定位特异性。Hi-C可以对已经发表的基因组中没有定位的scaffold进行定位,提高已发表基因组的完整性。


5

参考文献


Xie T, Zheng J F, Liu S, et al. De Novo Plant Genome Assembly Based on Chromatin Interactions: A Case Study of Arabidopsis thaliana[J]. Molecular Plant, 2015, 408(3): 489-492.

Q Hi-C 需不需要做重复?


A理论上是需要做 3 个重复的,但是从成本角度考虑,暂时 Hi-C 可以做两个技术重复, 即如果一个样本理论   上需要测 180G 数据量,那我们建两个文库,每个文库测 90G, 分析数据相关性比较高后将两个文库的数据进行整合。


Q样品交联后检测出现降解、DNA 蛋白复合物少怎么办?


A

1) 植物或者动物组织尽量剪碎,保证充分交联。

2) 要注意交联反应温度(25 度左右)和时间。甲醛处理时间过长,未及时中和容易导致样本降解。

3) 同时要保证样本新鲜。



Qbin size 的真正含义是什么?


A在所设定的 bin size 下,80%—90%以上的 bin 对有 reads 支持(80%—90%bin 与 bin 之间有互作),则   认为此分辨率是可以达到的。市场上偷换概念者大有人在,把 bin size 设得特别小,但是很多 bin 都是空的,即和其他 bin 没有互作,可能也就 50% 甚至更低的 bin 之间有互作,达不到承诺的分辨率。




在线客服

>>

安诺基因在线客服

客服1 客服2 客服3

电话:400-8986-980