小白学数据挖掘:一文看懂如何用数据库筛选变异位点
2019.11.27

2019年即将接近尾声了啦,又到了一年一度总结过去展望未来的关键时期。回望过去,看着年初的计划,小编发出灵魂三问:文章发表了吗?基因测序找安诺了吗?外显子数据库使用对了吗?

不晚,最好的开始时间就是现在,为了答谢广大客户长期以来对安诺优达的衷心支持,小编呕心沥血总结了一套最全的数据库使用教程,帮助大家在年底梳理数据,进一步筛选候选位点,迈向发paper的2020年。快动下手指点赞收藏起来吧~


基因注释

推荐数据库:

refGene(https://www.ncbi.nlm.nih.gov/refseq/)
Ensembl(http://asia.ensembl.org/index.html)
UCSC(http://genome.ucsc.edu)

以ensembl数据库为例,在词条中输入要查询的变异位点、基因名称、位置信息或者rs号等,此处需要注意选择参考基因组版本号:hg38(GRCh38)/hg19(GRCh37)。

1574815408394911.png

举个栗子,输入“rs9793256”,即出现如下界面:

1574815435772443.png

点击红框内容,可以看到有关该变异的注释信息,包括突变类型、突变频率、位置信息等。

1574815458863046.png


频率注释

推荐数据库:

1000Genomes(http://www.internationalgenome.org/)

ESP(http://evs.gs.washington.edu/EVS/)

ExAC(http://exac.broadinstitute.org/)

gnomAD(http://gnomad.broadinstitute.org/)

以ExAC数据库为例,在搜索词条里面,输入要检索的变异位点,或者关注的基因、变异区域等,按照词条下面提供的格式示例输入即可。

1574815535304583.png

举个栗子,输入“1- 1387764-G-A”即1号染色体,1387764位置上,由G突变成A的变异情况,提交即可看到该变异在各个数据库中的突变频率,也可以链接到UCSC、ClinVar数据库查看详细信息。

1574815561275984.png


功能注释

推荐数据库:

HGMD(http://www.hgmd.cf.ac.uk/ac/index.php)Clinvar(https://www.ncbi.nlm.nih.gov/clinvar/)

OMIM(https://omim.org/)

以Clinvar为例,在词条栏可以输入基因名、rs号等,也可以点击“Advanced”进行高级搜索。

1574815623975563.png

举个栗子,输入“rs1051740”,数据库对该变异位点进行了星级打分,可以评估某个特定突变在疾病中的本来或者注释作用。临床意义:良性、可能良性、致病性等,且提供OMIM数据库链接、文献支撑等。

1574815661178728.png



1574815686508012.png

1574815708595138.png



疾病与表型的关系

Phenolyzer在线工具网址http://phenolyzer.wglab.org/,点击进入后会看到如下界面,按下述红色备注进行操作:


1574815798140848.png

所有选项填写完成后点击如上所述“Submit”按钮,在结果中的任意节点可以用鼠标进行拖拽移动节点位置,图片下方可以根据自己的需要选择是否显示某些信息(基因、疾病……),以及互作连线的方式(蛋白互作、同属一个家族……)。

1574815820739508.png

点击“Barplot”按钮,可将候选基因与该疾病/表型的相关性进行打分,基因排序越靠前代表与疾病/表型相关性越高,具体结果如下所示:

1574815840917225.png

以上就是小编整理的关于变异位点筛选中经常用到的数据库,当然上述数据库的功能绝不仅限于此,感兴趣的小伙伴们可以自行进行数据挖掘,欢迎大家随时交流沟通~


安诺基因搭建多样化的人基因组测序平台,为遗传性疾病的研究提供优质、高效的高通量测序服务。

●自动化建库平台:实现DNA小片段文库、外显子捕获文库的自动化建库,单次建库通量96个样品,大幅缩短实验周期。

●安诺云大数据分析平台:拥有全面的基因组学分析流程,数据分析快速高效,快速分析周期1天内完成。

●中国人群基因组数据库:打造中国人自己的基因组数据库——Annoroad Typical Chinese Genomes(ATCG)数据库,辅助深入挖掘中国人群特有变异,助力中国疾病研究。

●多组学联合分析流程:更高效地利用基因组、转录组及表观组三大组学数据,全面揭示疾病致病机制,助力生物标志物挖掘。

●丰富的医学临床转化经验:具有多种IVD产品的临床转化经验,曾参与合作项目临床试验成果的专利申报及产品转化。

在线客服

>>

安诺基因在线客服

客服1 客服2 客服3

电话:400-8986-980