快好知 kuaihz

玩转基因组浏览器之VCF文件的可视化

除了基因结构,测序深度的可视化外,IGV也可以展示基因组变异信息,支持以下两种文件格式

VCF

MAF

VCF是存储突变位点分型结果的标准文件格式,而MAF是由TCGA制订的,存储突变位点注释信息的文件格式。本文主要展示VCF文件导入IGV的详细过程。

首选我们需要对VCF文件建立索引,可以使用tabix软件来实现,操作方法如下

# 使用bgzip进行压缩

bgzip input.vcf

# 对压缩文件建立索引

tabix -p vcf input.vcf.gz

建立索引之后,就可以直接将vcf.gz文件导入IGV进行查看,结果示意如下

VCF文件中存储了多个样本的分型结果,每个位点的突变类型用不同颜色表示

深蓝色,杂合突变

青绿色,纯合突变

灰色,纯合未突变

在最上方用柱状图来表示allel在所有样本中的频率,蓝色表示ref allele, 红色表示alt allele。不同颜色表征不同的突变类型,可以形成类似热图的效果,方便直观的比较不同样本突变情况的异同。

·end·

本站资源来自互联网,仅供学习,如有侵权,请通知删除,敬请谅解!
搜索建议:转基因  转基因词条  可视化  可视化词条  浏览器  浏览器词条  文件  文件词条  VCF  VCF词条