除了基因结构,测序深度的可视化外,IGV也可以展示基因组变异信息,支持以下两种文件格式
VCF
MAF
VCF是存储突变位点分型结果的标准文件格式,而MAF是由TCGA制订的,存储突变位点注释信息的文件格式。本文主要展示VCF文件导入IGV的详细过程。
首选我们需要对VCF文件建立索引,可以使用tabix软件来实现,操作方法如下
# 使用bgzip进行压缩
bgzip input.vcf
# 对压缩文件建立索引
tabix -p vcf input.vcf.gz
建立索引之后,就可以直接将vcf.gz文件导入IGV进行查看,结果示意如下
VCF文件中存储了多个样本的分型结果,每个位点的突变类型用不同颜色表示
深蓝色,杂合突变
青绿色,纯合突变
灰色,纯合未突变
在最上方用柱状图来表示allel在所有样本中的频率,蓝色表示ref allele, 红色表示alt allele。不同颜色表征不同的突变类型,可以形成类似热图的效果,方便直观的比较不同样本突变情况的异同。
·end·