快好知 kuaihz

使用MACS2进行差异peak分析

MACS2作为使用最广泛的peak calling软件,在v2版本中添加了差异peak分析的功能,所有的子命令功能描述如下

通过bdgdiff子命令来进行差异peak分析, 该命令不需要基于已有的peak calling结果,只需要输入每个样本对应的bedGraph格式的文件。需要注意的是,该命令只针对两个样本间的差异peak进行设计,适用于没有生物学重复的情况。

对于使用macs2来进行差异peak的完整流程,官方给出了详细的说明文档,链接如下

https://github.com/taoliu/MACS/wiki/Call-differential-binding-events

可以分为以下3步

1. 预测插入片段长度

通过predictd子命令可以预测样本的fragment size,命令如下

macs2 predictd -i input.bam

2. peak  calling

在peak calling时,需要添加-B参数,这样才可以输出样本对应的bedgraph文件,同时需要保证peak  calling时采用一致的--extsize的值,就是第一步预测出来的数值,取多个样本的均值即可。官方也给出了推荐值,对于大多数的转录因子chip_seq数据,推荐值为200, 对于大部分组蛋白修饰的chip_seq数据,推荐值为147,命令如下

# condition1

macs2 callpeak -B -t cond1_ChIP.bam -c cond1_Control.bam -n cond1 --nomodel --extsize 120

# condition2

macs2 callpeak -B -t cond1_ChIP.bam -c cond1_Control.bam -n cond1 --nomodel --extsize 120

在运行这一步的时候,会输出每个样本过滤之后的reads数目,示意如下

# tags after filtering in treatment: 19291269

# tags after filtering in control: 12914669

这个数值在差异分析中会用到,所以要记录下来。

3. 差异peak分析

命令如下

macs2 bdgdiff --t1 cond1_treat_pileup.bdg --c1 cond1_control_lambda.bdg --t2 cond2_treat_pileup.bdg

--c2 cond2_control_lambda.bdg --d1 12914669 --d2 14444786 -g 60 -l 120 --o-prefix diff_c1_vs_c2

其中-d1和-d2的值就是第二步运行时输出的reads数目,-o参数指定输出文件的前缀。运行成功后,会产生3个文件

diff_c1_vs_c2_c3.0_cond1.bed

diff_c1_vs_c2_c3.0_cond2.bed

diff_c1_vs_c2_c3.0_common.bed

其中, con1.bed保存了在condition1中上调的peak, con2.bed保存了在condition2中上调的peak, common.bed文件中保存的是没有达到阈值的,非显著差异peak。

上述3个文件格式是完全相同的,最后一列的内容为log10 likehood ratio值,用来衡量两个条件之间的差异,默认阈值为3,大于阈值的peak为组间差异显著的peak, 这个阈值可以通过-c参数进行调整。

·end·

本站资源来自互联网,仅供学习,如有侵权,请通知删除,敬请谅解!
搜索建议:差异  差异词条  进行  进行词条  使用  使用词条  分析  分析词条  MACS2  MACS2词条  
科技

 Star Wars「R2-Q5」...

Star Wars「R2-Q5」投影式虚拟键盘,继去年推出的 R2-D2 虚拟键盘大获好评之后,日本科技公司 imp. 日前又推出另一款专为《Star Wars...(展开)

科技

 Gartner报告:三星、华为Q...

来源:新浪VRGartner分析师表示,全球智能手机销量仍呈现缓慢的下滑态势。该公司今天发布的一份报告显示,2019年第二季度销量下降1.7%,为3.68亿部(...(展开)