Проблема: вызов пиков с MACS2 из данных ChIP-seq
Что это случилось? Увидеть ниже.
- Я получил файлы bam после сопоставления с эталонным геномом, а затем удалил дубликаты, используя samtools с параметром 'rmdup'.
Затем я получил большие файлы, используя команду ниже.
bamCoverage -b test.uq.st.rmdup.bam -o test.uq.st.rmdup.bw --smoothLength=200 --ignoreForNormalization chrX chrM --normalizeTo1x 2451960000
- Я загрузил файл .bw в Genome Browser и увидел четыре пика, следующие за геном HBE1, как показано на прилагаемой картинке.
Но когда я назвал пики с командой ниже,
macs2 callpeak -t test.uq.st.rmdup.bam -f BAMPE -g hs -n test --outdir ./
и я не назвал четыре пика.Но когда я устанавливаю p-значение как 0,0001 вместо значения по умолчанию q-value0.05 с помощью команды ниже,
macs2 callpeak -t test.uq.st.rmdup.bam -f BAMPE -g hs -p 0.0001 -n test --outdir ./
был вызван только первый пик, а остальные три были пропущены. Это кажется странным.
Чего я жду? MACS2 может вызывать все четыре пика, что согласуется с результатами, которые показывает трек Big wiggle.
На самом деле, метод fold_enrichment из большого файла покачивания для peak2 очень высок по сравнению с peak1. Я не знаю, почему это не вызывает второго. Это потому, что пик1 соответствует распределению Пуассона, а остальные нет? Не могли бы вы помочь мне с этой проблемой и подсказать, как ее решить? Я был бы очень признателен. Благодарю.