Проблема: вызов пиков с MACS2 из данных ChIP-seq

Что это случилось? Увидеть ниже.

  1. Я получил файлы bam после сопоставления с эталонным геномом, а затем удалил дубликаты, используя samtools с параметром 'rmdup'.
  2. Затем я получил большие файлы, используя команду ниже.

    bamCoverage -b test.uq.st.rmdup.bam -o test.uq.st.rmdup.bw --smoothLength=200 --ignoreForNormalization chrX chrM --normalizeTo1x 2451960000

  3. Я загрузил файл .bw в Genome Browser и увидел четыре пика, следующие за геном HBE1, как показано на прилагаемой картинке.
  4. Но когда я назвал пики с командой ниже,

    macs2 callpeak -t test.uq.st.rmdup.bam -f BAMPE -g hs -n test --outdir ./ и я не назвал четыре пика.

  5. Но когда я устанавливаю p-значение как 0,0001 вместо значения по умолчанию q-value0.05 с помощью команды ниже,

    macs2 callpeak -t test.uq.st.rmdup.bam -f BAMPE -g hs -p 0.0001 -n test --outdir ./

был вызван только первый пик, а остальные три были пропущены. Это кажется странным.

Чего я жду? MACS2 может вызывать все четыре пика, что согласуется с результатами, которые показывает трек Big wiggle.

На самом деле, метод fold_enrichment из большого файла покачивания для peak2 очень высок по сравнению с peak1. Я не знаю, почему это не вызывает второго. Это потому, что пик1 соответствует распределению Пуассона, а остальные нет? Не могли бы вы помочь мне с этой проблемой и подсказать, как ее решить? Я был бы очень признателен. Благодарю.

Большая дорожка покачивания, сгенерированная из файла bam

0