2

Я пытаюсь распаковать файлы fastq.gz и затем проанализировать данные последовательности в них. Однако последующий анализ зависит от сохранения строки (строка 1 из заархивированного файла должна быть строкой 1 в разархивированном файле) по порядку в разархивированных файлах.

Когда я вручную просматриваю файлы, мне кажется, что порядок строк сохраняется при использовании gunzip для распаковки файлов fatsq.gz (и я бы не ожидал ничего другого). Однако последующий анализ завершается неудачей, поскольку порядок не был сохранен в исходном файле. Я что-то упускаю из-за процесса распаковки? Благодарю.

Похоже, что-то вроде следующего происходит.

Sequencer записывает данные в fastq.txt:

line1
line2
line3
lin4

Тогда архивирует это в fastq.gz. Затем я разархивирую с помощью gunzip и получаю что-то вроде следующего, где порядок строк нарушается:

line2
line1
line4
line3

0