Я пытаюсь распаковать файлы fastq.gz и затем проанализировать данные последовательности в них. Однако последующий анализ зависит от сохранения строки (строка 1 из заархивированного файла должна быть строкой 1 в разархивированном файле) по порядку в разархивированных файлах.
Когда я вручную просматриваю файлы, мне кажется, что порядок строк сохраняется при использовании gunzip для распаковки файлов fatsq.gz (и я бы не ожидал ничего другого). Однако последующий анализ завершается неудачей, поскольку порядок не был сохранен в исходном файле. Я что-то упускаю из-за процесса распаковки? Благодарю.
Похоже, что-то вроде следующего происходит.
Sequencer записывает данные в fastq.txt:
line1
line2
line3
lin4
Тогда архивирует это в fastq.gz. Затем я разархивирую с помощью gunzip и получаю что-то вроде следующего, где порядок строк нарушается:
line2
line1
line4
line3