У меня есть два файла с одним общим столбцом, который является избыточным.Файл 1 имеет хромосомные местоположения и TF, файл 2 имеет хромосомные местоположения и номера Refseq.

Файл 1:
chr1: 66997824-67000456 ZNF333
chr1: 66997824-67000456 EGR1
chr1: 66997824-67000456 MZF-1
chr22: 51221989-51222166 Zic2
chr22: 51221989-51222166 ZF5

Файл 2:
chr1: 66997824-67000456 Refseq # 1
chr22: 51221989-51222166 Refseq # 22

Я хотел бы объединить эти два файла и создать новый файл с тремя столбцами,
chr1:66997824-67000456 ZNF333 Refseq # 1
chr1:66997824-67000456 EGR1 Refseq # 1
chr1:66997824-67000456 MZF-1 Refseq # 1
chr22:51221989-51222166 Zic2 Refseq # 22
chr22:51221989-51222166 ZF5 Refseq # 22

Поскольку хромосомные местоположения являются избыточными, я не смог объединить их с помощью объединения в Unix. Есть ли способ объединить с помощью sed или awk?

1 ответ1

1
join file1 file2

Выход:

chr1:66997824-67000456 ZNF333 Refseq#1
chr1:66997824-67000456 EGR1 Refseq#1
chr1:66997824-67000456 MZF-1 Refseq#1
chr22:51221989-51222166 Zic2 Refseq#22
chr22:51221989-51222166 ZF5 Refseq#22

или же

join file1 file2 | awk '{OFS="     ";print $1,$2,$3}'

Выход:

chr1:66997824-67000456     ZNF333     Refseq#1
chr1:66997824-67000456     EGR1     Refseq#1
chr1:66997824-67000456     MZF-1     Refseq#1
chr22:51221989-51222166     Zic2     Refseq#22
chr22:51221989-51222166     ZF5     Refseq#22

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .