-1

У меня есть два файла, чтобы присоединиться.

ФАЙЛ 1:

a  A1
a  A2
a  A3
...
c  C1
c  C2
...

ФАЙЛ 2:

a  feature1_of_a
a  feature2_of_a
...
a  featureN_of_a
...
...
c  feature1_of_c
c  feature2_of_c
...

после присоединения я мог получить Файл как это:

A1  feature1_of_a
A2  feature1_of_a
A3  feature1_of_a
A1  feature2_of_a
A2  feature2_of_a
A3  feature2_of_a
...
A1  featureN_of_a
A2  featureN_of_a
A3  featureN_of_a
...

Чтобы сделать это: я написал команду оболочки join -11 -21 -o1.2,2.2 file1 file2 . Но проблема в том, что число N может быть огромным. Таким образом, если объединение прочитает все свойства a в памяти, памяти может не хватить.

Я не знаю, как реализовано соединение. Может ли Момери стать проблемой? Если так, есть ли способ получить то, что я хочу?

1 ответ1

1

Как вы думаете, насколько велика N?

Если он не находится в диапазоне «многих миллионов» или вы работаете в необычайно жестких условиях (нехватка памяти), у вас не будет недостатка памяти.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .