How huge do you think N might be?
Unless it is in the 'many millions' range, or you are working in an unusually tightly constrained (memory poor) environment, you are not going to run out of memory.
У меня есть два файла, чтобы присоединиться.
ФАЙЛ 1:
a A1 a A2 a A3 ... c C1 c C2 ...
ФАЙЛ 2:
a feature1_of_a a feature2_of_a ... a featureN_of_a ... ... c feature1_of_c c feature2_of_c ...
после присоединения я мог получить Файл как это:
A1 feature1_of_a A2 feature1_of_a A3 feature1_of_a A1 feature2_of_a A2 feature2_of_a A3 feature2_of_a ... A1 featureN_of_a A2 featureN_of_a A3 featureN_of_a ...
Чтобы сделать это: я написал команду оболочки join -11 -21 -o1.2,2.2 file1 file2
. Но проблема в том, что число N может быть огромным. Таким образом, если объединение прочитает все свойства a в памяти, памяти может не хватить.
Я не знаю, как реализовано соединение. Может ли Момери стать проблемой? Если так, есть ли способ получить то, что я хочу?
How huge do you think N might be?
Unless it is in the 'many millions' range, or you are working in an unusually tightly constrained (memory poor) environment, you are not going to run out of memory.