Возможно, есть три причины, по которым можно было бы разделить память между двумя процессорами.
Во-первых, интерфейс памяти каждого процессора имеет заданную максимальную пропускную способность. При удвоении числа процессоров эта пиковая пропускная способность памяти удваивается.
Во-вторых, в некоторых системах скорость интерфейса памяти может быть ограничена количеством модулей, подключенных к каналу памяти, поэтому использование одного модуля на канал (с вдвое большим числом процессоров и, таким образом, вдвое большим количеством каналов) может обеспечить более высокую пропускную способность. Кроме того, количество модулей памяти, поддерживаемых одним процессором, может заставить более дорогой модуль обеспечить одинаковую общую емкость системы.
В-третьих, если рабочая нагрузка выигрывает от распространения обработки на другой процессор (например, большое количество потоков или меньшее количество потоков, которые получают выгоду от большей емкости L3 на поток), больше, чем она теряет из-за большей задержки (и, возможно, более низкой пропускной способности) некоторого доступа к памяти, идущего на другой процессор, то даже без значительной оптимизации выделения памяти ОС (оптимизация NUMA [Non-Uniform Memory Access], выделение памяти и планирование потоков так, чтобы память, присоединенная к процессору потока, использовалась чаще), производительность может быть выше. С существенной оптимизацией NUMA (которая не может быть практичной для рабочей нагрузки), большинство обращений к памяти было бы к более быстрой, локальной памяти.
Только на двух узлах репликация памяти вряд ли будет выполнена, поскольку коэффициент NUMA (насколько медленнее удаленная память по сравнению с локальной памятью) невелик. Если память для определенного доступа подключена к удаленному процессору, запрос будет передаваться через межпроцессорное соединение (QPI для Intel) к контроллеру памяти удаленного процессора (хотя возможно попадание в кэш в L3 этого процессора) и контроллеру памяти (или Кэш L3) будет удовлетворять запрос, отправляющий данные запрашивающей стороне через межпроцессорное соединение.
(Система с большим количеством узлов / процессоров может извлечь выгоду из дублирования содержимого ОС, которое невозможно записать. Некоторые операционные системы даже использовали миграцию (перемещение содержимого памяти на другой узел) в качестве оптимизации NUMA.)