Ваша проблема (как и в большинстве проблем машинного обучения), вероятно, связана с пропускной способностью памяти.
Машинное обучение не особенно интенсивно вычисляет ЦП, оно выполняет много «простых» вычислений, но сильно ограничено пропускной способностью для памяти. Это одна из причин того, что потоковые процессоры видеокарт так хороши для этого. Каждый потоковый процессор относительно ограничен (по сравнению с процессором), но для более простых операций их большая пропускная способность и огромное количество процессоров более чем компенсируют их ограничения.
Чтобы выбрать случайное 8-е поколение i5 :
Max Memory Bandwidth 41.6 GB/s
CPUboss предполагает, что пропускная способность памяти E7-4820 первого поколения составляет 23 ГБ / с (23 464 МБ / с)
Многопроцессорная машина должна будет постоянно копировать память между процессорами или иным образом делиться доступом к памяти из одного процессора в другой.
Начнем с того, что сочетание старой памяти и существенно более низкой пропускной способности, вероятно, наносит ущерб старой системе.
Более новые Xeons требуют пропускной способности выше 85 ГБ / с.