Это звучит как состояние гонки или тупик .
Т.е.: SW1 и SW2 должны иметь протокол связи с запросами и подтверждениями. Если этот протокол не разработан должным образом, может возникнуть состояние гонки, при котором пакеты не отправляются в правильном порядке. SW1 получает стек в ожидании пакета от SW2, но который SW2 уже отправил в прошлом (и SW1 пропустил его), и SW2 не собирается отправлять его снова, переходя в состояние блокировки на SW1.
В этом случае сбой зависит от скорости выполнения SW1 и SW2 и, более того, от нагрузки на серверы. Допустим, если оба процесса выполняются медленно, более сложно, чтобы SW1 пропустил пакет из SW2, который создает состояние блокировки. Запуск системного монитора немного замедляет работу всей системы, что может быть достаточно для этой работы.
Что касается разных серверов, если первый сервер имеет большую нагрузку, чем другие, то у вас это работает.