Компьютер Ubuntu Server 9.04 периодически замораживает всю сеть

1285
BloodPhilia

У меня есть безголовый компьютер под управлением Ubuntu Server 9.04, который я использую для обмена файлами в сети и в качестве частного веб-сервера. Время от времени я теряю свое интернет-соединение на своем ноутбуке, который находится в той же сети. Когда я проверяю, вся сеть не работает, и ни одно из подключенных устройств не может быть достигнуто. Тем не менее, если я отключу (и, таким образом, перезагрузлю) Ubuntu Server, вся сеть возобновит работу, как будто ничего не произошло. Это происходит один или два раза в два месяца.

Я смотрел на системные журналы, и там нечего видеть. Системный журнал внезапно останавливается в 20.45 и затем возобновляется в 21.15 с сообщениями о загрузке ядра, в тот момент, когда я нажимал на кнопку включения, чтобы загрузить компьютер.

2

1 ответ на вопрос

3
Spiff

Я видел, как сетевые карты теряли разум и гасили дешевые коммутаторы из-за болтовни (передачи бесконечного кадра) или отправки чрезмерных низкоуровневых сигналов управления потоком Ethernet. К сожалению, такого рода аппаратные ошибки MAC / PHY могут остаться незамеченными драйвером Ethernet хоста, поэтому вы ничего не увидите в своих журналах. Также прискорбен тот факт, что ни один из этих недостатков не будет виден на типичной трассировке анализатора, поскольку сигналы управления потоком на самом деле не являются «кадрами Ethernet», а что касается подавления помех, анализаторы обычно только захватывают кадры, которые находятся в пределах нормальных размеров.

В следующий раз, когда это произойдет, было бы интересно посмотреть, исчезнет ли проблема просто путем отключения Ethernet-соединения сервера Ubuntu с сетью, и если это произойдет, проблема вернется, когда вы снова подключите кабель Ethernet?

Для устранения проблемы может быть достаточно сбросить связь, чтобы сбросить микросхемы сетевого адаптера, но если проблема не исчезнет, ​​как только вы снова подключите Ethernet, вы можете попробовать подключить кабель Ethernet от сервера Ubuntu непосредственно к Ethernet на анализаторе машина (надеюсь, у вас есть машина с Auto-MDI-X или удобный кабель кроссовер). Тогда вы можете попробовать захватывать кадры; если вы можете захватывать кадры, они могут дать вам подсказку о том, где находится ошибка с сетевой картой, драйвером, сетевым стеком или некоторыми сетевыми приложениями.

Вы также можете использовать Google для других людей с тем же типом NIC (или, по крайней мере, с набором микросхем NIC), что и вы, чтобы увидеть, есть ли у других такая же проблема. Конечно, всегда полезно убедиться, что у вас установлена ​​последняя версия драйвера для вашей карты.

У вашего безголового сервера Ubuntu есть графическая карта вообще, или вы можете временно ее вставить? Затем в следующий раз, когда это произойдет, вы можете подключить дисплей, клавиатуру и мышь и посмотреть, что вы можете узнать на месте на хосте. Является ли ядро ​​хоста паническим или полностью замороженным, или это просто, что его сетевой ввод-вывод скрыт? Если хост в основном пригоден для использования (кроме сети), то вы можете запустить на нем tcpdump или Wireshark и посмотреть, что он думает, что он делает по сети.

Обратите внимание, что вам даже не нужно использовать графическую консоль для проверки того, что происходит на сервере Ubuntu. Например, если у вашей машины есть последовательный порт (или вы можете подключить USB-последовательный адаптер), который вы можете настроить в качестве порта терминала последовательной консоли, вы можете подключить другую машину к этому порту и копаться в ней из оболочки. Или, если у вас есть другой сетевой адаптер, который вы можете поместить в этот блок, вы можете сделать так, чтобы другой сетевой адаптер пошел в отдельную изолированную сеть, которую вы можете использовать для SSH или VNC в блоке (исходя из теории, что это только один сетевой адаптер, который потерял свой ум, а не весь сетевой стек Linux).

Я бы посоветовал установить высококачественную сетевую карту на вашем сервере или заменить вероятный коммутатор потребительского уровня, который вы используете дома, на что-то достаточно корпоративного уровня, чтобы спроектировать его для разделения портов, которые блокируют сеть.

Обновление: добавлены некоторые дополнительные предложения по диагностике / устранению неполадок. Но в целом, если я подумываю о режимах аппаратного сбоя NIC, я сомневаюсь, что у кого-то будет большая надежда на отладку этого, кроме инженеров, которые разработали этот чипсет NIC.

Спасибо за быстрый ответ! Нет ли способа диагностировать, что вызывает это? BloodPhilia 14 лет назад 0
Я просто добавил еще несколько идей для его диагностики, но, если я подозреваю, что это аппаратный сбой сетевого адаптера, единственные люди, которые действительно могут его диагностировать, - это инженеры чипсета NIC, которые его создали. Spiff 14 лет назад 0
Спасибо за все комментарии, я проверю все варианты, но из вашего ответа я заключу, что мой сетевой адаптер может быть неисправен. Или я ошибаюсь? +1 на данный момент за усилия и принять, когда я получу решение! Спасибо! BloodPhilia 14 лет назад 0
Я бы еще не назвал это "выводом". Это просто лучшая рабочая гипотеза, которую я могу вам предложить, основываясь на вашем описании и моем опыте. Я должен также упомянуть, что я видел, что очень хорошие сетевые карты теряют разум, когда хост-система паникует или зависает, поэтому вашей основной причиной может быть что-то еще, что вызывает панику или зависание, и сетевая карта, загрязняющая сеть, может быть просто неудачной. эффект второго порядка. Spiff 14 лет назад 0