Debian "sar -n DEV 1 1" очень медленный

217
Brian Leishman

На всех моих машинах я использую sar (sysstat), чтобы получить текущую пропускную способность сети, используя sar -n DEV 1 1то, что я анализирую позже, но на одной из моих машин эта команда больше не выдает результат в 1 секунду, как другие машины, и занимает больше 20-30 секунд. Как мне отладить, что здесь происходит?

1
Не могли бы вы рассказать нам, какую версию Debian вы используете и откуда взята утилита "sar"? Я только что заглянул в свои коробки Debian Lenny и Debian Jessie, и похоже, что такой утилиты нет. Кроме того, там нет пакета "sysstats" и нет программы "sysstats". Я никогда не использовал EC2, поэтому, если это какая-то фирменная утилита Amazon, то я вне игры. Binarus 7 лет назад 0
О, это плохо, это называется "sysstat" (без дополнительной буквы "S", которую я имел в конце перед моим редактированием только сейчас). Я только что установил его с помощью обычного `apt-get install sysstat`, так что я не думаю, что это было сделано из каких-либо специальных репозиториев. Версия Debian хоть и тестируется (растягивается) Brian Leishman 7 лет назад 0
Вы правы. Я сейчас нашел это. Причина, по которой у меня изначально возникли трудности с обнаружением, заключалась в том, что его первоначальное имя - sar.sysstat (а не sar) и что sar связан с sar.sysstat не раньше, чем при установке пакета sysstat, то есть sar отсутствует в каких-либо пакетах. , но динамически создается во время установки пакета sysstat. Так что я не нашел сар в первую очередь. Binarus 7 лет назад 0

1 ответ на вопрос

0
Binarus

Я еще не использовал sar, но я только что прочитал руководство и некоторые статьи, и я не думаю, что вы делаете что-то не так или это sarсамо по себе вызывает проблему. К сожалению, вы не сообщаете нам о дальнейших обстоятельствах на затронутой машине, поэтому я постараюсь дать некоторые общие рекомендации.

  • Я видел случаи, когда только одна прикладная программа или одна конкретная часть ОС были сильно замедлены из-за неисправного диска. Это может произойти, если уязвимое приложение пытается снова и снова считывать один и тот же дефектный сектор (ы), каждый раз в ожидании тайм-аута, или если оно пытается выполнить запись в дефектные сектора (Примечание: по некоторым причинам диски иногда не распознают дефектные сектора соответствующим образом). или не в состоянии переназначить их своевременно).

    Я видел это в реальной жизни на производственных машинах, которые в остальном были хорошими, на разных операционных системах. Поэтому первое, что я хотел бы сделать, - это просмотреть файлы журнала и найти признаки ошибок ввода-вывода диска и тайм-ауты.

    Если dmesg, last и друзья ничего не показывают, возможно, запустите SMART-тест.

  • Конечно, может быть другое приложение, которое занимает все процессорное время. Но я предполагаю, что вы уже использовали topи друзей, и если бы это было так, другие приложения (не только sar) пострадали бы также. Я думаю, вы бы заметили такое поведение.

  • Со временем возникает проблема с NIC. Например, могут быть ошибки ввода-вывода с PCI / PCI-E, что означает, что сетевой адаптер или материнская плата повреждены или имеют дефекты. Но в этом случае другие сетевые приложения также будут испытывать резкое замедление, и, опять же, я думаю, вы бы заметили такое поведение.

Вы пометили свой вопрос "amazon-ec2", поэтому я не знаю, сможете ли вы заменить систему или ее части. Если бы система была моей, и я мог бы получить к ней доступ, я бы сначала клонировал и заменил диск (и). Не могли бы вы сделать так, чтобы Amazon сделал это? Если нет, я бы сделал полную резервную копию, выгрузил эту систему и перешел на другую (хотя я не знаю, работает ли это с Amazon и как это работает).