1

На всех моих машинах я использую sar (sysstat) для получения текущей пропускной способности сети с помощью sar -n DEV 1 1 который я анализирую позже, но на одном из моих компьютеров эта команда больше не выдает свои выходные данные за 1 секунду, как другие машины и занимает больше, как 20-30 секунд. Как мне отладить, что здесь происходит?

1 ответ1

0

Я еще не использовал sar , но я только что прочитал руководство и некоторые статьи, и я не думаю, что вы делаете что-то не так, или что сам sar вызывает проблему. К сожалению, вы не сообщаете нам о дальнейших обстоятельствах на затронутой машине, поэтому я постараюсь дать некоторые общие рекомендации.

  • Я видел случаи, когда только одна прикладная программа или одна конкретная часть ОС были сильно замедлены из-за неисправного диска. Это может произойти, если уязвимое приложение пытается снова и снова считывать один и тот же дефектный сектор (ы), каждый раз в ожидании тайм-аута, или если оно пытается выполнить запись в дефектные сектора (Примечание: по некоторым причинам диски иногда не распознают дефектные сектора соответствующим образом). или не в состоянии переназначить их своевременно).

    Я видел это в реальной жизни на производственных машинах, которые в остальном были хорошими, на разных операционных системах. Поэтому первое, что я хотел бы сделать, - это просмотреть файлы журнала и найти признаки ошибок ввода-вывода диска и тайм-ауты.

    Если dmesg, last и друзья ничего не показывают, возможно, запустите SMART-тест.

  • Конечно, может быть другое приложение, которое занимает все процессорное время. Но я предполагаю, что вы уже использовали top и друзей, и в этом случае пострадают и другие приложения (не только sar). Я думаю, вы бы заметили такое поведение.

  • Со временем возникает проблема с NIC. Например, могут быть ошибки ввода-вывода с PCI/PCI-E, что означает, что сетевой адаптер или материнская плата повреждены или имеют дефекты. Но в этом случае другие сетевые приложения также будут испытывать резкое замедление, и, опять же, я думаю, вы бы заметили такое поведение.

Вы пометили свой вопрос "amazon-ec2", поэтому я не знаю, сможете ли вы заменить систему или ее части. Если бы система была моей, и я мог бы получить к ней доступ, я бы сначала клонировал и заменил диск (и). Не могли бы вы сделать так, чтобы Amazon сделал это? Если нет, я бы сделал полную резервную копию, выгрузил эту систему и перешел на другую (хотя я не знаю, работает ли это с Amazon и как это работает).

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .