На всех моих машинах я использую sar (sysstat) для получения текущей пропускной способности сети с помощью sar -n DEV 1 1
который я анализирую позже, но на одном из моих компьютеров эта команда больше не выдает свои выходные данные за 1 секунду, как другие машины и занимает больше, как 20-30 секунд. Как мне отладить, что здесь происходит?
1 ответ
Я еще не использовал sar
, но я только что прочитал руководство и некоторые статьи, и я не думаю, что вы делаете что-то не так, или что сам sar
вызывает проблему. К сожалению, вы не сообщаете нам о дальнейших обстоятельствах на затронутой машине, поэтому я постараюсь дать некоторые общие рекомендации.
Я видел случаи, когда только одна прикладная программа или одна конкретная часть ОС были сильно замедлены из-за неисправного диска. Это может произойти, если уязвимое приложение пытается снова и снова считывать один и тот же дефектный сектор (ы), каждый раз в ожидании тайм-аута, или если оно пытается выполнить запись в дефектные сектора (Примечание: по некоторым причинам диски иногда не распознают дефектные сектора соответствующим образом). или не в состоянии переназначить их своевременно).
Я видел это в реальной жизни на производственных машинах, которые в остальном были хорошими, на разных операционных системах. Поэтому первое, что я хотел бы сделать, - это просмотреть файлы журнала и найти признаки ошибок ввода-вывода диска и тайм-ауты.
Если dmesg, last и друзья ничего не показывают, возможно, запустите SMART-тест.
Конечно, может быть другое приложение, которое занимает все процессорное время. Но я предполагаю, что вы уже использовали
top
и друзей, и в этом случае пострадают и другие приложения (не толькоsar
). Я думаю, вы бы заметили такое поведение.Со временем возникает проблема с NIC. Например, могут быть ошибки ввода-вывода с PCI/PCI-E, что означает, что сетевой адаптер или материнская плата повреждены или имеют дефекты. Но в этом случае другие сетевые приложения также будут испытывать резкое замедление, и, опять же, я думаю, вы бы заметили такое поведение.
Вы пометили свой вопрос "amazon-ec2", поэтому я не знаю, сможете ли вы заменить систему или ее части. Если бы система была моей, и я мог бы получить к ней доступ, я бы сначала клонировал и заменил диск (и). Не могли бы вы сделать так, чтобы Amazon сделал это? Если нет, я бы сделал полную резервную копию, выгрузил эту систему и перешел на другую (хотя я не знаю, работает ли это с Amazon и как это работает).