У меня есть сервер Ubuntu под управлением Apache2 и Mysql 5.7, который отлично работает около года и странно ведет себя со вчерашнего дня. Казалось, он отключился на несколько минут, а затем вернулся. Это случилось еще раз спустя, но потом все было в порядке.
Во время "простоя" я не могу заставить mysql, ssh или apache отвечать, но ping делает.
Я проверил top, чтобы увидеть нагрузку на сервер, и все цифры были низкими, так что не похоже, что он только что закончил большую работу
top - 12:23:04 up 26 days, 21:59, 2 users, load average: 0.28, 0.18, 0.19
Tasks: 387 total, 1 running, 386 sleeping, 0 stopped, 0 zombie
%Cpu(s): 0.4 us, 0.2 sy, 0.0 ni, 99.4 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
KiB Mem : 82331792 total, 75453456 free, 5990408 used, 887928 buff/cache
KiB Swap: 19401728+total, 19397209+free, 45172 used. 75653488 avail Mem
Система оснащена двумя Intel(R) Xeon(R) CPU E5-2670 0 @ 2.60GHz
и большим объемом памяти, а операционная система находится на LSI Megaraid с 4 дисками в RAID 10, в каталогах данных используется PCI SSD с отличным скорость чтения-записи.
Я подумал, может быть, сначала это была DDoS-атака, но проверка была такой:
netstat -an|grep ESTABLISHED|awk '{print $5}'|awk -F: '{print $1}'|sort|uniq -c|awk '{ printf("%s\t%s\t",$2,$1); for (i = 0; i < $1; i++) {printf("*")}; print ""}'
26 **************************
127.0.0.1 6 ******
204.23.45.6 2 **
34.237.124.252 1 *
61.72.21.21 8 ********
Ничего не выскакивает для меня. Я пытался пинговать с другого компьютера в том же кабинете, используя общедоступный IP-адрес, и не было никаких ошибок.
Я проверил статус рейда, и это хорошо, много свободного места.
При наборе этого он зависал 3-4 раза, поэтому, пытаясь поймать его в действии, я запустил top
и установил обновление на 0,5 секунды, и теперь это было пару часов без замораживания. Что я должен проверить дальше?