Вопрос компьютерного оборудования:

Несколько дней назад я установил дополнительный жесткий диск SATA на свой сервер Ubuntu 16.04, чтобы он служил местом для хранения больших наборов данных. Он не настроен как загрузочный диск, и он "работает нормально", но я обнаружил, что машина теперь иногда зависает или выключается "случайно".

Я понятия не имею, почему, или как отладить или исправить это. У кого-нибудь есть предложения?

  • РЕДАКТИРОВАТЬ: Теперь, когда HD удален и все восстановлено, как раньше, система все равно будет зависать. Запустил проверки памяти, все прошло. Есть идеи, что еще попробовать?

Дополнительная информация о системе:

  • Блок питания на сервере "перегружен" - емкость 850 Вт, и мы добавили около 650, прежде чем добавить дополнительный жесткий диск.
  • Два дня назад я обнаружил, что машина отключилась. Я снова включил его и не заметил никаких проблем, пока ...
  • Прошлой ночью замерзло. Питание машины оставалось включенным, но оно перестало отвечать на запросы (не выводился видеосигнал, нажатие кнопки num lock не приводило к включению подсветки клавиатуры), мое соединение ssh было разорвано, и машина была не в состоянии пропинговать.
  • Вчера вечером, когда он замерз, у меня было 15 минут на выполнение вычислений, которые я делал на этой машине в течение многих месяцев, и часть вычислений, которая считывает данные с накопителя, уже была завершена в течение ~ 15 минут, таким образом, дополнительный "диск данных" даже не был доступен.
  • Я только что перезагрузился после вчерашней заморозки и заглянул в /var /syslog, но там нет ничего, что могло бы предложить что-то необычное, например, ничего о каких-либо сбоях, панике ядра или "сбое системы" и т.д. Последний системный журнал запись с прошлой ночи - это то, что она собиралась запустить почасовую работу cron (а /etc/cron.hourly пуст).
  • Временное изменение BIOS: еще один возможный совет: когда я установил диск, я подумал, что, возможно, мне нужно как-то добавить его в меню конфигурации BIOS. Оказывается, я этого не сделал, но в то время как там я заметил, что в BIOS было три разных системных параметра - "Экономия энергии", "Нормальный" и "Производительность". У меня это было на "Нормальном", но я пытался изменить его на "Производительность". После этого я обнаружил, что машина не запускается. Затем я выключил и снова включил, и он запустился, но сказал: «Разгон не выполнен!«Поэтому я вернулся и изменил настройки BIOS на" Нормальный "и оставил все остальное без изменений. Теперь он загружается, но, как я уже сказал, иногда он замерзает или умирает. (Какая у меня материнская плата /BIOS / чипсет? Я счастлив перезагрузиться и проверить, и редактировать этот пост позже.)
  • Выполнены тесты GSmartControl: базовая самопроверка, краткая самопроверка и самотестирование при транспортировке выполнены без ошибок.
  • Соответствующая строка в / etc / fstab читается как /dev/sda /mnt/data auto nofail,nosuid . Есть ли какая-то очевидная ошибка в этом?

?

0