У меня есть несколько серверов. У каждой есть 9 объединительных плат, и у каждой объединительной платы есть 5 жестких дисков. Время от времени происходит сбой одного из кабелей, соединяющих объединительную плату с материнской платой (на самом деле плату PCI на материнской плате), и система начинает выдавать ошибки и продолжает сбрасывать канал SATA. Но это происходит только при большой нагрузке на конкретную ссылку. Замена кабеля все в порядке.

У меня вопрос: есть ли инструмент (для Linux), который может провести стресс-тестирование всех каналов SATA, чтобы я мог знать, какой кабель неисправен, прежде чем развертывать сервер для производства? Что-то, что чрезмерно пишет на все жесткие диски? (Примечание: жесткие диски разделены на группы по 15, а затем логический том состоит из 3 наборов рейдов. Когда я пытаюсь записать много данных на том, ОС обычно пишет только в один массив raid.)

2 ответа2

0

badblocks будет записывать в каждый сектор диска (случайные данные или нули, по вашему выбору), а затем перечитать его для проверки.

Мне неясно, каким образом установка RAID предотвратит полную запись на все диски, если только ваши контейнеры RAID не меньше емкости ваших дисков (у меня не очень большой опыт работы с RAID, поэтому я могу ошибаться). Вам нужно будет отменить конфигурацию RAID и позволить Linux напрямую обращаться к ним по отдельности, чтобы полностью протестировать их на badblocks .

0

Эй, Скиппер, похоже, у вас есть BackBlaze Pod <= 3.0, и вы пытаетесь проверить SATA-ссылку на множитель порта (и, возможно, также на множитель на подключенные диски.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .