2

Два дня назад одна из Barracudas в моей Synology (3 диска как RAID-5) вызвала несколько предупреждений о "плохом секторе". Данные не потеряны. Их не так много (62 за 24 часа, потом больше), и, согласно информации SMART, диск "просто в порядке". Но все-таки мне достаточно заменить диск. Ваш пробег может варьироваться, но для меня все, что не равно нулю с точки зрения плохого сектора, это NG.

Итак ... благодаря большому книжному интернет-магазину, который также продает жесткие диски, я получил заменяющие диски одинакового размера (Ironwolf) буквально за ночь.

Сначала подключите один к 4-му слоту и измените тип массива на RAID-6, пока старый диск еще жив и работает, чтобы добавить дополнительную избыточность. Лучше быть на всякий случай, на всякий случай. Как только это будет сделано, следующим шагом будет замена старых дисков один за другим.

Так что ... сейчас происходит ресинсинг.

Я изменил настройки с "меньшего воздействия" на "повторную синхронизацию быстрее", что, очевидно, мешает приоритетам ввода-вывода. Воздействие очень заметно, попытка получить доступ к общему ресурсу сейчас очень и очень медленная (но, конечно, все еще работает). Это хорошо, в конце концов мы хотим, чтобы ресинхронизация закончилась незадолго до того, как может произойти что-то более радикальное. Тем не менее, использование диска составляет только 60-56% на каждый диск в мониторе ресурсов. Ну, это не так плохо, я думаю.

Новый диск способен поддерживать последовательную запись 150 МБ / с, и старые диски не должны иметь проблем с доставкой при последовательном чтении (тем более, что их три, что сокращает необходимую пропускную способность). 60% от этого - что-то около 90 МБ / с. Это 4ТБ диски.

Давайте будем пессимистичны и предположим, что мы получаем только пропускную способность всего 50 МБ / с. Таким образом, это 4*(1024*1024)/50 секунд для выполнения повторной синхронизации, или чуть более 23 часов.

Я оставил эту штуку в покое, выполняя свою работу на ночь, а она работает 26 часов. Глядя на окно состояния, оно показывает 11% завершено.

Не то чтобы я все равно мог с этим поделать, но серьезно ... что не так? 11% после 26 часов означает, что это займет почти две недели. Что за?

Это выше моего понимания. Есть ли какая-либо техническая причина, почему это займет так много времени?

1 ответ1

2

Вы начали с этого:

и в итоге получится так:

Когда вы конвертировали в RAID6, вы начали операцию, чтобы добавить бит четности для каждого отдельного диска в массиве, включая «умирающий» диск. Если этот диск умирает, то, вероятно, будет очень медленно записывать любые данные, которые могли быть ранее скрыты из-за того, что другие диски быстро записывали данные, и медленное воспроизведение диска постоянно нагоняло.

Добавление к боли состоит в том, что тот факт, что данные четности, вероятно, воссоздаются также для каждого диска, вместо того, чтобы просто копировать существующие данные четности, а это означает, что все диски должны быть прочитаны, рассчитаны и затем записаны обратно.

Затем есть факт, что данные с каждого из существующих дисков теперь перемещаются на новый диск и, вероятно, реорганизуют существующие данные на каждом из существующих дисков, чтобы ускорить доступ.

В общем, вы смотрите до 3x операций чтения и записи (для 4 дисков), чтобы переместить данные для разметки RAID6, в отличие от копирования и записи одного диска на другой (1x чтение, 1xwrite).

Кроме того, помимо всей этой работы, связанной с перемещением данных, у вас нет бесконечно большого пространства для загрузки данных во время работы над ними. Ограничения оперативной памяти также замедляют любую обработку, и, как вы видели, доступ к файлам во время этого процесса также замедляет его. Наконец, многие готовые NAS-блоки имеют довольно слабые ЦП, что, как правило, хорошо для нормальной работы, такие вещи, как повторная синхронизация и изменения архитектуры, в конечном итоге занимают много времени.

Вот почему это занимает так много времени.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .