Причины поломок и восстановление данных основных видов RAID массивов

Расшифровывается RAID-массив как «Redundant Array of Independent Disks» (резервный массив независимых дисков). Под RAID-массивом понимают объединение нескольких физических дисков в один логический. ОС взаимодействует с RAID-массивом как с одним накопителем, несмотря на то, что он состоит из нескольких жестких дисков. Массивы бывают программные и аппаратные. Первые объединяются с помощью ОС, вторые — до загрузки ОС, с помощью специальных утилит.

Реклама

Что такое RAID массив 0, 1, 5 и 10

Восстановление RAID

Жесткие диски, объединенные в массивы, дают преимущество в скорости записи/чтения данных, имеют более высокую отказоустойчивость (не требуется восстановление информации с RAID) и уровень безопасности. Чтобы понять, как это происходит, рассмотрим основные виды RAID-массивов, то, как они формируются, а также цель их использования.

  • RAID-0. Данный массив еще называют «Stripe» или «Лента». Несколько жестких дисков здесь объединяются путем последовательного суммирования объемов. Два диска по 500 Гб воспринимаются как один, объемом в 1000 Гб, — в два раза увеличивается скорость записи и чтения информации. Чем больше дисков в таком массиве, тем быстрее он работает. Недостатком RAID-0 является отсутствие отказоустойчивости: при выходе из строя одного диска, не работает весь массив. В результате приходится выполнять восстановление всего RAID массива.
  • RAID-1. Его также называют «Mirror» или «Зеркало». Здесь несколько жестких дисков объединяются путем параллельного слияния. Из двух дисков по 500 Гб получается один диск также в 500 Гб. Скорость останется неизменной (как у одного диска на 500 Гб). Преимущества в скорости такой массив не дает, но обеспечивает высокую отказоустойчивость: при выходе из строя одного жесткого диска, полный дубль информации остается на втором диске, который используется для того, чтобы восстановилось полное содержимое массива. Однако стоит помнить, что при целенаправленном удалении информации пользователем, она удаляется со всех дисков одновременно, и восстановление с RAID 1 выполнить будет сложнее.
  • RAID-5. Этот массив представляет собой усовершенствованный вариант RAID-0. Несколько жестких дисков объединяются в массив RAID-0. На одном из дисков хранится служебная информация, с помощью которой восстанавливаются любые из дисков, в случае их выхода из строя. В итоге получается более высокий уровень безопасности, при такой же скорости чтения, как на RAID-0, хотя запись выполняется с меньшей скоростью, так как затрачивается дополнительное время на запись контрольной суммы. Массив создается минимум из 3 дисков, что и дает гарантию того, что восстановление необходимых данных RAID 5 пройдет довольно быстро. У RAID-5 нет защиты от единовременного возникновения ошибок на разных дисках.
  • RAID-10. Его еще называют RAID 1+0. Массив RAID-10 задуман как симбиоз RAID-1 и RAID-0 и совмещает в себе преимущества обоих вариантов, а именно — высокую скорость и отказоустойчивость (восстановление данных с RAID 10 выполняется по аналогии с RAID-0). Для его создания требуется минимум четыре диска. Существуют и другие разновидности основных массивов — они используются только для повышения уровня отказоустойчивости либо для увеличения скорости записи/чтения и несут в себе функционал базовых типов (RAID-50, RAID-60 и др.).

Причины поломок Рейд массивов

Реклама

Реклама

Существует две основных причины выхода из строя RAID-массивов.

  1. Несерьезное отношение системных администраторов к первым признакам поломки является самой распространенной причиной. Во время работы RAID-5 один из дисков может выйти из строя, и массив продолжит функционировать с заметным снижением скоростных показателей. Некоторые системные администраторы в этом случае не спешат предпринимать активных действий, рассчитывая на то, что жесткие диски какое-то время смогут продолжать свою работу. Такое мнение часто оказывается ошибочным.
  2. Другая распространенная причина отказа массивов — одновременный переход сразу нескольких жестких дисков в режим off-line. Это происходит из-за накопления блоков. Пока количество блоков не превышает определенное значение, диск работает, но как только блоков становится слишком много, массив перестает запускаться. Несмотря на статус off-line, диск по звуку стартует нормально и правильно определяется контроллером. Причина здесь в том, что контроллер не в состоянии считать нужные данные или же определяет диск как вышедший из строя.

Сбои в работе RAID-массивов больше характерны для дешевых контроллеров, однако проблема может возникнуть и по ходу использования дорогого «железа».

Важно! При поломке одного из дисков рекомендуется сразу же сделать резервное копирование важной информации, выполнив, таким образом, восстановление всех данных с RAID массивов. Затем нужно заменить неисправный накопитель и произвести перезагрузку массива. Предварительный бэкап необходим потому, что иногда во время перезагрузки процесс «зависает». Это обычно наблюдается после обнаружения на диске блока во время чтения/записи данных (контроллер не может прочитать информацию из сектора).

Восстановление данных RAID массивов

Рассмотрим, как восстановить основные типы RAID массивов.

  • RAID-0. При выходе из строя какого-либо из дисков RAID-0, невозможно восстановить данные в полном объеме. Чтобы восстановить RAID полностью, вначале восстанавливаем данные с RAID через неисправный накопитель и затем с оставшихся жестких дисков. Если неисправны все диски, то для восстановления используют специальные программные методы.
  • RAID-1. Применяемая здесь «зеркальная» технология позволяет сохранять все данные, даже когда один из накопителей неисправен. Когда RAID массив перестает определяться, нужно рабочий диск подсоединить к ПК напрямую, без использования контроллера. В результате восстановление данных с RAID можно выполнить, не задействовав программное обеспечение.
  • RAID-5. Количество накопителей здесь не менее трех. Неисправность одного диска не влияет на общий ход работы — массив с RAID 5 продолжает функционировать в обычном режиме. Такой результат достигается благодаря использованию специальных блоков контроля, вычисляющих недостающую информацию после выхода одного из накопителей из строя. Восстановление RAID 5 предполагает использование диска «горячей замены» (Hot Spare), задача которого — заменить собой накопитель, вышедший из строя.
  • RAID-10. Объединенные первый и нулевой уровни состоят минимум из четырех накопителей, поэтому при неисправности одной пары, другая остается работоспособной. Восстановление RAID 10 выполняется по аналогии с RAID-0: считываются данные из нерабочей пары либо применяются дополнительные методы.

Для программного восстановления подходят как сами диски, так и их образы. Использование образов предпочтительно в случаях проблем с одним из винчестеров массива на аппаратном уровне. Для размещения образов с нескольких дисков требуется носитель большого размера.

Реклама

Похожие публикации