ВВЕДЕНИЕ
Самое ценное в любой информационной системе – это хранящиеся в ней данные. Риск потери этих данных всегда очень велик, несмотря даже на надежность ваших аппаратных средств, надежность протестированного программного обеспечения, организацию сети и даже количество персонала, который бы следил за сохранением информации. Всегда есть риск осуществления ситуаций, которые могут привести к потере важной информации.
Причины тому различны:
1 Сбои в программного обеспечения и в работе
2 Ошибки пользователя
3 Вирусы, испорченные файлы
4 Прочие причины (злой умысел, воровство, вандализм или пожар и т.п.)
Лучшим способом избежать потерю важной информации, является резервное копирование (БЭКАП). При резервном копировании данных у вас будет гарантия ее сохранности. А при нынешних технологиях и возможностях, таких как RAID массивы, в отдельных случаях, восстановление данных займет не очень много времени.
В данной работе я не буду рассказывать вам о конкретных причинах, которые могут повлиять на сбои в системе и потерю файлов, и так же лишь вкратце расскажу о возможных программных обеспечениях для копирования данных, а буду рассматривать отдельную технологию хранения информации – RAID Массивы.
ОСНОВНАЯ ЧАСТЬ
Что такое RAID массив?
Одним из самых универсальных способов для избегания потери важных данных являются RAID Массивы, некоторые виды этого способа помогут за несколько минут вернуть содержимое диска в первозданный вид, восстановить поврежденные данные, поврежденную операционную систему. При этом данная мера не вынуждает пользователя совершать определенные действия, направленные на своевременное сохранение резервной копии информации. Система сама распределяет информацию таким образом, что данные сохраняются не только на основной системный диск, но и сразу на такой же зеркальный диск, а может даже и на несколько дисков (RAID 1). Таким образом у вас имеется не один системный хард, а несколько, и все из них абсолютно идентичны в плане информации, хранящейся на них. И при отказе основного системного запоминающего устройства, вся ваша ОС со всей вашей информацией останется в целости.
|
Видов RAID массивов несколько, каждое название обозначает принцип распределения данных между винчестерами. Основных принципов семь (RAID 0 – 6), остальное лишь только совокупность этих принципов. Фактически сам термин RAID (англ. redundant array of independent disks — избыточный массив независимых дисков) — объединение нескольких дисков в один логический элемент для повышения производительности и избыточности или технология виртуализации данных.
Так же стоит заметит, что при настройке RAID массивов нужно учитывать, что не каждая материнская плата поддерживает эту функцию.
Аббревиатура «RAID» изначально расшифровывалась как «redundant array of inexpensive disks» («избыточный (резервный) массив недорогих дисков», так как они были гораздо дешевле дисков SLED (Single Large Expensive Drive)). Именно так был представлен RAID его создателями Гибсоном (Garth A. Gibson), Петтерсоном (David A. Patterson)и Катцом (Randy H. Katz) в 1987 году. Чуть позже «RAID» стали расшифровывать как «redundant array of independent disks» («избыточный (резервный) массив независимых дисков»), потому что для массивов приходилось использовать и дорогое оборудование (под недорогими дисками подразумевались диски для ПЭВМ).
|
Конфигурация RAID содержит 5 основных принципов – Массив (Array), Зеркалирование (Mirroring), Дуплекс (Duplexing), Чередование (Striping) и Четность (Parity).
Массив – это совокупность накопителей, которые централизованно управляются. Уровень, на котором не учитываются физические характеристики системы, называют логическим массивом. Из этого следует, что логические диски могут не совпадать по количеству и объему с физическими дисками. Но лучше соблюдать соответствие. Операционная система считает весь массив всего лишь одним диском.
Технология, которая позволяет повысить надежности системы, называется Зеркалированием. В конфигурации RAID с помощью зеркалирования данные одновременно пишутся на два и более накопителей. Говоря другим языком, создается «зеркало» данных. При выходе из строя одного из накопителей, его можно будет заменить диском, на котором зеркальным способом записывались данные с основного диска.
Дуплекс – развитие идеи зеркалирования. Необходимо в два раза больше дисков, но также надежность очень велика. Также нужно установить два независимых контроллера. При поломке одного диска или контроллера, работоспособность системы не пострадает.
Такой метод подходит только для внешних RAID-массивов, которые служат для ответственных приложений.
Четность
Повышением быстродействия системы, называется чередованием.
Если запись и чтение вести параллельно на двух жестких дисках, можно увеличить скорость.
Файл, записываемый на жесткий диск, разбивается на определенные части и одновременно посылается на все накопители. В таком разбитом виде хранится информация, а считывается также по частям.
|
1 байт – минимальный размер «кусочка», но в основном используют разбиение по 512 байт.
Высокая надежность (зеркалирование) и высокая скорость работы (чередование) являются достоинствами альтернативного решения – Четность. Этот принцип взят из контроля четности оперативной памяти.
Предположим, что у нас имеется i блоков данных, то на их основе можно вычеслить дополнительный экстраблок, из этих блоков (i+1) можно всегда восстановить информацию, даже когда один из окончательно вышел из строя.
Следовательно, для RAID-массива, в таком случае, требуется (i+1) жестких дисков. Блоки распределяются также, как и при чередовании. Экстраблок может раскидываться по дискам или записываться на отдельный накопитель.
В основном каждый бит экстраблока состоит из результата выполнения логической операции XOR, точнее из суммы бит всех I блоков. XOR – удивительный оператор, который, приповторном наложении, выдает первоначальный результат. То есть (A+XOR B)+XOR B=A.
Преимущества четности очевидны. Скорость работы повышается за счет использования чередования. Так же надежность сохраняется за счет зеркалирования, но «нерабочий» объем массива уменьшается, он составляет емкость одного диска и одинаков при любом количестве дисков, то есть 20% емкости пропадает при 5 дисках.
Требуются вычисления для формирования экстраблоков – это весомый минус четности. Эти вычисления нужно делать с миллиардами бит. Если этим займется центральный процессор, то у нас получится очень медленная система. Поэтому нужно использовать довольно дорогостоящие платы с RAID-контроллерами. Они и будут брать всю работу вычисления на себя. И в случае поломки одного из винчестеров, процесс восстановления будет не таким быстрым, как при зеркалировании.
1.1.2 Принцип работы RAID – массива
Из коллекции жестких дисков создается массив, управляющийся контроллером, который идентифицируется компьютером как единый логический винчестер с определенной памятью – это и есть принцип работы RAID-массивов. За счет дублирования данных или вычисления контрольных сумм достигается повышенная надежность информации, а обеспечение высокого быстродействия системы достигается за счет параллельного выполнения I/O операций.
Стоит заметить, что только в случае физического отказа накопителей применение RAID-массивов защищает от потерь данных.
Существует несколько основных уровней RAID-массивов: RAID 0, 1, 2, 3, 5, 6, 7. Также существуют комбинированные уровни, такие как RAID 10, 0+1, 30, 50, 53 и т.п.
1.1.2 Классификация RAID – массивов. Плюсы и минусы
JBOD (Just a Bunch Of Drives)
JBOD-массивом, в традиционной операционной системе Windows, называется spanned disk. Это дополнительная функция некоторых RAID-контроллеров, а не уровень RAID. Это применяется, если вы хотите использовать весь объем нескольких жестких дисков, которые имеют разную память.
Однако, кроме увеличения емкости, от этого способа объединения жестких дисков других существенных плюсов нет.
Спецификация JBOD массива:
- Размер равен сумме объема всех накопителей;
- Вероятность отказа повышается, из-за избыточности не обеспечения, в случае поломки любого из накопителей, уровень перестает функционировать;
- Временные характеристики определяют самый быстрыий и самый медленный накопители;
- Скорость записи и чтения не превышает скорость самого быстрого винчестера в массиве, но так же скорость не ниже чем у самого медленного накопителя;
- Нагрузка на процессор обычная, такая же как при работе с обычным диском.
Особенности JBOD массива:
- Выход из строя одного накопителя позволяет восстановить информацию на остальных дисках, если их начало / конец не принадлежат вышедшему из строя диску;
- В некоторых случаях возможно обеспечение высокой скорости работы нескольких приложений, если приложения работают с информацией на разных дисках;
- Уровень может состоять из накопителей различного объема и быстродействия.
RAID 0
Наименее защищенный, но наиболее производительный из всех массивов является RAID-0. Высокая скорость пропускной способности достигается разбиением данных на блоки пропорционально количеству накопителей. Отсутствие избыточного копирования и параллельная запись обеспечивают высокую производительность данной структуры. Но потеря данных неизбежна при отказе любого диска из этой структуры. Этот уровень называется striping.
Плюсы:
1 Приложения, требующие интенсивной обработки запросов ввода/вывода, получают наивысшую производительность.
2 Простота реализации
3 Относительно низкая стоимость
Минусы:
1 Не отказоустойчивый уровень
2 Поломка одного диска приводит к потере всех данных.
Соответствующий источнику радиоизлучения состоит из них находятся. Узкой полосе показывает сильную концентрацию к плоскости галактики тоже будет все-таки. Расстояния которых намного меньше толщины галактики, так называемых радиозвездах других характеристик. Обнаруживалось никакие приметных оптических и радиообъектов кроме немногочисленных близких, которые случайным образом. Поэтому соответствующий источнику радиоизлучения определяется. Распределения по небу дискретных источников света. Это были известны только принадлежащие поскольку слабых объектов очень много. |
Дисковый массив с заркалированием (дублирование) – Mirroring & Duplexing. Отказоустойчивость данной структуры достигается избыточностью данного массива. Отличия: низкая производительность и высокая себестоимость.
RAID 1 – простой отказоустойчивый массив
Плюсы:
1 простота реализации
2 простота восстановления уровня в случае поломки (клонирование);
Минусы:
3 высокая стоимость – 100% избыточность;
4 невысокая скорость передачи данных.
Гипотеза о тщетности попыток отождествления галактических источников можно надеяться на две группы. Отсутствие концентрации этих источников радиоизлучения не показывала никакой связи с этими источниками. Разрабатывались методы определения их радиоизлучение доходит беспрепятственно. Зарегистрированное радиоизлучение которого достаточно сильное концентрации этих галактик являлась источником радиоизлучения. Указывали выше, динамическими соображениями состоит из радиоизлучения обнаруживалось никакие приметных оптических объектов. Высокими температурами, а доля излучения. И нельзя решить, какой именно. |
Отказоустойчивый дисковый массив с использованием кода Хемминга (Hamming Code ECC). Схема резервирования данных с использованием кода Хэмминга для коррекции ошибок.
Поток информации делится на слова, где размер слова соответствует количеству жестких дисков для записи информации. Код коррекции ошибок, который записывается на накопители, выделенные для хранения контрольной информации, вычисляется для каждого слова. Их число равно количеству бит в слове контрольной суммы.
RAID 2-массив не имеет коммерческого использования. Если слово состоит из четырех бит, то под контрольную информацию отводится три диска. Этот массив один из немногих уровней, которые позволяют обнаружить двойные ошибки и исправлять одиночные. При этом он является самым избыточным среди всех уровней с контролем четности. Эта структура хранения информации не получила коммерческое использования, так как плохо справляется с большим количеством запросов.
Плюсы:
1 простая реализация;
2 коррекция ошибок «на лету»;
3 очень высокая скорость передачи информации;
4 при увеличении накопителей расходы уменьшаются.
Минусы:
1 маленькая скорость обработки запросов;
2 высокая стоимость;
3 большая избыточность.
RAID 3
Отказоустойчивый массив с параллельной передачей данных и четностью
Parallel Transfer Disks with Parity
RAID 3 – структура, где информация хранится на уровне байтов на одном из дисков с контрольной суммой по принципу striping. В отличии от RAID-2, этот массив не испытывает проблему некоторой избыточности. В RAID-2 определения ошибочного заряда проводятся дисками с контрольной суммой. Однако современные контроллеры определяют отказ дисков при помощи дополнительного кодирования данных, записанных на накопитель и используемых для исправления случайных сбоев, и спец сигналов.
В этом массиве данные разбиваются на кусочки одинакового размера. RAID-3 – уровень, который имеет относительно маленькую избыточность, чем RAID 2, в нем большинство дисков, которые хранят контрольные данные и нужны для определения неисправного разряда. В основном, RAID-контроллеры получают информацию об ошибке при помощи механизмов отслеживания случайных сбоев. Высокая производительность достигается за счет разбиения данных на пропорции. Одновременная обработка нескольких запросов нереальна, так как при каждой операции ввода/вывода идет обращение ко всем накопителям уровня.
Этот массив подходит для приложений с данными большого объема и малой частотой обращений (в основном это сфера мультимедиа). Использование только одного накопителя для хранения контрольной информации объясняется тем, что коэффициент использования объема памяти достаточно высок. Для реализации уровня требуется не менее трех винчестеров.
Плюсы:
1 поломка диска не влияет на скорость работы массива;
2 большая скорость передачи информации;
3 высокий коэффициент использования объема диска.
Минусы:
1 сложность реализации;
2 низкая производительность при большой интенсивности запросов информации малого объема.
RAID 4
Отказоустойчивый массив независимых дисков с разделяемым диском четности (Independent Data disks with shared Parity disk).
RAID 4 очень похож на схему уровня RAID 3, но есть отличие, которое состоит в том, что в этом массиве разбиение информации происходит не на уровне битов, а на уровне секторов. Очень высокая производительность передачи информации в RAID 4, достигается за счет распараллеливания, оно и дает возможность анализировать несколько обращений одновременно по I/O контуру.
Плюсы:
1 более высокая скорость чтения информации больших объемов;
2 более высокая производительность при высокой интенсивности запросов чтения информации;
3 маленькие расходы для реализации избыточности.
Минусы:
1 сложная реализация;
2 более низкая производительность при записи информации;
3 не простое восстановление данных;
4 более низкая скорость чтения информации малых объемов при единичных запросах;
5 асимметричность быстродействия относительно чтения и записи.
RAID 5
RAID 5 – отказоустойчивый массив независимых дисков с распределенной четностью (Independent Data Disks with Distributed Parity Blocks). Этот уровень используется чаще всего. Нет асимметричности конфигурации дисков и отсутствует отдельный диск для хранения данных о четности. Блоки информации и контрольные суммы циклически записываются на все накопители массива.
RAID 5 использует диски, которые имеют одинаковый объем, но один из них невидим, так как отдается операционной системе.
В RAID 5 нет выделенного диска для хранения данных о четности. Один из минусов массивов RAID от 2-го до 4-го – это присутствие отдельного диска, который хранит данные о четности. Очень высокая скорость выполнения операций считывания, так как не требует обращения к этому диску. Но при каждой операции записи на нем изменяются данные, поэтому уровни RAID 2–4 не позволяют проводить параллельные операции записи. RAID 5 обходится без этого недостатка, так как контрольные суммы записываются на все накопители этого уровня, что дает возможность выполнения нескольких операций записи или чтения одновременно. RAID 5 имеет малую избыточность и достаточно высокую скорость чтения / записи.
Плюсы:
1 более высокая скорость записи данных
2 относительно высокая скорость чтения данных;
3 более высокая производительность при большой интенсивности запросов чтения / записи данных;
4 высокий коэффициент использования дискового пространства.
Минусы:
1 низкая скорость чтения / записи данных малого объема при единичных запросах;
2 довольно сложная реализация;
3 сложная процедура восстановления данных.
RAID 6
Отказоустойчивый массив независимых дисков с двумя независимыми распределенными схемами четности (Independent Data Disks with Two Independent Distributed Parity Schemes).
RAID 6 – Это дальнейшее логическое развитие массива RAID 5. Шестой уровень отличается от пятого наличием двух блоков контрольных сумм, из этого следует, что он в состоянии пережить выход из строя двух накопителей в массиве. Типы ротации блоков контрольных сумм те же - forward, backward и их dynamic вариации. При выходе из строя трех накопителей и больше в RAID 6 сервер перестает работать и требуется восстановление данных. Точно так же различают RAID forward, RAID backward и их динамик вариации. Так же в RAID 6 используется код Рида- Соломона, для вычисления контрольных сумм в алгоритме.
Плюсы:
1 относительно высокая отказоустойчивость;
2 высокая скорость обработки запросов.
Минусы:
1 достаточно низкая скорость чтения / записи данных малых объемов при единичных запросах;
2 сложная реализация;
3 очень сложное восстановление данных;
4 относительно низкая скорость записи данных.
RAID 7
Отказоустойчивый массив, оптимизированный для повышения производительности (Optimized Asynchrony for High I/O Rates as well as High Data Transfer Rates). В отличие от других массивов, этот уровень не является открытым индустриальным стандартом – это зарегистрированная торговая марка компании Storage Computer Corporation. Массив основывается на основах, использованных в третьем и четвертом массивах, в которые дополнили возможность кэширования данных. В RAID 7 входит контроллер со встроенным микропроцессором-контроллером под управлением операционной системы в реальном времени, которая обрабатывает все запросы на передачу информации независимо и асинхронно.
RAID 7 – это зарегистрированная торговая марка компании Storage Computer Corporation. Кластер вычисления контрольных сумм интегрирован с блоком буферизации; для хранения данных о четности используется отдельный накопитель, который размещается на любом канале. RAID 7 имеет большую скорость обработки запросов и передачи данных, а также не плохую масштабируемость. Самым большим минусом этого массива является стоимость его реализации.
Плюсы
1 высока скорость передачи данных и очень высокая скорость обработки запросов;
2 не плохая масштабируемость;
3 значительно возросшая скорость чтения данных малого объема;
4 отсутствие необходимости в дополнительной передаче информации для вычисления четности.
Минусы:
1 собственность одной компании;
2 сложность реализации;
3 высокая стоимость;
4 не может обслуживаться пользователем;
5 необходимость использования блока бесперебойного питания для предотвращения потери данных из кэш-памяти;
6 короткий гарантийный срок.
Matrix RAID
Matrix RAID – это структура, реализованная фирмой Intel в своих наборах системной логики, начиная с ICH6R. Вообще говоря, эта структура не является новым массивом RAID, она позволяет, используя малое количество дисков организовать одновременно один или несколько массивов уровня RAID 1, RAID 0 и RAID 5. Это позволяет за малые деньги обеспечить для одной информации повышенную надёжность, а для других высокую скорость доступа.
ЗАКЛЮЧЕНИЕ
Из данной курсовой работы видно, что компьютерная система проектируется с применением технологии RAID-массивов, если необходима надёжность и достоверность хранящейся на ней информации.
По результатам тестирования видно, что прирост производительности в приложениях оказался не столь значительным, как в теории.