()

Czym jest RAID?

Kilka lat temu zastanawiałem się, w jaki sposób dane potrafią być przetrzymywane w danej lokalizacji przez dłuższy okres czasu bez utraty, chociaż części danych. Awarie dysków nie są bardzo częste, lecz anihilacja ważnych informacji może skutkować wieloma negatywnymi skutkami, na przykład utratą wieloletniej bazy danych. Rozwiązaniem tego problemu jest RAID (skrót od angielskiego Redundant Array of Independent Disks – nadmiarowa macierz niezależnych dysków), czyli przechowywanie danych na minimum dwóch dyskach.

Gdzie wykorzystuje się RAID?

RAID znajduje powszechne zastosowanie wśród serwerów – w przypadku awarii jednego dysku możemy go wymienić na sprawny, który dzięki RAID będzie mógł pracować bez konieczności przywracania kopii zapasowej. Jest to szczególnie wygodne, jeśli sprawujemy pieczę nad wieloma serwerami, ponieważ do poprawnego działania wystarczy wstawić nowy dysk do kieszeni dyskowej.

Przykładowy serwer, w którym można wykorzystać RAID. Obok niego znajdują się dwa dyski ze złączem SAS.

Podział RAID

Macierze RAID dzielą się na dwa rodzaje. W zależności od posiadanego sprzętu można wykorzystać odpowiedni rodzaj RAID – każdy z nich posiada wady i zalety.

  • Sprzętowy RAID – dyskami zarządza oddzielny kontroler. Dzięki temu CPU nie jest obciążone wykonywaniem obliczeń związanymi z określaniem sum kontrolnych. Ustawienie RAID jest niezależne od systemu operacyjnego, tj. dokonywane jest przed jego wystartowaniem. Pozwala to na uruchomienie systemu z dysków znajdujących się w macierzy. Minusem sprzętowego RAID jest konieczność posiadania dysków o identycznych złączach, jak i posiadanie fizycznego kontrolera. Same kontrolery różnią się od siebie sposobem zapisu danych, co może powodować problemy z kompatybilnością.
  • Programowy RAID – dyskami zarządza komputer. CPU zajmuje się obliczaniem sum kontrolnych, przez co macierze RAID mogą tracić na wydajności. System musi być uruchamiany z woluminu nieznajdującego się w RAID, ponieważ to on zajmuje się obsługą partycji w macierzy. Programowy RAID pozwala jednak na łączenie ze sobą dysków o różnych złączach (np. popularne SATA i USB) i działanie bez konieczności posiadania fizycznego kontrolera.

Spotykane jest również połączenie tych dwóch rodzajów – tak zwane FakeRAID. Polega ono na konfigurowaniu RAID przez BIOS, lecz pozostawieniu procesorowi operacji związanych z obsługą dysków.

Czy RAID to kopia zapasowa?

RAID w pewnym stopniu zabezpiecza dane przed ich utratą, nie może być stosowany jako kopia zapasowa. Dyski w macierzy RAID nadal są narażone na przykład na ataki ransomware lub działanie osób wewnątrz danej organizacji mające na celu usunięcie cennych danych. RAID nie pozwala również na przywrócenie danych, które nie zostały wcześniej nadpisane – nie można ich przywrócić sprzed danej daty. RAID nie zwalnia administratora z konieczności robienia kopii zapasowej. Chroni jednak dane przed awariami fizycznych dysków.

Automatyzacja działania RAID – hot spare

Hot spare w RAID oznacza dodatkowy fizyczny dysk, na którym nie są przechowywane dane. Jest on w trybie czuwania (standby) i zastępuje uszkodzony dysk w momencie, gdy nie działa prawidłowo. Dzięki zastosowaniu tego rozwiązania dana macierz dyskowa może nieustannie pracować, zaś administrator może wymienić uszkodzony dysk bez konieczności wyłączania danego systemu.

Poziomy RAID

Czym jest RAID 0?

RAID 0 to segmentacja danych pomiędzy minimum dwa dyski, które są widoczne w systemie jako pojedynczy wolumin. Dzięki temu dane mogą być szybciej odczytywane i zapisywane.

Niestety taka konfiguracja oznacza, że awaria jednego dysku fizycznego skutkuje utratą danych dla całego dysku logicznego. Ten poziom RAID nie powinien być wykorzystywany dla ważnych danych, ponieważ istnieje duże ryzyko zaprzepaszczenia cennych plików.

Czym jest RAID 1 ?

RAID 1 różni się diametralnie od RAID 0 – zamiast zapisywać dane pomiędzy dwoma fizycznymi dyskami, RAID 1 zapisuje identyczne dane na obydwu dyskach logicznych. Dzięki temu nazywany jest lustrzanym RAID. Skutkuje to jednak znacząco wolniejszym zapisem niż w przypadku RAID 0 – dane zapisywane są równolegle lub sekwencyjnie dla obydwu woluminów.

Przestrzeń zapisu jest równa przestrzeni dyskowej najmniejszego fizycznego dysku. Dzięki temu awaria jednego dysku nie oznacza utraty danych, a po wymianie uszkodzonego dysku na nowy RAID może działać ponownie, bez konieczności wykonywania obliczeń lub innych skomplikowanych operacji.

Czym jest RAID 2 ?

RAID 2 to historyczny rodzaj RAID, wykorzystujący m.in. 10 dysków i zapisywanie danych na paskach, które pozwalają na korygowanie błędnie zapisanych danych. Osiem dysków służyło do przechowywania danych, zaś dwa do kodu służącego do eliminowania ewentualnych błędów. Obecnie ten poziom RAID uznaje się za przestarzały, m.in. spowalnia działanie systemu.

Czym jest RAID 3 ?

RAID 3 wymaga minimum trzech dysków fizycznych. Na jednym z nich przechowywane są sumy kontrolne, zaś na pozostałych trzymane są pliki. Dzięki sumom kontrolnym w przypadku awarii jednego fizycznego dysku jesteśmy w stanie odzyskać jego zawartość.

RAID 3 znacząco spowalnia zapisywanie danych na dyskach, ponieważ na bieżąco muszą być generowane sumy kontrolne.

Czym jest RAID 4 ?

RAID 4 działa podobnie do RAID 0 i RAID 3 – zapisuje dane na dyskach analogicznie do RAID 0, lecz tworzy również bloki parzystości podobnie do RAID 3. RAID 4 jest znacząco wydajniejszy niż RAID 3. Lepiej spisuje się współpracując z dużymi plikami zamiast z wieloma małymi – każda operacja generuje blok parzystości o wielkości będącej potęgą liczby 2 (w kB).

Czym jest RAID 5 ?

RAID 5 działa analogicznie do RAID 4, lecz nie używa oddzielnego dysku do przechowywania informacji o parzystości. W razie awarii dane odzyskiwane są na podstawie informacji zawartych w pozostałych dyskach. Na pojedynczym dysku znajduje się suma kontrolna i liczba bloków danych pomniejszona o jeden.

Szybkość odczytu jest atutem tego poziomu, lecz generowanie bitów parzystości może spowalniać działanie systemu w programowych RAID. Awaria jednego z dysków powoduje chwilowe spowolnienie działania macierzy po wymianie dysku, ponieważ sumy kontrolne dla minimum dwóch dysków muszą zostać wygenerowane od zera.

Czym jest RAID 6?

RAID 6 jest podobny do RAID 5, lecz tworzy dwa bloki zawierające bity parzystości. Dzięki temu RAID 6 jest odporny na awarie dwóch dysków, dzięki czemu może być stosowany do przechowywania cennych danych. Wymaga minimum czterech dysków fizycznych do poprawnego działania — dwóch przechowywujących dane i dwa odpowiedzialne za sumy kontrolne.

Dzięki temu kilka lub kilkanaście dysków działających jako RAID 6 wymaga jedynie dwóch dysków z informacjami o parzystości, dlatego można spotkać RAID 6 w konfiguracji np. 13+2 (13 dysków z danymi i 2 przeznaczone dla bitów parzystości). Takie ustawienie pozwala na bezpieczne przechowywanie danych w macierzy, przy wykorzystaniu ok. 87% przestrzeni dyskowej na przechowywanie danych.

RAID 0+1 i RAID 1+0

RAID 0+1 składa się z minimum czterech dysków. Cztery dyski podzielone są na dwa RAID 0 po dwa dyski, czyli dane zapisywane są równolegle na obu dyskach. Lustrzane kopie RAID 0 są połączone w RAID 1, czyli dane między nimi są replikowane do nowego dysku w razie awarii.

Cechuje się wieloma zaletami, przede wszystkim możliwością łączenia dysków o różnych pojemnościach i szybkością charakterystyczną dla RAID 0. RAID 0+1 wiąże się jednak z tym, że połowa przestrzeni dyskowej jest niewykorzystywana.

RAID 1+0 (RAID 10) to analogiczne rozwiązanie do RAID 0+1. Składa się on z minimum czterech dysków, gdzie każde dwa działają jako RAID 1, zaś cztery jako RAID 0. Oznacza to, że uszkodzony dysk może zostać wymieniony na nowy i skopiować dane z tego, który znajduje się z nim w RAID 1. Wymaga jednak do poprawnego działania dysków o identycznej pojemności.

Matrix RAID

Matrix RAID to połączenie dwóch dysków fizycznych przy wykorzystaniu zarówno RAID 0, jak i RAID 1. Ważne dane przechowywane są jako RAID 1, zaś mniej ważne jako RAID 0. Wymaga to podzielenia fizycznego dysku na dwie partycje. Pozwala to zachować dużą szybkość zapisu dla mniej ważnych danych i bezpieczne przechowywanie cennych informacji.

Podsumowanie

Różne poziomy RAID pozwalają na szybki zapis danych lub bezpieczne przechowywanie informacji. Zastosowanie danego poziomu wiąże się z ograniczeniami dotyczącymi prędkości zapisu lub wykorzystywanej przestrzeni dyskowej, dlatego należy szczegółowo przeanalizować dobranie poziomu RAID w organizacji. Każda macierz dyskowa może wymagać innego podejścia odnośnie zapisywania danych w RAID.

Oskar

Jak przydatny był ten Artykuł

Kliknij gwiazdke by zagłosować

Średni / 5. Liczba głosów

Doceń naszą prace

Przepraszam że ten post nie był dla Ciebie przydatny

Popraw ten post!

Napisz mi co mogę poprawić