본문 바로가기

리눅스/리눅스 서버

하드디스크 관리(1) - RAID 이론

여러 개의 하드디스크를 하나의 하드디스크처럼 사용하고자 할 때가 있다.


이 때 사용되는 방법이 RAID와 LVM이다.


우선 RAID부터 알아보도록 한다.


RAID

RAID는 크게 하드웨어 RAID와 소프트웨어 RAID가 있지만 하드웨어는 생략하고 넘어간다.


RAID는 구성하는 방식에 따라서 Linear, 0, 1, 5, 6 등으로 분류된다. 비슷한 것끼리 묶어서 알아보도록 한다.


 - Linear RAID / RAID 0

  우선 두 방식 모두 최소 2개의 하드디스크를 필요로 하며 2개 이상의 하드디스크를 1개의 볼륨으로 사용한다.


  두 방식의 가장 큰 차이점은 저장 방식이다.


  Linear는 앞 하드디스크에 데이터가 완전히 저장된 후 다음 하드디스크에 저장된다.

  반면 RAID 0은 여러 하드디스크에 동시에 저장된다.

  위 사진으로 간단하게 비교해볼 수 있다.


  한 글자당 저장되는 시간이 1초라고 가정할 시 Linear RAID는 6초지만 RAID 0은 2초면 저장이 완료된다. 이렇게 여러 개의 하드디스크에 동시에 저장하는 방식을 스트라이핑 이라고 한다.


  이렇듯 RAID 0방식은 속도면에서 우월하지만 하나의 하드디스크만 고장이 나더라도 모든 데이터를 사용할 수 없게 된다는 단점을 가지고 있다.


 - RAID 1

  RAID 1방식은 간단히 말해 미러링 이라고 할 수 있다.

  사진으로 보면 더 쉽게 알 수 있다.


  같은 내용을 2번 저장하기에 저장 공간 효율은 50%밖에 되지 않지만 하나의 디스크가 고장나더라도 데이터는 안전하다.


 - RAID 5

  안전성이 어느정도 보장되면서도 공간 효율성도 좋은 방식이다. 단 최소 3개 이상의 하드디스크를 필요로 한다.


  하나의 디스크에 문제가 생기더라도 패리티를 이용해서 복구할 수 있다.

  x로 표시된 자리가 패리티 데이터이다. 위 사진은 짝수 패리티를 사용했다. 이는 각 행의 합이 짝수가 된다는 뜻이다.


  이렇듯 RAID 5 방식은 하드디스크 개수를 N개라 할 때 N-1만큼의 공간을 사용할 수 있으며 어느 정도의 결함도 허용한다.


 - RAID 6

  RAID 5 방식보다 데이터의 신뢰도를 더 높인 방식이다. 패리티 데이터를 1자리만 쓰는 5방식과는 달리 패리티 데이터를 2자리 사용한다.

 

  따라서 하드디스크의 개수도 최소 4개로 구성해야만 한다.


  하지만 하드디스크 개수를 N개라 할 때 N-2만큼의 공간을 사용할 수 있으며, 패리티를 2개 사용해야하기에 내부적인 알고리즘이 복잡해져서 속도는 약간 떨어진다는 단점이 있다.


 - 조합

  위의 기본적인 RAID 방식을 조합해서 구성할 수도 있다.

  위와 같은 0+1 방식은 데이터의 신뢰성과 속도를 동시에 확보하는 방법이다.


  

'리눅스 > 리눅스 서버' 카테고리의 다른 글

네임 서버  (0) 2020.03.21
원격 관리 - 텔넷, ssh, vnc  (0) 2020.03.10
하드디스크 관리(4) - 쿼터  (0) 2020.03.08
하드디스크 관리(3) - LVM  (0) 2020.03.08
하드디스크 관리(2) - RAID 실습  (0) 2020.03.06