Raid là gì? các loại Raid phổ biến dùng cho máy chủ Server
1. RAID là gì?
RAID tên viết tắt của cụm từ (Redundant Array Of Independent Disks) là một công nghệ giúp tối ưu hóa hệ thống lưu trữ dữ liệu. Nguyên lý là kết hợp nhiều ổ đĩa cứng vật lý để tạo thành một ổ cứng logic. Công nghệ này được thiết kế để tăng cường độ tin cậy, hiệu suất, tính dự phòng và khả năng chịu lỗi.
Hệ thống RAID yêu cầu tối thiểu 2 ổ đĩa trở lên, các ổ đĩa có thể ở dạng cơ HDD hoặc thể rắn SSD. Dựa vào nhu cầu RAID được chia ra rất nhiều cấp độ khác nhau, các cấp độ này được tối ưu hóa cho các tình huống lưu trữ cụ thể.
Hiểu đơn giản như sau: Máy chủ có 4 ổ đĩa, nếu bạn gắn vào máy chủ sẽ vẫn nhận 4 ổ độc lập. Bạn vẫn có thể thiết lập đọc ghi. Tuy nhiên, các đĩa hoạt động độc lập, dữ liệu trên ổ đĩa sẽ không đồng bộ được với nhau. Khi xảy ra sự cố các dữ bị mất rất khó phục hồi. Vẫn là 4 ổ cứng, nhưng khi sử dụng RAID thì bạn chỉ còn 1 ổ logic. Dung lượng thực tế, tốc độ đọc ghi, độ chịu lỗi, khả năng phục hồi sẽ phụ thuộc vào cấp độ RAID được cài đặt. Phương pháp này sẽ tối ưu hóa quá trình vận hành, quản trị trong các hệ thống lưu trữ.
2. Lịch sử của RAID
Năm 1987 tại đại học Đại học California ở Berkeley, thuật ngữ RAID (Redundant arrays of inexpensive disks) ra đời. Nội dung chính của sự kiện này là giới thiệu một công nghệ để kết hợp các đĩa cứng trên PC của mình để tạo thành một ổ logic duy nhất. Và kể từ đó, RAID đã tạo ra một cuộc cách mạng trong việc lưu trữ và dự phòng dữ liệu.
Hiện tại RAID đã được chuẩn hóa và phát triển với rất nhiều tiêu chuẩn, cấp độ khác nhau để đáp ứng nhu cầu đa dạng của hệ thống lưu trữ. Hệ thống RAID vẫn là một thành phần không thể thiếu cho các máy chủ hoặc hệ thống lưu trữ hiện đại. Khi được cấu hình ở các cấp độ khác nhau, RAID có thể tăng khả năng đọc ghi dữ liệu, tăng tuổi thọ ổ cứng, đảm bảo khả năng chịu lỗi, dự phòng khi có sự cố vật lý.
3. Bộ điều khiển RAID
Dựa vào kiến trúc bộ điều khiển của RAID được chia làm hai loại chính là Phần cứng và phần mềm.
RAID cứng tập trung vào các phương tiện lưu trữ hiệu suất cao được tổ chức bởi các thành phần phần cứng đặc biệt, còn được gọi là bộ điều khiển RAID. Bộ điều khiển Raid được cài đặt trên các máy chủ server, storage, hoặc các disk array chứa các ổ đĩa cứng. Disk array được sử dụng trong các trung tâm dữ liệu và được thực hiện trên các hệ thống DAS (Direct Attached Storage), SAN hoặc NAS. Ưu điểm của phần cứng RAID là hiệu suất tốc và độ truyền tải cao
RAID phần mềm được quản lý bởi phần mềm chạy trực tiếp trên CPU của máy chủ, còn được gọi là hệ thống RAID dựa trên máy chủ. Các hệ điều hành phổ biến như Windows (kể từ NT) hoặc Linux đều hỗ trợ. So với giải pháp phần cứng, RAID phần mềm được thiết lập nhanh hơn và rẻ hơn nhiều. Nhược điểm là yêu cầu CPU cao cho máy chủ và thiếu tính độc lập với nền tảng. Vì việc truy cập ổ đĩa không thể được điều chỉnh một cách tinh tế như bằng bộ điều khiển RAID nên hiệu suất cũng có xu hướng kém hơn.
4. Các loại cấp độ RAID phổ biến
4.1 RAID 0
RAID 0 là một cấp độ cơ bản nhất sử dụng phương pháp striping và yêu cầu tối thiểu 2 ổ đĩa. Dữ liệu được chia thành từng khối và lưu trên tất cả các ổ đĩa. Cấu hình này có phân chia nhưng không có dữ liệu dư thừa. Nó mang lại hiệu suất tốt nhất nhưng không cung cấp khả năng chịu lỗi
Hiểu đơn giản như sau:
Bạn có 2 ổ đĩa dung lượng 1TB, dữ liệu được chia thành các khối từ A1-A8. Sau khi cấu hình RAID 0 bạn sẽ có một ổ logic với dung lượng 2TB. Các khối dữ liệu sẽ chia thành các cụm nhỏ đẩy về các Ổ cứng 1 và 2. Ví dụ: A1, A3, A5, A7 sẽ được chia về ổ cứng 1. A2, A4, A6, A8 sẽ được chia về ổ đĩa 2. Khi ổ 1 hoặc 2 hỏng dữ liệu sẽ bị mất. Tốc độ đọc ghi sẽ được tăng lên do các khối dữ liệu được ghi về 2 ổ đồng thời
Ưu điểm: sử dụng tối được tối đa dung lượng của ổ cứng, dễ triển khai chi phí hoạt động thấp. Mục đích duy nhất là cộng gộp ổ cứng
Nhược điểm: RAID 0 bảo vệ dữ liệu và dự phòng kém nhất trong các cấp độ, khi 1 ổ lỗi là dữ liệu sẽ bị mất.
Trường hợp sử dụng: Raid 0 được sử dụng tốt nhất trong các trường hợp lưu dữ liệu không quan trọng, cần tối đa dung lượng ổ cứng, đọc ghi ở tốc độ cao. Lưu ý khi sử dụng RAID 0, bạn nên backup dữ liệu thường xuyên nhé!
Hình 1: Mô tả RAID 0
4.2 RAID 1
Raid 1 là một cấp độ tiếp theo sử dụng phương pháp Mirroring phản chiếu và yêu cầu tối thiểu 2 ổ đĩa vật lý. Nguyên lý của RAID 1 là sao chép, dữ liệu được ghi vào hai đĩa vật lý riêng biệt. hiểu đơn giản là hình ảnh phản chiếu của nhau. Nếu một đĩa bị lỗi, dữ liệu có thể được lấy từ đĩa kia. cấu hình RAID 1 yêu cầu tối thiểu hai ổ đĩa và chỉ nhận dung lượng của 1 ổ
Chi tiết: Bạn có 2 ổ cứng 1TB, có các khối dữ liệu cần ghi từ A1-A8. Sau khi dùng RAID 1 bạn sẽ có 1 ổ logic dung lượng 1TB vì cơ chế sao chép của RAID 1. Các khối dữ liệu từ A1-8 sẽ được chia đều trên 2 ổ đĩa 1 và 2. Khi dữ liệu trên một ổ bị lỗi thì vẫn có thể lấy dữ liệu từ ổ còn lại.
Ưu điểm: có thể bảo vệ dữ liệu ở mức cơ bản, có khả năng dự phòng
Nhược điểm: chỉ sử dụng được 1 nửa dung lượng lưu trữ, chi phí cao hơn, phải tắt nguồn điện nếu thay thế đĩa lỗi
Trường hợp sử dụng: Raid 1 sử dụng tốt nhất cho các yêu cầu về dự phòng với tối thiểu 2 ổ đĩa cứng bao gồm các dịch vụ lưu trữ như: dữ liệu doanh nghiệp, cơ sở dữ liệu, tài liệu quan trọng.
Hình 2: Mô tả RAID 1
4.3 RAID 5
RAID 5 là cấp độ phổ biến và được triển khai rộng rãi nhất. Yêu cầu tối thiểu 3 ổ đĩa. RAID 5 sử dụng cơ chế striping (phân chia dữ liệu) cùng với parity để cung cấp khả năng dự phòng. Tương tự như RAID 1 dữ liệu sẽ được sao chép và chia đều sang các ổ cứng, Đồng thời parity sẽ sử dụng thuật toán XOR (Exclusive OR) tạo ra một khối parity từ khối dữ liệu gốc. Khối này sẽ có nhiệm vụ khôi phục khi một trong các ổ đĩa bị lỗi. RAID 5 có thể chịu tải nếu một ổ cứng bị lỗi.
Giả sử có 3 ổ cứng vật lý dung lượng 1TB, các khối dữ liệu từ A1-A3, B1-B3, C1-C3, D1-D3. Khi cấu hình RAID 5 sẽ có công thức tính dung lượng logic như sau:
Dung lực thực tế= (Dung lượng của 1 ổ cứng) x [(Số lượng các ổ cứng tham gia RAID) - 1].
Như vậy bạn có tổng 2TB dữ liệu. Các khối dữ liệu sẽ được chia đều sang các ổ cứng như mô tả trong hình 3. Đồng thời khối parity cũng được tạo và ghi tuần tự lên các đĩa. Khi một ổ đĩa bị lỗi dữ liệu sẽ được khôi phục dựa vào các thông tin parity khởi tạo trước đó. RAID 5 cho phép chịu lỗi 1 ổ cứng và thời gian khôi phục sẽ phụ thuộc vào dung lượng, tốc độ, hạ tầng của ổ đĩa vật lý. Nếu 2 ổ lỗi dữ liệu bị mất sẽ không khôi phục được.
Ưu điểm: RAID 5 có hiệu suất cao, tốc độ đọc nhanh và đáng tin cậy. Vì dữ liệu được trải đều trên các ổ nên khi sự cố vẫn có thể hoạt động bình thường khi một ổ cứng bị lỗi. Ngoài ra, Raid 5 còn có thể hoán đổi thay thế nóng mà không cần ngắt nguồn, giúp duy trì sự ổn định của hệ thống.
Nhược điểm: Hiệu suất ghi trên ổ RAID 5 chậm hơn hiệu suất đọc do tạo thêm các khối parity. RAID 5 có thời gian xây dựng lại lâu hơn và có khả năng mất dữ liệu nếu ổ đĩa thứ hai bị lỗi trong quá trình xây dựng lại. Bộ điều khiển phức tạp hơn các cấp độ RAID khác.
Khuyên dùng: RAID 5 mang đến sự tối ưu hóa giữa chi phí và hiệu suất. Do đó, được sử dụng thường xuyên cho các máy chủ cơ sở dữ liệu, hệ thống lưu trữ đòi hỏi sự an toàn, dự phòng cao.
Hình 3: Mô tả RAID 5
4.4 RAID 6
RAID 6 là một phiên bản nâng cấp của RAID 5 nhưng sử dụng 2 khối parity. Kiến trúc này tăng độ tin cậy hơn RAID 5 cho phép các hoạt động I/O chồng chéo lên nhau để cải thiện hiệu suất. Khi được thiết lập nó có thể chịu tải 2 ổ cứng bị lỗi. Yêu cầu tối thiểu 4 ổ cứng để hoạt động
Ví dụ: bạn có 4 ổ cứng 1TB, Các khối dữ liệu từ A1-A4. B1-B4. Sau khi cài RAID 6 dung lượng nhận được sẽ là 2TB được tính toán theo công thức sau:
Dung lực thực tế= (Dung lượng của 1 ổ cứng) x [(Số lượng các ổ cứng tham gia RAID) - 2].
Cơ chế ghi và phục hồi dữ liệu như RAID 5 nhưng tạo ra 2 khối parity và ghi đều về các đĩa
Ưu điểm: có thể chịu tải 2 ổ đĩa hỏng, hiệu suất đọc cao
Nhược điểm: tốc độ ghi thấp, thời gian xây dựng lại lâu, quá trình thực hiện phức tạp, chi phí cao
RAID 6 là một lựa chọn tốt cho các hệ thống lưu trữ yêu cầu sự bảo vệ dữ liệu cao và khả năng chịu được nhiều lỗi ổ cứng. Nó phù hợp cho các ứng dụng và môi trường mà sự toàn vẹn và sẵn có của dữ liệu là ưu tiên hàng đầu, chẳng hạn như trong các doanh nghiệp lớn, trung tâm dữ liệu, và các hệ thống lưu trữ lớn.
Hình 4: Mô tả RAID 6
4.5 RAID 10
RAID 10 là sự kết hợp của RAID 1+0 là kiểu lồng nhau phổ biến nhất cung cấp giữa hiệu suất và độ tin cậy tốt nhất. RAID 10 sử dụng phản chiếu logic để ghi cùng một dữ liệu trên 2 hoặc nhiều ổ đĩa, cung cấp khả năng dự phòng tốt nhất. Nếu một đĩa bị lỗi sẽ có hình ảnh phản chiếu của dữ liệu được lưu trữ trên đĩa khác. Ngoài ra, raid 10 còn có tính năng phân chia cấp khối để phân phối các khối dữ liệu trên các ổ đĩa khác nhau. Điều này giúp tăng hiệu suất đọc ghi khi có thể truy cập dữ liệu từ nhiều ổ đĩa.
Ví dụ: bạn có 4 ổ đĩa 1TB dung lượng thực tế là 2TB. Nếu 1 ổ đĩa bị hỏng, dữ liệu vẫn an toàn trên ổ đĩa sao chép và được khôi phục dễ dàng.
Ưu điểm: hiệu suất cao, tăng đọc nghi, khả năng chịu lỗi cao, thời gian xây dựng nhanh chóng.
Nhược điểm: khả năng mở rộng hạn chế, chi phí cao, chỉ sử dụng được một nửa không gian đĩa. Việc thiết lập cấu hình ban đầu cũng phức tạp.
Raid 10 thường được sử dụng trong các yêu cầu lưu trữ lớn, tốc độ đọc ghi nhanh, chịu lỗi tốt. Cấp độ RAID này thường sử dụng cho các máy chủ email, web, cơ sở dữ liệu.
Hình 5: Mô tả RAID 10
Ngoài ra còn rất nhiều cấp độ RAID không phổ biến hoặc các biến thể khác nhau như RAID 2,4,7… dùng trong nhiều trường hợp đặc biệt. Nếu bạn đọc quan tâm có thể để lại bình luận và đội ngũ biên tập của chúng tôi sẽ có các giải đáp sớm nhất. Trên bài viết này CNTTShop.vn chỉ đề cập đến các cấp độ RAID phổ biến hay sử dụng cho Server hoặc các môi trường lưu trữ bạn nhé.
5. Các cấp độ chính của RAID
5.1 Cấp độ RAID tiêu chuẩn: Là một tập hợp các cấp độ RAID được xác định và chuẩn hóa bởi Tổ chức Tiêu chuẩn SCSI (SCSI Trade Association) và Tổ chức Tiêu chuẩn (Internet Engineering Task Force - IETF). Các cấp độ này định nghĩa các phương pháp cụ thể để tổ chức và quản lý dữ liệu trên các hệ thống lưu trữ RAID. Cấp độ này bao gồm RAID 0,1,5,6
5.2 Cấp độ RAID không chuẩn: Hay còn được gọi là "non-standard RAID levels", là các cấu hình RAID không thuộc vào các cấp độ RAID tiêu chuẩn như RAID 0, 1,5,6. Các cấp độ RAID không chuẩn thường là các biến thể được tùy chỉnh hoặc cải tiến của các cấp độ RAID tiêu chuẩn, được phát triển để đáp ứng các yêu cầu cụ thể của hệ thống lưu trữ hoặc ứng dụng. Một số các biến thể như RAID 3,4,7 ...
5.3 Cấp độ RAID lồng nhau: Là RAID hỗn hợp, là một phương pháp kết hợp các cấp độ RAID để tận dụng các ưu điểm của từng cấp độ RAID trong một hệ thống lưu trữ. Bằng cách kết hợp các cấp độ RAID, các hệ thống RAID lồng nhau có thể cung cấp hiệu suất cao, độ tin cậy tốt và bảo mật dữ liệu đồng thời.
5.4 Lưu ý: Các cấp độ RAID lồng nhau cung cấp sự linh hoạt trong việc tối ưu hóa hiệu suất, bảo mật và độ tin cậy của hệ thống lưu trữ, đặc biệt trong các môi trường nơi cần đồng thời cả hiệu suất cao và bảo mật cao. Tuy nhiên, việc triển khai và quản lý các hệ thống RAID lồng nhau có thể phức tạp hơn so với các cấp độ RAID độc lập.
6. Kết Luận:
RAID là một công cụ vô cùng quan trọng trong các hệ thống lưu trữ. Nó mang lại rất nhiều lợi ích to lớn cho doanh nghiệp như:
- Tối ưu hóa chi phí khi có thể sử dụng triệt để nhiều ổ cứng dung lượng nhỏ.
- Tăng hiệu suất, tốc độ, độ tin cậy của ổ đĩa.
- Đảm bảo tính toàn vẹn, dự phòng, chịu lỗi trong các hoạt động lưu trữ.
- Cải thiện khả năng quản lý khi chỉ cần tập trung vào một cụm logic duy nhất.
- Có khả năng phục hồi dữ liệu nhanh chóng khi một trong các thành phần bị lỗi.
Bình luận bài viết!