Raid ngày càng phổ biến và được nhiều người sử dụng bởi đó là một giải pháp phòng hộ dữ liệu không những vậy nó còn cho phép tăng tốc độ và hiệu suất ghi/ đọc dữ liệu. Để hiểu rõ hơn Raid là gì? có mấy loại raid phổ biến hãy cùng chúng tôi tìm hiểu bài viết dưới đây
1. Raid là gì?
Raid là một công nghệ hiện đại sử dụng để tăng độ tin cậy và hiệu suất lưu trữ cao hơn từ việc lưu trữ dữ liệu từ ổ đĩa. Raid là từ viết tắt của cụm (Redundant Array of Displugged Disks). Trong một hệ thống Raid bao gồm 2 hoặc nhiều hệ thống ổ đĩa làm việc song song. Phần lớn những đĩa Raid này đề là ổ cứng HDD, chỉ có ít xu hướng dùng công nghệ SSD (ổ địa ở trạng thái rắn – solid state).
Có nhiều loại Raid và nhiều mức độ khác nhau, mỗi cấp độ sẽ được tối ưu hóa cho một tình huống cụ thể, nhưng đều thiết kế để đáp ứng được 2 nhu cầu cơ bản của người dùng:
• Tăng độ tin cậy của dữ liệu
• Tăng hiệu suất đầu vào/ đầu ra (I/O)
2. Lịch sử hình thành Raid
Thuật ngữ Raid được đưa ra vào năm 1987 bởi David Patterson, Randy Katz and Garth A. Gibson. Trong báo cáo kỹ thuật năm 1988, thuật ngữ Raid có tiêu đề là A Case for Redundant Arrays of Inexpensive Disks (RAID). Họ giả thiết rằng việc truyền dữ liệu trên nhiều ổ đĩa có thể cải thiện được hiệu suất của hệ thống, giảm chi phí và giảm điện năng tiêu thụ trong khi vẫn tránh được các vấn đề độ tin cậy.
Geac Computer Corp.’s Gus German and Ted Grunau đã đề cập đến ý tưởng này như ổ MF-100. IBM’s Norman Ken Ouchi đã đưa bằng sáng chế cho công nghệ này vào năm 1977, mãi đến sau này mới được gọi là Raid 4. Nắm 1983, Digital Equipment Corp đã chuyển nó thành Raid 1. Đến năm 1986, IBM đã được đưa bằng sáng chế cho việc nâng cấp đến Raid 5. Patterson, Katz và Gibson cũng xem xét những gì đã làm được bởi các công ty như Tandem Computers, Thinking Machines và Maxstor để xác định phân loại RAID của họ.
Ngày nay, công nghệ Raid gần như phổ biến giữa các thiết bị lưu trữ doanh nghiệp và cũng được tìm thấy trong nhiều thiết bị lự trữ của người tiêu dùng. Tuy nhiên một số lưu trữ không sử dụng Raid thay vào đó là JBOD – nó cung cấp dung lượng lưu trữ nhưng lại không cung cấp về khả năng phòng lỗi cũng như không mang lại độ tin cậy cho người dùng.
3. Những loại Raid phổ biến
Với mỗi nhu cầu sử dụng riêng, các nhà phát triển đã thiết lập nhiều loại Raid khác nhau, và tất nhiên mỗi loại sẽ có ưu điểm và nhược điểm riêng.
• RAID 0 – striping
• RAID 1 – mirroring
• RAID 5 – striping with parity
• RAID 6 – striping with double parity
• RAID 10 – kết hợp giữa Raid 0 + Raid 1: mirroring and striping
Striping: Là phương thức ghi chia nhỏ dữ liệu, được sử dụng ở Raid 0
Mirroring: Là phương thức ghi sao chép, tất cả các ổ đĩa đều sao dữ liệu y nhau.
Striping with parity: Là phương thức ghi chia nhỏ dữ liệu, và lúc nào cũng có một khối để backup dữ liệu.
Striping with double parity: Là phương thức ghi chia nhỏ dữ liệu, và lúc nào cũng có hai khối để backup dữ liệu. Nên cho phép hỏng 2 ổ đĩa cùng một lúc vẫn đảm bảo an toàn về dữ liệu.
Phần mềm để thực hiện các chức năng của Raid và kiểm soát ổ đĩa có thể được đặt trên một thẻ điều khiển riêng là trình điều khiển. Một số phiên bản của Windows như windows server 2012 cũng như Mac OS X bao gồm chức năng Raid phần mềm. Đối với bộ điều khiển Card Raid rất tốn kém nhưng bù lại chúng cung cấp hiệu năng tốt nhất là ở Raid 5 và Raid 6.
Hệ thống Raid có thể sử dụng với một số giao diện như SCSI, IDE, SATA hoặc FC (hệ thống cáp quang). Có hệ thống sử dụng đĩa SATA nội bộ, nhưng cần phải có một giao diện FireWire hoặc SCSI cho hệ thống máy chủ lưu trữ.
3.1. Raid 0 – Triping
Trong hệ thống lưu trữ Raid 0, dữ liệu được chia thành những khối nhỏ để ghi đều lên tất cả các ổ đĩa. Bằng cách sử dụng ít nhất 2 ổ đĩa cùng lúc, quá trình này cung cấp hiệu suất cao hơn về I/O – (imput và output). Hiệu suất này có thể tăng và trở nên lý tưởng khí sử dụng bộ điều khiển riêng cho mỗi đĩa.
Ưu điểm:
Raid 0 cung cấp hiệu suất lý tưởng, thậm chí cả trong quá trình hoạt động đọc/ ghi
Tất cả các ổ đĩa đều được sử dụng và không hề tốn chi phí
Là một công nghệ dễ thực hiện
Nhược điểm:
Không nên sử dụng cho dữ liệu quan trọng vì chỉ cần 1 ổ chết là sẽ mất tất cả dữ liệu. Việc cứu dữ liệu Raid 0 lại rất phức tạp, cần phải có chuyên môn cao
Sử dụng lý tưởng:
Raid 0 sử dụng lý tưởng cho việc lưu trữ dữ liệu không quá quan trọng, sử dụng cho công việc không yêu cầu quá cao về tốc độ đọc và tốc độ ghi chẳng hạn như chỉnh sửa video hay hình ảnh. Nếu bạn vẫn muốn sử dụng Raid 0 hoàn toàn có thể kết hợp với dung lượng của ổ đĩa trong máy. Điều này được hỗ trợ đối với tất cả các hệ điều hành Linux, OS X, Windows.
3.2. Raid 1 – Mirroring
Dữ liệu sẽ được lưu trữ bằng cách ghi chúng vào chung một ổ đĩa, và sao chép y nguyên vào ổ đĩa còn lại. Bạn cần tối thiểu 2 ổ đĩa cho Raid 1, nghĩa là các dữ liệu được ghi vào ổ 1 và 2 đều y chang nhau. Trong trường hợp có một ổ bị lỗi hoặc bị hỏng thì ổ còn lại vẫn còn dữ liệu, đến khi thay ổ đĩa mới vào nó sẽ tự động backup dữ liệu sang ổ đĩa mới.
Ưu điểm:
Raid 1 có tốc độ đọc và ghi lý tưởng
Đảm bảo an toàn về dữ liệu, trong tường hợp có một ổ đĩa bị hỏng, lỗi dữ liệu sẽ tự động được sao chép vào ổ đĩa được thay thế
Raid 1 là công nghệ đơn giản
Nhược điểm:
Dung lượng chỉ bằng 1 nửa của cả tổng dung lượng ổ đĩa vì tất cả dữ liệu đều được ghi 2 lần.
Khi ổ đĩa bị hỏng chỉ có thể thay thế bằng cách tắt máy tính đi
Không phải là Raid lý tưởng cho máy chủ nhiều người sử dụng
Sử dụng lý tưởng:
Raid là gì? Raid 1 là sự lý tưởng cho những nhiệm vụ lưu trữ quan trọng. Thích hợp cho sử dụng máy chủ nhỏ.
3.3. Raid 5 – striping with parity
Là raid an toàn và phổ biến nhất, nó đòi hỏi ít nhất 3 ổ đĩa để hoạt động được và tối đa có thể lên đến tận 16 ổ đĩa, các dữ liệu cũng được chia nhỏ và lưu vào đĩa theo phương thức striping with parity, nghĩa là các ổ đĩa đều được ghi đều dữ liệu, ngoại trừ 1 ổ để backup toàn bộ dữ liệu phòng trong trường hợp có hỏng 1 ổ đĩa thì vẫn sẽ không bị mất dữ liệu.
Ưu điểm:
Đọc dữ liệu rất nhanh nhưng ghi lại dữ liệu lại rất chậm, đó là do phương thức ghi party
Nếu có 1 ổ cứng hỏng vẫn hoàn toàn không bị mất dữ liệu vì trong đó luôn có một ổ đĩa dự phòng đã sao lưu sẵn dữ liệu.
Nhược điểm:
Lỗi về ổ đĩa sẽ ảnh hưởng nhanh đến hiệu suất
Là công nghệ phức tạo
Sử dụng lý tưởng:
RAID 5 là một hệ thống toàn diện rất tốt về kết hợp lưu trữ hiệu quả với bảo mật tuyệt vời.
Đọc thêm: Hướng dẫn cứu dữ liệu Raid 5
3.4. Raid 6 – Striping with double parity
Raid 6 cũng giống như Raid 5, những dữ liệu được chia ra ra và lưu đồng thời lên tất cả các đĩa. Với Raid 6 nó yêu cầu tối thiểu là 4 ổ đĩa, để đảm bảo được dữ liệu vẫn sẽ an toàn khi bị hỏng cả 2 ổ đĩa cùng một lúc. Tuy nhiên xác xuất hỏng cả 2 ô đĩa cùng một lúc là rất nhỏ. Thường chỉ dùng chó người muốn bảo mật và tính an toàn cao.
Ưu điểm:
Giông như Rài 5, đọc và ghi dữ liệu rất nhanh
Nếu 2 ổ đĩa cùng hỏng một lúc, bạn vẫn có thể truy cập được vào đữ liệu
Raid 6 an tòa hơn raid 5.
Nhược điểm:
Viết các giao dịch dữ liệu chậm hơn so với raid 5, thấp hợp khoảng 20% về hiệu suất
Lỗi ổ đĩa có ảnh hưởng đến thông lượng
Đây là một công nghệ phức tạp
Sử dụng lý tưởng
Là hệ thống toàn diện rất tốt, kết hợp quá trình lưu trữ dữ liệu hiệu quả cùng
Chứa và sử dụng được nhiểu ô đĩa.
3.5. Raid 10 – mirroring and striping
Là sự kết hợp giữa Raid 0 và Raid 1 tạo thành Radi 10, mang lại hiệu năng cao hơn Raid 1, bù lại chi phí chi trả cao. Đối với Raid 10 chúng ta cần tối thiểu là 4 ổ đĩa cứng.
Ưu điểm:
Nếu có gì sai hoặc lỗi thì cấu hình Raid 10 sẽ xậy dựng lại rấy nhanh
Trong trường hợp cần thiết có thể backup dữ liệu vào ổ đĩa mới (30 phút với ổ 1T)
Nhược điểm:
Một nửa dung lượng lưu trữ vào Mirroring
So với Raid 5 và 6 có phần tốn kém về chi phí hơn.
Hiện nay Raid là phần lưu trữ dữ liệu phổ biến, nên các nhà cung cấp sẽ tiếp tục nghiên cứu và phát hành những sản phẩm nâng cấp vượt trội hơn mà vẫn hạn chế về mặt chi phí cho người dùng. Đọc xong bài viết trên chắc hẳn các bạn đã hiểu raid là gì? có mấy loại Raid phổ biến