Một số lưu ý về backup dữ liệu

 Quy tắc backup 3-2-1 là gì?

  • Giữ ít nhất ba (3) bản sao dữ liệu.
  • Lưu trữ hai (2) bản sao lưu trên các phương tiện lưu trữ khác nhau.
  • Lưu trữ một (1) bản sao lưu ngoại vi (tape, cloud…)
Quy tắc sao lưu 3-2-1 đề cập đến cách tiếp cận đã được thử nghiệm và kiểm chứng để lưu giữ và lưu trữ dữ liệu hiệu quả, an toàn hơn

Bằng cách áp dụng quy tắc này, bạn sẽ được đảm bảo rằng dữ liệu có thể được phục hồi trong hầu hết mọi trường hợp hỏng hóc. Một trong những phương pháp phổ biến nhất là giữ một bản sao dữ liệu sản xuất, một bản sao lưu trên kho lưu trữ cục bộ và một bản sao lưu trong bộ nhớ ngoại vi hoặc trên đám mây.


Phục hồi sau thảm họa (Disaster Recovery)

Nói về giải pháp backup và phục hồi sau thảm họa (DR) thì có 02 thông số cực kỳ quan trọng trong việc backup đó là RTO và RPO.



RTO (Thời gian phục hồi) viết tắt của Recovery Time Objectives , đây là một khoảng thời gian để hệ thống có thể phục hồi, kể từ khi xảy ra sự kiện gián đoạn bất ngờ nào đó.

Khi tài nguyên bị gián đoạn, hệ thống cần thực hiện một số hành động như: thay thế bộ phận bị hư hỏng, lập trình hoặc kiểm tra lại các tài nguyên trước khi đưa chúng trở về hoạt động bình thường. 

Thời gian phục hồi và chi phí phục hồi tỷ lệ nghịch với nhau, ví dụ như RTO càng ngắn thì chi phí càng cao. Do đó, các lãnh đạo doanh nghiệp cần tham gia đầy đủ và cân nhắc kỹ về giá trị RTO phù hợp. Mặc dù doanh nghiệp muốn thời gian phục hồi là 30 phút, tuy nhiên chi phí cho việc này sẽ rất cao và doanh nghiệp cần cân nhắc kỹ.

RPO (Thời điểm phục hồi) viết tắt của Recovery Point Object , là thời gian tối đa được phép mà dữ liệu có thể được khôi phục để tiếp tục hoạt động bình thường nếu máy tính, hệ thống hoặc mạng ngừng hoạt động do lỗi. 

RPO được thể hiện ngược thời gian - tức là về quá khứ - kể từ thời điểm xảy ra lỗi và có thể được chỉ định theo giây, phút, giờ hoặc ngày. Đây là một yếu tố quan trọng cần cân nhắc trong kế hoạch khắc phục thảm họa (DRP).

Khi RPO cho một máy tính, hệ thống hoặc mạng được xác định, nó sẽ xác định tần suất tối thiểu phải thực hiện sao lưu. Cùng với thời gian khôi phục (RTO), giúp quản trị viên lựa chọn các công nghệ và quy trình khắc phục thảm họa (DR) tối ưu nhất.

Giả sử bạn đặt RPO là 1 giờ. Điều này có nghĩa là nếu sự cố xảy ra lúc 10 giờ sáng, bạn chỉ có thể chấp nhận mất dữ liệu tối đa 1 giờ trước thời điểm đó, tức là dữ liệu mới nhất được sao lưu lúc 09 giờ sáng. Mọi thay đổi dữ liệu từ 09 giờ sáng đến 10 giờ sáng sẽ bị mất trong quá trình khôi phục.

Nếu RPO là 01 giờ thì quản trị viên phải lên lịch sao lưu ít nhất một lần mỗi giờ. Nếu RPO là 05 ngày (120 giờ), thì việc sao lưu phải diễn ra trong khoảng thời gian 120 giờ hoặc ít hơn. Trong trường hợp đó, lưu trữ đám mây (cloud storage) có thể đáp ứng tốt nhất.

Khác nhau giữa RTO và RPO
Mặc dù cả 2 RTO và RPO đều sử dụng các tiêu chí đo lường khác nhau, tuy nhiên:
  • RPO tập trung vào xử lý và hạn chế việc thất thoát dữ liệu, tập trung vào các giải pháp sao lưu.
  • RTO tập trung xử lý các vấn đề về phục hồi hệ thống, tài nguyên,... khi có sự cố bất ngờ xảy ra.
Ngoài ra, chi phí duy trì RTO cũng sẽ cao hơn nhiều so với RPO. 
Với RPO, các công việc có thể thực hiện tự động, vì chúng chỉ cần sao lưu theo đúng khoảng thời gian xác định. Còn với RTO thì điều này là không thể, vì chúng liên quan nhiều đến các hoạt động xử lý giải quyết sự cố.

RTO và RPO tỷ lệ thuận với nhau, khi RPO ngắn thì RTO cũng sẽ ngắn theo. Thời gian RTO càng ngắn thì doanh nghiệp càng ít bị ảnh hưởng bởi các sự cố đột xuất nhưng chi phí sẽ vô cùng đắt đỏ.

Cách tính RTO và RPO

Cách tính Recovery Time Objective (RTO)
RTO được tính từ thời gian hệ thống ngừng hoạt động cho đến khi chúng được khôi phục bình thường, không ảnh hưởng nhiều đến việc kinh doanh của doanh nghiệp. Cách tính RTO:
  • Xác định các ứng dụng quan trọng cần được phục hồi sau thảm họa.
  • Đo lường thời gian từ khi xảy ra sự cố đến khi hệ thống được phục hồi.
  • Tính thêm cả thời gian khắc phục thảm họa, thời gian khởi động lại hệ thống và thời gian để kiểm tra xem hệ thống đã hoạt động ổn định chưa.
Cách tính Recovery Point Objective (RPO)
RPO được tính từ thời gian gần nhất mà hệ thống phục hồi được dữ liệu cũ, sau khi có sự cố hoặc thảm họa xảy ra. Cách tính RPO:
  • Xác định các dữ liệu quan trọng trong doanh nghiệp.
  • Xác định tần suất của hoạt động sao lưu là theo giờ, theo ngày hay theo tháng.
  • Tính thời gian giữa các bản sao lưu.
  • Tính thêm thời gian để sao lưu dữ liệu và rủi ro các dữ liệu bị mất khi xảy ra sự cố.
Các phương pháp lưu trữ dữ liệu backup
Tape Backup
  • Tape là một phương tiện lưu trữ máy tính từ những năm 1950, vẫn tồn tại như một công nghệ sao lưu.
  • Ưu điểm của nó bao gồm bảo mật vì Tape bản chất là ngoại tuyến nên nó dữ liệu sao trên nó được tách khỏi mạng. Ngoài ra, các loại tape mới nhất còn lưu trữ một lượng lớn dữ liệu. Thông số định dạng LTO-9 có thể lưu trữ 18 TB trong một thẻ nhớ duy nhất và chứa dung lượng nén lên tới 45 TB.

Disk Backup
  • Disk đã trở thành công nghệ sao lưu phổ biến, đưa ra mức giá hấp dẫn hơn trước đây và thường mang lại hiệu suất nhanh hơn so với tape.
  • Tuy nhiên, lưu trữ ổ đĩa vật lý thường nằm trong văn phòng của tổ chức và do đó dễ bị hư hại hơn trong trường hợp xảy ra thảm họa thiên nhiên. Điều đó nhấn mạnh tầm quan trọng của việc áp dụng phương pháp sao lưu 3-2-1 để giúp tránh mất dữ liệu vĩnh viễn.

Cloud Backup

  • Cloud backup  là một lớp lưu trữ ngoại tuyến, bảo vệ dữ liệu doanh nghiệp khỏi các thảm họa ảnh hưởng đến trung tâm dữ liệu nội bộ.
  • Sao lưu dữ liệu đám mây như một phần của chiến lược 3-2-1. Tùy chọn này cung cấp khả năng mở rộng, chi phí thấp và loại bỏ nhu cầu mua và bảo trì phần cứng dự phòng của khách hàng. Sử dụng đám mây cũng có thể giảm bớt quá trình sao lưu từ xa. Tuy nhiên, lợi thế chi phí đó có thể thay đổi khi khối lượng dữ liệu được sao lưu trên đám mây ngày càng tăng.
Các loại phương pháp backup dữ liệu:

  • Full backup: Là việc sao lưu toàn bộ dữ liệu và tất cả các file của hệ thống. Đây là phương pháp sao lưu cơ bản và toàn diện. Phương pháp này tốn nhiều thời gian và tài nguyên lưu trữ hơn so với các phương pháp khác.
  • Differential backup(sao lưu khác biệt): Là việc sao lưu các file đã thay đổi kể từ lần sao lưu (full) cuối cùng. Đây là phương pháp tiết kiệm thời gian và tài nguyên hơn so với Full backup.
  • Incremental backup(sao lưu tăng dần): Là việc sao lưu các file đã thay đổi kể từ lần sao lưu gần nhất. Đây là phương pháp tiết kiệm thời gian và tài nguyên lưu trữ nhất trong ba phương pháp.

Những khác biệt giữa Incremental backup và Differential backup được tóm tắt như sau:

Incremental backup

Differential backup

Đối chiếu với lần incremental backup cuối cùng.

Đối chiếu với lần backup full cuối cùng

Backup nhanh chóng vì so sánh với bản incremental backup cuối cùng.

Chậm hơn vì phải so sánh với bản backup full cuối cùng rồi xác định tất cả các thay đổi.

Yêu cầu ít băng thông hơn khi upload vì phần dữ liệu đã thay đổi sẽ tương đối ít hơn.

Yêu cầu nhiều băng thông hơn incremental backup vì so sánh được thực hiện với dữ liệu backup full mỗi khi thực hiện.

Khôi phục dữ liệu sẽ cần backup toàn bộ dữ liệu và tất cả bản sao incremental.

Việc khôi phục dữ liệu chỉ cần bản backup full và bản sao differential cuối cùng.

Việc khôi phục chậm hơn, vì tất cả các bản sao phải được đối chiếu.

Việc khôi phục diễn ra nhanh hơn vì chỉ bản sao mới nhất phải được đối chiếu.

Reset lại bit lưu trữ.

Không phải reset lại bit lưu trữ.

Nguy cơ mất dữ liệu cao hơn.

Nguy cơ mất dữ liệu tương đối thấp hơn.

Chọn Incremental backup, nếu:
  • Khoảng thời gian giữa các lần backup full dài.
  • Dung lượng bộ nhớ sắp hết.
  • Muốn các cửa sổ sao lưu ngắn.
  • Bạn đang xử lý dữ liệu nhạy cảm và muốn sao lưu từng giờ.

Chọn Differential backup, nếu:
  • Không gian lưu trữ không phải là vấn đề.
  • Việc sao lưu thường kéo dài cả đêm và không cản trở bất kỳ quá trình nào khác.
  • Thời gian giữa các lần backup full ít hơn.
  • Khôi phục dữ liệu nhanh chóng là một yêu cầu quan trọng.








Comments are closed.