fbpx

Xác định lại bộ nhớ để có tính khả dụng cao (HA)

Xác định lại bộ nhớ để có tính khả dụng cao (HA)

Ngày nay, các dịch vụ mạng hoạt động dựa vào Internet. Ngay cả thời gian ngừng hoạt động ngắn nhất cũng có thể gây ra tổn thất lớn cho doanh nghiệp. Sự cố ngừng hoạt động có thể dẫn đến mất doanh thu, gián đoạn hoạt động kinh doanh, tăng cường bảo mật và rủi ro liên quan đến gian lận cũng như khả năng truy cập dữ liệu khủng khiếp. Trong một thảm họa như vậy, hình ảnh công ty có thể bị tổn hại và sự hài lòng của khách hàng có thể không thể sửa chữa được. Do đó, thiết kế và chạy một hệ thống có tính khả dụng cao là chìa khóa để tránh thời gian chết.

Tính khả dụng cao High Availability là gì?

Tính khả dụng có nghĩa là phần trăm tổng thời gian mà hệ thống máy tính có thể được truy cập trong quá trình làm việc bình thường. Bạn có thể cho rằng tính sẵn có tối ưu là 100%, nhưng rất khó đạt được. Hệ thống HA (Tính khả dụng cao) là những hệ thống có tính khả dụng trực tuyến trong khoảng thời gian 99,9% đến 99,999%. HA lý tưởng là 99,999% (“fine nines”) và chỉ có thể chịu được khoảng năm phút thời gian chết trong một năm.

Availability % Downtime per Year Downtime per Month Downtime per Week
90% (“one nine”) 36.5 days 72 hours 16.8 hours
99% (“two nine”) 3.65 days 7.20 hours 1.68 hours
99.9% (“three nine”) 8.76 hours 43.8 minutes 10.1 minutes
99.99% (“four nine”) 52.56 minutes 4.32 minutes 1.01 minutes
99.999% (“five nine”) 5.26 minutes 25.9 seconds 6.05 seconds
99.9999% (“six nine”) 31.5 seconds 2.59 seconds 0.605 seconds

HA có thể được cải thiện thông qua khả năng chịu lỗi. Dựa trên một kiến ​​trúc phần cứng và phần mềm phức tạp, tất cả các bộ phận của hệ thống hoạt động hoàn toàn độc lập với nhau. Do đó, sự cố của bất kỳ thành phần nào không làm hỏng toàn bộ hệ thống.

Hiểu về RPO và RTO

RTO (Recovery Time Objective) và RPO (Recovery Point Objective) là hai tham số quan trọng nhất trong kế hoạch khôi phục dữ liệu hoặc khôi phục sau thảm họa. Những mục tiêu này có thể hướng dẫn các công ty lựa chọn phương án sao lưu dữ liệu tốt nhất.

RTO là khoảng thời gian ứng dụng có thể được tắt mà không gây tổn hại đáng kể cho doanh nghiệp. Một số ứng dụng có mức độ ưu tiên cao chỉ có thể ngừng hoạt động trong vài giây mà không gây ra phiền toái đến khách hàng và tổn thất kinh doanh. Trên thực tế, RTO càng ngắn trong các ứng dụng quan trọng sẽ càng tốt.

RPO là thước đo lượng dữ liệu tối đa cho phép bị mất. Nó cũng giúp đo thời gian có thể xảy ra giữa lần sao lưu dữ liệu cuối cùng và thảm họa mà không gây ra tổn thất kinh doanh nghiêm trọng. Trên thực tế, RPO không cho phép mất dữ liệu trong các ứng dụng quan trọng.

Yêu cầu đối với lưu trữ HA

Chúng tôi liệt kê các yêu cầu đối với việc lưu trữ HA, tùy thuộc vào ba thông số. Chúng là tỷ lệ phần trăm khả dụng, RTO (Recovery Time Objective) và RPO (Recovery Point Objective).

HA Storage Type Near HA Native HA True HA
Availability % (Downtime per Year) 99.9% (8.76 hours) 99.999% (5.26 minutes) 99.9999% (31.5 seconds)
RTO (Recovery Time Objective) < 5 minutes < 30 seconds < 30 seconds
RPO (Recovery Point Objective) ≠ 0 = 0 = 0

Lưu trữ HA là một hệ thống lưu trữ có thể chạy liên tục hoặc cung cấp ít nhất 99% thời gian hoạt động. Dự phòng là một tính năng chính của lưu trữ HA vì nó loại bỏ SPOF (Single Points Of Failure). Một mảng lưu trữ HA yêu cầu ít nhất hai bộ điều khiển nếu một bộ điều khiển bị lỗi hoặc bị mất. Các yêu cầu cơ bản khác đối với HA là các thành phần mô-đun dự phòng và có khả năng chịu lỗi như PSU, mô-đun FAN và giao diện ổ đĩa cổng kép. Cập nhật chương trình cơ sở không có thời gian ngừng hoạt động của hệ thống sẽ giữ cho bộ nhớ hoạt động.

Để khôi phục thảm họa, bộ lưu trữ HA yêu cầu hệ thống lưu trữ dự phòng tiếp quản dữ liệu và ứng dụng quan trọng mà doanh nghiệp cần khi một trong số chúng chuyển sang chế độ ngoại tuyến. Nó còn được gọi là chuyển đổi dự phòng. Với chuyển đổi dự phòng, các tác vụ sẽ tự động được định tuyến lại thành công việc phụ trong thời gian ngừng hoạt động theo kế hoạch hoặc ngoài kế hoạch.

Người dùng có thể xây dựng các dịch vụ HA của họ dựa trên các ứng dụng. Các dịch vụ có tỷ lệ phần trăm khả dụng cao hơn có thể được thực hiện thông qua các cơ chế hoàn thiện hơn. Tất nhiên, nó tốn rất nhiều chi phí vì nó cần phải cân nhắc nhiều hơn.

Lấy sao lưu dữ liệu thường xuyên làm ví dụ, nó có thể yêu cầu 99,9% thời gian hoạt động. RTO của nó sẽ ổn sau 5 phút. Nếu bị mất dữ liệu, việc gửi lại dữ liệu cũng có thể được chấp nhận.

Trong các dịch vụ quan trọng của sứ mệnh như dịch vụ email doanh nghiệp hoặc giám sát quy mô lớn, chúng yêu cầu 99,999% thời gian hoạt động và không thể chịu được việc mất dữ liệu. Nếu thời gian ngừng hoạt động quá lâu, máy chủ có thể bị lỗi và bắt đầu bỏ các gói I / O khi có quá nhiều lần thử lại. Tại thời điểm này, các email đặt hàng quan trọng có thể bị mất hoặc không ghi lại được hình ảnh của những thời điểm quan trọng.

Trong một dịch vụ không ngừng trực tuyến, các điều kiện nghiêm ngặt hơn. Sử dụng AFA (All-Flash Array, vui lòng tham khảo tại đây) với tính năng bảo vệ RAID EE (vui lòng tham khảo tại đây) và cơ chế C2F (Cache-To-Flash, vui lòng tham khảo tại đây) phù hợp với tính toán cao hơn và dịch vụ không bị gián đoạn.

So sánh lưu trữ HA

Dựa trên ba chỉ số về lưu trữ HA, hãy so sánh bộ lưu trữ bộ điều khiển Dual Controller và cụm lưu trữ 2-node.

Dual Controller Storage                                vs.                                2-Node Storage Cluster

Dual Controller Storage 2-Node Storage Cluster
Availability % (Downtime per Year) At least 99.999% (5.26 minutes) 99.9% (8.76 hours)
RTO (Recovery Time Objective) < 30 seconds > 1 minutes
RPO (Recovery Point Objective) = 0 ≠ 0

Các tính năng của lưu trữ bộ điều khiển dual controller (active-active) là khả năng sẵn sàng ít nhất là 99,999%, RTP <30 giây và không mất dữ liệu cho RPO. Tuy nhiên, cụm lưu trữ 2 nút với kiến ​​trúc chủ động-thụ động không thể đạt tới RPO = 0 do thiếu C2F và RTO của nó có thể lớn hơn 1 phút. Do đó, tổng phần trăm khả dụng có thể là 99,9% thời gian hoạt động.

Kiến trúc bộ điều khiển hoạt động tích cực có thể cung cấp dịch vụ lưu trữ thời gian thực song song cùng một lúc. Kiến trúc hoạt động tích cực tăng gấp đôi băng thông máy chủ có sẵn và tốc độ truy cập bộ nhớ cache, đảm bảo rằng không có tài nguyên lãng phí trong hệ thống. hêm vào đó, bộ điều khiển dual-controller all-in-one với ổ cứng SAS cổng kép tiết kiệm chi phí và dễ triển khai so với cụm lưu trữ 2-node.

Cả hai kiến ​​trúc đều yêu cầu lưu trữ HA, bạn chọn gì?

Kết luận

Bằng cách giữ cho doanh nghiệp của bạn trực tuyến trong các ứng dụng quan trọng, bạn sẽ luôn có thể kinh doanh mà không bị mất bất kỳ doanh thu nào. Một thiết kế HA chất lượng sẽ tạo dựng được lòng tin của khách hàng bằng cách luôn trực tuyến và có sẵn. Đối với bộ lưu trữ HA thực, bạn có thể xem lại các điều kiện như tỷ lệ phần trăm khả dụng, RTO và RPO có đúng không.

Bài viết tham khảo: Redefine Storage for High Availability (HA)

Facebook Comments
Chia sẻ với bạn bè

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *