Làm thế nào để biết được dịch vụ kiểm tra Uptime nào tốt

Chuyện chẳng có gì lạ, dịch vụ nào cũng nói mình hay thôi cho đến khi người dùng phát hiện ra vấn đề của họ! Trong bài viết mà tôi giới thiệu về 3 dịch vụ kiểm tra uptime website chất lượng, tôi có nói cảm nhận của mình là updown.io tốt hơn so với freshping.io. Tôi có cơ sở cho điều đó dựa vào trải nghiệm trước đây, nhưng trải nghiệm đó không nhiều, do vậy trước khi đi đến kết luận có tính khẳng định, tôi sẽ phải thực hiện kiểm tra kỹ càng hơn.

Các dịch vụ không đứng yên một chỗ, nó thay đổi chất lượng qua thời gian, danh tiếng có thể là một trong các tiêu chí quan trọng để bạn biết được sản phẩm nào đó có ổn hay không. Nhưng suy cho cùng để biết ở thời điểm hiện tại, dịch vụ mà bạn muốn dùng có chất lượng ra sao thì bạn phải kiểm tra nó.

Hai dịch vụ đưa vào kiểm tra có tính đại diện tốt:

  • updown.io: chỉ có các gói thu phí, nó có interval rất cao, với tần số kiểm tra cao nhất cho phép chọn là 15s/lần, giá thành của updown rất cạnh tranh (rẻ hơn) so với nơi khác
  • freshping.io: dịch vụ freemium có tần số kiểm tra ngay cả ở gói free là 1 phút/lần. Không nhiều dịch vụ miễn phí cho kiểm tra ở tần số tốt như vậy, ví dụ Uptime Robot một dịch vụ nổi tiếng khác chỉ cho kiểm tra với tần số 5 phút/lần với gói miễn phí

Cả hai đều có giao diện người dùng hiện đại, cho phép tên miền tùy chỉnh dễ dàng.

Kịch bản kiểm tra

Bạn cần một kịch bản để kiểm tra uptime, mục tiêu là làm website bị gián đoạn và làm độ trễ phản hồi gia tăng để xem các ứng dụng kiểm tra uptime có phát hiện được hay không. Tôi đề xuất một số kịch bản sau, bạn có thể thử một trong số chúng hoặc tất cả:

  • Làm sai lệch dịch vụ DNS: Bạn thử trỏ DNS của tên miền đến IP ngẫu nhiên để làm gián đoạn website hoặc xóa bỏ tất cả các bản ghi DNS sẵn có của trang cũng cho hệ quả tương tự
  • Làm gián đoạn hosting: Bạn thử tạm dừng hoạt động của hosting để làm gián đoạn website
  • Làm sai lệch tên bảng database: Để việc kết nối với cơ sở dữ liệu không thành công, qua đó làm gián đoạn website
  • Stress test: Bạn giả lập số lượng người dùng lớn (chẳng hạn 500 người truy cập đồng thời) để thử thời gian phản hồi của trang. Nếu khả năng cho phép bạn có thể gia tăng số lượng người truy cập website để quan sát hiện tượng trang bị sập và bị gián đoạn

Để kiểm tra công bằng, môi trường kiểm tra phải được thiết lập giống nhau:

  • URL kiểm tra cần giống nhau giữa cả hai dịch vụ check uptime
  • Interval giống nhau, nếu dịch vụ này kiểm tra với interval là 1s/lần thì dịch vụ kiểm tra khác cũng phải được cài đặt như vậy

OK, vậy là xong các bước cơ bản, giờ chúng ta đi vào phần chính.

Các thử nghiệm

Tôi sẽ dùng CloudFlare – DNS trung gian có tốc độ cập nhật bản ghi cực nhanh để thử làm sai lệch dịch vụ DNS của tên miền.

Kết quả, updown.io ngay lập tức phát hiện ra vấn đề:

updown.io phát hiện rất nhanh vấn đề

Trong khi freshping.io thì không:

Freshping không phát hiện được downtime

Sau khi chủ động để website downtime hơn 3 tiếng, kết quả cả hai hệ thống đều phát hiện ra được và đều gửi email cảnh báo về nhưng hệ thống của updown.io gửi email cảnh báo sớm hơn freshping.io 15 phút.

Giờ tôi sẽ khôi phục lại website, rồi sau đó để gián đoạn trong thời gian ngắn hơn, khoảng 10 phút xem freshping có phát hiện ra không. Với updown.io như chúng ta đã thấy gần như sau vài chục giây bị gián đoạn nó đã phát hiện ra rồi.

Kịch bản bị gián đoạn từ 3 – 5 phút phổ biến hơn, không nhiều trường hợp bị gián đoạn cả 3 tiếng. Nếu freshping không phát hiện ra gián đoạn ngắn, việc dùng nó cần phải cân nhắc, kể cả cho dù freshping miễn phí.

Kết quả khả quan hơn tôi nghĩ. Tôi để gián đoạn website khoảng 3 phút, bằng cách stop server trên Vultr. Freshping đã phát hiện ra và gửi email cảnh báo, nó xác định chính xác thời gian bị gián đoạn:

Fresh Ping báo website bị gián đoạn

Lần này, biểu đồ cảnh báo của nó cũng phát hiện gián đoạn sớm hơn so với việc điều chỉnh DNS:

biểu đồ phát hiện downtime

Với Updown.io, như mọi khi nó phát hiện gián đoạn rất sớm và nhanh:

updown.io phát hiện gián đoạn

Kết luận

Một thí nghiệm nhỏ giúp tôi xác định chất lượng của 2 dịch vụ kiểm tra uptime và xóa bỏ một số hiểu lầm với Freshping:

  • updown.io có chất lượng tốt: nó phát hiện downtime nhanh, cả trên biểu đồ lẫn thông qua việc gửi email. Việc bị gián đoạn gần như ngay lập tức được công cụ này phát hiện
  • freshping cũng phát hiện nhanh downtime trong trường hợp stop server, nhưng với trường hợp thay đổi DNS nó phát hiện chậm hơn so với updown.io. Freshping cũng gửi email phát hiện downtime trong cả hai trường hợp. Tuy vậy biểu đồ của nó có vẻ không hiển thị chính xác như biểu đồ của updown.io, chủ yếu do phần test với DNS của nó kém hơn

Bonus

Nếu bạn nào dùng Freshping, có thể vào phần Setting > Acount Setting để chỉnh lại một số thứ như sau:

cài đặt Freshping

Trong đó bạn chú ý đến hai phần:

  • Timezone: bạn chủ động chọn Indochina Time – Ho Chi Minh City để báo cáo thống kê của nó khớp với giờ ở Việt Nam
  • Alert sensivity for email alerts: mặc định nó để là Low, nghĩa là thời gian downtime phải kéo dài ít nhất là 2 phút nó mới gửi thông báo, bạn nào cần hệ thống cảnh báo ngay lập tức khi có downtime thì chuyển sang High. Cuối cùng nhấn Save Changes để lưu

Leave a Comment