• Sự cố ngừng hoạt động của Cloudflare cho thấy Internet phụ thuộc vào một số nhà cung cấp đến mức nào.
  • Những thất bại gần đây của AWS và Azure nhấn mạnh sự cần thiết phải có kế hoạch dự phòng tốt hơn.

Cloudflare đã phải đối mặt với sự cố ngừng hoạt động lớn trong tuần này khiến phần lớn Internet bị sập trong vài giờ. Các trang web như ChatGPT, Spotify, Canva và trang web theo dõi ngừng hoạt động Down detector hiển thị thông báo lỗi thay vì tải bình thường.

Sự cố bắt đầu xảy ra ngay sau 11:30 GMT, khi hàng nghìn người dùng bắt đầu báo cáo sự cố trong danh sách rộng rãi các ứng dụng và trang web. Down detector, công ty thu thập các báo cáo đó, cũng bị ảnh hưởng.

Cloudflare cho biết sự cố ngừng hoạt động bắt đầu khi một tệp cấu hình nhằm quản lý lưu lượng truy cập của mối đe dọa không thành công và “gây ra sự cố” trong phần mềm xử lý các yêu cầu trong dịch vụ của nó.

Công ty cho biết: “Chúng tôi xin lỗi khách hàng và Internet nói chung vì đã làm các bạn thất vọng ngày hôm nay”. Nó cũng lưu ý rằng “do tầm quan trọng của các dịch vụ của Cloudflare, bất kỳ sự cố ngừng hoạt động nào đều không thể chấp nhận được”.

Sự cố đã được khắc phục nhưng công ty cảnh báo rằng một số dịch vụ vẫn có thể hiển thị lỗi khi chúng trực tuyến trở lại.

Tác động rất rộng. Người dùng nhận thấy sự chậm trễ hoặc gặp sự cố khi mở các ứng dụng như Grindr, Zoom và Canva. Trang web của ChatGPT đã yêu cầu người dùng “vui lòng bỏ chặn các thử thách trên cloudflare.com để tiếp tục”.

Cloudflare cung cấp bảo mật internet và quản lý lưu lượng truy cập cho một lượng lớn trang web. Nó kiểm tra xem khách truy cập vào trang web là người thật hay bot và cung cấp các dịch vụ khác giúp duy trì trang web trực tuyến khi có lưu lượng truy cập lớn. Công ty cho biết khoảng 20% ​​​​tất cả các trang web sử dụng các công cụ của họ theo một cách nào đó.

Cloudflare nhấn mạnh rằng vấn đề là do kỹ thuật. Tuyên bố của họ cho biết: “Nói rõ hơn, không có bằng chứng nào cho thấy đây là kết quả của một cuộc tấn công hoặc do hoạt động độc hại gây ra”.

Sự cố ngừng hoạt động diễn ra chỉ một tháng sau khi Amazon Web Services ngừng hoạt động, khiến hơn một nghìn trang web và ứng dụng bị ngoại tuyến. Các vấn đề tương tự cũng xảy ra với Microsoft Azure và AWS trong cùng tuần, làm gián đoạn các phần chính của Internet phụ thuộc vào các nhà cung cấp lớn này.

Mehdi Daoudi, Giám đốc điều hành và đồng sáng lập của công ty giám sát Catchpoint, cho biết chuỗi thất bại gần đây sẽ là “lời cảnh tỉnh” cho các công ty. “Mọi người đều bỏ tất cả trứng vào một giỏ và sau đó họ ngạc nhiên khi có vấn đề,” ông nói. “Về phía công ty, họ phải đảm bảo rằng họ có khả năng dự phòng và khả năng phục hồi.”

Cloudflare hỗ trợ phần lớn trang web thông qua mạng phân phối nội dung, bảo vệ DDoS và dịch vụ DNS. Năm ngoái, công ty cho biết mạng lưới của họ chiếm khoảng 1/5 lưu lượng truy cập internet và phục vụ 35% công ty trong danh sách Fortune 500, cùng với nhiều công ty khác.

Sự cố ngừng hoạt động cũng mang lại sự chú ý mới về mức độ phụ thuộc của Internet vào một nhóm nhỏ các nhà cung cấp cơ sở hạ tầng. Sau khi sự cố ngừng hoạt động gần đây của AWS làm gián đoạn ứng dụng nhắn tin an toàn Signal, chủ tịch của nó, Meredith Whittaker, cho biết công ty không có lựa chọn nào khác ngoài việc sử dụng một nhà cung cấp lớn.

Jake Moore, Cố vấn An ninh Toàn cầu tại ESET, cho biết vài tháng qua đã cho thấy những hệ thống này có thể mỏng manh đến mức nào. Ông nói: “Các công ty thường buộc phải phụ thuộc nhiều vào những công ty như Cloudflare, Microsoft và Amazon để lưu trữ các trang web và dịch vụ của họ vì không có nhiều lựa chọn khác”. Ông nói thêm rằng các hệ thống DNS, dịch tên trang web thành những con số mà máy tính có thể hiểu được, “dựa trên một mạng cũ, lỗi thời” có thể bị lỗi theo cách gây ra sự cố ngừng hoạt động trên quy mô lớn. Mặc dù khó có thể thay thế hệ thống này, nhưng ông lưu ý rằng các nhà cung cấp đám mây lớn có xu hướng có biện pháp bảo vệ mạnh mẽ hơn những nhà cung cấp nhỏ hơn.

Cloudflare cho biết họ hiện đã khôi phục dịch vụ của mình sau thời gian ngừng hoạt động. Theo công ty, tệp cấu hình được tạo tự động nhằm quản lý các mối đe dọa bảo mật đã phát triển quá lớn và làm hỏng phần mềm định tuyến lưu lượng truy cập cho một số dịch vụ của công ty. Công ty cho biết họ đã triển khai bản sửa lỗi nhưng cảnh báo rằng một số khách hàng vẫn có thể gặp sự cố khi hệ thống khôi phục trên toàn thế giới. Cổ phiếu của nó giảm 2,3% trong phiên giao dịch buổi sáng.

Doc quyen Cach chinh phu Dubai chuyen doi cac dich TechWire Vietnam Sự cố ngừng hoạt động của Cloudflare cho thấy mức độ phụ thuộc của web vào một số nhà cung cấp

Bạn muốn trải nghiệm toàn bộ quá trình đổi mới công nghệ của doanh nghiệp? Tham gia TechEx ở Amsterdam, California và London. Bao gồm AI, Dữ liệu lớn, An ninh mạng, IoT, Chuyển đổi kỹ thuật số, Tự động hóa thông minh, Điện toán biên và Trung tâm dữ liệu, TechEx tập hợp các nhà lãnh đạo toàn cầu để chia sẻ các trường hợp sử dụng trong thế giới thực và hiểu biết sâu sắc. Bấm vào đây để biết thêm thông tin.

Tech Wire Asia được cung cấp bởi TechForge Media. Khám phá các sự kiện và hội thảo trực tuyến về công nghệ doanh nghiệp sắp tới khác tại đây.

Chia sẻ.
Để lại bình luận