Góc khuất đằng sau nguyên nhân Facebook sập toàn cầu

Facebook khẳng định lỗi thay đổi cấu hình là nguyên nhân gốc rễ khiến Facebook cùng các ứng dụng WhatsApp, Messenger và Instagram bị sập trong gần 6 giờ đêm 4/10, khiến 3,5 tỉ người dùng của họ không thể truy cập.

"Đội ngũ kỹ thuật phát hiện những thay đổi cấu hình trên các bộ định tuyến xương sống điều phối lưu lượng mạng giữa các trung tâm dữ liệu của chúng tôi là nguyên nhân gây ra sự cố gián đoạn" – Facebook cho biết.

Facebook, Instagram, Messenger và WhatsApp đã hoạt động trở lại vào chiều 4/10 (giờ ET) sau sự cố nêu trên. Khi đó, Facebook đã xin lỗi nhưng không giải thích tức thì nguyên nhân gián đoạn.

"Với mỗi doanh nghiệp lớn và nhỏ, gia đình và những cá nhân phụ thuộc vào dịch vụ của chúng tôi, tôi xin lỗi" – Giám đốc công nghệ Facebook Mike Schroepfer bày tỏ, đồng thời cho biết thêm "phải mất một khoảng thời gian để dịch vụ trở lại 100%".

Theo nhiều nhân viên giấu tên của Facebook, sự cố gián đoạn nêu trên có thể do lỗi nội bộ liên quan đến cách chuyển lưu lượng truy cập internet đến các hệ thống.

Lỗi của các công cụ liên lạc nội bộ và các tài nguyên khác dựa vào hệ thống này để hoạt động đã khiến sự cố thêm nghiêm trọng, nhóm nhân viên này nói thêm.

Góc khuất đằng sau nguyên nhân Facebook sập toàn cầu - 1

"Facebook về cơ bản là đã khóa xe và bỏ quên chìa khóa trong xe" – chuyên gia Jonathan Zittrain của Trung tâm Internet và Xã hội Berkman Klein thuộc Trường ĐH Harvard (Mỹ) khẳng định trên mạng xã hội Twitter.

Trong khi đó, chuyên gia Troy Mursch của Công ty Bad Packets (Mỹ) cho rằng sự cố gián đoạn của Facebook có thể liên quan đến Hệ thống tên miền (DNS) – thường được mô tả là danh bạ điện thoại của internet.

Lỗi DNS vốn phổ biến, có thể xảy ra vì vấn đề kỹ thuật, thường là những vấn đề liên quan đến cấu hình.

"Sự cố gián đoạn của Facebook dường như xuất phát từ DNS. Tuy nhiên, đây chỉ là triệu chứng của vấn đề" – ông Mursch khẳng định.

Vấn đề cơ bản, theo ông Mursch và những chuyên gia khác, là Facebook đã rút giao thức tìm đường nòng cốt trên internet (BGP). Nếu DNS là danh bạ điện thoại của internet, BGP là hệ thống định vị. Câu hỏi được đặt ra là tại sao BGP lại biến mất ngay từ đầu.

Góc khuất đằng sau nguyên nhân Facebook sập toàn cầu - 2

Bản đồ cho thấy kết nối đến Facebook bị gián đoạn vào ngày 4-10. Về cơ bản kết nối bị gián đoạn ở mọi nơi, cùng lúc. Ảnh: Cisco

Chuyên gia John Graham-Cumming của Công ty Cloudflare (Mỹ) nói rằng câu trả lời khả dĩ nhất là lỗi cài đặt cấu hình từ bên trong Facebook.

"Có vẻ như Facebook đã làm gì đó với các bộ định tuyến của họ, những bộ kết nối mạng Facebook với phần còn lại của internet" – ông Graham-Cumming khẳng định với Wired.

Chuyên gia Doug Madory của Công ty Kentik (Mỹ) khẳng định đây là đợt gián đoạn quy mô lớn nhất mà bà từng chứng kiến từ một công ty internet tầm cỡ như Facebook.

"Với nhiều người, Facebook là internet" – ông Madory nói, đồng thời cho biết thêm các công ty thường mất kết nối internet khi cập nhật cấu hình mạng.