Theo TechRadar, Google đã tiết lộ thêm thông tin về sự việc khiến họ phải đóng cửa một trong những trung tâm dữ liệu lớn ở London (Anh) vào ngày nóng nhất trong năm của nước này tính đến thời điểm hiện nay, ngày 19/7 với nhiệt độ lên đến 40 độ C.
Theo Google, sự “thất thủ” của khu vực dữ liệu “europe-west2-a” vào tháng trước là do không duy trì được nhiệt độ hoạt động ở mức an toàn, vì hàng loạt sự cố của các hệ thống làm mát dự phòng xảy ra cùng lúc với tình trạng nhiệt độ bên ngoài môi trường quá cao.
Sự cố đã ảnh hưởng đến nhiều dịch vụ của Google, bao gồm Google Compute Engine, Persistent Disk (PD), và Google Cloud Storage, gây ra các trường hợp mất kết nối, xuống cấp dịch vụ và các sự cố mạng.
Chi tiết sự việc tắt máy chủ để “trốn nhiệt”
Hệ thống làm mát của các trung tâm dữ liệu đã gặp sự cố và cần được sửa chữa, điều này khiến các kỹ sư của Google phải tắt trung tâm dữ liệu khu vực Europe-west2-a. Những sự cố này đã tác động lên các dịch vụ đám mây trong khoảng 18 giờ 23 phút.
Đây là một tin tức khá đáng lo ngại, đặc biệt là khi Google từng tuyên bố các dịch vụ của khu vực này được thiết kế để có thể duy trì các hoạt động ngay sau khi xảy ra sự cố cục bộ.
Google cho rằng sự cố đã vô tình sửa đổi định tuyến lưu lượng cho các dịch vụ nội bộ của cả ba khu vực thuộc “europe-west2”, không chỉ riêng “europe-west2-a” bị ảnh hưởng. Sự cố định tuyến đã khiến khách hàng không thể truy cập dữ liệu từ các dịch vụ lưu trữ tại khu vực, trong đó có GCS và BigQuery.
Nhiều dịch vụ đám mây của Google gặp sự cố vì máy chủ ở Anh tạm ngưng hoạt động.
Sự cố máy chủ liệu sẽ còn tiếp diễn?
Đối với những người đang lo ngại về tình trạng nóng dần lên toàn cầu, thì tin tức này sẽ khá đáng ngại, vì Vương quốc Anh có thể sẽ chứng kiến một vài ngày thậm chí còn nóng hơn trong tương lai.
Để đối phó với tình trạng này, Google đã thực hiện một số cam kết để ngăn chặn những sự cố tương tự ảnh hưởng đến dịch vụ lưu trữ đám mây của công ty một lần nữa. Bao gồm việc sửa chữa và kiểm tra lại tính năng tự động chuyển đổi dự phòng, nhằm đảm bảo khả năng phục hồi mạnh mẽ hơn khi đối mặt với các sự kiện quy mô lớn như sự cố vừa xảy ra.
Gã khổng lồ đám mây cũng cam kết nghiên cứu và phát triển các phương pháp tiên tiến hơn để giảm tải nhiệt độ trong không gian của một trung tâm dữ liệu, giảm xác suất phải tắt hoàn toàn các máy chủ.
Ngoài ra, Google được cho là sẽ kiểm tra các quy trình, công cụ và hệ thống khôi phục tự động của mình để tìm các lỗ hổng, đồng thời kiểm tra các tiêu chuẩn và thiết bị hệ thống làm mát của các trung tâm dữ liệu có Google Cloud trên toàn cầu.