Theo TechSpot, siêu máy tính Eos của Nvidia, được thiết kế chuyên cho các tác vụ xử lý AI, đã chính thức lộ diện với những thông số ấn tượng. Được mệnh danh là "nhà máy AI", Eos là minh chứng cho sức mạnh của công nghệ NVIDIA khi hoạt động ở quy mô lớn.
Eos sở hữu 576 hệ thống Nvidia DGX H100, mỗi hệ thống trang bị 8 GPU H100 Tensor Core, với tổng cộng 4.608 GPU. Ngoài ra, siêu máy tính này còn được trang bị mạng lưới Nvidia Quantum-2 InfiniBand và phần mềm chuyên dụng. Sự kết hợp này mang lại hiệu suất AI FP8 lên tới 18.4 exaflop.
Với kiến trúc mạng hỗ trợ tốc độ truyền dữ liệu lên đến 400Gb/s, Eos có thể huấn luyện các mô hình ngôn ngữ lớn, hệ thống đề xuất và mô phỏng lượng tử, cùng nhiều tác vụ AI khác. Nvidia cho biết Eos được xây dựng dựa trên kiến thức từ các siêu máy tính Nvidia DGX trước đó như Saturn 5 và Selene. Hiện tại, các nhà phát triển của Nvidia đang sử dụng Eos cho các nghiên cứu về AI.
Eos đã gây chú ý khi xếp hạng thứ 9 trong danh sách Top500 của những siêu máy tính nhanh nhất thế giới vào năm ngoái. Siêu máy tính đứng đầu trong bảng xếp hạng Top500 là hệ thống Frontier tại Phòng thí nghiệm Quốc gia Oak Ridge ở Tennessee (Mỹ), với điểm HPL là 1.194 PFlop/s, trong khi Eos đạt 121.4 PFlop/s. Rất có thể điểm số này sẽ được cải thiện trong thời gian tới.
Tháng 11 năm ngoái, Eos đã hoàn thành bài benchmark huấn luyện MLPerf dựa trên mô hình GPT-3 với 175 tỷ tham số được huấn luyện trên 1 tỷ token chỉ trong 3,9 phút - cải thiện gần 3 lần so với 10,9 phút của 6 tháng trước. Nvidia tuyên bố rằng do benchmark sử dụng một phần của bộ dữ liệu GPT-3 hoàn chỉnh, bằng cách ngoại suy, Eos giờ đây có thể huấn luyện chỉ trong 8 ngày, nhanh hơn 73 lần so với hệ thống sử dụng 512 GPU A100, vốn là tiêu chuẩn hiệu suất cao nhất khi GPT-3 ra mắt vào năm 2020.
Eos cũng đi kèm với một bộ phần mềm tích hợp dành cho phát triển và triển khai AI, bao gồm quản lý dàn máy và biên dịch, lưu trữ tính toán và thư viện mạng được tăng tốc, cùng với hệ điều hành được tối ưu hóa cho khối lượng công việc AI.