Trước những nghi ngại về tính minh bạch, DeepSeek đã "phản pháo" dư luận bằng việc mở mã nguồn hệ thống tập tin "Fire-Flyer" (3FS), hứa hẹn mang đến cuộc cách mạng trong tốc độ xử lý dữ liệu AI. Giới chuyên gia đánh giá, đây là bước tiến đột phá, có thể thay đổi cục diện ngành công nghiệp AI.
Trong sự kiện Open Source Week, DeepSeek đã công bố 3FS, hệ thống tập tin dựa trên Linux được tối ưu hóa cho huấn luyện và suy luận AI. 3FS tận dụng các tính năng của ổ cứng SSD hiện đại và mạng RDMA, cho phép truy cập dữ liệu tốc độ cao, loại bỏ bộ nhớ đệm đọc và ưu tiên các yêu cầu đọc ngẫu nhiên, phù hợp với đặc thù của các mô hình AI.
Thử nghiệm cho thấy, 3FS đạt thông lượng đọc tổng hợp 6,6 TiB/giây trong cụm 180 node (máy chủ) của một cluster (hệ thống gồm nhiều máy chủ được kết nối với nhau), một con số vô cùng ấn tượng. Perspective AI đánh giá đây là "điểm chuẩn cấp độ tiếp theo", mở ra tiềm năng cho các ứng dụng AI, nghiên cứu khoa học và các lĩnh vực cần xử lý dữ liệu lớn.
DeepSeek cũng khẳng định, nhờ 3FS và các thành phần khác trong ngăn xếp phần mềm, họ đã đạt được 80% hiệu năng của máy chủ Nvidia DGX-A100 với chi phí chỉ bằng 50% và mức tiêu thụ năng lượng thấp hơn 40%.
Việc mở mã nguồn 3FS và các sản phẩm phần mềm khác như FlashMLA, DeepEP, DeepGEMM là một phần trong nỗ lực của DeepSeek nhằm chứng minh tính minh bạch và thúc đẩy sự hợp tác trong cộng đồng AI.