Tháng 4 vừa qua, Meta tiết lộ rằng họ đang phát triển sản phẩm đầu tiên cho ngành AI: một nền tảng mã nguồn mở có hiệu suất sánh ngang với các nền tảng tốt nhất hiện nay từ các công ty như OpenAI. Giờ đây, nền tảng đó đã ra mắt.
Meta đang phát hành Llama 3.1, mô hình AI mã nguồn mở lớn nhất từ trước đến nay, được công ty tuyên bố là vượt trội hơn GPT-4o và Claude 3.5 Sonnet của Anthropic trên một số điểm chuẩn.
Công ty cũng đang cung cấp trợ lý Meta AI dựa trên Llama ở nhiều quốc gia và ngôn ngữ hơn, đồng thời bổ sung một tính năng có thể tạo hình ảnh dựa trên hình ảnh mẫu của một người cụ thể. CEO Mark Zuckerberg hiện dự đoán rằng Meta AI sẽ là trợ lý được sử dụng rộng rãi nhất vào cuối năm nay, vượt qua cả ChatGPT.
Llama 3.1 phức tạp hơn đáng kể so với các mô hình Llama 3 nhỏ hơn ra mắt cách đây vài tháng. Phiên bản lớn nhất có 405 tỷ tham số và được đào tạo với hơn 16.000 GPU H100 siêu đắt tiền của Nvidia. Meta không tiết lộ chi phí phát triển Llama 3.1, nhưng chỉ dựa trên chi phí của riêng các chip Nvidia, có thể đoán chắc rằng nó tốn hàng trăm triệu USD.
Vậy, xét đến chi phí, tại sao Meta vẫn tiếp tục cung cấp Llama với giấy phép chỉ cần sự chấp thuận từ các công ty có hàng trăm triệu người dùng? Trong một lá thư được công bố trên blog công ty của Meta, Zuckerberg lập luận rằng các mô hình AI nguồn mở sẽ vượt qua, và hiện đang cải thiện nhanh hơn, các mô hình độc quyền, tương tự như cách Linux trở thành hệ điều hành nguồn mở cung cấp năng lượng cho hầu hết các điện thoại, máy chủ và tiện ích ngày nay.
Zuckerberg so sánh khoản đầu tư của Meta vào AI mã nguồn mở với Dự án Open Compute trước đó, mà ông cho biết đã tiết kiệm cho công ty "hàng tỷ USD" bằng cách có các công ty bên ngoài như HP giúp cải thiện và chuẩn hóa các thiết kế trung tâm dữ liệu của Meta khi công ty đang xây dựng năng lực của riêng mình. Nhìn về phía trước, CEO Meta kỳ vọng động lực tương tự sẽ diễn ra với AI, ông viết rằng "Tôi tin rằng bản phát hành Llama 3.1 sẽ là một bước ngoặt trong ngành mà hầu hết các nhà phát triển bắt đầu chủ yếu sử dụng mã nguồn mở".
Để giúp đưa Llama 3.1 ra thế giới, Meta đang hợp tác với hơn 20 công ty, bao gồm Microsoft, Amazon, Google, Nvidia và Databricks... để giúp các nhà phát triển triển khai các phiên bản của riêng họ. Meta tuyên bố rằng Llama 3.1 có chi phí chỉ bằng một nửa GPT-4o của OpenAI để chạy trong sản xuất. Meta đang phát hành các trọng số mô hình để các công ty khác có thể đào tạo nó trên dữ liệu tùy chỉnh và điều chỉnh theo ý thích của họ.
Theo người phát ngôn của Meta, Jon Carvill, Gemini không được đưa vào các so sánh chuẩn này vì Meta gặp khó khăn khi sử dụng API của Google để sao chép các kết quả đã nêu trước đó.
Không có gì ngạc nhiên khi Meta không nói nhiều về dữ liệu mà họ sử dụng để đào tạo Llama 3.1. Những người làm việc tại các công ty AI cho biết họ không tiết lộ thông tin này vì đây là bí mật thương mại, trong khi những người chỉ trích cho rằng đây là chiến thuật để trì hoãn các vụ kiện bản quyền sắp tới.
Meta sẽ nói rằng họ đã sử dụng dữ liệu tổng hợp hoặc dữ liệu do mô hình tạo ra thay vì con người để có phiên bản Llama 3.1 với 405 tỷ tham số, đồng thời cải thiện các phiên bản nhỏ hơn gồm 70 tỷ và 8 tỷ tham số. Ahmad Al-Dahle, Phó chủ tịch AI tạo sinh của Meta, dự đoán rằng Llama 3.1 sẽ được các nhà phát triển ưa chuộng như "một giáo viên cho các mô hình nhỏ hơn sau đó được triển khai" theo "cách tiết kiệm chi phí hơn".
Khi tôi hỏi liệu Meta có đồng ý với sự đồng thuận ngày càng tăng rằng ngành công nghiệp đang cạn kiệt dữ liệu đào tạo chất lượng cho các mô hình hay không, Al-Dahle cho rằng có một giới hạn sắp tới, mặc dù nó có thể xa hơn một số người nghĩ. "Chúng tôi nghĩ rằng chúng tôi sẽ có thêm một vài lần đào tạo nữa", ông nói. "Nhưng thật khó để nói về điều này".
Lần đầu tiên, việc kiểm tra đối kháng (hay red teaming) của Meta đối với Llama 3.1 bao gồm việc tìm kiếm các trường hợp sử dụng an ninh mạng và sinh hóa tiềm năng. Một lý do khác để thử nghiệm mô hình mạnh mẽ hơn là những gì Meta mô tả là các hành vi "tác nhân" mới nổi.
Ví dụ, Al-Dahle cho tôi biết rằng Llama 3.1 có khả năng tích hợp với API của công cụ tìm kiếm để “lấy thông tin từ internet dựa trên truy vấn phức tạp và gọi nhiều công cụ liên tiếp để hoàn thành nhiệm vụ”. Một ví dụ khác mà ông đưa ra là yêu cầu mô hình vẽ biểu đồ số lượng nhà được bán tại Hoa Kỳ trong năm năm qua. “Nó có thể lấy những kết quả tìm kiếm trên web cho bạn và tạo ra các mã Python rồi thực thi các mã đó”.
Việc triển khai Llama của Meta là trợ lý AI của họ, được định vị là một chatbot đa năng như ChatGPT và có thể được tìm thấy trong hầu hết mọi phần của Instagram, Facebook và WhatsApp. Bắt đầu từ tuần này, Llama 3.1 sẽ có thể truy cập đầu tiên thông qua WhatsApp và trang web Meta AI tại Hoa Kỳ, tiếp theo là Instagram và Facebook trong những tuần tới. Nó cũng đang được cập nhật để hỗ trợ các ngôn ngữ mới, bao gồm tiếng Pháp, tiếng Đức, tiếng Hindi, tiếng Ý và tiếng Tây Ban Nha.
Trong khi mô hình tham số 405 tỷ tiên tiến nhất của Llama 3.1 được sử dụng miễn phí trong Meta AI, trợ lý sẽ chuyển bạn sang mô hình 70 tỷ thu nhỏ hơn sau khi vượt qua một số lượng lời nhắc không xác định trong một tuần nhất định. Điều này cho thấy mô hình 405 tỷ quá đắt để Meta có thể chạy ở quy mô đầy đủ. Người phát ngôn Jon Carvill cho tôi biết công ty sẽ cung cấp thêm thông tin về ngưỡng lời nhắc sau khi đánh giá mức sử dụng ban đầu.
Một tính năng mới khác có tên là "Imagine Me" trong Meta AI sẽ quét khuôn mặt của bạn thông qua camera của điện thoại để sau đó cho phép bạn chèn hình ảnh của mình vào hình ảnh được AI tạo ra. Bằng cách chụp hình ảnh của bạn theo cách này chứ không phải thông qua ảnh trong hồ sơ của bạn, Meta hy vọng sẽ tránh được việc tạo ra một cỗ máy deepfake.
Công ty thấy nhu cầu của những người muốn tạo ra nhiều loại phương tiện AI hơn và chia sẻ chúng lên nguồn cấp dữ liệu của họ, ngay cả khi điều đó có nghĩa là làm mờ ranh giới giữa những gì có thể nhận ra là thật và không.
Meta AI cũng sẽ có mặt trên tai nghe Quest trong những tuần tới, thay thế giao diện lệnh bằng giọng nói. Giống như cách triển khai trong kính Meta Ray-Ban, bạn sẽ có thể sử dụng Meta AI trên Quest để xác định và tìm hiểu về những gì bạn đang nhìn trong khi ở chế độ passthrough của tai nghe, chế độ này hiển thị thế giới thực thông qua màn hình.
Ngoài dự đoán của Zuckerberg cho rằng Meta AI sẽ là chatbot được sử dụng nhiều nhất vào cuối năm nay (ChatGPT có hơn 100 triệu người dùng), Meta vẫn chưa chia sẻ bất kỳ số liệu sử dụng nào cho trợ lý của mình. "Tôi nghĩ toàn bộ ngành công nghiệp vẫn còn ở giai đoạn đầu trên con đường hướng tới sự phù hợp với thị trường sản phẩm", Al-Dahle chia sẻ. Ngay cả khi AI đã được thổi phồng quá mức, rõ ràng là Meta và những công ty khác nghĩ rằng cuộc đua chỉ mới bắt đầu.