OpenAI vừa công bố phiên bản mới của mô hình ngôn ngữ của công ty, GPT-4o mini, được thiết kế để làm cho công nghệ AI trở nên dễ tiếp cận hơn và chi phí thấp hơn. Mô hình mới này, một phiên bản nhỏ hơn và hiệu quả hơn của GPT-4o, không chỉ hứa hẹn cải thiện khả năng xử lý văn bản mà còn mở rộng sang các phương tiện khác như hình ảnh, video và âm thanh.
GPT-4o mini là một phần trong chiến lược của OpenAI nhằm tiếp cận rộng rãi hơn với công nghệ AI, cung cấp khả năng đa phương thức mà công ty mô tả là khả năng tích hợp nhiều loại phương tiện như văn bản, hình ảnh, âm thanh và video trong một công cụ duy nhất. Brad Lightcap, đại diện OpenAI, nhấn mạnh tầm quan trọng của việc tương tác với thế giới theo nhiều cách khác nhau, không chỉ qua văn bản mà còn qua thị giác và âm thanh.
GPT-4o mini, bắt đầu triển khai cho người dùng miễn phí và đăng ký của ChatGPT, thay thế cho phiên bản GPT-3.5 Turbo trước đây và sẽ có mặt trên ChatGPT Enterprise vào tuần tới. Mô hình này cũng là một nhánh của GPT-4o, phiên bản nhanh nhất và mạnh mẽ nhất của OpenAI tính đến thời điểm hiện tại, đã được giới thiệu vào tháng 5 với các cải tiến đáng kể về khả năng tạo âm thanh, video và văn bản.
Với sự hỗ trợ của Microsoft và được các nhà đầu tư định giá hơn 80 tỷ USD, OpenAI đang nỗ lực duy trì vị trí dẫn đầu trong thị trường AI tạo sinh. Công ty, được thành lập vào năm 2015, đang đối mặt với thách thức không chỉ trong việc phát triển công nghệ mà còn trong việc tìm kiếm lợi nhuận từ những khoản đầu tư lớn vào cơ sở hạ tầng và bộ xử lý cần thiết để xây dựng và đào tạo các mô hình AI của mình.