OpenAI vừa giới thiệu phiên bản thử nghiệm của mô hình trí tuệ nhân tạo mới nhất, GPT-4o, có khả năng dạy ngoại ngữ ấn tượng thông qua chế độ giọng nói nâng cao (AVM). Dự kiến bắt đầu thử nghiệm vào cuối tháng 7 với nhóm người dùng ChatGPT Plus, phiên bản mới này hứa hẹn sẽ cải tiến đáng kể trong việc hỗ trợ học ngôn ngữ.
GPT-4o không chỉ hiểu và phản hồi ngay lập tức bằng giọng nói mà còn nhận biết và bắt chước cảm xúc người dùng, cũng như điều chỉnh tốc độ nói theo yêu cầu. Khả năng này được thể hiện rõ trong một video mà OpenAI phát hành, trong đó một người nói tiếng Tây Ban Nha sử dụng GPT-4o để hỗ trợ một người bạn học tiếng Bồ Đào Nha. Người dùng có thể yêu cầu GPT-4o giảm tốc độ nói hoặc giải thích những cụm từ khó hiểu một cách rõ ràng.
Điểm nổi bật của GPT-4o là khả năng chuyển đổi trực tiếp từ giọng nói này sang giọng nói khác mà không cần qua bước chuyển đổi thành văn bản, giúp tương tác với người dùng mượt mà và tự nhiên hơn. Hơn nữa, AI này có thể nhận diện cách phát âm và giọng điệu của người dùng, từ đó đưa ra phản hồi phù hợp.
Mira Murati, CTO của OpenAI, trong buổi công bố ngày 14/5, nhấn mạnh rằng GPT-4o đã đạt được những tiến bộ vượt trội trong khả năng đàm thoại, có thể thể hiện cảm xúc, thay đổi giọng điệu và thêm vào những tiếng cười, mang lại không khí hài hước trong giao tiếp.