OpenAI vừa công bố Voice Engine, một công cụ AI đột phá có khả năng tạo ra bản sao của giọng nói chỉ qua 15 giây thu âm giọng gốc. Công nghệ này hứa hẹn mang đến những ứng dụng mới mẻ và đầy tiềm năng trong nhiều lĩnh vực khác nhau.
Voice Engine hoạt động dựa trên mô hình AI tiên tiến, có thể học hỏi và mô phỏng giọng nói của người nói một cách chính xác. Chỉ với một đoạn thu âm ngắn, Voice Engine có thể tạo ra giọng nói AI và đọc bất kỳ văn bản nào, cùng ngôn ngữ với người nói hoặc nhiều ngôn ngữ khác.
OpenAI cho biết họ bắt đầu phát triển Voice Engine vào cuối năm 2022 và công nghệ này đã cung cấp giọng nói cài đặt sẵn cho API chuyển văn bản thành giọng nói và tính năng đọc phản hồi của ChatGPT.
OpenAI đang hợp tác với một số công ty trong các lĩnh vực giáo dục, y tế và công nghệ để thử nghiệm và ứng dụng Voice Engine. Một số ví dụ điển hình bao gồm:
- Tạo nội dung giáo dục: công ty công nghệ giáo dục Age of Learning sử dụng Voice Engine để tạo nội dung thuyết minh cho các bài học trực tuyến, giúp học sinh tiếp thu kiến thức hiệu quả hơn.
- Hỗ trợ người khuyết tật: nhà sản xuất phần mềm y tế Dimagi đang sử dụng Voice Engine để tạo giọng nói cho phần mềm y tế, giúp người khuyết tật có thể sử dụng dễ dàng hơn.
- Cải thiện trải nghiệm khách hàng: công ty sản xuất ứng dụng AI giao tiếp Livox hiện sử dụng Voice Engine để tạo giọng nói cho chatbot, giúp mang đến trải nghiệm khách hàng một cách tự nhiên.
Tuy nhiên, việc sử dụng công nghệ AI tạo giọng nói cũng tiềm ẩn một số nguy cơ. OpenAI cam kết sẽ sử dụng Voice Engine một cách có trách nhiệm và tuân thủ các nguyên tắc đạo đức. Các đối tác của OpenAI phải đồng ý không sử dụng Voice Engine để mạo danh cá nhân hoặc tổ chức, đồng thời phải có sự đồng ý của người nói trước khi sử dụng giọng nói của họ.
Voice Engine là một bước tiến quan trọng trong lĩnh vực AI. Công nghệ này hứa hẹn mang đến nhiều lợi ích cho xã hội, tuy nhiên cũng cần được sử dụng một cách thận trọng và có trách nhiệm.