Google Tạo phụ đề trực tiếp (Google Live Transcribe) là ứng dụng di động miễn phí được các kỹ sư Google tạo ra nhằm hỗ trợ người điếc có thể giao tiếp tốt hơn. Cụ thể, ứng dụng chuyển giọng nói thành văn bản theo thời gian thực, nhờ đó người điếc hay giảm thính lực có thể dễ dàng tham gia các cuộc trò chuyện hàng ngày chỉ với chiếc điện thoại Android. Người đối diện nói bất cứ điều gì, ứng dụng cũng đều chuyển lời nói đó thành văn bản trên màn hình điện thoại để người dùng xem và phản hồi.
Bên cạnh đó, một công dụng phụ thú vị mà hầu như các nhân viên văn phòng hoặc báo chí truyền thông thường gặp phải đó là "xả băng" ghi âm cuộc họp. Người dùng thường mất nhiều thời gian để nghe lại một bản ghi âm cuộc họp hay trao đổi, rồi gõ lại thành văn bản. Tuy nhiên, với ứng dụng Live Transcribe, bản ghi âm và chuyển thành văn bản được thực hiện ngay lúc cuộc họp đang diễn ra.
Sử dụng công nghệ nhận dạng lời nói tự động tiên tiến của Google, ứng dụng trực tiếp hiển thị lời nói và âm thanh ở dạng văn bản trên màn hình, hỗ trợ đến hơn 80 ngôn ngữ và phương ngữ, bao gồm tiếng Việt. Nhờ vậy, người điếc hay người suy giảm thính lực có thể dễ dàng tham gia các cuộc trò chuyện đang diễn ra quanh mình hơn. Họ có thể nhập câu trả lời trên màn hình, nhận thông báo rung khi tên bạn được nhắc và tìm kiếm nội dung trong bản chép lời đó.
Một số thiết lập.
Ứng dụng cho phép bạn chọn nhanh hai ngôn ngữ thường được dùng nhất trong phần thiết lập, ví dụ có thể chọn tiếng Việt và tiếng Anh. Đặc biệt hơn, ứng dụng cho phép phân loại các giọng phát âm để có thể nhận diện giọng nói tốt hơn như tiếng Anh (giọng Mỹ), tiếng Anh (giọng Ấn),... Điều này cho phép ứng dụng ghi nhận giọng nói và chuyển thành văn bản chính xác hơn, nắm bắt chính xác các sắc thái của cách sử dụng từ trong ngữ cảnh.
Một số tính năng phụ mà người dùng có thể thiết lập:
- Thêm các từ tùy chỉnh mà bạn thường dùng, như tên hoặc vật dụng trong nhà.
- Xem các sự kiện âm thanh trong môi trường xung quanh bạn, như tiếng chó sủa, tiếng vỗ tay hoặc tiếng huýt sáo.
- Nhập nội dung trả lời trong cuộc trò chuyện của bạn.
- Xem âm lượng giọng nói của người nói so với độ ồn trong môi trường của bạn. Bạn có thể dùng chỉ báo âm thanh này để điều chỉnh âm lượng của mình khi nói.
Khi đã hoàn thành bản chuyển giọng nói thành văn bản, tạm gọi là bản chép lời, người dùng có thể chọn xem lại bản này trong 3 ngày (mặc định không được lưu lại) để chuyển chúng sang các "đám mây" như Google Drive hoặc sao chép nhanh nội dung qua Google Docs.
Ứng dụng Live Transcribe là sản phẩm hợp tác giữa Google và Đại học Gallaudet - Trường Đại học hàng đầu Hoa Kỳ dành cho người khiếm thính và người bị suy giảm thính lực. Ứng dụng hỗ trợ điện thoại Android 5.0 (Lollipop) trở lên, tải miễn phí trên Google Play.
Công nghệ nhận diện giọng nói và chuyển thành văn bản trong thời gian thực dùng cho ứng dụng này đã được Google chia sẻ trên mạng phát triển mở GitHub.
Clip minh họa việc sử dụng Live Transcribe trong giao tiếp.