Trong vài tuần trở lại đây, cái tên Zoom có lẽ không còn xa lạ gì đối với người dân trên toàn thế giới, đặc biệt là những người đang phải tạm thời làm việc online để tránh đại dịch Covid-19. Với tính năng trò chuyện video trực tuyến tiện lợi, Zoom có thể tạo ra những văn phòng ảo giúp mọi người dễ dàng kết nối với nhau để cùng giải quyết công việc mà không cần gặp mặt trực tiếp. Chính vì lý do này, số lượng người dùng của Zoom bỗng chốc tăng đột biến trong thời gian qua và hiện vẫn chưa có dấu hiệu ngừng lại, bất chấp thị trường vẫn còn nhiều lựa chọn khác như Google Hangouts hay Microsoft Team.
Tuy nhiên, không phải ai cũng hứng thú với phương thức làm việc từ xa, lại còn phải tiến hành liên tục trong nhiều ngày liền. Ví dụ như anh chàng YouTuber Matt Reed dưới đây: Thấy mỗi ngày phải họp hành online nhiều quá, anh chế luôn 1 hệ thống AI để thay mình trả lời đồng nghiệp trên Zoom. Hệ thống AI này sẽ tái tạo lại hình ảnh của Matt, kèm theo chuyển động khuôn mặt dù chưa được tự nhiên cho lắm, nhưng lại sở hữu khả năng đối đáp tự động cực mượt mà.
Matt gọi phát minh của mình là Zoombot Digital Twin - Người anh em sinh đôi số hóa của bản thân, tích hợp những công nghệ tân tiến như: AI Speech Recognition, khả năng nhận diện giọng nói của đồng nghiệp bằng AI; và Text-to-Speech, khả năng đối đáp tùy theo hoàn cảnh dựa trên những mẫu văn bản được cung cấp trong cơ sở dữ liệu. Và thế là khi nào mệt quá, Matt hoàn toàn có thể nghỉ ngơi thư giãn, để người anh em sinh đôi này thay mình xử lý công việc trên Zoom một cách dễ dàng.
Matt cũng cho biết quá trình tự nhân bản bản thân của anh khá đơn giản chứ không phức tạp như trong series Westworld của HBO. Về mặt hình ảnh, anh sử dụng Quicktime để tự chụp lại gương mặt bản thân ở nhiều góc độ khác nhau (với cùng background) để có thể tạo ra cảm giác chuyển động mượt mà nhất có thể. Về mặt nội dung, Matt thiết lập một webapp bằng cách sử dụng thư viện mã nguồn có tên Artyom.js để người anh em sinh đôi của mình có thể nghe và trả lời các câu hỏi từ người khác.
Ví dụ, anh lập trình cho Digital Twins một số câu trả lời mẫu như “Tôi khỏe, cảm ơn bạn đã hỏi thăm” khi nghe người khác nói “Anh khỏe không?”; “Tôi nghe không rõ lắm” để trả lời câu “Anh nghe rõ không?”; hay “Nói chuyện với mọi người sau. Nhớ giữ an toàn nhé” khi người khác chào tạm biệt anh.
Bản sao AI của Matt thoải mái trò chuyện với đồng nghiệp.
Cuối cùng, Matt xử lý nốt phần hình ảnh hiển thị để kết quả được chân thật nhất. Anh cho biết vì Zoombot khá là lag khiến cho loạt ảnh selfie của anh khi chuyển động trông hơi “lởm” (mà anh thường đổ lỗi cho kết nối Internet khi đồng nghiệp nghi ngờ), chưa đủ thuyết phục. Giải pháp mà Matt đưa ra là sử dụng là phần mềm ManyCam - cho phép tạo ra một hệ thống webcam ảo từ những file ảnh, video quay sẵn từ trước thay vì sử dụng video theo thời gian thực để giảm sự phụ thuộc vào chất lượng đường truyền Internet.
Là 1 YouTuber chuyên về sáng tạo công nghệ, đây không phải lần đầu tiên Matt Reed có những phát minh độc đáo như vậy. Vài năm trước, anh từng xây dựng cả một cánh tay robot với khả năng nhận diện khuôn mặt, có thể xử lý trò chơi “hại mắt” Finding Waldo trong 1 nốt nhạc. Nếu như bạn chưa biết, Finding Waldo là 1 trò chơi trẻ em khá phổ biến ở Mỹ với yêu cầu rất đơn giản: Người chơi phải tìm ra nhân vật có tên Waldo (thường mặc áo và đội mũ sọc đỏ trắng, đeo kính) trong 1 bức tranh màu mè, nhiều chi tiết.
Trở lại với người anh em sinh đôi của Matt, như đã nêu trên, hệ thống AI này vẫn còn khá nhiều hạn chế và mới chỉ dừng lại ở mức độ hoạt động ổn mà thôi, chứ chưa mượt mà cho lắm. Tuy nhiên, Matt cũng không hề có ý định chế ra hệ thống này để trốn làm việc hay tranh thủ nghỉ ngơi gì cả, mà chỉ để thỏa mãn đam mê công nghệ của bản thân mà thôi. Anh cũng đã chia sẻ mã nguồn của mình trên Twitter cá nhân kèm theo nhiều lưu ý quan trọng để bất cứ ai cũng có thể tải về và trải nghiệm.
Theo Gizmodo