Trong Google I/O 2024, gã khổng lồ công nghệ đã giới thiệu qua về Gemini Live, một phiên bản AI độc đáo trên thiết bị di động có khả năng thực hiện "các cuộc trò chuyện tự nhiên". Bạn có thể coi nó giống như Siri, vì bạn có thể tham gia vào cuộc đối thoại hai chiều với Gemini và để AI phản hồi một cách ngắn gọn.
Kể từ thông báo ban đầu, chúng ta chưa nghe nhiều về công nghệ này cho đến gần đây, khi các chuỗi mã tham chiếu đến Gemini Live được tìm thấy trong bản beta của ứng dụng Google. Mã này đề cập đến "chế độ nền" cho phép người dùng tiếp tục cuộc trò chuyện "trong khi sử dụng các ứng dụng khác hoặc trong khi màn hình điện thoại đang khóa". Như 9To5Google chỉ ra, điều này đã thực sự biến trải nghiệm Gemini Live thành một dạng cuộc gọi thoại gọn nhẹ và tiện lợi.
Với Gemini Live, AI sẽ tiếp tục chấp nhận các đầu vào bằng giọng nói và trả lời khi bạn làm những việc khác. Ví dụ, người dùng có thể mở Chrome trên điện thoại Android của họ, tra cứu thứ gì đó trên công cụ tìm kiếm và chuyển tiếp thông tin đó trở lại Gemini một cách liền mạch. Điều này làm cho việc nói chuyện với AI trở nên thực sự tự nhiên.
9To5Google cho biết tương tác có thể kết thúc bằng cách "tìm kiếm thông báo liên tục" hoặc nói "Dừng" với Gemini Live bằng giọng nói.
Tuy nhiên, vẫn còn nhiều điều chưa được khám phá trong bản beta ngoài chế độ nền. Google dường như đang nghiên cứu một cách để cung cấp cho người dùng quyền truy cập nhanh vào Gemini ngay cả khi điện thoại của người dùng đang khóa. Từ các thông tin ban đầu, bạn sẽ có thể sử dụng bốn tiện ích mở rộng cho các dịch vụ của bên thứ nhất: Google Maps , Google Flights, Google Hotels và YouTube .
Không rõ chính xác bạn có thể làm gì với những tiện ích mở rộng đó vì thông tin chi tiết chưa được công bố. Nhưng xét theo những gì đã được tiết lộ, người dùng có thể yêu cầu Gemini chỉ đường, phát nhạc trên YouTube hoặc đặt vé máy bay.
Bốn tiện ích đó sẽ được bật theo mặc định và Google dường như có kế hoạch thêm hỗ trợ cho nhiều tiện ích mở rộng hơn. Tuy nhiên, có một vấn đề nhỏ là "các tiện ích mở rộng không yêu cầu thông tin xác thực của người dùng hoặc không truy cập dữ liệu riêng tư sẽ được bật theo mặc định". Mọi úng dụng khác có lẽ sẽ yêu cầu kích hoạt thủ công.
Ngoài ra, người dùng có thể bật/tắt ba tính năng bổ sung cho Gemini trên màn hình khóa, mở rộng mức độ kiểm soát của AI. Messages cho phép bạn nhắn tin cho bạn bè và gia đình, trong khi Workspace có thể định vị và tóm tắt email hoặc tài liệu. Cuối cùng là Home Automation, có thể nói là thú vị nhất vì nó cho phép chủ nhà quản lý các thiết bị nhà thông minh ngay từ màn hình khóa.
Thời điểm Gemini Live ra mắt vẫn chưa được ấn định. Thông báo vào tháng 5 cho biết công cụ này dự kiến sẽ đến tay người dùng đăng ký Gemini Advanced trong những tháng sắp tới. Cho đến nay, Google vẫn im lặng. Có thể nền tẩng AI này sẽ ra mắt trước khi mùa hè kết thúc hoặc muộn hơn vào mùa thu
Chưa nói đến thời điểm phát hành, những thông tin về chế độ nền và tương tác từ màn hình khóa có thể giúp Gemini AI trở nên vượt trội hơn hẳn so với những ứng dụng như Apple Intelligence. Công nghệ của Apple cũng rất có tiềm năng, cung cấp đủ loại công cụ để tổ chức, tạo nội dung, v.v. Tuy nhiên, xét theo những gì chúng ta đã thấy, các ứng dụng AI của Apple cần sự tương tác liên tục từ người dùng. Gemini Live ít khắt khe hơn trong vấn đề này, giúp sử dụng dễ dàng hơn.