Robot Mobile ALOHA là một hệ thống AI mới được phát triển bởi các nhà nghiên cứu tại Đại học Stanford. Sản phẩm đã tạo ra những bước đột phá ấn tượng trong việc huấn luyện robot di động có thể thực hiện các nhiệm vụ phức tạp trong các môi trường khác nhau.
Robot Mobile ALOHA là hệ thống phần cứng nguồn mở chi phí thấp dành cho vận hành từ xa hai tay, giúp giải quyết các thách thức kỹ thuật và chi phí cao trong việc đào tạo rô-bốt hai tay di động, cần có sự hướng dẫn cẩn thận từ người vận hành.
Robot Mobile ALOHA.
Cách hoạt động
Người điều khiển sẽ thực hiện nhiệm vụ bằng cách điều khiển cánh tay robot thông qua bộ điều khiển từ xa. Hệ thống thu thập dữ liệu trình diễn sẽ được sử dụng để huấn luyện hệ thống điều khiển thông qua học tập mô phỏng từ đầu đến cuối.
Mobile ALOHA mở rộng hệ thống bằng cách gắn trên đế có bánh xe. Đây là giải pháp tiết kiệm chi phí cho việc đào tạo hệ thống robot. Toàn bộ thiết lập, bao gồm webcam và máy tính xách tay có GPU dành cho người điều khiển có giá khoảng 32.000 USD (khoảng 787 triệu đồng), rẻ hơn nhiều so với các robot hai tay bán sẵn với giá lên tới 200.000 USD (khoảng 4,9 tỷ đồng).
Mobile ALOHA được thiết kế để vận hành từ xa đồng thời tất cả các bậc tự do. Người vận hành được buộc vào thắt lưng của hệ thống và điều khiển hệ thống đi vòng quanh môi trường làm việc trong khi vận hành cánh tay bằng bộ điều khiển. Điều này cho phép hệ thống điều khiển robot học đồng thời chuyển động và các lệnh điều khiển khác. Sau khi thu thập đủ thông tin, mô hình có thể tự động lặp lại chuỗi nhiệm vụ.
Các bản demo cho thấy, robot đã được huấn luyện nấu một bữa ăn ba món với các nhiệm vụ khó như: đập trứng, băm tỏi, đổ trứng, lật rau và lật trứng gà trong chảo rán.
Robot Mobile ALOHA cũng có thể thực hiện nhiều công việc nội trợ khác nhau, bao gồm: tưới cây, sử dụng máy hút bụi, xếp và lấy bát với máy rửa bát, lấy đồ uống từ tủ lạnh, mở cửa và vận hành máy giặt.
Học tập bắt chước và đồng đào tạo
Giống như nhiều công trình gần đây về robot, Mobile ALOHA tận dụng máy biến áp, kiến trúc được sử dụng trong các mô hình ngôn ngữ lớn. Hệ thống ALOHA ban đầu sử dụng kiến trúc có tên Action Chunking with Transformers (ACT), lấy hình ảnh từ nhiều góc nhìn và vị trí khớp làm đầu vào và dự đoán một chuỗi hành động.
Mobile ALOHA mở rộng hệ thống đó bằng cách thêm tín hiệu chuyển động vào vectơ đầu vào. Công thức này cho phép Mobile ALOHA sử dụng lại các thuật toán học bắt chước sâu trước đây với những thay đổi tối thiểu.
Robot Mobile ALOHA có thể nấu tới 3 ăn.
Công việc này cũng được hưởng lợi từ sự thành công của các phương pháp gần đây nhờ các bộ dữ liệu robot đa dạng từ các dự án khác. Đáng chú ý, RT-X - một dự án của DeepMind và 33 tổ chức nghiên cứu đã kết hợp một số bộ dữ liệu về robot để tạo ra các hệ thống điều khiển có thể khái quát hóa vượt xa dữ liệu đào tạo và hình thái robot.
Việc sử dụng dữ liệu hiện có cho phép các nhà nghiên cứu đào tạo Mobile ALOHA cho các nhiệm vụ phức tạp với rất ít sự minh họa của con người.
Các nhà nghiên cứu cũng khẳng định thêm: “Với việc đồng đào tạo, chúng tôi có thể đạt được hơn 80% thành công trong các nhiệm vụ này chỉ với 50 lần con người thực hiện mỗi nhiệm vụ, mức cải thiện tuyệt đối trung bình là 34% so với không đồng đào tạo”.
Chưa sẵn sàng sản xuất
Mặc dù có kết quả ấn tượng nhưng Mobile ALOHA vẫn có nhược điểm: kích thước cồng kềnh và kiểu dáng khó sử dụng trong môi trường chật hẹp.
Trong tương lai, các nhà nghiên cứu có kế hoạch cải tiến hệ thống bằng cách bổ sung thêm bậc tự do và giảm khối lượng của robot.
Bên cạnh đó, đây không phải là một hệ thống tự động hoàn toàn, không thể tự học cách khám phá môi trường mới. Robot vẫn yêu cầu người vận hành phải trình diễn đầy đủ trong môi trường của mình dù có thể học các nhiệm vụ với ít ví dụ hơn so với các phương pháp trước đó nhờ vào hệ thống đồng đào tạo.
Các nhà nghiên cứu sẽ khám phá những thay đổi đối với mô hình AI cho phép robot tự cải thiện và tiếp thu kiến thức mới. Với xu hướng đào tạo hệ thống AI điều khiển gần đây trên các bộ dữ liệu và hình thái khác nhau, công việc này có thể đẩy nhanh hơn nữa sự phát triển của robot đa năng.
Trường hợp lý tưởng nhất là tạo ra các robot hữu ích dành cho doanh nghiệp và người tiêu dùng. Đây là một lĩnh vực đang nhanh chóng nóng lên với sự tham gia của các nhà nghiên cứu và công ty khác như: Tesla với robot hình người Optimus và Hyundai với Boston Dynamics, chó robot Spot với giá khoảng 74.000 USD (tương đương 1,82 tỷ đồng).