Không chỉ học được cách chơi game, AI này còn "phá" hỏng game bằng một lỗ hổng mà chưa ai tìm ra được

"Nếu không kiểm soát AI, hậu quả có thể khó đoán trước" - nhiều người sẽ nói vậy.

Nghiên cứu AI và trò chơi điện tử như một cặp đôi hoàn hảo. Nhờ vào game, các nhà nghiên cứu có được một môi trường ảo với những mục tiêu được định sẵn và có thể kiểm soát hoàn toàn, và các con AI có thể tự do hoành hành mà không gây ra tổn hại gì cả. Tuy nhiên, đôi khi AI cũng gây hỏng hóc một số thứ.

Trong một nghiên cứu được đăng tải tuần này bởi 3 nhà nghiên cứu máy học từ Đại học Freiburg ở Đức, một con AI đã "phá" được một trò chơi điện tử. Ba nhà nghiên cứu đang tìm hiểu một phương pháp để dạy AI có thể di chuyển trong game. Họ đã thử nghiệm một tựa game trên Atari từ những năm 80 mang tên Q*bert. Khi đang nghiên cứu, họ phát hiện ra một sự việc bất thường: phần mềm mà họ thử nghiệm đã phát hiện được một lỗi trong game, cho phép AI có thể đạt được điểm số vô hạn.

Bài báo cáo miêu tả, trong lúc AI đang học cách chơi game Q*bert, nó đã phát hiện ra "một giải pháp thú vị." Thông thường, trong game này, người chơi phải nhảy từ khối hộp này đến khối hộp kia, và với mỗi lần nhảy, màu của khối hộp sẽ thay đổi. Nếu có thể đổi màu tất cả các khối hộp, người chơi sẽ được thưởng điểm và được lên bàn chơi tiếp theo. Tuy nhiên, AI này đã tìm ra một cách hay hơn nhiều.

Ban đầu, AI đã hoàn thành được vòng chơi đầu tiên, và nó bắt đầu nhảy từ khối hộp nọ sang khối hộp kia theo một cách tưởng như là ngẫu nhiên. Vì một lí do nào đó, game đã không sang màn chơi tiếp theo, và các khối hộp bắt đầu nhấp nháy không ngừng. AI từ đó đã có thể kiếm được số điểm vô hạn.

Đây là một lỗ hổng mà chưa một người nào đã phát hiện ra được. Nếu AI mà biết suy nghĩ, có thể nó sẽ nghĩ là, tại sao phải khổ công nhảy từ hộp nọ sang hộp kia, khi mà có một cách ghi điểm hay như thế này.

Xem cách mà AI "phá" game tại đây.

AI "phá" game

Một điểm quan trọng cần lưu ý là, AI không tiếp cận vấn đề này theo cách mà con người vẫn thường làm. Nó không hề có chủ đích tìm ra được lỗ hổng. Nghiên cứu của ba nhà khoa học này thực chất là một bài kiểm tra một loạt rộng các nghiên cứu AI được biết với cái tên "các thuật toán tiến hoá." Trong bài kiểm tra, họ sẽ cho các thuật toán thi đấu để xem thuật toán nào hoàn thiện tác vụ tốt nhất, và sau đó sẽ bổ sung một vài cải tiến nhỏ cho những người chiến thắng để xem liệu chúng có thể hoạt động tốt hơn nữa không. Bằng cách đó, các thuật toán sẽ ngày càng trở nên tốt hơn.

Đây không phải là hình thái AI mạnh nhất hay được dùng phổ biến nhất hiện tại, nhưng hình thái này đang dần dần trở nên phổ biến trở lại. Khả năng "phá" game Q*bert có thể là một điềm tốt, cho thấy rằng các thuật toán tiến hoá sẽ trở nên rất hữu dụng trong tương lai.