“Đấu trường AI- Reinforcement Learning” là cuộc thi về Trí tuệ nhân tạo – Học tăng cường lần đầu diễn ra tại Việt Nam, nhằm mang tới thách thức chinh phục thuật toán mới, nâng cao năng lực kiến thức AI (trí tuệ nhân tạo) cho sinh viên, kỹ sư công nghệ thông tin; mở ra cơ hội nghiên cứu và đưa ra nhiều đóng góp cho công nghệ AI nói chung và Reinforcement Learning nói riêng.
Trong trận chung kết vừa diễn ra, ba nam sinh ĐH Khoa học Tự nhiên TPHCM của đội Black Panther đã giành chiến thắng khi dùng các thuật toán tự thiết kế dựa trên tư duy của người chơi.
Đội đã sử dụng Heuristic - thuật toán đại diện cho bộ não con người để tham gia thử thách trí tuệ nhân tạo; đồng thời lựa chọn chiến thuật chậm rãi từ các vòng ngoài, quan sát và nghiên cứu đối thủ để bùng nổ trong đêm chung kết.
Trong 5 lượt đấu của trận chung kết, Black Panther giành điểm cao nhất trong 3 lượt thi. Chiến thuật của Black Panther tập trung đi đường riêng biệt và đào các bãi vàng lớn nhất trên bản đồ.
Đội Trusted AI đã sử dụng thuật toán Học tăng cường (RL) - một trong ba nhánh của Machine Learning để huấn luyện agent (máy ảo), giải các bài toán theo phương thức học và tích lũy kinh nghiệm để đưa ra hành động tương tác với môi trường. Hành động đúng được máy lưu lại, sai hoặc không mang lại kết quả bị loại bỏ. Đội giành được giải nhì.
Anh Nguyễn Xuân Phong (chuyên gia AI đang công tác tại Viện Nghiên cứu Trí tuệ nhân tạo Mila, cố vấn của cuộc thi) cho biết, thế giới đã có nhiều cuộc thi tương tự để xem AI có thắng được trí tuệ con người hay không.
"Trong không ít cuộc thi về cờ vây, thể thao điện tử, con người đã thua AI, nhưng tại cuộc thi này trí tuệ con người lại chiến thắng. Điều đó cho bộ não của con người vẫn còn rất nhiều điều để khám phá. AI vẫn rất tiềm năng để theo đuổi trí tuệ loài người và phục vụ cho những lợi ích của nhân loại", anh Phong nhận xét.
Các đội thi trong vòng chung kết huấn luyện agent đào vàng.
Ông Nguyễn Đỗ Văn đến từ Viện Trí tuệ nhân tạo Việt Nam- giám khảo của cuộc thi cho biết: Cuộc thi lần đầu tổ chức diễn ra dưới dạng trò chơi khá đơn giản để cộng đồng dễ dàng làm quen. Ông hy vọng trong tương lai cuộc thi sẽ đưa ra các bài toán thú vị hơn để có thể giải quyết được ngay những vấn đề tồn tại trong xã hội.
"Thay vì dùng AI để đào vàng, có thể chuyển sang đua ôtô tự lái. Trí tuệ nhân tạo phải học hỏi để phân biệt đèn giao thông, xử lý các tình huống trên đường. Hoặc các thí sinh sẽ huấn luyện AI thành các robot cảnh sát, mọi người cùng thi xem ai bắt được nhiều tội phạm hơn", ông Văn nói.