Nhóm nghiên cứu của Đại học Công nghệ Kaunas ở Litva đã đưa ra một mô hình AI có khả năng trực tiếp loại bỏ các đối tượng trên các cảnh quay theo thời gian thực.
Các nhà khoa học đánh giá trong các cảnh quay của một trận bóng, khi một người quay phim xuất hiện trên màn hình, điều này sẽ "làm giảm đi những khoảnh khắc quan trọng của trận đấu" và có thể dẫn đến "mất doanh thu cho đài truyền hình vì người xem không hài lòng".
Để giải quyết vấn đề mất tập trung về mặt thị giác này, các nhà nghiên cứu đã phát triển một giải pháp trí tuệ nhân tạo (AI) có thể phát hiện các đối tượng được phân loại sẵn trong video và loại bỏ họ theo cách tương tự như một biên tập viên ảnh xóa bỏ một vật thể khỏi ảnh bằng phần mềm chuyên dụng.
Việc loại bỏ vật thể khỏi các cảnh quay, đặc biệt hơn là các cảnh quay đang được phát sóng trực tiếp là một thách thức rất lớn và để giải quyết vấn đề này, các nhà nghiên cứu đã phát triển một công nghệ AI có thể phát hiện vật thể có tên YOLOv8, có tốc độ phát hiện vật thể nhanh và cực kỳ chính xác.
YOLOv8 là viết tắt của “You Only Look Once”. Công nghệ này có thể phát hiện và phân loại các đối tượng chỉ trong một lần quét, rất lý tưởng cho các sự kiện thời gian thực như chương trình phát sóng thể thao trực tiếp.
“Nó hoạt động bằng cách chia hình ảnh thành một lưới và dự đoán các đối tượng bị giới hạn, xác suất lớp và đa giác phân đoạn cho mỗi ô lưới. Điều này cho phép nó xác định và phân đoạn các đối tượng cần loại bỏ”, thành viên nhóm nghiên cứu Serhii Postupaiev cho biết.
Để giúp hướng dẫn mô hình YOLOv8 phát hiện và phân đoạn chính xác người quay phim trong các trận đấu, nhóm đã tạo ra một hệ thống dữ liệu định sẵn.
Postupaiev cho biết: “Chúng tôi đã tạo ra các bộ dữ liệu chuyên biệt, chẳng hạn như một bộ dữ liệu bao gồm nhiều loại máy quay phim với kích thước, hình dạng và loại thiết bị khác nhau, được chụp trong nhiều điều kiện khác nhau và ở nhiều giai đoạn khác nhau của một trận đấu thể thao. Hiện tại, YOLOv8 sử dụng bộ dữ liệu này để xác định vị trí của người quay phim trong các khung hình video”.
Nhóm nghiên cứu đã sử dụng video inpainting, một thuật toán loại học sâu hoạt động khá giống với công cụ Spot Healing Brush.
YOLOv8 kết hợp trí tuệ nhân tạo (AI) và công nghệ dựa trên thị giác máy tính phân tích các khung hình video để phát hiện những người quay phim không mong muốn và lấp đầy các khu vực bị xóa bằng các chi tiết nền có liên quan. Các khung hình đã sửa đổi sau đó được truyền trực tiếp trở lại cho người xem.
Nhờ độ trễ nhỏ khi phát sóng trực tiếp, thuật toán sẽ xử lý hình ảnh đã ghi trước khi phát trực tiếp trên sóng chỉ sau vài giây.
“Chương trình phát sóng sẽ trở nên chuyên nghiệp hơn mà không bị gián đoạn bởi các quay phim xuất hiện ở những nơi không nên có. Cải tiến này sẽ làm giảm số trường hợp bỏ lỡ những khoảnh khắc quan trọng của trận đấu do các máy quay gây mất tập trung”, Postupaiev nhấn mạnh.
Trong khi dự án chủ yếu tập trung vào các trận đấu bóng đá, YOLOv8 có thể được phát triển mở rộng hơn để áp dụng cho tất cả các môn thể thao khác bao gồm bóng rổ, bóng bầu dục hay khúc côn cầu trên băng. Postupaiev cho biết công nghệ này cũng có thể được tích hợp để xử lý hình ảnh trên các bản thu hình cũ của các trận đấu thể thao kinh điển.