Một báo cáo mới đây từ 404 Media đã tạo ra một làn sóng dư luận khi tiết lộ rằng phần mềm tạo video dựa trên trí tuệ nhân tạo, Jupiter, đã sử dụng một lượng lớn video thu thập được từ YouTube và các nguồn khác để huấn luyện mô hình của mình. Phần mềm này do Runway AI, Inc., một công ty khởi nghiệp có giá trị 1,5 tỷ đô la vận hành, với nguồn tài trợ từ những tên tuổi lớn trong ngành như Google và NVIDIA.
Theo báo cáo, có một bảng tính liệt kê các kênh YouTube của các nhóm truyền thông và nhà sáng tạo nội dung hàng đầu thế giới, bao gồm cả các trang web chứa nội dung vi phạm bản quyền, được dùng trong nỗ lực "toàn công ty" để thu thập video. Trong số những tên tuổi được nhắc đến có Netflix, Disney, Sony, Pixar, Vice News cũng như các nhà sáng tạo nội dung cá nhân như Marques Brownlee và Casey Neistat.
Một nguồn tin ẩn danh đã tiết lộ với 404 Media rằng bảng tính này là một phần trong chiến lược của Runway để tìm kiếm các video chất lượng cao dùng để xây dựng mô hình. Công ty này sử dụng phần mềm nguồn mở để thu thập nội dung từ YouTube và đã phân loại các video theo chủ đề như phim hoạt hình ngắn và phim của sinh viên.
Phản hồi từ Runway đối với yêu cầu bình luận của 404 Media không được cung cấp, trong khi Google đã chuyển hướng các câu hỏi đến một tuyên bố trước đó về việc sử dụng video từ YouTube để đào tạo mô hình video của OpenAI là vi phạm các quy tắc của YouTube.
Vụ việc này là phần mới nhất trong loạt các tranh cãi liên quan đến việc các công ty sử dụng dữ liệu của người sáng tạo mà không trả phí. Runway, đã được nhắc đến trong danh sách 100 công ty có ảnh hưởng nhất của Tạp chí TIME, hiện đang đứng trước những câu hỏi lớn về tính chính đáng của các phương pháp thu thập dữ liệu của mình