Các kênh YouTube của Netflix Anime, Aniplex USA và GKIDS nằm trong số rất nhiều kênh YouTube có video đã bị công ty AI Runway thu thập dữ liệu. 404 Media đã chia sẻ một bảng tính lớn đã được biên tập lại chi tiết về các kênh YouTube mà công ty đã từng đào tạo công cụ tạo video AI của họ mặc dù điều này vi phạm Điều khoản dịch vụ của YouTube.
Ngoài những kênh này, các kênh có chủ đề anime khác được đề cập trong tài liệu bao gồm các kênh tóm tắt anime như Anime Recap Time, Recap-kun, và AniClimax; cũng như những người viết tiểu luận video lấy anime làm trung tâm như Mastar và Anime Philosopher. Animenz Piano Sheets, Anime Luna, Utoi Anime Talk TV và Anime Select dường như cũng đã bị loại bỏ vì các kênh của họ được gắn thẻ “anime”.
Ngoài các kênh YouTube, cũng có thông tin cho rằng AI của Runway cũng đã loại bỏ trang Archive.org giới thiệu một số bộ phim của Studio Ghibli, cũng như một số trang web cướp biển bao gồm Aniwave, Animesuge, 9Anime, Aniwatch và phiên bản lặp lại của KissAnime hiện không còn tồn tại. Một số kênh hoạt hình độc lập cũng bị ảnh hưởng.
Google trước đây đã cảnh báo OpenAI không được sử dụng các video của nền tảng này để đào tạo người mẫu AI Sora, tuyên bố rằng điều đó sẽ vi phạm Điều khoản dịch vụ của nền tảng.
“Từ góc nhìn của người sáng tạo, khi người sáng tạo tải tác phẩm chăm chỉ của họ lên nền tảng của chúng tôi, họ có một số quyền lợi nhất định mong đợi. Một trong những kỳ vọng đó là các điều khoản dịch vụ sẽ được tuân thủ. Nó không cho phép tải xuống những thứ như bản ghi hoặc bit video và đó là sự vi phạm rõ ràng các điều khoản dịch vụ của chúng tôi. Đó là những quy tắc về nội dung trên nền tảng của chúng tôi”, Giám đốc điều hành YouTube Neil Mohan nói với Bloomberg.
404 Truyền thông đưa tin rằng một cựu nhân viên giấu tên của Runway đã tiết lộ rằng có một công ty-nỗ lực rộng rãi để tổng hợp thông tin video thành bảng tính sẽ được sử dụng cho đào tạo AI. Sau đó, công ty đã tải xuống hàng loạt video bằng các công cụ tải xuống có sẵn trên YouTube, cụ thể là YouTube-DL. Công ty cũng sử dụng dịch vụ proxy để tránh bị YouTube phát hiện khi tải xuống nhiều video.
“Các kênh trong bảng tính đó là nỗ lực của toàn công ty nhằm tìm ra những video có chất lượng tốt để xây dựng mô hình. Sau đó, thông tin này được sử dụng làm đầu vào cho một trình thu thập thông tin web khổng lồ tải xuống tất cả video từ tất cả các kênh đó, sử dụng proxy để tránh bị Google chặn,” cựu nhân viên nói với 404 Media.
Mặc dù điều đó không xảy ra vẫn chưa được xác minh liệu tất cả video của các kênh này có được sử dụng để đào tạo mô hình AI của Runway hay không, điều đáng chú ý là các kênh này được phân loại theo thẻ, thẻ này có thể được sử dụng làm lời nhắc bất cứ khi nào người dùng muốn tạo một kiểu video AI cụ thể. Runway, công ty đã huy động được hàng triệu USD từ những người ủng hộ bao gồm NVIDIA và Google vào năm ngoái, vẫn chưa đưa ra tuyên bố nào về chủ đề này.
Hình ảnh nổi bật: Sword Art Online: Alicization, ©2017 Reki Kawahara/KADOKAWA Ascii/Media Works/Dự án SAO-A