¿Sora de OpenAI entrenado con videos de Netflix?

Sora es uno de los mejores modelos de texto a vídeo del mercado. Cuando OpenAI lo anunció a principios de diciembre de 2024, producía vídeos casi fotorrealistas (aunque con algunos errores notables). El Washington Post descubrió que podría haberse utilizado contenido de Netflix, TikTok y Twitch para el entrenamiento.
¿Entrenamiento sólo con datos públicos?En el momento del anuncio, OpenAI reveló que Sora se entrenó con datos públicos y con licencia , sin especificar claramente las fuentes. El Washington Post (que colabora con la empresa californiana) generó cientos de videos y descubrió que muchos son similares a los que se muestran en películas, programas de televisión, videojuegos y redes sociales.
Algunos videos generados por Sora (de unos 20 segundos sin sonido) parecen ser fragmentos de series de Netflix (Wednesday), juegos populares (Minecraft) y TikTok. Los videos finales también incluyen logotipos y marcas de agua de las compañías que ofrecen el contenido original, lo que confirma que se utilizaron para entrenar al modelo.
Sin embargo, esto no significa necesariamente que el contenido haya sido copiado u obtenido del propietario. Podría haber sido "robado" de plataformas para compartir videos (como YouTube) o redes sociales, donde se subió sin el consentimiento del titular de los derechos de autor. Portavoces de Netflix y Twitch declararon que sus respectivas empresas no tienen acuerdos con OpenAI.
Las condiciones de YouTube prohíben la descarga de vídeos. El año pasado, un grupo de creadores demandó a OpenAI porque se utilizaron transcripciones de audio de vídeos para entrenar el modelo de ChatGPT. La empresa californiana ha recibido varias quejas por el uso de libros, artículos y otras fuentes. OpenAI aún no ha recibido ninguna queja por los datos utilizados para entrenar a Sora, probablemente debido a la mala calidad final.
Punto Informatico