OpenAI crea Misterioso Entrenamiento para Sora

La comunidad de IA supone que OpenAI utiliza grandes cantidades de vídeos de YouTube para entrenar modelos, incluida su nueva oferta Sora. Esto, es casi un secreto a voces a estas alturas. Aunque el mayor misterio es cómo OpenAI accede a suficiente contenido de YouTube para que esto funcione.

YouTube de Google prohíbe la extracción de sus videos por parte de bots y otros métodos automatizados, y también prohíbe las descargas con fines comerciales. El gigante de Internet también limita los intentos de descargar datos de vídeos de YouTube en grandes volúmenes.

Durante años han aparecido quejas sobre esto en los foros de codificación GitHub y Reddit, los usuarios han dicho que los intentos de descargar incluso un vídeo de YouTube serán tan lentos que tardarán horas en completarse.

OpenAI requiere enormes cantidades de texto, imágenes y videos para entrenar sus modelos de IA, eso significa que la startup debe haber descargado de alguna manera grandes volúmenes de contenido de YouTube o haber accedido a estos datos de alguna manera que eluda las limitaciones de Google.

Comentario de OpenAI

El contenido de YouTube está disponible gratuitamente en línea, por lo que descargar pequeñas cantidades de este con fines de investigación parece inofensivo, pero el aprovechar millones de vídeos para crear nuevos y potentes modelos de IA puede ser algo completamente distinto. Según The Information informó que OpenAI usa videos de YouTube para entrenar un modelo llamado Whisper.

Según la gente de OpenAI: «La capacitación de Sora incluyó material de fuentes autorizadas, así como contenido disponible públicamente en Internet».

Una Carrera por los Datos de Calidad

El rápido surgimiento de la IA generativa ha provocado una carrera global por datos de alta calidad para entrenar los modelos que sustentan servicios como ChatGPT y Microsoft Copilots.

No existen reglas claras sobre lo que es legal, ético o incluso las mejores prácticas en este nuevo ámbito.

Admin

Compartir
Publicado por
Admin
Etiquetas: OpenAISora

Entradas recientes

Por qué el lenguaje de programación favorito de Elon Musk es Python

La icónica compañía de Elon Musk, Tesla, opera en un sistema operativo basado en el…

18 horas hace

Encuentran cura revolucionaria contra la Leucemia Infantil en Madrid

Los hospitales públicos de la Comunidad de Madrid se sitúan en la vanguardia internacional de…

22 horas hace

Sora 2 API Tutorial: Cómo Integrar el Modelo de Video de OpenAI en Kie.ai

El 30 de septiembre de 2025, OpenAI lanzó oficialmente Sora 2, su nueva generación del…

22 horas hace

Peter Thiel vende 100 millones de dólares de Nvidia, tras los rumores de la burbuja IA

Peter Thiel acaba de hacer un movimiento que está sacudiendo a los mercados tecnológicos: su…

1 día hace

Sora 2 Gratis: Cómo Usar el Generador de Video de OpenAI sin Invite Code gracias a Vidful.ai

La llegada de Sora 2, el nuevo modelo de video de OpenAI, está revolucionando internet.…

1 día hace

El mercado cripto pierde 1,2 billones tras la mayor liquidación desde 2022

El mercado de las criptomonedas acaba de vivir uno de los golpes más duros de…

1 día hace