OpenAI está ampliando de forma significativa el entrenamiento de ChatGPT más allá de sus capacidades generales en escritura y programación.
Según una investigación de Business Insider, la compañía está reclutando miles de profesionales independientes para enseñar al modelo cómo operar en más de 400 ocupaciones especializadas.
Proyecto Stagecraft: el nuevo frente del entrenamiento de IA
El programa, conocido internamente como Proyecto Stagecraft, es gestionado junto a la startup de etiquetado de datos Handshake AI.
El objetivo es claro: convertir a ChatGPT en un modelo capaz de entender tareas reales de trabajo en sectores altamente especializados.
Profesiones incluidas
Entre las áreas cubiertas están:
- Pilotos comerciales
- Farmacéuticos
- Médicos de urgencias
- Científicos de suelos
- Ingenieros agrícolas
- Músicos y compositores
- Profesionales de la ganadería
- Trabajadores del sector de la aviación
Cómo funciona el entrenamiento
El programa involucra a entre 3.000 y 4.000 trabajadores independientes, que reciben pagos de aproximadamente 50 dólares por hora, con tarifas que pueden alcanzar hasta 500 dólares en roles altamente especializados.
Sus tareas incluyen:
- Crear descripciones detalladas de su trabajo diario
- Diseñar prompts realistas basados en situaciones profesionales
- Evaluar respuestas del modelo en contextos reales
- Mapear tareas económicamente relevantes dentro de su sector
De modelo generalista a modelo experto
El Proyecto Stagecraft refleja un cambio estructural en la industria de la IA.
A medida que los modelos generalistas maduran, empresas como OpenAI buscan:
- Mayor precisión en dominios específicos
- Mejor comprensión del trabajo profesional real
- Reducción de errores en tareas críticas
Esto marca una transición desde modelos “que saben de todo un poco” hacia sistemas con conocimiento profundo por industria.
El papel de los trabajadores expertos
Los contratistas describen el proceso como un esfuerzo por capturar el “conocimiento tácito” del trabajo humano.
Sin embargo, el proyecto también genera tensiones:
- Algunos trabajadores reconocen que están entrenando sistemas que podrían reemplazarlos
- Existe preocupación por la sensibilidad de los datos recopilados
- Se están documentando procesos laborales muy específicos y detallados
Un ecosistema en expansión de datos de entrenamiento
El proyecto se apoya en un ecosistema creciente de empresas de datos como:
- Scale AI
- Surge AI
- Mercor
- Handshake AI
Estas compañías actúan como intermediarios entre expertos humanos y laboratorios de IA, proporcionando datos de alta calidad para entrenamiento avanzado.
Tensiones éticas y laborales
El enfoque también ha generado debates sobre:
- Posible automatización futura de profesiones especializadas
- Uso de trabajo real como material de entrenamiento
- Transparencia en la recolección de datos laborales
Algunos contratistas expresan una paradoja central: el mismo conocimiento que aportan hoy podría hacer su trabajo innecesario mañana.
