OpenAI ha publicado el primer borrador de su Model Spec, un documento que describe el comportamiento deseado y las pautas para sus modelos de IA.
Esta medida es parte del compromiso continuo de la compañía para mejorar el comportamiento del modelo y participar en una conversación pública sobre las consideraciones éticas y prácticas del desarrollo de la IA.
¿Por qué especificaciones de modelo?
Dar forma al comportamiento del modelo es una tarea compleja y matizada. Los modelos de IA aprenden de grandes cantidades de datos y no están programados explícitamente, por lo que guiar sus respuestas e interacciones con los usuarios requiere una consideración cuidadosa.
La especificación del modelo tiene como objetivo proporcionar un marco para esto, garantizando que los modelos sigan siendo beneficiosos, seguros y legales en sus aplicaciones.
Componentes clave de la especificación del modelo
La especificación del modelo se estructura en torno a tres categorías principales: objetivos, reglas y comportamientos predeterminados.
Objetivos
Estos son principios amplios que guían el comportamiento deseado de los modelos. Incluyen ayudar a los desarrolladores y usuarios finales, beneficiar a la humanidad y reflejar los valores y las normas sociales de OpenAI.
Normas
Las reglas son instrucciones específicas que ayudan a garantizar la seguridad y legalidad de las respuestas de los modelos.
Incluyen cumplir con las leyes, respetar la privacidad, evitar riesgos de información y seguir una cadena de mando (priorizar las instrucciones del desarrollador sobre las consultas de los usuarios).
Comportamientos predeterminados
Estas son pautas sobre cómo el modelo debe manejar los conflictos y hacer concesiones. Incluyen asumir las mejores intenciones de los usuarios, ser lo más útil posible sin excederse, expresar incertidumbre y fomentar la justicia y la amabilidad.
Poner en práctica la especificación del modelo
OpenAI tiene la intención de utilizar la especificación del modelo como guía para investigadores y formadores de IA, en particular aquellos que trabajan en el aprendizaje por refuerzo a partir de la retroalimentación humana.
También explorarán la posibilidad de que los modelos aprendan directamente de la especificación.
OpenAI agradece los comentarios sobre la especificación del modelo de diversas partes interesadas, incluidos formuladores de políticas, instituciones confiables, expertos en el dominio y el público en general.
Su objetivo es recopilar conocimientos y perspectivas para garantizar el desarrollo y la implementación responsables de su tecnología de inteligencia artificial.
Ejemplos de especificaciones del modelo en acción
El documento incluye varios ejemplos de cómo la especificación del modelo guiaría las respuestas del modelo en diferentes escenarios. Estos incluyen situaciones que involucran actividades ilegales, temas delicados, consultas de usuarios poco claras e instrucciones contradictorias de desarrolladores y usuarios.
Por ejemplo, en una situación en la que un usuario pide consejos sobre un robo en una tienda, la respuesta ideal del modelo es negarse a brindar asistencia, cumpliendo con las pautas legales y de seguridad.
El lanzamiento de OpenAI de Model Spec es un movimiento proactivo, que invita a aportaciones externas para dar forma al comportamiento de sus modelos de IA.
Este enfoque transparente garantiza que las consideraciones éticas y la retroalimentación humana sean fundamentales para el desarrollo de la IA.
A medida que el campo evoluciona, las conversaciones y adaptaciones continuas son clave para el despliegue seguro de estas poderosas herramientas.