OpenAI acaba de hacer oficial el lanzamiento de ChatGPT Agent, una nueva generación de agente de inteligencia artificial que fusiona las capacidades conversacionales de ChatGPT, la investigación profunda en la web y la funcionalidad automatizada de Operator.
El objetivo: crear un asistente capaz de investigar por ti en internet, entender contenido largo y además, ejecutar tareas directamente desde la web.
¿Cómo funciona ChatGPT Agent?
Todo empezó porque los usuarios pedían dos cosas a la vez: que la IA pudiera investigar temas a profundidad y después, realizar acciones o tareas prácticas. OpenAI decidió fusionar sus dos tipos de agentes:
- ChatGPT Deep Research: Especializado en analizar información, leer artículos largos y extraer respuestas precisas.
- ChatGPT Operator: Experto en interactuar con aplicaciones, sitios web y completar tareas (por ejemplo, rellenar formularios, enviar emails, buscar archivos, etc).
Ahora, con ChatGPT Agent, tienes un único asistente que puede por ejemplo: leer un informe extenso, buscar datos específicos, contestar tus dudas y luego realizar la tarea solicitada, todo sin que tengas que cambiar de herramienta.
¿Qué incluye la suite de ChatGPT Agent?
- Navegador visual: Permite a la IA interactuar con páginas y aplicaciones web tal como lo haría una persona en el navegador.
- Navegador de texto: Para búsquedas más ligeras y automatizadas, ideal para consultas rápidas o razonamiento textual.
- Terminal: Para ejecutar comandos (útil para desarrolladores o quienes trabajen con servidores).
- Acceso a API directo: Integración avanzada con otras apps mediante conectores (por ejemplo, Gmail, GitHub), facilitando búsquedas y acciones personalizadas según tus necesidades.
Esto significa que si le das acceso, ChatGPT Agent puede integrar tus herramientas favoritas y encontrar información relevante en tiempo real, usándola directamente en sus respuestas.
Seguridad y el problema de la “prompt injection”
OpenAI señaló el riesgo de la llamada “prompt injection”, un ataque que puede manipular a los modelos de lenguaje para realizar acciones no deseadas, especialmente cuando hay sitios maliciosos de por medio. Imagina, por ejemplo, que pides a la IA que haga una compra por ti y la página web maliciosa intenta engañar al agente para que ingrese datos sensibles.
Para minimizar riesgos, OpenAI recomienda usar la función de “handover”: cuando ChatGPT Agent llega a una etapa crítica (como ingresar tarjetas de crédito o contraseñas), te devuelve el control para que seas tú quien escriba esos datos.
Conclusión
El nuevo ChatGPT Agent lleva la automatización de tareas y la investigación asistida por IA a un nivel mucho más práctico y seguro, integrando lo mejor de la conversación, la búsqueda profunda y la acción en la web.
Aunque no está exento de riesgos, OpenAI busca un equilibrio entre funcionalidad y protección del usuario, dándote herramientas para delegar lo tedioso y controlar lo delicado.