Los Algoritmos de los años 80 impulsan los Avances Actuales de la IA y sus Investigadores reciben el Premio Turing

Andrew Barto y Richard Sutton han ganado el Premio Turing 2024 por desarrollar tecnologías clave que impulsan la inteligencia artificial moderna, incluidos los recientes avances en modelos de razonamiento grandes.

Reforzamiento y su impacto en la IA

La Asociación para la Maquinaria Computacional (ACM) seleccionó a Barto y Sutton por su trabajo pionero en aprendizaje por refuerzo, una tecnología que permitió logros como AlphaGo y los actuales modelos de razonamiento grandes (LRM).

El premio, conocido como el «Premio Nobel de la Ciencia de la Computación», está acompañado de un premio de $1 millón y reconoce sus algoritmos y conceptos de los años 80 que permiten que las máquinas aprendan de manera independiente a través de señales de recompensa.

De la psicología a la inteligencia artificial

Los investigadores tomaron un concepto simple de la psicología, el aprendizaje de sistemas a partir de retroalimentación sobre sus acciones y lo transformaron en un marco matemático que ahora se utiliza en aplicaciones de IA.

Su libro de texto de 1998, «Reinforcement Learning: An Introduction», se ha convertido en una piedra angular del campo y ha sido citado más de 75,000 veces.

Combinando aprendizaje profundo y aprendizaje por refuerzo

Cuando se combina con aprendizaje profundo, sus métodos llevaron a avances importantes: AlphaGo derrotando al campeón mundial Lee Sedol, el entrenamiento de ChatGPT mediante retroalimentación humana y nuevos LRMs como el o3 de OpenAI y el R1 de Deepseek.

Esta tecnología ahora impulsa desde la robótica avanzada hasta mejoras en redes, diseño de chips y publicidad en línea.

Cumpliendo la visión de Turing ‍

Jeff Dean, vicepresidente senior de Google, ve su trabajo como el cumplimiento de los objetivos originales de Alan Turing: «En una conferencia de 1947, Alan Turing dijo ‘Lo que queremos es una máquina que pueda aprender de la experiencia. El aprendizaje por refuerzo, como lo pioneros Barto y Sutton, responde directamente al desafío de Turing’.»

Una colaboración histórica y premios acumulados

La asociación comenzó en 1978 en la Universidad de Massachusetts, donde Barto fue mentor de Sutton durante sus estudios doctorales. Su investigación ha obtenido numerosos premios y ha generado miles de millones en inversión en IA.

Hoy en día, Barto es profesor emérito en UMass Amherst, mientras que Sutton trabaja tanto en la Universidad de Alberta como en Keen Technologies. Sutton también es conocido por escribir el influyente ensayo «The Bitter Lesson».

Barto y Sutton se unen a un grupo selecto de innovadores en informática, incluidos los pioneros del aprendizaje profundo Yoshua Bengio, Geoffrey Hinton y Yann LeCun, quienes recibieron el premio en 2019.

Nombrado en honor al matemático británico Alan Turing, el premio ha reconocido contribuciones transformadoras a la ciencia de la computación desde 1966.

Relacionados


Descubre más desde CIBERED

Suscríbete y recibe las últimas entradas en tu correo electrónico.

Deja un comentario