Meta Llama 3.1 ya está Disponible Oficialmente y destrona a GPT-4o

Después de que se filtrara Llama 3.1, Meta lanzó oficialmente Llama 3.1 405B, un nuevo modelo de IA de código abierto junto con sus versiones 70B y 8B.

Meta ofrece a los desarrolladores acceso gratuito a sus pesos y código y permite el ajuste, etc.

El modelo Llama 3.1 405B tiene un rendimiento similar al de los mejores modelos cerrados. Admite una longitud de contexto de 128k, ocho idiomas y ofrece capacidades sólidas en generación de código, razonamiento complejo y uso de herramientas.

“Meta AI está en camino de alcanzar nuestro objetivo de convertirnos en el asistente de inteligencia artificial más utilizado del mundo para finales de año”, afirmó el director ejecutivo de Meta, Mark Zuckerberg. También dio pistas sobre las próximas funciones de Meta AI.

“En las próximas semanas, también agregaremos un par de funciones nuevas. Meta AI Imagine, que genera imágenes tan rápido como escribes, también te permitirá ponerte en tus imágenes con cualquier estilo y hacer casi cualquier cosa que puedas imaginar. Así que creo que será muy divertido. También estamos a punto de lanzar una herramienta que puedes usar para crear tus propias IA con las que interactuar en nuestras aplicaciones. Pronto les daremos más información al respecto”, agregó Zuckerberg.

Meta ha presentado la API Llama Stack para una fácil integración, respaldada por un ecosistema de más de 25 socios, incluidos AWS, NVIDIA, Databricks, Groq, Dell, Azure y Google Cloud. Para esta versión, Meta evaluó el rendimiento en más de 150 conjuntos de datos de referencia en varios idiomas.

[content-egg module=Amazon products=”es-8441548048″ template=list]

También se llevaron a cabo evaluaciones humanas exhaustivas, comparando Llama 3.1 con modelos de la competencia en situaciones del mundo real. La evaluación sugiere que Llama 3.1 es competitivo con los modelos básicos líderes como GPT-4, GPT-4o y Claude 3.5 Sonnet.

Además, los modelos más pequeños de la serie Llama 3.1 son competitivos con los modelos cerrados y abiertos con recuentos de parámetros similares.

Zuckerberg afirmó que este es un momento similar a Linux en el mundo de la IA. “Creo que la IA de código abierto se convertirá en el estándar de la industria, al igual que Linux. Te da el control para personalizar y ejecutar tus propios modelos.

[content-egg module=Amazon products=”es-B0CP9MSJK1″ template=list]

Llama 3.1 está diseñado para permitir nuevos flujos de trabajo como la generación de datos sintéticos y la destilación de modelos.

Está disponible para pruebas en los EE. UU. en WhatsApp y en meta.ai, donde los usuarios pueden plantear preguntas complejas de matemáticas o codificación.

El modelo se entrenó con más de 15 billones de tokens y más de 16 000 GPU H100, lo que lo convierte en el modelo más grande y ambicioso de Meta hasta la fecha.

[content-egg module=Amazon products=”es-8441548161″ template=list]

El proceso de entrenamiento implicó optimizaciones significativas, incluida una arquitectura de modelo de transformador con solo decodificador estándar y procedimientos iterativos posteriores al entrenamiento.

Estos esfuerzos apuntaron a maximizar la estabilidad del entrenamiento y mejorar la calidad de los datos sintéticos.

Para respaldar la inferencia de producción a gran escala, Meta cuantizó los modelos de 16 bits a 8 bits, lo que redujo los requisitos de cómputo y permitió que el modelo se ejecutara dentro de un solo nodo de servidor.

Se espera que este avance impulse la innovación y la exploración en aplicaciones de IA, ofreciendo oportunidades de crecimiento sin precedentes.

[content-egg module=Amazon template=list]

Vistas: 0

🚀 Tecnología, IA y Desarrollo

🎮 Hardware, Gaming y Cultura

Quizás te Interese..