El procesador Ascend 910C de Huawei logra entrenar un modelo de 1,6 billones de parámetros y marca un nuevo hito en la IA

El ecosistema de la inteligencia artificial ha vivido uno de sus anuncios más comentados de los últimos días. Según informes procedentes de China, el chip Ascend 910C de Huawei habría completado con éxito el entrenamiento de un modelo de gran escala vinculado a DeepSeek con un total de 1,6 billones de parámetros.

El dato por sí solo ya es relevante, pero lo que ha generado más atención es el tipo de proceso realizado, ya que no se trata únicamente de ejecución o inferencia, sino de entrenamiento completo a gran escala, una de las tareas más exigentes dentro del desarrollo de modelos de inteligencia artificial.

Este avance ha sido presentado como un punto de inflexión para la capacidad de cómputo nacional en China, especialmente en un contexto donde el entrenamiento de modelos masivos ha estado históricamente dominado por infraestructuras basadas en chips extranjeros.

¿Para qué se usa el procesador Ascend 910C?

El Ascend 910C no está pensado para móviles, portátiles ni dispositivos de consumo. Se trata de un procesador de inteligencia artificial (NPU o acelerador de IA) desarrollado por Huawei para su uso en centros de datos, servidores de IA e infraestructuras de computación avanzada.

¿En qué campos se usa este procesador de Huawei?

Principalmente para:

  • Entrenar modelos de inteligencia artificial generativa (LLMs).
  • Ejecutar inferencias de modelos de IA como DeepSeek, Qwen o desarrollos propios de empresas chinas.
  • Alimentar supercomputadores y clústeres de inteligencia artificial.
  • Impulsar servicios en la nube especializados en IA.

¿En qué dispositivos se encuentra?

No se instala en productos destinados al consumidor final.

Se integra en:

  • Servidores de IA Huawei Atlas.
  • Sistemas de computación masiva como CloudMatrix 384.
  • Infraestructuras de nube para empresas, organismos públicos y centros de investigación.

¿Quién lo usa?

Según diversos informes, compañías tecnológicas chinas como:

  • Baidu
  • ByteDance
  • Tencent
  • Alibaba

han probado o utilizado infraestructura basada en el Ascend 910C para ejecutar cargas de trabajo relacionadas con la inteligencia artificial.

¿Con qué procesadores compite el Ascend 910C?

Su objetivo es competir con los aceleradores de IA de NVIDIA, entre ellos:

  • NVIDIA H100
  • NVIDIA H200
  • NVIDIA Blackwell

Diversos análisis estiman que el Ascend 910C alcanza aproximadamente el 60% del rendimiento de inferencia de un NVIDIA H100. Sin embargo, Huawei compensa esta diferencia mediante sistemas que agrupan cientos de chips trabajando de forma conjunta, aumentando así la capacidad total de procesamiento.

¿Qué significa entrenar un modelo de 1,6 billones de parámetros?

Para entender la magnitud del logro es necesario diferenciar dos conceptos clave en inteligencia artificial.

La inferencia es el uso del modelo ya entrenado. Es decir, cuando un usuario hace una pregunta, el sistema responde utilizando conocimientos ya adquiridos. Es un proceso relativamente eficiente y es donde actualmente muchos chips de IA ya tienen un rendimiento competitivo.

El entrenamiento es el proceso de creación del modelo. Aquí es donde el sistema aprende a partir de enormes volúmenes de datos y ajusta cada uno de sus parámetros internos. Este proceso requiere una potencia de cálculo extremadamente alta, además de infraestructuras distribuidas capaces de trabajar de forma coordinada durante largos periodos de tiempo.

Cuando se habla de un modelo con 1,6 billones de parámetros, la complejidad se multiplica. No solo implica almacenamiento masivo, sino también una comunicación constante entre miles de unidades de procesamiento trabajando en paralelo.

Un desafío técnico que solo unos pocos sistemas pueden afrontar

El entrenamiento completo de un modelo de este tamaño no es simplemente una cuestión de potencia bruta. Requiere coordinación entre hardware, software y arquitectura de red.

Uno de los principales retos es la distribución de memoria. Un modelo de este nivel no puede residir en un solo chip, por lo que debe dividirse en fragmentos distribuidos entre múltiples unidades de cómputo. Cada parte debe sincronizarse en tiempo real para mantener la coherencia del modelo.

Otro desafío crítico es el equilibrio de carga. En arquitecturas de tipo Mixture of Experts (MoE), diferentes partes del modelo se activan según la tarea, lo que puede generar desequilibrios de uso si no se gestiona correctamente la distribución de trabajo.

A esto se suma la estabilidad del sistema, ya que un entrenamiento de estas características puede durar semanas o incluso meses, donde cualquier fallo puede comprometer todo el proceso.

El papel del Ascend 910C en este avance

El chip Ascend 910C se ha convertido en el protagonista de este desarrollo al formar parte del clúster de computación utilizado en el entrenamiento del modelo.

Según la información difundida, el sistema habría sido capaz de mantener sesiones de entrenamiento prolongadas sin interrupciones significativas, lo que indica no solo capacidad de procesamiento, sino también madurez en la infraestructura de software y orquestación del hardware.

El rendimiento global del sistema se presenta como un ejemplo de cómo la industria de semiconductores china está evolucionando hacia escenarios de entrenamiento de modelos de gran escala, más allá de la inferencia, que hasta ahora era su principal campo de aplicación.

Más allá del chip: un ecosistema de inteligencia artificial en desarrollo

Uno de los puntos más destacados del proyecto es que no se limita a la tecnología del chip en sí, sino que incluye todo un ecosistema de inteligencia artificial orientado al desarrollo y la formación.

El entrenamiento del modelo habría sido realizado en colaboración entre instituciones académicas, centros de investigación y equipos de ingeniería, con participación directa de estudiantes y técnicos en entornos reales de computación a gran escala.

Este enfoque no solo busca resultados técnicos, sino también formar talento especializado en inteligencia artificial, algo considerado clave en la competencia global del sector.

Un avance con implicaciones estratégicas

Este tipo de logros tiene implicaciones que van mucho más allá del ámbito técnico. El entrenamiento de modelos de este tamaño con hardware nacional refuerza la independencia tecnológica en un sector altamente estratégico como es la inteligencia artificial.

También pone sobre la mesa la capacidad de desarrollar modelos avanzados de IA sin depender exclusivamente de infraestructura extranjera, lo que puede tener impacto directo en la industria global de semiconductores, computación de alto rendimiento y software de inteligencia artificial.


Conclusión

El supuesto entrenamiento de un modelo de 1,6 billones de parámetros utilizando el chip Ascend 910C de Huawei representa un paso importante en la evolución de la computación de alto rendimiento aplicada a la inteligencia artificial.

Más allá de la cifra, lo relevante es el salto conceptual que implica: pasar de la inferencia a la formación completa de modelos de gran escala con infraestructura propia.

Si este tipo de avances se consolida, la competencia global en inteligencia artificial no solo se medirá por la calidad de los modelos, sino también por la capacidad de países y empresas para entrenarlos de forma autónoma, mantener una infraestructura de IA escalable y desarrollar un ecosistema tecnológico capaz de competir a escala mundial.

Vistas: 1
Scroll al inicio