AMD RDNA 4 Architecture a Fondo: Nuevas Unidades de Cómputo, Núcleos Mejorados de Ray Tracing, Mejoras en IA y Path Tracing

AMD finalmente ha desvelado los detalles completos de la arquitectura RDNA 4 de su próxima generación de GPUs, que está diseñada desde cero para la serie Radeon RX 9000.

Características Principales de la Arquitectura RDNA 4: Un Salto para los Jugadores

La arquitectura RDNA 4 ha sido muy esperada desde el lanzamiento de la anterior RDNA 3 y su versión mejorada RDNA 3.5.

Aunque no veremos modelos ultra-entusiastas, RDNA 4 trae cambios significativos que mejorarán el rendimiento en los juegos, ya que está especialmente diseñada para audiencias de gaming.

Mejoras clave de RDNA 4:

  • Optimización para cargas de trabajo de juegos de alto nivel.
  • Mejora en la Rasterización y Eficiencia de Cómputo.
  • Un salto en el rendimiento de Ray Tracing.
  • Soporte avanzado para ML (Machine Learning).
  • Mayor eficiencia de ancho de banda para todo tipo de cargas de trabajo.
  • Mejoras multimedia para jugadores y creadores de contenido.

Comparación RDNA 4 vs RDNA 2: Mejoras en Rendimiento ⚡

Comparado con RDNA 2, los GPUs RDNA 4 muestran un aumento cercano a 2x en la rasterización, casi 2.5x en ray tracing y 3.5x en cargas de trabajo de ML (matrices densas FP16) por unidad de cómputo. Ahora, veamos en detalle los bloques de construcción de RDNA 4 para entender cómo se ensamblan los chips.

Nuevas Unidades de Cómputo en RDNA 4

El Motor de Cómputo es el bloque fundamental de la arquitectura RDNA 4. Las nuevas Unidades de Cómputo (CUs) incluyen:

  • Unidades SIMD32 Dual y Operaciones de Matrices Mejoradas con nuevas tasas de matrices densas de 16b y 8b/4b.
  • Eficiencia estructural de Sparsidad 4:2, aumentando las tasas hasta 2x.
  • Nuevas tipos de datos en Flotante 8b y operaciones de matrices con transposición.

Además, las mejoras en el sombreado permiten que las unidades de sombreado asignen registros de manera dinámica, optimizando la latencia de memoria y aumentando la eficiencia general.

Mejoras en Ray Tracing

Las unidades de Ray Tracing de tercera generación ahora tienen una tasa de intersección de rayos 2x superior, mejor compresión de BVH y un sistema acelerado de recorrido de rayos.

Estas mejoras resultan en menores requisitos de memoria para BVH, reduciendo el uso de memoria a menos del 60% en comparación con RDNA 3.

Los nuevos ray accelerators también incluyen:

  • 2x unidades de intersección de caja y triángulo.
  • Transformaciones de instancias de hardware.
  • Mejor administración de RT stack y compresión de nodos.

Optimización de Memoria y Soporte de AI

La arquitectura RDNA 4 incluye mejoras de compresión de memoria para aliviar el ancho de banda disponible y tiene soporte para memoria GDDR6 de hasta 20.00 Gbps, con capacidades de hasta 16 GB y una interfaz de bus de 256 bits.

En el lado de la IA, RDNA 4 implementa su 3ra Generación de Motor de Aceleración de Matrices, que mejora las tasas densas de Tensor, soporta Sparsidad Estructurada y tiene capacidad de upscaling basado en ML o Super Resolución.

Mejoras en el Motor Multimedia y Display

El Motor Multimedia de RDNA 4 ahora es de diseño doble ancho con mejoras en los encoders/decoders, con hasta un 25% de mejora en la calidad de AVC/H.264/H.265 y el doble de rendimiento de AV1.

Además, el Radiance Display Engine ahora soporta DisplayPort 2.1a, HDMI 2.1b y un motor de escalado y afilado actualizado.

La GPU Navi 48 y Su Futuro en Path Tracing

RDNA 4 estará fabricada en el nodo de proceso TSMC 4nm, con hasta 53.9 mil millones de transistores y un tamaño de chip de 356.5mm2. La GPU Navi 48 (Radeon RX 9070 XT) es una de las variantes destacadas de la serie.

En cuanto a Path Tracing, AMD está adoptando técnicas similares a las utilizadas por NVIDIA, como el uso de Neural Supersampling y técnicas de denoising con IA/ML para mejorar el rendimiento y la calidad gráfica, enfocándose en la optimización de los costes de recorrido de rayos.


Descubre más desde CIBERED

Suscríbete y recibe las últimas entradas en tu correo electrónico.

Deja un comentario