WAN 2.7 vs WAN 2.2: así evoluciona el modelo de vídeo con IA de Alibaba y cambia el equilibrio del mercado

El sector de la generación de vídeo mediante inteligencia artificial continúa avanzando a gran velocidad, y uno de los actores más relevantes en este espacio es el modelo WAN.

Tras el éxito de WAN 2.2 como una de las versiones más utilizadas en producción por su equilibrio entre calidad y coste, la llegada de WAN 2.7 supone un salto más significativo de lo que su numeración sugiere.

No se trata de una simple actualización incremental, sino de una mejora estructural que afecta directamente a la calidad del movimiento, la coherencia visual y los flujos de trabajo profesionales.

Mejora clave: fidelidad del movimiento mucho más estable

Uno de los problemas clásicos en los modelos de vídeo generativo es la coherencia temporal: mantener consistencia entre fotogramas cuando hay acción compleja.

En WAN 2.2, este problema ya estaba parcialmente resuelto, pero seguía fallando en escenarios como:

  • movimientos humanos complejos
  • interacción entre varios personajes
  • acciones rápidas o dinámicas

Con la llegada de WAN 2.7, estos puntos débiles se reducen notablemente.

Ahora, escenas con movimiento humano (caminar, correr, gesticular o manipular objetos) presentan una coherencia mucho más estable.

Además, las interacciones entre dos personajes funcionan con mayor consistencia visual, algo especialmente importante en narrativas cortas o vídeos publicitarios.

Video-extend: el cambio más importante del flujo de trabajo

Una de las novedades más relevantes de WAN 2.7 es la incorporación del modo video-extend, una función que permite prolongar clips existentes sin regenerarlos desde cero.

Este sistema permite tomar un vídeo generado previamente y extender su duración manteniendo:

  • iluminación general
  • dirección del movimiento
  • continuidad del sujeto

En la práctica, esto cambia por completo el flujo de producción.

En lugar de generar múltiples clips independientes, ahora es posible construir secuencias más largas de forma progresiva.

Sin embargo, no es perfecto: pueden aparecer ligeras variaciones en personajes o iluminación, especialmente en extensiones largas o escenas narrativas complejas.

Resolución y calidad más equilibradas

Otro de los avances importantes de WAN 2.7 está en la consistencia entre resoluciones. El modelo soporta salida en:

  • 720p
  • 1080p

En versiones anteriores, la diferencia de calidad entre ambas resoluciones era notable. Sin embargo, ahora el salto entre 720p y 1080p es mucho menor.

Esto convierte al 720p en una opción viable para contenido destinado a redes sociales o consumo móvil, optimizando costes sin sacrificar demasiada calidad visual.

Mayor duración de clips: hasta 15 segundos

Una de las limitaciones tradicionales de los modelos de vídeo con IA es la duración de los clips generados.

En WAN 2.2, el rango útil se situaba entre 2 y 8 segundos. Con WAN 2.7, ese rango se amplía hasta aproximadamente 15 segundos en escenas estables.

Esto abre la puerta a usos más avanzados como:

  • B-roll continuo
  • vídeos de producto
  • planos de establecimiento
  • contenido narrativo corto

Mejora en la adherencia al prompt

Otro avance importante es la precisión en la interpretación de instrucciones.

WAN 2.2 tendía a capturar la idea general del prompt, pero podía alterar detalles específicos como:

  • colores
  • posiciones de objetos
  • elementos de escena

En WAN 2.7, estos elementos se respetan con mayor fidelidad.

Esto es especialmente relevante para producción comercial, donde detalles como la posición de un objeto o el diseño de un entorno deben mantenerse consistentes.

Limitaciones que aún persisten

A pesar de las mejoras, el modelo todavía presenta algunas debilidades importantes:

  • estilos artísticos muy estilizados pueden perder coherencia en clips largos
  • escenas con coreografías complejas siguen siendo inestables
  • no existe soporte nativo de audio ni sincronización labial precisa

Esto significa que, aunque WAN 2.7 es más sólido, aún no sustituye completamente a pipelines de producción cinematográfica avanzados.

Posición de WAN 2.7 en el mercado de vídeo con IA

El papel de WAN 2.7 dentro del ecosistema de vídeo generativo es claro:

  • alternativa de alto volumen y bajo coste
  • ideal para producción masiva
  • competitivo frente a soluciones premium

En comparación, modelos como Sora o Veo siguen liderando en calidad cinematográfica, pero WAN destaca por su relación coste-rendimiento, especialmente en entornos de producción escalable.


Conclusión

La evolución de WAN 2.2 a WAN 2.7 no es simplemente una mejora incremental. Representa un cambio real en la madurez de los modelos de vídeo generativo.

Con mayor estabilidad de movimiento, clips más largos, mejor adherencia a prompts y un nuevo sistema de extensión de vídeo, el modelo se posiciona como una herramienta cada vez más sólida para producción audiovisual basada en IA.

Si la tendencia continúa, WAN podría convertirse en una de las piezas clave del ecosistema de generación de vídeo con inteligencia artificial a escala industrial.

Vistas: 4