El 30 de septiembre se publicó la versión 1.8.0 de whisper.cpp, la implementación de alto rendimiento del modelo de reconocimiento de voz Whisper de OpenAI.
El proyecto, desarrollado en C y C++ y distribuido bajo licencia MIT, utiliza la librería tensorial GGML, escrita también en C, para el cómputo eficiente en CPU y GPU.
Este proyecto se ha convertido en una referencia dentro del ecosistema de herramientas de speech-to-text por su capacidad de funcionar de forma ligera en distintos sistemas, incluso en dispositivos con recursos limitados.
-fa, --flash-attn ahora está habilitada de serie, mejorando la eficiencia del procesamiento.dtw.params para la v3-large-turbo.-nlp, --no-language-probabilities para desactivar el cálculo de probabilidades de idioma en el JSON detallado (reduce latencia).–Corrección de errores en GPU: solucionado un fallo al seleccionar dispositivos gráficos en sistemas con múltiples GPUs.
– Mejora en scripts de descarga: se prefiere curl frente a wget.
– Actualización de GGML a la última versión.
– Otros ajustes y correcciones menores.
La versión 1.8.0 refuerza el papel de whisper.cpp como una de las implementaciones más prácticas y portables de Whisper:
Con estas mejoras, whisper.cpp sigue siendo una alternativa ideal para quienes necesitan speech-to-text en local, con bajo consumo de recursos y sin depender de servicios en la nube.
Los juegos gratis de Amazon Prime Gaming representan un atractivo significativo para los suscriptores de…
Si eres un amante de los videojuegos, estás de suerte. Hasta el 20 de noviembre…
La computación cuántica acaba de dar un salto gigante. John M. Martinis, recién galardonado con…
La biografía más vendida del cofundador de Apple, Steve Jobs; escrita por uno de los…
Hubo un tiempo en el que la “seguridad en el hogar” significaba confiar en un…
Elon Musk vuelve a romper todos los esquemas. Los accionistas de Tesla acaban de aprobar…