En este artículo te cuento sobre un programa genial que te permite convertir archivos de audio a textos de forma rápida y muy eficiente. Para ello utiliza el motor de inteligencia artificial Whisper creado por OpenAI (los mismos de ChatGPT) y todo de forma gratuita y además local, es decir que no se necesita subir ningún contenido a Internet.
La aplicación en cuestión se llama Speech Note y la puedes encontrar en formato flatpak (en el repositorio flathub), lista para instalar en cualquier distribución Linux. Entre otras cosas destaca por permitir descargar y utilizar múltiples modelos de transcripción para adaptarse a la potencia y memoria del PC o notebook que estemos utilizando. Tenemos versiones del motor que van desde base, tiny, small, medium y large. Whisper es una IA que obtiene resultados impresionantes al transcribir, con una tasa de aproximadamente 5% de error y siempre menor a 20% con el idioma español. En su última versión cuenta con más de un millón de horas de entrenamiento.
Por si fuera poco, el programa permite hacer la función opuesta: transcribir texto a voz utilizando diferentes tipos de voces y velocidades de reproducción. Y además se puede usar para hacer traducciones de idiomas. Todo esto de forma local ya que se descargan los modelos al equipo y no tenemos que usar Internet luego para hacer las transcripciones. Esto brinda una gran seguridad de que nuestros datos y archivos no son accedidos por nadie más que nosotros.
Si eres estudiante, profesional o periodista esta herramienta te resultará extremadamente útil y seguro cambiará tu flujo de trabajo, ya que te permitirá automatizar una de las tareas más tediosas y difíciles como es la transcripción de audios.
Te invito a probar Speech Note y dejo a continuación el video explicando su uso:
Comentarios