Skip to content

Proyeccto corriendo bajo los modelos de vosk, junto con librerias sounddevice y scipy

Notifications You must be signed in to change notification settings

Gatogordo03/Voz-a-Texto

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 

Repository files navigation

Proyecto de Conversión de Voz a Texto con Vosk

Este proyecto permite convertir audio de voz a texto en tiempo real usando Python, la biblioteca Vosk y un modelo de reconocimiento de voz en español.

Requisitos

  • Python 3.8 o superior: Asegúrate de tener Python instalado en tu sistema.
  • pip: Python Package Installer.
    • Si no tienes pip, puedes instalarlo siguiendo las instrucciones aquí.

Instalación

Sigue estos pasos para instalar todas las dependencias necesarias y configurar el proyecto:

  1. Clona este repositorio o descarga los archivos manualmente.

    git clone https://github.com/Gatogordo03/Voz-a-Texto.git
    cd Voz-a-Texto
  2. Instala las dependencias utilizando el script de instalación incluido. Este script instala las bibliotecas necesarias (vosk, sounddevice, scipy) y descarga el modelo de reconocimiento de voz.

    • Para usuarios de Windows:

      • Haz doble clic en el archivo install_and_run.bat o ejecútalo desde la terminal.
      install_and_run.bat
      • El script descargará automáticamente el modelo de reconocimiento de voz y lo descomprimirá.
    • Para usuarios de Linux o Mac:

      • Instala manualmente las dependencias con:
      pip install vosk sounddevice scipy
      • Descarga el modelo de reconocimiento de voz en español desde este enlace y descomprímelo en la carpeta del proyecto.
  3. Configura la ruta del modelo: En el archivo prog.py, asegúrate de que la variable rutModel apunte a la carpeta donde está descomprimido el modelo Vosk.

Uso

Una vez que todo esté instalado y configurado, puedes ejecutar el proyecto para convertir tu voz en texto en tiempo real:

python prog.py

El programa capturará el audio desde tu micrófono y convertirá lo que digas en texto en tiempo real. Los resultados se mostrarán en la terminal.

Notas Importantes:

  • Si tienes problemas con el micrófono, asegúrate de que está correctamente configurado en tu sistema y que es compatible con Python a través de la biblioteca sounddevice.
  • Si usas Linux, puede que necesites permisos adicionales para acceder al dispositivo de audio. Intenta ejecutar el programa con sudo si es necesario.

About

Proyeccto corriendo bajo los modelos de vosk, junto con librerias sounddevice y scipy

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published