¿Qué es Voz a texto?
Voz a Texto convierte tus palabras habladas en texto escrito usando el reconocimiento de voz integrado en tu dispositivo. Úsalo para dictar notas, redactar mensajes o anotar ideas con las manos libres. Todo se procesa de forma privada en tu dispositivo.
El reconocimiento usa la Web Speech API que viene en Chrome, Edge y Safari, así que la precisión depende de tu dispositivo y micrófono, no de un servidor lejano. Hay trece idiomas de reconocimiento, incluidas variantes del inglés, mandarín, árabe e hindi. La puntuación no se inserta sola: di 'coma' o 'punto' para añadirla.
Cómo usar
- Paso 1 — Haz clic en el botón del micrófono y concede acceso al micrófono cuando se te solicite.
- Paso 2 — Habla con claridad hacia el micrófono. Tus palabras aparecerán como texto en tiempo real.
- Paso 3 — Haz clic en detener cuando termines, luego copia o descarga tu texto transcrito.
Cuándo usar
- Dictar mensajes, correos o notas con las manos ocupadas mientras conduces o cocinas.
- Capturar apuntes de reuniones cuando escribir a teclado sería demasiado lento.
- Reducir el esfuerzo en las muñecas si teclear te causa molestias.
Resultado
Estás en una reunión y necesitas tomar notas rápidas. Pulsa el botón del micrófono, habla con naturalidad sobre los puntos de discusión y obtén una transcripción limpia que puedes pegar en tu aplicación de notas.
Preguntas frecuentes
- ¿Mi voz se envía a un servidor?
- El reconocimiento lleva el audio al servicio de voz integrado del dispositivo: en Chrome va a Google, en Safari a Apple y en algunas plataformas se hace en local. En cuanto aparece el texto se queda aquí en tu dispositivo. Además lo guardamos automáticamente en local para que una recarga no te haga perder el trabajo; el botón Borrar elimina la copia guardada.
- ¿Por qué el botón del micrófono no hace nada?
- O el navegador no expone la Web Speech API (Firefox antiguo, algunas ventanas privadas) o se denegó el permiso del micrófono. Revisa el icono de permisos de la barra de direcciones. Chrome y Edge en escritorio o Android suelen ir mejor.
- Se detiene a los pocos segundos, ¿qué pasa?
- Muchos navegadores cortan tras un silencio para ahorrar recursos. Hablando seguido se mantiene activo. Si se corta a mitad de frase, vuelve a pulsar el micrófono: la transcripción se conserva y lo nuevo se añade al final.
- ¿Puedo añadir comas, puntos y saltos de línea?
- Sí, di los signos en voz alta: 'coma', 'punto', 'signo de interrogación', 'salto de línea'. Los motores de reconocimiento varían en lo bien que los captan, así que es normal repasar el texto después.
- Se transcribió mal mi acento, ¿puedo editar el diccionario?
- El modelo de reconocimiento es del navegador, aquí no se puede tocar. Elegir la variante regional más cercana (en-GB frente a en-US, es-MX frente a es-ES) cubre la mayoría de los problemas. Para nombres o jerga, edita el texto antes de copiarlo.
Herramientas relacionadas
Analizador de espectro
Visualiza el espectro de frecuencias de audio en tiempo real
Conversor de mono a estéreo
Convierte archivos de audio mono a estéreo
Conversor de Tasa de Bits de Audio
Cambia la tasa de bits de archivos de audio
Fundido Cruzado de Audio
Transición suave entre dos pistas de audio
Efecto de Coro
Añade efecto de coro al audio
Generador de imágenes de onda
Exporta la forma de onda del audio como imagen