Google lanza la primera voz Wavenet en español

Tiempo de lectura: 2 minutos
Google lanza su primera voz WaveNet en español. La nueva voz sintética, de tono masculino, está disponible tanto en la consola de Dialogflow como en la página de Text-to-speech.

Al fin se ha producido el lanzamiento que muchos desarrolladores de asistentes virtuales de voz llevaban esperando en España: la primera WaveNet en español está disponible desde este miércoles 7 de octubre.

Hasta ahora, tanto Text-to-speech como Dialogflow sólo ofrecían la posibilidad de una voz estándar, de género femenino. Aunque la consola de Dialogflow permite cierto grado de personalización en la velocidad de locución, los semitonos y el volumen, esta voz resultaba bastante robótica y poco natural en ciertos momentos:

Por su parte, la nueva voz WaveNet en español suena mucho más natural y humana:

Qué son las WaveNet

WaveNet es una red neuronal desarrollada por Deepmind, empresa que fue adquirida por Google en 2014. Esta red neuronal profunda es capaz de modular directamente ondas de sonido, en lugar de concatenar fragmentos de sonido grabados, como hacen otras tecnologías. 

La WaveNet se entrena con una gran cantidad de muestras de voz. Así, es capaz de aprender las características de muchas voces diferentes, masculinas y femeninas. El mismo modelo puede ser entrenado para distintos idiomas y puede, incluso, generar música.

El resultado con WaveNet son voces sintéticas que tienen un sonido más natural que otros sistemas que imitan a la humana. De hecho, no sólo se generan los sonidos del habla, sino también otros como los de respiración y los movimientos de la boca. 

Apuesta de Google Cloud por la IA

El hecho de que Google haya liberado su primera voz WaveNet en español es solo un paso más de la empresa en su apuesta por ofrecer a todo el mundo sus productos de Inteligencia Artificial aplicada a todos los ámbitos.

“Para nosotros es una oportunidad de mejorar la calidad del servicio que prestamos, ya sea para aplicaciones que desarrollan los clientes, como para los agentes virtuales que se pueden desarrollar con Dialogflow y CCAI. En particular para el mundo del Contact Center telefónico, donde la interacción se realiza con voz, pensamos que va a ser un gran avance para los proyectos en castellano. ” 

Javier Martínez, Customer Engineer Manager de Google Cloud Spain. 

Esta nueva voz en castellano viene a sumarse a la larga lista de lenguajes ya soportados por Google Cloud Text-to-speech.

Se prevé que a medio plazo aparezcan nuevas voces WaveNet que enriquezcan los agentes conversacionales en español desarrollados en Dialogflow. En algunas empresas como Emergya ya estamos aplicando estas nuevas voces a nuestros proyectos. Para conocer un poco más, puedes contactar con nosotros.

Deja un comentario