“Auto Speech adaptation”, nueva función para mejorar la precisión del reconocimiento del habla del agente a través de pistas contextuales
Dialogflow CX ha incluido una nueva función llamada “auto speech adaptation” que busca mejorar la precisión de reconocimiento del habla de sus agentes. Para ello, usa automáticamente el estado de la conversación para pasar entidades relevantes y frases de entrenamiento como sugerencias de contexto del habla en todas las solicitudes de detección de intención.
La nueva característica funciona de la siguiente forma: al realizar una solicitud de detección de intención, se pueden incluir en Dialogflow CX opcionalmente phrase_hints (“pistas” contextuales) para proporcionar sugerencias al reconocedor de voz. Estas pistas ayudarán con el reconocimiento en un estado de conversación específico.
Cómo funciona Speech adaptation
En los agentes de voz, la intención del usuario pasa por Speech-to-text antes de ser procesada por Dialogflow. Por ello, en ocasiones pueden surgir malentendidos o malas interpretaciones de lo que está transmitiendo el usuario final.
Con la función “auto speech adaptation” se van a poder limitar estos errores de transcripción al facilitar al agente “pistas” contextuales (phrase_hints) que ayuden a conducir la conversación hacia el intent correcto.
Por ejemplo, en un agente de seguros, puede existir un intent relacionado con las pólizas de “decesos”. Pero esta palabra supone un reto a nivel de pronunciación y entendimiento para Speech-to-text: puede confundirse con expresiones como “de esos”, “de sexos” u otras similares. Al proporcionar un phrase_hints estaremos dirigiendo la conversación hacia el intent sobre decesos y evitaremos la aparición de fallback.
Habilitar la función “auto speech” en Dialogflow CX
La función “auto speech” está desactivada por defecto en Dialogflow CX. Para habilitarla o deshabilitarla, hay que seguir los siguientes pasos:
- Abre la consola de Dialogflow CX.
- Elige tu proyecto de GCP.
- Selecciona el agente.
- Haz clic en Configuración del agente.
- Haz clic en la pestaña IVR y voz.
- Activa o desactiva la opción Habilitar la adaptación de voz automática.
- Haz clic en Guardar.

Si habilitas la adaptación automática de voz, puedes compilar tu agente para aprovecharla. En concreto, puedes mejorar el reconocimiento de voz con ciertos cambios en las frases de entrenamiento y las entidades del agente.
En el ejemplo que dábamos anteriormente, si defines una frase de entrenamiento como “seguro de decesos”, ante un enunciado del usuario que suene similar, se reconocerá de manera correcta como “seguro de decesos” y no de otra forma con la que ese pueda confundir.