Cómo puedo humanizar un asistente virtual

Tiempo de lectura: 4 minutos
Si hay algo que caracterice la tecnología de Google para la creación de bot conversacionales es su nivel de personalización. Humanizar un asistente virtual en Dialogflow no sólo es posible, sino recomendable. Te contamos cómo hacerlo.

Uno de los fallos más comunes a la hora de desarrollar un proyecto conversacional es que no dotarlo de suficiente humanidad. Son muchos los factores que influyen en que pueda acabar pareciendo un robot, con las consecuencias negativas que ello supone. Pero Keep calm! Humanizar un asistente virtual en Dialogflow es posible. Con unos pocos tips tu bot conversacional puede pasar de parecer un simple robot a cumplir las expectativas de quien acabe conversando con él.

La humanización de un bot conversacional debe abordarse desde dos enfoques: el del desarrollo y el del diseño conversacional. Es decir, no podremos obtener un asistente virtual humano si sólo nos centramos en parámetros técnicos. Es necesario incorporar a un equipo de lingüistas que ayuden desde el enfoque con el que se vaya a ejecutar, hasta el propio entrenamiento y posteriores mejoras. Ambos equipos han de trabajar de forma conjunta para adaptar al máximo los atributos del asistente.

Uno de los principales inconvenientes que existe en la actualidad es la poca literatura y bibliografía en torno a la personalización de Dialogflow en español. Eso hace fundamental la propia investigación; el ensayo-error hasta dar con la personalización de voz que andamos buscando.

Algunos elementos que se trabajan desde el enfoque conversacional y de desarrollo que harán que nuestro asistente parezca una persona son: frases de entrenamiento, chit-chat y parámetros extralingüísticos. A ello hay que sumar una continua mejora que vendrá determinada por el feedback de interlocutores y de las propias métricas extraídas del asistente.

Uno de los principales inconvenientes que existe en la actualidad es la poca literatura y bibliografía en torno a la personalización de Dialogflow en español. Eso hace fundamental la propia investigación; el ensayo-error hasta dar con la personalización de voz que andamos buscando.

Frases de entrenamiento

Dialogflow es una tecnología sustentada en Machine Learning. Es decir, el propio asistente va aprendiendo a base de entrenamiento, de frases de ejemplo. Así, se configura para que aporte una serie de respuestas a determinados intents (objetivos o necesidades que tiene una persona). 

La calidad de estos ejemplos de entrenamiento es esencial para un correcto funcionamiento del asistente. La elección de estos ejemplos tiene que partir de un equipo de lingüistas computacionales que sepan correctamente agrupar los intents y ofrezca frases precisas que hagan al asistente aprender de manera contextual y semántica.

Chit-chat para humanizar un asistente virtual

Algo que nos identifica a las personas cuando nos comunicamos de forma oral son los chascarrillos, las bromas, los dobles sentidos, las referencias… En contextos escritos es más difícil encontrar este tipo de mensajes. Sin embargo, estos contenidos informales hacen que la comunicación establecida sea más cercana.

Por ello, a la hora de desarrollar un asistente, no sólo deben contemplarse respuestas limitadas a su funcionalidad. Han de incorporarse frases o temáticas que alivien de formalidad la conversación. Si necesitas información sobre cómo crear este chit-chat, puedes ojear nuestro tutorial para crear el Small Talk en Dialogflow.

En esta web puedes jugar con DiFi

Empezar

Prosodia

Una de las cuestiones que planteadas al comienzo es que la configuración de Dialogflow está basada en los rasgos propios de un idioma concreto: el inglés. Pero cada lengua tiene unos elementos característicos de su prosodia, es decir, sus propias características en cuanto a entonación, pausas… Eso provoca que la voz básica que por defecto ofrece Dialogflow en español pueda resultar chocante. 

Sin embargo, también comentábamos que esas características preconfiguradas pueden personalizarse. Algo que necesitarás hacer no sólo si quieres humanizar tu asistente de voz, sino también si quieres diferenciarlo de otros que puedan existir en el mercado.

Te ponemos un ejemplo. “Bien” es una palabra aguda con diptongo que se pronuncia como una sola sílaba. Pero si entras en la consola de Dialogflow, Text-to-speech lo pronuncia como dos sílabas: “bi-en”. Esto ocurre cuando la palabra “bien” aparece aislada en un texto.

Configuración por defecto:

<p><s>Bien.</s><s>Para poder identificar otra reserva. Por favor, ¿me podría indicar el localizador?</s></p>

Sin embargo, es posible cambiar los parámetros para que se ajuste a nuestra prosodia: se añade un punto y espacio para que Text-to-speech lo identifique como final de frase haciendo descender la entonación:

Configuración correcta, tras pruebas de ensayo-error:

<p><s>Bien. </s><s>Para poder identificar otra reserva. Por favor, ¿me podría indicar el localizador?</s></p>

Evaluación y mejora

El trabajo de personalización del asistente no termina con la puesta en marcha de la primera versión. Si queremos un bot conversacional que sea eficaz y lleve a la compañía un paso más allá, la mejora tiene que ser continua

Dialogflow guarda un histórico de todas las conversaciones. Gracias a este registro es posible:

  • Detectar frases o preguntas con las que el asistente no ha funcionado o no ha sido preciso.
  • Descubrir nuevos usos o intents que no habían sido contemplados en el momento del desarrollo y para los que el bot no ha sido entrenado.
  • Establecer contextos y situaciones en los que es posible incorporar chit-chat o expresiones más coloquiales para descargar el tono formal de la conversación.

Por otro lado, es imprescindible establecer métricas para saber cómo está funcionando el asistente. Si existe abandono de interlocutores, si se detectan fallos de conexión… Para ello Dialogflow ofrece la posibilidad de conectar con sistemas externos como Chatbase o Botmetrics.

De igual forma, algunas empresas optan por desarrollar sus propios sistemas de medición. El aspecto más positivo de estos sistemas es que están adaptados a las peculiaridades del asistente virtual construido, para sus funciones y aplicaciones.

Un ejemplo de ello es la solución ad hoc desarrollada por Emergya para medir el desempeño de DiFi, nuestro asistente virtual, utilizando herramientas como BigQuery y DataStudio de Google.

Deja un comentario