Dialogflow CX anuncia nuevas capacidades para Vertex AI Conversation: configuración de análisis y fragmentación en los almacenes de datos
Dialogflow CX ha integrado nuevas capacidades para Vertex AI Conversation, permitiendo la configuración de análisis y fragmentación en los almacenes de datos. Según la fuente de datos que estés utilizando, ahora podrás ajustar los parámetros de análisis y fragmentación de documentos de acuerdo con las especificaciones establecidas por Vertex AI Search.
Definir cómo Vertex AI Search analiza el contenido
Al cargar contenido no estructurado en Vertex AI Search, puedes especificar cómo quieres que se analice. Ofrece las siguientes opciones:
- Analizador digital: extrae texto legible por máquina de los documentos. Detecta bloques de texto, pero no elementos de documentos como tablas, listas y encabezados.
- Analizador de OCR para archivos PDF: si tienes archivos PDF que no se pueden buscar (escaneados o con texto dentro de imágenes), Google recomienda activar el procesamiento de reconocimiento óptico de caracteres (OCR) durante la creación del almacén de datos. Esto permite que Vertex AI Search extraiga elementos de párrafo. Con archivos PDF con capacidad de búsqueda no es necesario activarlo.
- Analizador de diseño: permite a Vertex AI Search detectar diseños para archivos PDF, HTML y DOCX para luego identificar elementos de contenido (bloques de texto, tablas, listas) y elementos estructurales (títulos y encabezados) y usarlos para definir la organización y jerarquía de un documento.
También tienes la opción de utilizar tus propios documentos ya analizados. Se recomienda utilizar el analizador de diseño cuando el contenido contiene elementos estructurales como secciones, párrafos, tablas y listas, ya que estos elementos se extraerán de los documentos para la búsqueda y generación de respuestas. En esta tabla puedes ver la disponibilidad de cada analizador por tipos de archivos de documentos y muestra qué elementos puede detectar y analizar cada uno:
Utilizar Vertex AI Search para la generación aumentada de recuperación
Otra de las nuevas capacidades para Vertex AI Search es que está optimizado para la recuperación de documentos (RAG), donde su aplicación de búsqueda se utiliza principalmente para aumentar la salida de LLM con datos personalizados. Cuando la fragmentación de documentos está activada, Vertex AI Search divide sus documentos en partes. En los resultados de búsqueda, puede devolver fragmentos de datos relevantes en lugar de documentos completos, como PDFs o páginas web. El uso de datos fragmentados para RAG aumenta la relevancia de las respuestas de los LLM y reduce la carga computacional de los LLM.
Para utilizar la búsqueda Vertex AI para RAG:
- Activa la fragmentación de documentos cuando crees tu almacén de datos.
- Recupera y visualiza fragmentos enumerando fragmentos de un documento, obteniendo fragmentos en JSON de un documento procesado u obteniendo fragmentos específicos.
- Devuelve fragmentos en solicitudes de búsqueda.
Pero ojo, porque la fragmentación tiene algunas limitaciones:
- No se puede activar ni desactivar después de la creación del almacén de datos.
- Puedes realizar solicitudes de búsqueda de documentos en lugar de fragmentos de un almacén de datos con la fragmentación de documentos activada. Sin embargo, estos almacenes no están optimizados para devolver documentos, sino que se devuelven agregando fragmentos en documentos.
- Cuando la fragmentación de documentos está activada, no se admiten resúmenes de búsqueda ni búsquedas con seguimientos.
Por último, además de las nuevas capacidades para Vertex AI Conversation, Dialogflow CX ha implementado Call Companion de forma general, con nuevas configuraciones de interfaz de usuario.