OPINIÓN

Agentes de datos inteligentes: clave para aprovechar la información empresarial



Dirección copiada

Para aprovechar todo el potencial de la IA generativa en las empresas, es clave que los modelos accedan a datos relevantes y fiables

Publicado el 27 jun 2025

Anastasio Molano

senior VP para EMEA en Denodo



agentes ia de datos

Agentes de datos inteligentes

El mundo de la IA generativa está en constante evolución. Los grandes modelos de lenguaje (LLM) han mejorado sus capacidades de razonamiento y eficiencia, reduciendo los costes de entrenamiento y operación. Al mismo tiempo, las herramientas para el desarrollo de aplicaciones agentic han avanzado, permitiendo que los agentes especializados colaboren para ofrecer funcionalidades más completas.

El 2025 se presenta como el año en el que las organizaciones pasarán de la experimentación a la obtención de valor de negocio real de sus implantaciones de IA generativa en forma de reducción de costes, mayor eficiencia en sus procesos y mejores servicios a sus clientes. Sin embargo, las compañías son cada vez más conscientes de que la diferenciación no estará en los modelos de IA generativa utilizados, sino en cómo los datos empresariales pueden ponerse a disposición de estos motores para resolver sus problemas de negocio manteniendo los criterios razonables de seguridad y confiabilidad.

El patrón RAG (“Retrieval Augmented Generation”) se ha convertido en la mejor manera de proporcionar, a un modelo de lenguaje LLM, información específica de una organización

ANASTASIO MOLANO, DENODO

La importancia de los datos en la IA generativa

Para aprovechar todo el potencial de la IA generativa en las empresas, es clave que los modelos accedan a datos relevantes y fiables. El poder proporcionar estos datos integrados en una sola fuente de datos de manera integrada y consistente, mejora la precisión de las respuestas. Se han desarrollado diversas metodologías para optimizar el uso de la información dentro de dichos modelos.

El patrón RAG (“Retrieval Augmented Generation”) se ha convertido en la mejor manera de proporcionar, a un modelo de lenguaje LLM, información específica de una organización. Algo que se logra al proporcionar datos relevantes empresariales y sobre el negocio a la conversación con el motor LLM, permitiendo generar respuestas más precisas y personalizadas.

Cuando se trabaja con documentos no estructurados, el proceso es más simple. Primero, los documentos se dividen en fragmentos llamados ‘chunks’, que luego se convierten en vectores y se almacenan en una base de datos vectorial. Cuando un usuario hace una pregunta, su consulta también se convierte en un vector y se compara con dichos fragmentos almacenados. Así, los más similares se incluyen en la conversación con el motor LLM, ya que contienen la información más relevante para obtener la mejor respuesta.

Pero cuando se trata de datos empresariales, ya sean estructurados o semi-estructurados, la gestión puede presentar diferentes desafíos. En este caso, se utiliza una variante del patrón RAG llamada ‘Query RAG’, que consiste en incluir en la conversación con el motor LLM los metadatos que pueden aportar para conseguir la mejor respuesta para la consulta del usuario. Tras ello, se le pide al LLM que genere las consultas SQL necesarias para recuperar los datos correctos desde las bases de datos empresariales.

Los grandes retos de la IA generativa

Y es esta parte en donde encontramos los mayores retos para las organizaciones. Los datos se encuentran en la mayor parte de los casos fragmentados en diferentes silos de datos. Además, su nivel de calidad, la diferente nomenclatura de las diferentes tecnologías en las que residen los datos, y otras dificultades derivadas de la dispersión de los datos, seguramente no será adecuado para su utilización en la aplicación de IA generativa. De hecho, como los datos cambian constantemente, es difícil alimentar a un motor de LLM para que pueda responder con datos actualizados en tiempo real.

A su vez, en consultas complejas, el motor LLM ha de generar múltiples combinaciones de datos, lo que puede comprometer la calidad de sus respuestas. Los metadatos disponibles en las fuentes suelen ser principalmente técnicos, lo que también dificulta su interpretación por parte del motor de IA generativa y afecta la calidad de las respuestas. Y tampoco debemos olvidarnos de que el acceso a los datos ha de respetar las políticas de seguridad y gobierno establecidas en la organización, factor fundamental para una implantación a nivel corporativo.

Para resolver todos estos problemas resulta primordial disponer de una sólida base de gestión de datos (data foundation). Aquí es donde entran en juego las arquitecturas lógicas, que proporcionan una capa semántica capaz de exponer un modelo lógico de datos sobre multitud de fuentes de datos empresariales de manera ágil, eficiente y segura, permitiendo generar productos de datos a partir de combinaciones y transformaciones complejas de información.

Este modelo lógico utiliza etiquetas semánticas que representan conceptos de negocio y establecen relaciones entre objetos. Incluye descripciones que ayudan al motor LLM a comprender mejor la información, lo que mejora la traducción de consultas en lenguaje natural a SQL. Capacidades como la traducción del leguaje técnico a lenguaje de negocio, integración y centralización del control de acceso y de las políticas de privacidad, y la simplificación del acceso rápido y seguro a todos los datos relevantes para el proceso que el negocio necesita, son fundamentales para poner en marcha procesos apoyados en IA Generativa al ritmo que el negocio solicita.

Optimización de los modelos de lenguaje

Las plataformas más avanzadas de integración de datos que incorporan ahora IA Generativa permiten optimizar la precisión de los modelos de lenguaje compartiendo con estos motores la semántica de los datos, incluyendo relaciones entre objetos, linaje, etiquetas y descripciones semánticas, así como datos de ejemplo para mejorar el filtrado de las consultas.

A través de APIs basadas en frameworks como LangChain, estas soluciones facilitan un ágil y rápido despliegue de soluciones de IA Generativa (e.g. chatbots, asistentes inteligentes, etc.), así como su integración en herramientas de uso colaborativo en las organizaciones tales como Teams, Slack, Co-pilot, etc.

Las organizaciones deben evolucionar rápidamente y, en muchos casos, reinventar sus prácticas de gestión de datos. Es fundamental optar por soluciones más flexibles que permitan un acceso ágil a los datos, sentando las bases de un data foundation sólido. Esto es clave para hacer frente a un escenario cada vez más competitivo, impulsado por la irrupción de las tecnologías de IA generativa en todas las facetas empresariales.

Artículos relacionados

Artículo 1 de 5