OpiniónAnalytics

Aplicando la Inteligencia Artificial al Gobierno del dato

Mario de Francisco Ruiz, Chief Executive Officer de Anjana Data.

Desde 2016, la inversión en Inteligencia Artificial (IA) por parte de las organizaciones crece exponencialmente y la previsión es que esta tendencia siga en aumento a lo largo de los próximos años. Sin embargo, casi el 75% de las iniciativas de IA no logran los objetivos propuestos y más del 90% de este tipo de proyectos manifiesta tener graves problemas con la materia prima de la que se alimentan, los datos.

Esto se convierte en “la pescadilla que se muerde la cola”: invierto en IA, pero no consigo los objetivos porque no tengo un gobierno del dato efectivo y eficiente, pero no puedo invertir todo lo que necesito en gobierno del dato porque se dota de mayor presupuesto a los proyectos de IA que a los de gobierno del dato.

¿Y cómo se consigue romper este círculo vicioso?

Tenemos tres claros ejemplos de organizaciones que están tratando de hacerlo (y consiguiéndolo en gran medida):

  • Organizaciones nativas digitales o cuyo negocio son lo datos, las cuales llevan la cultura del dato en el ADN y, por lo tanto, el gobierno de estos es parte de su día a día y lo evolucionan a medida que avanzan los escenarios de negocio y tecnológicos. El problema es que son pocas las que presentan esta situación y, por lo general, suelen ser pequeñas y medianas empresas.
  • Organizaciones que se han visto obligadas a contar con un gobierno del dato por exigencias normativas (en especial Bancos e Instituciones Financieras) y, además, han tenido el presupuesto suficiente como para llevar a cabo iniciativas mastodónticas, con un grandísimo desembolso de dinero y un ROI seguramente negativo. No parece que esté al alcance de todas, ¿verdad?
  • Organizaciones que confían uno de sus activos estratégicos como son los datos a un único proveedor “capaz” de cubrir todo el ciclo de vida del dato con soluciones propietarias. Esto no sólo hace que se firmen contratos y licencias con montos altos y largas duraciones, sino que, como en toda externalización, están perdiendo el control de esa parte del negocio al dejarlo en manos de un tercero.

Nuestra visión desde Anjana Data

Los grupos anteriores están muy bien, pero la realidad es que cubren un pequeñísimo porcentaje del tejido empresarial actual. ¿Y si generamos un nuevo grupo donde tuvieran cabida la gran mayoría de las organizaciones que no están presentes en los anteriores? ¿Podríamos suplir esas carencias con soluciones diferenciales, innovadoras y disruptivas?

En Anjana Data creemos que sí, por eso estamos trabajando en la aplicación de IA, pero con un enfoque totalmente orientado a la potenciación de la cultura del dato en las organizaciones y a la implantación efectiva y eficiente de un gobierno del dato que garantice el éxito de las iniciativas de explotación de datos. El impacto es especialmente alto en iniciativas tan sensibles a la calidad del dato como IA.

Queremos ofrecer a nuestros clientes capacidades totalmente diferenciales, innovadoras y disruptivas dentro de nuestra solución de Gobierno del Dato

Además, si lo pensamos bien, estaríamos cubriendo varios frentes a la vez, ya que realizaríamos las diferentes labores en paralelo:

  • Pruebas de concepto de implementación de IA: Aunque no sean con objetivos directamente medibles para negocio, el aprendizaje, los resultados y las metodologías pueden servirnos igual.
  • Implantación incremental del gobierno del dato, derivando en una mejora directa de la cultura del dato para poder contar con más y mejores datos comprensibles y de confianza que alimenten posteriormente nuestras iniciativas de IA.
  • Dedicación del talento y conocimiento de las personas clave para un mismo objetivo en lugar de volver a “la pescadilla que se muerde la cola”.

Aplicando IA… ¿no tendría el mismo problema de la materia prima?

Sí, pero en menor medida. La materia prima que voy a necesitar en primera instancia para estas iniciativas son los metadatos, que se dividen en:

  • Técnicos: Extraídos de los sistemas y las BBDD. Suelen ser totalmente confiables ya que definen a nivel técnico las características de los datos. El mayor problema que entrañan es su abstracción, estandarización y entendimiento.
  • Operacionales: Extraídos de los procesos y sus ejecuciones. A menudo, su adquisición no es todo lo sencilla que nos gustaría y a veces podemos encontrarnos ante situaciones donde tendremos carencias de información en este aspecto, pero, por norma general, y además cada vez más, su exposición se trata de estandarizar para facilitar su captura y comprensión.
  • De negocio: Existen en las cabezas de las personas y, si estas los han digitalizado en algún momento, también existirán en algún repositorio del que se puedan extraer. Son los que mayor complejidad encierran y también los que más valor ofrecen, pero también son los que con mayor facilidad vamos a poder obtener gracias al aprendizaje continuo de los algoritmos de IA.

IA en Anjana Data

Seguro que a estas alturas te estás preguntando… ¿y qué aplicaciones de IA está empezando a implementar Anjana Data para ayudarme con mis iniciativas de gobierno del dato? Todavía no podemos hacer mucho spoiler (por eso de la competencia) pero sí que podemos dejaros algunas ideas:

  • Mejora de experiencia en la búsqueda de objetos tanto de negocio como técnicos con propuestas basadas en la interacción de los usuarios. Similar a lo que hacen los motores de búsquedas más potentes.
  • Sugerencia de objetos y elementos que pueden ser de interés en base a tu uso de la aplicación, por ejemplo, para solicitar acceso a datos. Similar a la experiencia de compra en las plataformas de ecommerce.
  • Inferencia y sugerencia de términos y metadatos de negocio gracias al Procesamiento de Lenguaje Natural, detección de patrones y las relaciones entre los objetos.
  • Descubrimiento de relaciones entre objetos (traza, linaje) basado en algoritmos de detección de similitudes y medición de la distancia euclídea.
  • Detección inteligente de Golden Sources y Golden Records en base a los metadatos, la calidad de los datos y el uso de los datos por parte de los usuarios, así como de datos críticos y/o calientes.
  • Detección de objetos y/o elementos duplicados o similares y propuesta de mejora de las estructuras de datos (localización, modelo de datos, rendimiento, particionamiento, …) en base al uso de los datos por los usuarios y los procesos.
  • Detección de cuellos de botella en los procedimientos internos de gobierno y recomendaciones predictivas para la mejora de estos.
  • Identificación de malos usos de los datos en base a los términos de licencia especificados y el uso real de los mismos.
  • Identificación de anomalías en procesamiento de datos en base al comportamiento habitual de las plataformas monitorizadas

Como puedes ver, en Anjana Data queremos ofrecer a nuestros clientes capacidades totalmente diferenciales, innovadoras y disruptivas dentro de nuestra solución de Gobierno del Dato y por ello te animamos a que conozcas nuestra solución, su estado actual, y hacia dónde nos dirigimos.

No pienses sólo en el presente, ten en cuenta que el futuro está a la vuelta de la esquina.

Computing 786