OpiniónInteligencia Artificial

Aprendizaje automático: el valor para la industria financiera

Lenildo Morais es Maestro en Ciencias de la Computación del Centro de Computación de la Universidad Federal de Pernambuco. Gerente de proyectos en Ustore. También es profesor en Uninassau - Ser Educacional e investigador en Assert - Advanced Research Technologies in Systems and Software Engineering

Lenildo Morais.
Lenildo Morais.

¿Qué es el Aprendizaje Automático?

Es bueno explorar este tema más a fondo primero. El aprendizaje automático es una parte de la inteligencia artificial que se enfoca en encontrar patrones en grandes cantidades de datos. Muchos grupos de datos son simplemente demasiado grandes para que un cerebro humano pueda extraer algo útil de ellos en un período de tiempo razonable, pero las computadoras son otra cuestión. Con su poder de procesamiento actual, las computadoras pueden escanear, comparar y finalmente reconocer patrones de un número infinito de diferentes tipos de datos. Estos patrones forman la base de un nuevo algoritmo, que continúa "aprendiendo" agregando nuevos datos y, por lo tanto, continúa evolucionando y descubriendo nuevos patrones.

El auge de Big Data ha impulsado un fuerte renacimiento del interés en la inteligencia artificial y el aprendizaje automático. Esto también se refleja en el número de vacantes que buscan analistas de datos. En todo el mundo se está invirtiendo mucho en Machine Learning. Esto se debe a la alta disponibilidad de Big Data.

Algunos Ejemplos en el Mercado Financiero

Los bancos más grandes del mundo están trabajando en el desarrollo de inteligencia artificial y aprendizaje automático. Al proporcionar información sobre pagos y gastos futuros, basándose en patrones pasados, los consumidores pueden estimar mejor si realizarán o no una compra en particular. También hay herramientas y una interfaz de programación de aplicaciones que pueden detectar patrones basados ??en fluctuaciones de precios (datos) anteriores y ayudar a los operadores de valores a tomar decisiones. O modelos de riesgo que brindan a los bancos información sobre el comportamiento de pago de los clientes hipotecarios, que se puede utilizar para identificar posibles dificultades o retrasos en los pagos en una etapa temprana.

Uso de Inteligencia Artificial y Aprendizaje Automático para combatir Delitos Financieros

Al utilizar tecnología inteligente como la inteligencia artificial, los bancos pueden exponer a los ciberdelincuentes mejor y más rápido. Esto es posible utilizando dos métodos concretos: "series de tiempo avanzadas" y "minería de modelos excepcionales". Al observar patrones en los datos con inteligencia artificial y técnicas de aprendizaje automático (ML), se puede detectar el lavado de dinero. Los datos con un aspecto temporal, como el volumen de negocios de una empresa por día o por semana, también se denominan a menudo datos de series de tiempo.

Los datos de series de tiempo se utilizan a menudo para hacer predicciones sobre el futuro, ya que una predicción sobre el futuro se realiza en función de los patrones observados en los datos históricos. Estas predicciones contienen una incertidumbre, por lo que cuanto más lejos está la predicción en el tiempo, mayor es la incertidumbre. Por lo tanto, la predicción no es un valor absoluto, sino un intervalo de confianza entre el cual el valor se encuentra con una probabilidad predeterminada. Estas predicciones se pueden hacer por adelantado y comparar con la realidad tan pronto como se disponga de datos reales. Normalmente, un punto se desvía si está fuera del intervalo de confianza.

Considere, por ejemplo, la evolución del desempeño empresarial en las industrias afectadas por Covid-19. Sería especial si una empresa en una industria actualmente de bajo rendimiento pudiera generar los mismos ingresos. En este caso, puede ser interesante investigar esta empresa con más detalle. Esto se debe a que un criminal en un caso de lavado de dinero hace todo lo posible para parecer "normal". Por tanto, puede resultar sospechoso si un punto se encuentra precisamente dentro del intervalo de confianza. Otra aplicación es que las tendencias actuales de la industria se incluyen en un análisis de series de tiempo. Si se hace correctamente, las tendencias de la industria deberían caer nuevamente dentro del intervalo de confianza.

El desarrollo del aprendizaje profundo es importante para desarrollar el aprendizaje automático

Aprendizaje Profundo

El desarrollo del aprendizaje profundo es importante para desarrollar el aprendizaje automático. Este segmento no solo se ocupa de la precisión humana en el reconocimiento de texto, imágenes y voz, sino incluso con precisión sobrehumana. Los nuevos desarrollos en el aprendizaje profundo permiten abordar de manera diferente los modelos convencionales y lineales y hacer mejores predicciones, también en el sector bancario. Las técnicas de aprendizaje profundo pueden descubrir relaciones más abstractas y patrones no lineales. Desarrollos que contribuyen a los modelos de riesgo. Un ejemplo práctico es la influencia de las (malas) hipotecas sobre el sistema financiero en su conjunto, una de las mayores causas de la crisis financiera, que los modelos convencionales no previeron.

La capacidad de descubrir patrones más abstractos y no lineales habilita nuevos modelos para predecir tendencias, fraudes y riesgos. Estos pueden ser desarrollos extremadamente valiosos para los bancos y los consumidores.

Modelo de Minería Excepcional

Otro uso útil de la inteligencia artificial para desenmascarar a los lavadores de dinero es la minería de modelos excepcionales. Este método puede distinguir subgrupos dentro de un conjunto de datos en función de una combinación de atributos, lo que determina si el comportamiento de ese subgrupo es excepcional o no. Esto significa que el algoritmo creará todos los subgrupos posibles en los datos, basándose en diferentes atributos. Supongamos que un conjunto de datos de un cliente tiene un atributo "edad", entonces el modelo genera un subgrupo con personas entre 11 y 20 años, entre 40 y 60 años y entre 13 y 55 años. Literalmente, todas las combinaciones son posibles.

El algoritmo evalúa estos subgrupos mediante una métrica que debe completarse por sí mismo. Cada subgrupo recibe una puntuación basada en esta métrica. Esta puntuación, por tanto, indica el grado de interés de un subgrupo. Dos ejemplos prácticos:

• Ejemplo 1: Aclaración de EMM

Suponga que tiene un conjunto de datos con casas y atributos asociados, como área de superficie, número de baños y ubicación relativa al centro. A la gente le gustaría saber qué factores influyen en el precio de venta de una vivienda. Ahora es posible realizar todo tipo de correlaciones. Sin embargo, a menudo habrá muchos factores que se influyen entre sí, lo que complica el análisis.

En este ejemplo, EMM examina primero para qué subgrupos se puede encontrar una correlación entre la superficie de una casa y el precio de venta. La hipótesis es que el área de superficie influye en esto, pero esto no parece ser lo suficientemente cierto para el conjunto de datos en general. La métrica utilizada es la correlación, las variables objetivo son el precio de la vivienda y el área, y las otras variables se utilizan para crear subgrupos. Por tanto, cada posible subgrupo recibe como puntuación la correlación entre el precio de la vivienda y la superficie dentro del subgrupo.

Después de que se hayan creado todos los subgrupos posibles, se obtiene una lista de los X subgrupos superiores con una correlación muy alta o muy baja (dependiendo de la maximización o minimización). Por ejemplo, la conclusión podría ser que la superficie tiene una correlación directa con el precio de venta solo si el terreno está al menos a diez kilómetros del centro de la ciudad, o al menos a dos kilómetros de distancia.

• Ejemplo 2: Aplicación EMM para Monitoreo de Transacciones

La misma metodología se puede aplicar a las transacciones. Como métrica, un ejemplo podría ser "número actual de transacciones versus número de transacciones en un día típico". Todos los subgrupos posibles se pueden crear y evaluar con esta métrica. Como resultado, surgirán subgrupos que harán negocios relativamente grandes o pequeños en relación con el índice de referencia. Algunos de estos grupos se pueden explicar con conocimientos de dominio. Por ejemplo, en determinados sectores que se vieron afectados en mayor o menor medida por la crisis.

Todavía existen algunos obstáculos para lo que es potencialmente una gran forma de tecnología. El reciente desarrollo de la Inteligencia Artificial Explicable proporciona más interpretabilidad y controlabilidad dentro de los nuevos modelos. El núcleo de la Inteligencia Artificial Explicable es una nueva forma de distinguir diferentes propiedades. En lugar de realizar conexiones cruzadas a través del espacio, esta técnica intenta hacer conexiones de forma lógica, confirmando o eliminando propiedades.

Arañazos

Casi parece una ley que las cosas más fantásticas siempre tienen lados oscuros. Lo mismo se aplica al aprendizaje profundo. La enorme libertad y el número de pasos de cálculo abstracto también pueden hacer que los modelos de Inteligencia Artificial sean difíciles de interpretar, lo que puede confundir las conexiones causales. La entrada de un modelo se modifica ligeramente, a un nivel que es indetectable para el ojo humano. Las conexiones causales pueden desaparecer, pero también pueden hacerse de formas indeseables, por ejemplo, en el campo de la etnicidad. Sin ser visibles en el resultado, los modelos de Inteligencia Artificial pueden deducir de los datos cuál es la etnia de una persona.

Hacer conexiones es la fortaleza pero también la debilidad del aprendizaje automático. No siempre está claro de antemano cómo interactuarán las conexiones entre sí. Esto puede provocar inestabilidad en el sistema financiero. Por último, los modelos de inteligencia artificial pueden "superponerse". Por ejemplo, encajan muy bien en un conjunto de entrenamiento, pero no tienen valor predictivo para nuevos datos. Un modelo mal entrenado conlleva el riesgo de evolucionar en una dirección que no queremos o que es totalmente inútil.

Computing 806