A FONDO

Machine learning, qué es, sus desafíos



Dirección copiada

El Machine Learning es una aplicación de la IA que hace posible que las máquinas extraigan conocimiento de los datos y aprendan de ellos de forma autónoma

Actualizado el 15 dic 2023



IA Generativa

El Machine Learning (ML) es una rama de la inteligencia artificial (IA) que se centra en el uso de datos y algoritmos para imitar la forma en la que los humanos aprenden. A Arthur Samuel, de IBM, se le atribuye haber acuñado el término ‘machine learning’ con su investigación en torno al juego de damas después de que Robert Nealey, el autoproclamado maestro de las damas, perdiera contra una computadora IBM 7094 en 1962.

Qué es el machine learning

El machine learning es un componente importante de la ciencia de datos. Mediante el uso de métodos estadísticos, los algoritmos se entrenan para hacer clasificaciones o predicciones y descubrir información clave en proyectos de minería de datos.

Aunque es un término que apareció hace más de 60 años, ha ido ganando protagonismo en los últimos años debido a la irrupción de la inteligencia artificial, la explosión de los datos y al aumento de la capacidad de computación.

El ML es, en definitiva, un tipo de inteligencia artificial (IA) centrada en construir sistemas informáticos que aprenden a partir de los datos. La amplia gama de técnicas que abarca el aprendizaje automático permite que las aplicaciones de software mejoren su rendimiento con el tiempo.

Cómo funciona el machine learning

El machine learning es una forma de inteligencia artificial (IA) que enseña a los ordenadores a pensar de manera similar a como lo hacen los humanos: aprender y mejorando experiencias pasadas. Funciona explorando datos e identificando patrones e implica una mínima intervención humana.

Casi cualquier tarea que se pueda completar con un patrón definido por datos o un conjunto de reglas se puede automatizar con aprendizaje automático.

Esto permite a las empresas transformar procesos que antes solo eran posibles para los humanos: responder a llamadas de servicio al cliente, llevar contabilidad, revisar currículums…

El machine learning utiliza dos tipos de técnicas: aprendizaje supervisado, que entrena un modelo con datos de entrada y salida conocidos para que pueda predecir el futuro, y aprendizaje no supervisado, que encuentra patrones ocultos o estructuras intrínsecas en los datos de entrada.

Machine learning e IA

La inteligencia artificial está muy ligada al machine learning, aunque no son lo mismo. La IA es un concepto más amplio que permite que una máquina o un sistema detecte, actúe o se adapte como una persona. Por su parte, el aprendizaje automático es una aplicación de la IA que hace posible que las máquinas extraigan conocimiento de los datos y aprendan de ellos de forma autónoma.

Inteligencia artificial es el término global mientras que el ML se encuadra dentro de la IA al igual que el aprendizaje profundo, la robótica, los sistemas de expertos y el procesamiento de lenguaje natural.

El hecho es que la inteligencia artificial incluye el concepto de una máquina que puede imitar la inteligencia humana y el machine learning pretende enseñar a una máquina a realizar una tarea específica y proporcionar resultados precisos mediante la identificación de patrones.

Objetivos del machine learning

Los algoritmos de machine learning funcionan en base a hipótesis. Su objetivo es imitar el pensamiento humano y mostrar comportamientos inteligentes. Pero para ir mejorando en sus proyecciones al máximo, el modelo necesita ir aprendiendo y recabando cada vez más información.

En su proceso, la máquina va aprendiendo cómo un ser humano toma decisiones, pero de forma mucho más optimizada. Con el ejemplo de la conducción de vehículos, un humano decide de forma intuitiva ajustar su velocidad en una carretera oscura con lluvia; el algoritmo de un coche autónomo hace lo mismo y reduce la velocidad en función de los parámetros que ha aprendido.

El objetivo último es reemplazar las tareas mentales de análisis de datos con sistemas de machine learning. Su necesidad se ha hecho más evidente con la llegada de Internet, el big data y el acceso a una inmensa cantidad de datos, al poder el machine learning trabajar millones de veces más rápido que una mente humana.

Tipos de machine learning y datos que se usan para entrenar modelos

Figuran diversos tipos de machine learning:

Aprendizaje supervisado

En este tipo de aprendizaje automático, las máquinas se entrenan utilizando conjuntos de datos etiquetados para predecir la producción en el futuro. Todo este proceso se basa en la supervisión, de tal forma que los datos etiquetados ayudan a establecer una ruta estratégica para las máquinas. Se utiliza en tareas para detectar fraudes, evaluar riesgos y en el filtrado de spam.

Aprendizaje no supervisado

Con esta técnica no hay supervisión involucrada. Aquí figuran conjuntos de datos sin etiquetar y sin clasificar que se utilizan para entrenar a las máquinas; estas luego predicen la salida sin supervisión ni intervención humana. Este método se usa comúnmente para agrupar o categorizar datos no ordenados en función de sus características, similitudes y diferencias. Las máquinas también son capaces de encontrar patrones y tendencias ocultos a partir de la entrada.

Aprendizaje semisupervisado

Con esta técnica, durante el período de entrenamiento, se utiliza una combinación de conjuntos de datos etiquetados y no etiquetados para preparar las máquinas. Sin embargo, en el mundo real, la mayoría de los conjuntos de datos de entrada son datos sin etiquetar. La ventaja de este método es que utiliza todos los datos disponibles, no solo la información etiquetada. Se agrupan datos similares con la ayuda de un algoritmo de aprendizaje no supervisado, lo que facilita etiquetar todos los datos sin etiquetar.

Aprendizaje por refuerzo

En el aprendizaje por refuerzo, no existe el concepto de datos etiquetados. Las máquinas aprenden solo de las experiencias. Usando un método de prueba y error, el aprendizaje funciona en un proceso basado en la retroalimentación. La IA explora los datos, observa las características, aprende de la experiencia previa y mejora su rendimiento general. Entonces, el agente de IA es recompensado cuando la salida es precisa, y castigado cuando los resultados no son favorables.

Por otro lado, el proceso de entrenamiento de un modelo de machine learning consiste en proporcionar datos de entrenamiento de los cuales aprender a un algoritmo de ML (es decir, el algoritmo de aprendizaje). El término modelo de ML se refiere al artefacto de modelo que se crea en el proceso de entrenamiento.

Los datos de entrenamiento deben contener la respuesta correcta, que se conoce como destino o atributo de destino. El algoritmo de aprendizaje encuentra patrones en los datos de entrenamiento que asignan los atributos de los datos de entrada al destino (la respuesta que desea predecir) y genera un modelo de ML que captura dichos patrones.

Cómo se evalúa la eficacia de un modelo de aprendizaje automático

Después de capacitar un modelo, es conveniente evaluar un modelo de machine learning para determinar si su rendimiento y precisión le permiten alcanzar sus objetivos comerciales. Se pueden generar varios modelos mediante distintos métodos y evaluar cada uno de ellos.

Por ejemplo, se podrían aplicar diferentes reglas empresariales para cada modelo y, a continuación, aplicar varias medidas para determinar la sostenibilidad de cada modelo. También se podría considerar si el modelo necesita ser más sensible que específico (o viceversa). Hay varios enfoques de evaluación:

Validación cruzada

Es un método estadístico que divide los datos de entrenamiento en múltiples subconjuntos y luego entrena el modelo con diferentes subconjuntos y valida con los restantes.

Pruebas A/B

Se trata de comparar el rendimiento de dos o más modelos diferentes en términos de métricas específicas.

Métricas clásicas

Como la precisión, la exhaustividad, el F1-score, entre otras, que se utilizan para evaluar el rendimiento de un modelo en una tarea específica.

Curva ROC y Área bajo la curva (AUC)

Son herramientas visuales que se utilizan para evaluar la capacidad de un modelo para distinguir entre dos clases.

Machine learning y Deep learning

El Deep learning es un tipo de técnica de machine learning que se basa en el cerebro humano. Los algoritmos de aprendizaje profundo analizan los datos con una estructura lógica similar a la que utilizan los humanos, son sistemas inteligentes, denominadas redes neuronales artificiales, para procesar información por capas: los datos fluyen desde la capa de entrada a través de varias capas de redes neuronales profundas ocultas antes de llegar a la capa de salida. El resultado es que se permite un aprendizaje mucho más eficaz que el de los modelos estándar de machine learning.

Así, se entiende que el Deep learning es un subconjunto del machine learning. Los algoritmos que lo componen serían como una evolución sofisticada y matemáticamente más compleja que los algoritmos de machine learning.

Aplicaciones del machine learning

El machine learning se utiliza desde asistentes de voz hasta automóviles autónomos. Se podría destacar el reconocimiento de imágenes, que es un método para catalogar y detectar un objeto o característica en una imagen digital. En reconocimiento de voz, el software ML encuadra muchas aplicaciones populares como Alexa de Amazon, Siri de Apple y Google Maps.

También puede predecir patrones de tráfico, recomendar productos por ecommerce mediante algoritmos de aprendizaje automático, manejar coches autónomos, detectar correo no deseado, detectar malware, ayudar a las personas a acceder a información relevante a través de texto o voz, o detectar fraudes.

Conocimientos necesarios para trabajar en machine learning

Para trabajar en entornos de machine learning, además de conocer los requisitos previos importantes sobre el aprendizaje automático, también hay que saber cómo trabajar con datos. Es una habilidad esencial. El aprendizaje automático requiere estadística, probabilidad, cálculo, álgebra lineal y conocimientos de programación.

El machine learning requiere estadística, probabilidad, cálculo, álgebra lineal y conocimientos de programación

El ingeniero de machine learning evalúa, organiza y monitorea conjuntos de datos que alimentan los sistemas de aprendizaje automático. Comprender los datos disponibles y qué tipos de aprendizaje puede respaldar es un paso fundamental. A partir de ahí, este profesional desarrolla sistemas de aprendizaje automático, elige las tecnologías y arquitecturas correctas para aprender de esos datos para, a continuación, crear los modelos que utilizará el sistema de machine learning, que definirán cómo el sistema interpreta los datos y aprende de ellos.

Software para el machine learning

El auge de los datos y el aprendizaje automático también ha llevado a un aumento en el software de machine learning, el cual consiste en herramientas dedicadas que se utilizan para la IA y el aprendizaje automático. Los más representativos son Google Cloud AI Platform, Azure Machine Learning y un tercer referente que es la suite IBM Machine Learning, que combina varios productos, como IBM Watson Studio, IBM Watson Machine Learning, IBM Cloud Pak for Data e IBM Watson Openscale. También conviene mencionar Amazon Machine Learning, que ha construido una sólida reputación; Neural Designer¸ Anaconda, un software de aprendizaje automático para pymes o autónomos; y H2O.ai, nombrada Visionaria por Gartner en el Cuadrante Mágico de 2020.

Ética y desafíos del aprendizaje automático o machine learning

Además de los beneficios potenciales, existe una conciencia cada vez mayor de que la aplicación del machine learning plantea riesgos y puede provocar daños, lo que lleva a una serie de cuestiones éticas. El uso de datos confidenciales, la discriminación basada en información personal, los resultados del modelo que afecta a la vida de las personas… se producen multitud de situaciones en las que el uso de tecnologías de machine learning pueden tener trasfondos éticos difíciles de determinar.

También existe la preocupación por la exageración de la capacidad de la IA para predecir con precisión ciertas cosas, mientras que el sesgo es otra preocupación importante en la ética del ML, que puede desembocar en resultados injustos.

Además del daño que se puede causar a las personas, otra razón importante para asumir la responsabilidad es que las consideraciones éticas pueden afectar a la confianza y a la credibilidad en la tecnología. Si la tecnología no se considera confiable y transparente, puede perjudicar su adopción y afectar su efectividad. Como resultado, la gente podría perder su confianza y no querer usar productos ligados a la inteligencia artificial o el machine learning.

Artículos relacionados

Artículo 1 de 5