Qué es deep learning y qué necesitas saber

Dentro de la inteligencia artificial existe un subnivel de aprendizaje profundo que permite a las máquinas conseguir de forma dinámica acceder a un conocimiento mediante la interpretación del lenguaje natural y redes neuronales.

Publicado el 12 Dic 2022

48901_02

Con la intensificación del uso de la inteligencia artificial en la práctica mayoría de aplicaciones y sistemas, hay términos que han saltado a la luz pública y que explican cómo está progresando el funcionamiento inteligente de las máquinas. El deep learning es uno de los que tiene mayor significación y cuya comprensión ayudará a entender este entramado algorítmico.

¿Qué es el aprendizaje profundo?

Deep Learning se traduce como aprendizaje profundo y es una rama de machine learning, y significa un paso más del aprendizaje automático, pues tiene que ver con algoritmos que se inspiran en la estructura y función del cerebro humano.

También conocido como aprendizaje estructurado profundo o aprendizaje jerárquico, se basa en métodos de análisis de datos mediante cálculo estadístico. Y tiene la ventaja añadida de ser un sistema de aprendizaje no supervisado que tira de todo el potencial del big data.

Deep learning quiere trabajar como los humanos

Básicamente el objetivo de los modelos de aprendizaje profundo es que las máquinas vayan asimilando y emulando el intelecto humano para conseguir cierta autonomía cognitiva. De ahí que se hable de redes neuronales artificiales que han intervenido en visión por ordenador, reconocimiento automático de lenguaje hablado, elaboración de lenguaje natural, reconocimiento de audio o en bioinformática.

Deep learning y los datos

Como consecuencia del uso de los algoritmos, al aplicar deep learning se consigue una máquina capaz de clasificar de forma autónoma los conjuntos de datos y estructurarlos jerárquicamente, localizando los más relevantes y útiles para la resolución de un problema, de la misma manera que lo haría la mente humana. Basa su funcionamiento en grandes cantidades de datos para deducir una hipótesis lógica, llegar a la resolución de un problema, poniendo en marcha sus neuronas artificiales y sus conexiones neuronales.

El deep learning se comporta de la misma manera y explota las redes neuronales artificiales, modelos matemático-computacionales basados en el funcionamiento de las redes neuronales biológicas, es decir, modelos formados por interconexiones de información.

Una red neuronal se presenta como un sistema ‘adaptativo’ capaz de modificar su estructura (los nodos y las interconexiones) basándose tanto en los datos externos como en la información interna que conecta y atraviesa la red neuronal durante la fase de aprendizaje y razonamiento.

Aplicaciones del deep learning

Ya hoy existen casos de uso y áreas de aplicación que se pueden percibir en nuestra vida cotidiana. Desde la visión por ordenador para los coches sin conductor, hasta los drones robot utilizados para la entrega de paquetes o incluso para la asistencia en casos de emergencia; el reconocimiento de voz y la síntesis de la voz y el lenguaje para los chatbots y los robots de servicio; el reconocimiento facial para la vigilancia en los países en los que hay riesgo de catástrofe, y para el uso de un robot en caso de emergencia; el reconocimiento y la síntesis del habla y el lenguaje para chatbots; el reconocimiento facial para la vigilancia en países como China; el reconocimiento de imágenes para ayudar a los radiólogos a detectar tumores en las radiografías, o para ayudar a los investigadores a identificar secuencias genéticas relacionadas con las enfermedades e identificar moléculas que podrían dar lugar a medicamentos más eficaces o incluso personalizados; los sistemas de análisis para el mantenimiento predictivo en una infraestructura o instalación mediante el análisis de los datos de los sensores de IoT…

Sectores y tareas

Tras esta enumeración, es evidente que son muchos y variados los sectores de aplicación en los que el deep learning puede demostrar sus potencialidades, si bien hay algunos donde su puesta en acción es más madura. A continuación, hacemos referencia a algunas actividades en las que se han dado auténticos pasos de gigante.

Es el caso del coloreado automático de imágenes en blanco y negro (para la red neuronal significa reconocer bordes, fondos, detalles y conocer los colores típicos de una mariposa, por ejemplo, saber exactamente dónde colocar el color correcto). También en el sector cinematográfico, es posible la adición automática de sonidos a las películas mudas o la traducción simultánea. Asímismo se trabaja en la clasificación de los objetos dentro de una fotografía (en este caso el sistema es capaz de reconocer y clasificar todo lo que ve en una imagen, incluso las muy complejas en las que hay un paisaje de fondo, por ejemplo, montañas, personas caminando por un sendero, animales pastando, etc.).

En el sector del periodismo y literario ya hay sistemas que realizan la generación automática de textos, ya sea artículos, la generación automática de relatos cortos o los relatos breves. En las artes general, las máquinas están mostrando progresos muy audaces: la finalización de la Décima Sinfonía ‘inconclusa’ de Beethoven, confección de cómics apocalípticos por la firma Campfire Entertainment o incluso una fotografía desarrollada con IA gana un concurso de imagen digital. Como guinda final, un sistema llamado DeepMind (ahora perteneciente a Google) consiguió aprender a jugar el complejo juego Go y derrotó al campeón del mundo, un ciudadano chino.

Requerimientos de hardware

Los sistemas de deep learning han dado grandes progresos en los últimos cinco años, sobre todo debido a la enorme cantidad de datos disponibles, pero, especialmente, a la disponibilidad de arquitecturas de gran rendimiento (CPU y GPU, en particular) que han ganado en capacidad de forma exponencial.

  1. Las GPU para procesamiento general

La unidad central de procesamiento o CPU (básicamente el procesador principal de un sistema) resulta esencial a la hora de entrenar a las arquitecturas de conocimiento profundo, y se ve complementada por la GPU o tarjeta gráfica. Si desde el punto de vista de sus posibilidades, el deep learning puede parecer más ‘espectacular’ y eficaz que el machine learning, hay que señalar que el cálculo computacional requerido para su funcionamiento resulta realmente impactante, también desde el punto de vista económico: las CPU y las GPU de alta gama útiles para soportar las cargas de trabajo de un sistema de deep learning siguen costando miles de euros.

  1. GPU en la nube

Recurrir a capacidades computacionales vía cloud solo mitiga parcialmente el problema porque la formación de una red neuronal profunda suele requerir el procesamiento de grandes cantidades de datos utilizando clusters de GPU de alta gama durante muchísimas horas (por lo que comprar ‘como servicio’ la capacidad computacional en la nube puede resultar muy caro).

  1. TensorFlow, el software también es crucial

Uno de los frameworks específicos para Deep Learning más utilizados por los investigadores, desarrolladores y científicos de datos es TensorFlow, una conocida librería de software de código abierto (proyecto apoyado por Google) que proporciona módulos probados y optimizados para la realización de algoritmos para ser utilizados en diferentes tipos de software y con diferentes tipos de lenguajes de programación, desde Python, C/C++, Java, Go, RUST, R, … (en particular para «tareas perceptivas» y comprensión del lenguaje natural).

Futuro del deep learning

En el campo de la investigación de la IA, el aprendizaje automático ha tenido un éxito considerable en los últimos años, permitiendo a los ordenadores superar o acercarse al rendimiento humano correspondiente en áreas que van desde el reconocimiento facial hasta el reconocimiento del habla y el lenguaje. El aprendizaje profundo, en cambio, permite a los ordenadores ir un paso más allá, sobre todo en la resolución de una serie de problemas complejos. Y el futuro se presenta lleno de fascinantes progresos de una tecnología que estará cada vez más presente en la vida cotidiana de las personas. Entre los conceptos de futuro se habla de Internet Cognitiva y Ubicua que será una generación de Internet inteligente donde se fusionará en la red de redes millones de equipos interconectados dotados de capas neuronales que podrán ser capaces de ejecutar acciones con total autonomía.

¿Qué te ha parecido este artículo?

La tua opinione è importante per noi!

Rufino Contreras
Rufino Contreras

Artículos relacionados