Inteligencia artificial, Machine Learning y Deep Learning : Qué son, cuáles son las diferencias y…

Inteligencia artificial, Machine Learning y Deep Learning : Qué son, cuáles son las diferencias y para que sirven?

El término inteligencia artificial puede ser relativamente conocido para varios de nosotros. Péliculas de Hollywood la han mostrado como robots que nos acompañan en nuestra vida diaria, hacen labores de limpieza, o cuidan y acompañan a nuestros hijos y familiares. Incluso en casos más avanzados (e.g Terminator) la han mostrado como el mecanismo por el cual seremos esclavos de las máquinas y que vivieremos luchando contra robots que dominan el mundo y quieren acabar con la humanidad.

Estas películas nos hacen entender el término Inteligencia Artificial como la capacidad que tienen las máquinas/robots de pensar por si mismas y de tomar sus propias decisiones, incluso si esas decisiones implican acabar con seres humanos.

Podemos definir la Inteligencia Artifical como: “la ciencia y la ingeniería de hacer máquinas inteligentes”, es decir la ciencia de lograr que las maquinas imiten la inteligencia humana y su comportamiento.

Para lograr esto se debe lograr que las máquinas puedan de alguna manera percibir el mundo tal como lo hacemos los humanos, bien sea por percepción visual o auditiva (ver y oir), logrando entender el contexto, las circunstancias, y las características del mundo y sus objetos, para que de esta manera puedan tomar decisiones o ejecutar labores tal como lo harían los humanos.

Hay muchas maneras de simular la inteligencia humana, y algunos métodos son más inteligentes que otros, con complejidades de implementación muy variadas entre esos métodos.

Los primeros métodos llamados “inteligentes” eran básicamente una cantidad de reglas donde se indicaba a una máquina todas las posibles opciones que la llevaran a tomar una decisión. Estas reglas son básicamente todos los pasos que un humano toma para llegar a una decisión o resultado. Por ejemplo el juego de ajedrez tiene una cantidad de reglas que cualquier jugador puede indicar claramente(e.g un peón se puede mover solo hacia adelante y come en diagonal, o que un alfil se puede mover únicamente en diagonal). Todo este conocimiento que pueda expresarse claramente en reglas se transferiere hacia una máquina, logrando que ella evalue cuál o cuáles de esas reglas aplican para una situación particual, y que tome la misma decisión que los humanos. En este tipo de sistemas es fundamental que los humanos hayan transferido correctamente todas las reglas y su resultado. Si esto se hace correctamente las máquinas tienen la ventaja de poder ejecutar estar reglas más rápido que un humano, no se cansan y lo pueden hacer millones de veces, siempre con los mismos resultados y sin fallar. Aca es importante resaltar que la única manera de que cambie el resultado de evaluar las reglas para una máquina es si los humanos que ingresan las reglas hacen modificaciones o adicionan o eliminan algunas. De lo contrarario la máquina siempre entregará los mismos resultados. Cualquier capacidad de entregar nuevos resultados dependerá que los humanos modifiquen el sistema.

Posteriomente los científicos se dieron cuenta que no todas las decisiones o labores que hacen los humanos se pueden expresar a traves de reglas. Por ejemplo, cuando ves un perro caminando en la calle los humanos identifican muy rápidamente al canino, su raza y su color.

Poder indicarle a una máquina cómo identificar a un perro, o que pueda diferenciar entre un perro y un conejo es una labor mucho más compleja que definir una reglas. Decirle a una máquina que un perro tiene 4 patas, 2 ojos, 2 orejas no es sencillo. Cómo expresarle a una maquina que un perro y un gato son diferentes si los dos tienen 4 patas, 2 ojos y 2 orejas? Cuando somos bebés y no sabemos qué es un perro o un gato, nuestros familiares nos muestran a los animales, y vamos aprendiendo a diferenciarlos a partir de ejemplos, es decir, de ver varios perros nuestra inteligencia nos permite aprender a reconocerlos. Una vez cumplimos ciertos años sabemos reconocer a los perros de los gatos, siendo que sus caracteristicas son similares. Casi el 100% de los humanos que viven en grandes ciudades saben identificar los principales animales domesticados. No es lo mismo con las bacterias y parásitos, ya que no es igual de facil que nuestros familiares nos muestren ejemplos de esas bacterias y asi aprender a reconocerlos, sin embargo un MicroBiólogo seguramente si puede reconocer algunos de ellos ya que ha estado expuesto a esos ejemplos.

Para un humano no basta con ver un solo ejemplo de un perro para poder identificar al 100% de los perros de la tierra. Se necesitan ver varias razas, tamaños, y colores para aprender a identificar los perros. Incluso siendo siendo adultos pueden haber perros que no podamos identificar correctamente:

Puedes identificar fácilmente que este animal es un perro? Source: http://listamaze.com/wp-content/uploads/2016/06/Bedlington-Terrier.jpg

Fijense que siendo humanos inteligentes, seguramente gran parte de los lectores no sabían que la imagen anterior es de un perro de raza Bedlington Terrier. Pero tenemos una gran ventaja al ser humanos inteligentes, la próxima vez que veamos un animal como el de la foto muchos podrán identificar que es un perro porque aprendimos al ver la foto del perro de esta extraña raza.

Qué ha pasado aqui? Aprendimos algo nuevo cuando se nos presenta un nuevo ejemplo que no conocíamos. Gran parte de nuestra inteligencia la debemos a la capacidad de aprender con ejemplos: aprendemos a hablar, reconocer, agrupar, y otras cosas a partir de ejemplos que nos muestran nuestros padres, familiares o naturaleza.

Esta capacidad de aprender a partir de ejemplos es lo que nos hace obtener conocimiento y mejorar con la experiencia.

Los científicos identificaron que esta misma capacidad de aprender a través de ejemplos podía replicarse a las máquinas. Buscaron un mecanismo donde se pudiera entregar a las máquinas ejemplos sobre un tema particular, y que la máquina supiera si nuevos elementos son similares a los que fueron usados para enseñarle. Para el caso de los perros es entregarle a la máquina por ejemplo información sobre cientos, miles o millones de perros (puede ser por ejemplo cantidad de ojos, patas, peso, altura, cantidad de pelaje, manchas, características de su piel, etc), y que para nuevos animales (no necesariamente perros) que no hayan sido presentados como ejemplos previos, la maquina sea capaz de identificar si el animal es perro o no. Este mecanismo es lo que se denomina Machine Learning o Aprendizaje de máquina.

Machine Learning es: “el mecanismo de lograr que las máquinas puedan aprender a partir de ejemplos previos, y que puedan seguir aprendiendo en el tiempo si se les presentan nuevos ejemplos”.

Uno de los retos principales del Machine Learning es lograr obtener las características que describen un cierto tema. En el caso de los perros se indicaba que es necesario poder obtener el numero de ojos, de patas, calificar el pelaje del animal o clasificar las características de la piel de los distintos perros. Esto lo puede hacer facilmente un humano a partir de ver una foto o el perro directamente, pero no es tan facil para una máquina. Si le presentas una foto a una máquina, cómo hace ella para saber que efectivamente el animal presentado tiene 2 ojos? o que tiene pelos? Existen técnicas de procesamiento de imágenes o Image Processing, que es una rama de lo que se llama Computer Vision, y que permiten obtener este tipo de información, de manera que su resultado pueda ser entregado a los algoritmos de Machine Learning. Su aplicación es bastante compleja y requiere conocimientos elevados en matemáticas.

En otro tipo de escenarios corporativos se pueden obtener más facilmente las características del tema que se quiere tratar con Machine Learning. Por ejemplo para Banca es importante saber si un cliente va a tener un buen manejo crediticio. El Banco puede obtener y almacenar relativamente facil información sobre las personas: Sabe si su cliente es hombre o mujer, dónde vive, en dónde trabaja, sus ingresos, sus egresos, dónde usa la tarjeta de crédito, entre otras. Con esta información el Banco puede por ejemplo observar que de los clientes que han dejado de pagar sus créditos algunos presentan características comunes. Se puede entregar a un algoritmo de Machine Learning por ejemplo la informacion de sus clientes, incluyendo las variables anteriores, y el algoritmo es capaz de identificar por ejemplo que un grupo grande de sus clientes hombres, cercanos a los 45 años, con ingresos de entre US$3000 y US5000 y que gastan más de US$2000 en tiendas de entrenimiento, son los que en gran parte están dejando de pagar los créditos. Esto se puede ver como mostrarle a la maquina los ejemplos para que aprenda. Para un nuevo cliente que pide un préstamo al Banco, se puede entregar al algoritmo de Machine Learning la información de género, edad, ingresos, egresos y consumos, y el algoritmo evalúa qué tanto se parecen estos datos a los que ya conoce el Banco sobre los clientes que no pagan. Si son bastante similares puede deducir que ese cliente tiene una alta probabilidad de no pagar, y tomar medidas adicionales antes de otorgar el crédito.

El Banco no necesariamente puede observar un único grupo de clientes que no pagan. Puede identificar otros grupos con características similares que no pagan sus créditos. Por ejemplo mujeres de 50 años, que trabajan en sector petrolero, con hijos y que gastan más de US$500 mensuales en tiendas de experiencias gastranómicas premium. Pueden existir varios grupos de malos clientes, y el algoritmo de Machine Learning es capaz de identificar si el nuevo cliente pertenece a estos grupos previamente identificados. Incluso con el tiempo el algoritmo es capaz de ir cambiando cómo se comforman estos grupos e ir modificando las respuestas que entrega sobre si el nuevo cliente tendrá un buen manejo crediticio.

Uno de los grandes retos del Machine Learning es poder obtener y medir las características que describen un tema particular. Para algunos temas puede ser bastante simple (como el caso del Banco y describir si su cliente es hombre o mujer, y sus niveles de ingresos y egresos), pero bastante más complejo para otros casos (como el caso de deducir a partir de una imagen si el animal tiene 4 patas, 2 ojos y bigotes).

En los últimos años se ha popularizado una técnica llamada Deep Learning, que permite que una máquina pueda llevar a cabo el proceso de inteligencia humana sin necesidad de tener que obtener previamente las características de que describen el tema particular. En el párrafo anterior se indicó que obtener a partir de una imagen si un animal tiene 2 ojos, patas y bigote es bastante complejo, incluso algunas veces imposible para el estado de arte actual. Deep Learning es una técnica que permite que con solo darle a la máquina las imagenes de los perros, sin necesidad de hacer labores de identificación previa de cantidad de ojos, patas, características de pelaje, etc, se pueda aprender a identificar a un perro. El algoritmo de Deep Learning se encarga de extraer de la imagen ciertas características de manera automática que le permiten identificar a partir de la foto si el animal presentado es perro o no. Internamente el algoritmo identifica características con representaciones matemáticas que representan a los perros. El algoritmo require una capacidad de computo bastante elevada para aprender a identificar qué es un perro, y una vez ejecutado este paso tiene una precisión bastante buena para identificar perros a partir de fotos que nunca antes habia visto. Estas técnicas pudieron popularizarse solo hasta hace pocos años ya que no era simple obtener capacidad de computo para realizar las operaciones matemáticas internas que se requieren ejecutar para hacer que el algorimo finalice su aprendizaje. Estas operaciones matemáticas son principalmente de algebra lineal (vectores) en volúmenes de millones de operaciones. Con la aparición de las GPU (Graphics Processing Units) fue posible reducir el tiempo de estas operaciones a unas cuantas horas o días. Con procesadores de PC tradicionales esas mismas operaciones podrían tomar años en finalizarse y por eso hace algunos años no era posible aplicarlo masivamente.

Estas técnicas de Deep Learning se están usando generalmente en escenarios donde obtener la información que describe un cierto tema es dificil de calcular y medir:

  1. Reconocimiento de objetos a partir de fotos y videos (piensen por ejemplo en identificación de caras y personas en Facebook, seguridad en aeropuertos para identificar armas cuando pasas por ciertos sectores, autos que se manejan solos y que deben identificar otros autos y peatones, entre otros)
  2. Procesamiento de audio (piensen en Alexa, Siri o Cortana, los asistentes de voz de las grandes compañías de software).

Si quisieramos entender entonces cómo se relacionan la Inteligencia Artificial, el Machine Learning y el Deep Learning debemos pensar en las muñecas rusas, esas que pueden guardarse una dentro de la otra:

Muñecas Rusas

Como muñeca principal y más grande tenemos a la Inteligencia Artificial que es la capacidad de lograr que una máquina imite a la inteligencia humana. Dentro de ella existe otra muñeca llamada Machine Learning que sirve para que las máquinas puedan aprender a partir de ejemplos. Dentro de ella existe otra mueñeca que se llama Deep Learning que sirve para lograr aprender a partir de conceptos que son complejos de describir y medir.

Se concluye que todo concepto de Deep Learning hace parte de Machine Learning. El Machine Learning es un tipo de inteligencia articial, pero hay otros, como el de sistemas basados en reglas.

Las grandes compañías de tecnología del mundo están apostando gran parte de su presupuesto en crear sistemas de inteligencia articial, y expertos e industria coinciden en que las grandes revoluciones de los negocio, el gobierno y el mundo estarán basados en la aplicación de estas técnicas a sus contextos.


Inteligencia artificial, Machine Learning y Deep Learning : Qué son, cuáles son las diferencias y… was originally published in Natural Stupidity on Medium, where people are continuing the conversation by highlighting and responding to this story.

Source: Deep Learning on Medium