¿Qué es la Inteligencia Artificial y por qué ahora?



Para comprender qué es la inteligencia artificial, IA (ó AI por sus siglas en inglés), primero debemos comprender qué es ser inteligente. La inteligencia se define como la habilidad de la mente para aprender, entender, razonar, tomar decisiones y formarse una idea de una determinada realidad.

La siguiente pregunta que podríamos hacernos es ¿cuál es el ser más inteligente que hay? La respuesta es simple: los humanos. Nosotros tenemos la habilidad de realizar varias tareas complejas que querremos que las computadoras también resulevan para poder decir que son inteligentes.

La comunicación oral es una de esas tareas complejas: hablamos y escuchamos, es decir, nos comunicamos con un lenguaje oral. Dentro de la IA, el campo que imita la forma de comunicarse oralmente de los humanos es Speech Recognition o reconocimiento de voz. Esto es lo que Siri, Alexa o Google Home hacen para comprender cuando por les pedimos llamar a alguien o reproducir música.

De hecho, tú estás leyendo este artículo… esto significa que te comunicas conmigo (el escritor) mediante un lenguaje escrito. Yo escribo y tú lees e incluso podrías escribirme y yo sería capaz de decodificar tu mensaje. Las computadoras replican esta función mediante el campo del Procesamiento del Lenguaje Natural, PLN o NLP por sus siglas en inglés.

Viendo las imágenes de arriba, puedes descifrar que en la primera se observa un cielo con nubes y seguramente te puedas dar cuenta que en la segunda hay palmeras y es probablemente la foto de una playa. Las computadoras pueden alcanzar las mismas conclusiones gracias al campo de Computer Vision que es otro campo dentro de la IA.

Computer Vision es parte de lo que se denomina Aprendizaje Simbólico mientras que tradicionalmente Speech Recognition y NLP son parte del Aprendizaje Estadístico.

Los humanos somos capaces de movernos e interactuar con el ambiente. Las computadoras pueden hacer esto gracias al campo de la robótica que es otro campo dentro de la Inteligencia Artificial. Siendo estrictos, la robótica incluye otros campos como la física, electrónica y más que no son parte de la IA. Los vehículos autónomos son parte de la robótica también y este campo es a su vez parte del aprendizaje simbólico que mencionamos antes.

Fácilmente las personas somos capaces de reconocer patrones. Si una determinada compañía vendió $1.000 hace tres años, $2.000 hace dos años y $3.000 el año pasado, podrás estimar las ventas de la misma este año en $4.000 con un grado alto de confianza o certidumbre. Las computadoras son capaces de detectar este patrón y también de hacer predicciones basadas en su aprendizaje. De hecho, mientras que los humanos somos capaces de manejar dos o tres dimensiones en simultáneo, las computadoras pueden manejar cientos o miles por lo que son incluso mejores que nosotros en esta tarea. Dentro de la inteligencia artificial, el campo que estudia el reconocimiento de patrones es el llamado Machine Learning y se aplica para resolver dos tipos de problemas:

  • Clasificación
  • Predicción

La diferencia entre ellos es sutil pero si por ejemplo estamos tratando de determinar si un cliente es VIP o no entonces estamos resolviendo un problema de clasificación. Si estás tratando de determinar si un cliente es probable que se vaya a la competencia, entonces estás prediciendo. La diferencia es que uno trabaja con la información que existe (aunque esté oculta) y el otro trata de inferir información que aún no existe.

Entonces… sabemos que si le enseñamos a una computadora a replicar diferentes tareas que realizamos los humanos y nos hacen inteligentes, entonces habremos creado un sistema de Inteligencia Artificial. ¿Pero cómo le enseñaremos esto? Podemos intentar contestar esto estudiando cómo aprenden los humanos. Nosotros aprendemos utilizando nuestro cerebro y el mismo puede ser visto como una red de neuronas. Si pudiéramos replicar la estructura y/o funcionalidad del cerebro, entonces le habríamos enseñado a una computadora a ser inteligente. Este enfoque para enseñarle a las computadoras se llama Deep Learning y es un subcampo dentro de Machine Learning.

Deep Learning es un gran campo dentro de la IA y puede ser dividido en subcampos a su vez. Por ejemplo, si analizas las siguientes partes de una imagen:

Seguro puedes deducir que hay un sol, pero será un poco más difícil deducir que también hay una duna de arena ahí. Esto es porque parte de la información espacial se perdió cuando la imagen se separó en las distintas partes. Si las neuronas usan la información espacial, entonces se llaman Redes Neuronales Convolucionales o Convolutional Neural Networks (CNN). Son un enfoque diferente que se utiliza para resolver problemas de Computer Vision.

Los humanos también tenemos la habilidad de recordar eventos. Por ejemplo, cuando es tu siguiente cita con el médico. También existen redes neuronales especializadas en esta tarea y se llaman Redes Neuronales Recurrentes o Recurrent Neural Networks (RNN).

En resumen, la Inteligencia Artificial se puede dividir de la siguiente forma:

Es importante resaltar que somos capaces de crear muchos sistemas de Inteligencia Artificial específicos pero no uno general (no aún por lo menos). Esto significa que podemos crear aplicaciones que predicen el valor de la acción de una compañía (una aplicación específica) y otra que decodifica mensajes hablados y así muchas más, pero Terminator (Inteligencia Artificial general) es todavía solo Ciencia Ficción.

Mencionamos antes el aprendizaje estadístico y el simbólico. Simbólico significa que le enseñamos a la computadora símbolos que los humanos comprendemos mientras que en el estadístico simplemente la alimentamos con mucha información y dejamos que la computadora decida por si misma qué es importante para tomar una decisión y qué no. Por ejemplo, si a un auto que se maneja solo le indicamos que debe parar cada vez que vea un cartel rojo al costado del camino con la palabra “Pare” escrita en blanco, eso es aprendizaje simbólico. Sin embargo, si le mostramos muchas horas de video de autos frenando cuando ven un cartel de Pare, eso es aprendizaje estadístico.

¿Por qué ahora?

Bien, la Inteligencia Artificial es genial, estamos todos de acuerdo con eso. Pero ¿por qué tanto alboroto en los últimos años? Especialmente dado que la IA ha existido desde la década de 1950. Turing incluso propuso su famoso Test de Turing en 1950 y el término “inteligencia artificial” se utilizó por primera vez en un workshop en la Universidad de Dartmouth en 1956. Algunos de los asistentes incluso recibieron millones de dólares para investigar y crear una máquina que sea tan inteligente como una persona pero no lo pudieron lograr en aquella época. Ésta y otras iniciativas eventualmente se quedaron sin fondos y sobrevino el primer invierno de la inteligencia artificial. Eso sucedió en los 70′ y duró hasta la década de 1980 cuando el gobierno japonés comenzó a invertir en investigación y desarrollo. Se dice que llegó un nuevo verano para la inteligencia artificial y duró durante algunos años hasta que nuevamente se acabaron los fondos y llegó un nuevo invierno. Ese último invierno se prolongó hasta la década del 2000′ cuando vino un nuevo verano. Esta vez las grandes compañías como Google, Facebook, Baidu y otras comenzaron a invertir en investigación y desarrollo. ¿Suena como un deja vu, no? ¿Cómo saber si se trata de otro verano o si esta vez vino para quedarse?

En la Inteligencia Artifical se utiliza mucha teoría matemática para crear algoritmos que son alimentados con datos y luego corren sobre determinado hardware para finalmente alcanzar una conclusión o decisión. La gran diferencia en esta oportunidad es el hardware. Los avances en este campo nos permiten ejecutar algoritmos mucho más complejos que antes en tiempos razonables y almacenar mucha más información que antes. Estos factores combinados nos permiten crear aplicaciones computacionalmente eficientes que puden alcanzar resultados suficientemente buenos en un tiempo razonable.

Imagina si le decimos a Alexa o Siri que fije una alarma mientras estamos cocinando. Vamos a esperar una respuesta inmediata. Si le lleva 10 minutos a Alexa comprender que dije “Poner una alarma dentro de 5 minutos” entonces no sirve de mucho. En cambio, la voz es decodificada inmediatamente y una respuesta se genera en cuestión de milisegundos.

En Marvik.ai pensamos que no vendrá ningún nuevo invierno para la Inteligencia Artificial porque el hardware ha alcanzado un punto donde podemos crear muchas aplicaciones comerciales de gran nivel. La Inteligencia Artificial recién está comenzando.

Source: Deep Learning on Medium