Mejores papers de la semana (Dic 31 — Ene 4)

Source: Deep Learning on Medium


[This is the Spanish version of Best AI Papers of the week (Dec 31-Jan 4).]

En este post cubriremos algunos de los papers más interesantes de la anterior semana. No se intenta hacer un resumen comprehensivo de cada paper, sino explicar por que son interesantes y proporcionar algunos recursos adicionales para aprender más del tema.

A Comprehensive Survey on Graph Neural Networks (https://arxiv.org/abs/1901.00596)

Muchas veces los datos son representados como grafos con relaciones complejas. La complejidad de los datos en grafo es un reto actual para muchas tareas de Machine Learning (ML). Hay muchos estudios que intentan extender los enfoques de Deep Learning (DL) para grafos. En este paper se da una visión general de Redes Neuronales de Grafo (Graph Neural Networks), las cuales fueron introducidas en el 2005. En los últimos cinco años, se ha realizado mucha investigación en redes neuronales convolucionales de grafo (GCN), un conjunto de enfoques que generalizan el operador convolución para grafos.

Para entender qué es un GCN, sugerimos revisar los siguientes recursos en el orden presentado:

Deep Learning (DL) ha logrado excelentes resultados en datos euclidianos. Por ejemplo, una imagen puede ser representada como una cuadrícula en un espacio euclidiano. Dado que los grafos son irregulares y los nodos son interdependientes, las suposiciones de los algoritmos de DL no se mantienen. Han habido trabajos recientes que usan ideas de redes neuronales convolucionales y recurrentes para diseñar redes neuronales de grafos.

Una de las contribuciones interesantes de este paper es la creación de una taxonomía de Redes Neuronales de grafo. Esta taxonomía lo divide en Redes Convolucionales de Grafo, las cuales pueden ser basadas en espacio (similares a cómo los filtros en las CNNs recorren una imagen) y basadas en espectro; Graph Autoencoders aprenden representaciones de pocas dimensiones de un grafo y lo reconstruye, Graph Attention Network asignan pesos de atención a los vecinos de los nodos; Graph Generative Networks pueden generar grafos a partir de un conjunto observado de grafos.

Este paper también explica los datasets más comunes y los divide en cuatro categorías. Concluyendo, este paper cubre diferentes aplicaciones de las GCNs como predecir relaciones semánticas, sistemas de recomendación de alta calidad y predicción de tráfico.

Algunos buenos recursos para aprender más del tema son:

Improving fairness in machine learning systems: What do industry practitioners need? (https://arxiv.org/abs/1812.05239v1)

Este paper es interesante ya que junta los resultados de 35 entrevistas y una encuesta anónima de 267 personas que trabajan con Machine Learning para lograr sistemas más justos de ML. En el 2018 ha habido un gran esfuerzo en desarrollar herramientas y métodos algorítmicos para prevenir que los sistemas de ML amplifiquen desigualdades e injusticias sociales. Un ejemplo es un sistema automático para contratar que puede perpetuar prejuicios a partir de patrones en los datos usados por los algoritmos de ML.

Con el crecimiento del uso de ML en sistemas de día a día (salud, educación, redes sociales, trabajos), también hay mayor responsabilidad de prevenir que estos sistemas incrementen la desigualdad social. Mientras más ha madurado este campo, han sido propuestas definiciones matemáticas de justicia y métodos algorítmicos para detectar discriminación en los sistemas.

Estos son algunos de los resultados del paper:

  • La mayoría de los participantes consideraron que el lugar más importante donde intervenir es en los datasets de entrenamiento. Herramientas para facilitar la comunicación entre modeladores y recolectores de datos sería útil.
  • Diseño cuidadoso del dataset de prueba podría detectar problemas potenciales de justicia.
  • Un reto es identificar qué partes de la población los equipos necesitan considerar cuando desarrollan aplicaciones de ML para asegurarse que hay suficientes datos para equilibrar los datasets.
  • A veces los problemas son detectados cuando son reportados por las quejas de los clientes.
  • Hay una necesidad de procesos proactivos estándares de auditorías. En vez de responder a las quejas de los clientes, guías podrían ayudar a detectar problemas. Métricas y KPIs de justicia son el primer paso hacia eso.
  • Necesidad para mayor escalabilidad. Las estrategias de prueba actuales están limitadas por el gran espacio de posibles problemas de justicia. Otro problema de escalabilidad es juntar individuos diversos en pruebas de usuario.

Este paper da algunas guías en cómo abordar algunas de las problemáticas. Lo primero es apoyo para elegir una estrategia. Dependiendo en el tipo de problema, el equipo debería enfocarse en cambiar a otro modelo, aumentar sus datos de entrenamiento, etc. Para prevenir el desperdicio de recursos, una metodología para elegir la estrategia sería útil. Cuando se tiene que recolectar más datos, es difícil determinar cuántos datos más se necesitan, por lo que normalmente se tiene que confiar en la intuición de los desarrolladores. Un método para saber cuántos datos adicionales se necesitan sería extremadamente útil. Este paper es extremadamente interesante ya que da lugar a investigación potencialmente interesante que busque resolver estos asuntos.

Algunos recursos para aprender más del tema:

Machine learning and AI research for Patient Benefit: 20 Critical Questions on Transparency, Replicability, Ethics and Effectiveness (https://arxiv.org/abs/1812.10404v1)

Mientras que Machine Learning y otros métodos estadísticos son adoptados en el campo de salud, hay mayor conciencia en la falta de transparencia, replicabilidad, exploración de potenciales problemas éticos, y demostraciones de efectividad. Este paper es interesante pues propone 20 preguntas que debería dar guía para seguir buenas prácticas en todas las etapas del proyecto.

Las preguntas deberían ayudar a detectar problemas potenciales, comprender los beneficios que trae usar AI, los lados negativos, la transparencia en manejo de datos, las metodologías de validación y la actualización de modelos. Aunque el paper está enfocado en ML para salud, vale la pena leerlo ya que muchas de estas preguntas son útiles para cualquier proyecto de ML.

DeepTraffic: Crowdsourced Hyperparameter Tuning of Deep Reinforcement Learning Systems for Multi-Agent Dense Traffic Navigation (https://arxiv.org/abs/1801.02805)

Esta es la segunda versión de este paper, pero me encanta este proyecto y creo que vale la pena mencionarlo. DeepTraffic. DeepTraffic es una excelente simulación de tráfico donde se pueden controlar muchos vehículos utilizando una red neuronal. Se pueden modificar los hiperparametros de la red neuronal y participar en un torneo al subir tu solución. Con casi 100 años de simulación de aprendizaje por refuerzo, hay varios resultados interesantes presentados en el paper. Hay un total de 15 hiperparametros en la implementación default del DQN. Estos se dividen en tres categorías: Parámetros de entrada que especifican cómo los coches ven el mundo, parámetros de descenso de gradiente y parámetros de aprendizaje por refuerzo. Revisar el paper vale la pena dado que tiene varios comentarios interesantes de los resultados.

Algunos otros resultados interesantes

¡Gracias por leer!