Machine Learning/Deep Learning

Source: Deep Learning on Medium

Machine Learning/Deep Learning

Como leer Papers técnicos

Andrew Ng es profesor en la Universidad de Stanford, co-fundador y profesor en diferentes cursos en Coursera. Es una figura imprescindible en la investigación y la formación en Inteligencia Artificial. Ha trabajo, entre otros, en los departamentos de investigación de Google o Baidu y ha fundado empresas como DeepLearning.ai o Landing AI.

Fuente: Wikipedia [1]

El proceso

Andrew Ng lector compulsivo de Papers, explicó en su clase de Stanford CS230[2] el proceso que sigue para la lectura de Papers técnicos:

  • Primer paso: Leer Title, Abstract y dedicarle un tiempo a las diferentes figuras del Paper.
  • Segundo paso: Leer la Introduction, la Conclusion, ver las figuras un poco mas en detalle y por último dar un vistazo al contenido del paper asi como a las References. Alguna de ellas puede dar lugar a añadir nuevos papers a nuestro inbox.
  • Tercer paso: Leer ya mas a fondo el Paper pero no entrando en la parte matemática.
  • Cuarto paso: Leerlo ya completo y a fondo pero saltandose aquellas cosas que ya no tienen sentido; ya sea por conocimiento previamente adquirido o por que están incluidas pero no aportan.
  • Quinto paso: Es el momento de hacer algunas preguntas como: ¿qué trataban de conseguir los autores? ¿cuales son los conceptos y/o elementos clave? ¿cuáles puedo usar en mis proyectos y/o investigaciones? ¿qué otras referencias tengo que seguir?

Cuando y que parte leer
Hay un momento específico en el que estamos preparados para leer determinado Paper. Este momento es en el que ya podemos entender los conceptos clave por que los conocemos o por que nos falta ese pequeño paso para conseguirlo con el documento que se tiene en pantalla.

El primer paso del proceso nos ayuda a identificar si el tema y la aproximación de los autores nos interesa y, tras el segundo paso, ya tendremos claro si queremos dedicarle mas tiempo para estudiarlo en profundidad. Anrew Ng nos lo advierte, hay muchos Papers y tenemos que tener claro en que queremos emplear nuestro escaso tiempo.

Un paso mas allá

Para un entendimiento mas profundo del contenido se pueden dar algunos pasos adicionales:

  • Matemática: Un análisis detallado de la parte matemática, realizando el proceso de deducción por uno mismo a partir de los mismos puntos de partida de los autores.
  • Código: Usar y revisar una implementación opensource que implementa el Paper o, adquiriendo ya un conocimiento excepcional, implementando uno mismo lo descrito en el Paper.

Referencias

[1] Andrew NG en Wikipedia
[2] Curso de Stanford CS230
[3] Youtube Playlist de Stanford CS230
[4] Video específico donde Andrew Ng explica el proceso.