Material de Estudo de Ciência de Dados

Original article was published on Deep Learning on Medium


Material de Estudo de Ciência de Dados

Nos últimos tempos, tenho recebido muitos pedidos de indicações de livros, cursos e materiais em geral para estudo de Ciência de Dados, tanto de curiosos e iniciantes na área quanto de profissionais já mais experientes. Comecei então a compilar uma lista de indicações de materiais (alguns que conheço com detalhes e outros recomendados por pessoas que os conhecem).

Imagem de Jan Vašek por Pixabay

Cada pessoa tem um estilo preferido de aprendizagem: alguns preferem conteúdos detalhados e profundos, recheados de demonstrações matemáticas; outros preferem ter primeiro uma visão geral dos assuntos e ir se aprofundando de acordo com a necessidade em determinados tópicos (o que particularmente funciona muito bem pra mim e eu chamo de “aprendizado cebola”, pois é feito “em camadas”). Algumas pessoas preferem aprender lendo livros e textos, outras aprendem melhor com vídeos, já outras praticando (colocando a mão na massa); algumas dominam e conseguem estudar bem materiais em inglês ou em outro idioma, enquanto outras rendem melhor em português, sem falar na diversidade de conhecimentos prévios, disponibilidade de tempo e dinheiro para investir nos estudos e o mais importante: o objetivo de cada um no aprendizado de ciência de dados. Para tal, esta lista contém materiais de diversas naturezas, níveis e tópicos relacionados à ciência de dados.

Sintam-se à vontade para deixar recomendações de novos conteúdos e feedbacks das suas experiências com os materiais desta lista. A ideia é termos um material em constante construção! Espero ajudar a todos com esta caminhada que tem início, mas nunca chega ao fim, pois o aprendizado é constante!

Livros

Ciência de Dados, Machine Learning, Inteligência Artificial (geral)

  • Introdução a Data Science: Algoritmos de Machine Learning e métodos de análise — Tatiana Escovedo e Adriano Koshiyama (https://www.casadocodigo.com.br/products/livro-data-science)
  • Livros do Machine Learning Mastery — Jason Brownlee: https://machinelearningmastery.com/products/
  • The Hundred Page Machine Learning Book — Andriy Burkov: http://themlbook.com/
  • Introduction to Data Science: A Python Approach to Concepts, Techniques and Applications — Laura Igual and Santi Seguí
  • Python para análise de dados: Tratamento de dados com Pandas, NumPy e Ipython — Wes McKinney
  • Practical Data Science with R — Nina Zumel and John Mount
  • Data Mining: Conceitos, Técnicas, Algoritmos, Orientações e Aplicações — Ronaldo Goldschmidt, Emmanuel Passos e Eduardo Bezerra
  • Data Science Para Negócios. O que Você Precisa Saber Sobre Mineração de Dados e Pensamento Analítico de Dados — Foster Provost e Tom Fawcett
  • Data Mining: Practical Machine Learning Tools and Techniques — Ian H. Witten, Eibe Frank, Mark A. Hall
  • Data Science do Zero. Primeiras Regras com o Python — Joel Grus
  • R for Data Science: Import, Tidy, Transform, Visualize, and Model Data — Garrett Grolemund and Hadley Wickham
  • Applied Artificial intelligence — Mariya Yao, Adelyn Zhou, Marlene Jia
  • Machine Learning: a Probabilistic Perspective — Kevin Patrick Murphy
  • Pattern Recognition and Machine Learning — Christopher M. Bishop
  • Python Data Science Handbook: Essential Tools for Working with Data — Jake VanderPlas
  • An Introduction to Statistical Learning with Aplications in R — Gareth James, Daniela Witten, Trevor Hastie e Robert Tibshirani — http://faculty.marshall.usc.edu/gareth-james/ISL/
  • Introdução à Ciência de Dados — Fundamentos e Aplicações — Versão parcial preliminar — Pedro A. Morettin e Julio M. Singer — https://www.ime.usp.br/~pam/cdados.pdf
  • Best Machine Learning Books (2020) — https://blog.floydhub.com/best-machine-learning-books/

Deep Learning, Processamento de Linguagem Natural e Text Mining

  • Deep Learning Book: http://www.deeplearningbook.org/
  • Neural Networks and Deep Learning: http://neuralnetworksanddeeplearning.com/
  • Deep Learning — Ian Goodfellow, Yoshua Bengio, Aaron Courville
  • Text Mining with R: A Tidy Approach — David Robinson and Julia Silge
  • Natural Language Processing with Python — Steven Bird, Ewan Klein, Edward Loper
  • Text Mining with R: A Tidy Approach — Julia Silge, David Robinson

Big Data

  • Hadoop: The Definitive Guide — Tom White
  • Spark: The Definitive Guide — Bill Chambers, Matei Zaharia

Análise de Séries Temporais

  • Análise de Séries Temporais — Pedro A. Morettin, Clélia M. C. Toloi

Banco de Dados

  • Projeto de Banco de Dados e Teoria Relacional — C. J. Date
  • Sistemas de Banco de Dados — Ramez Elmasri, Shamkant B. Navathe
  • NoSQL Essencial — Pramod J. Sadalage, Martin Fowler

Algoritmos

  • Estruturas de Dados e Seus Algoritmos — Lilian Markenzon, Jayme Luiz Szwarcfiter

Conceitos matemáticos para Ciência de Dados

  • Practical Statistics for Data Scientists — Andrew Bruce and Peter C. Bruce
  • Statistical Analysis: An Interdisciplinary Introduction to Univariate & Multivariate Methods — Sam K. Kachigan
  • Probability, Random Variables and Stochastic Processes — Athanasios Papoulis, S. Unnikrishna Pillai.
  • Applied Statistics and Probability for Engineers — Douglas C. Montgomery, George C. Runger
  • Introdução à Estatística — M. F. Triola.
  • O Cálculo Com Geometria Analítica — Volume 1 — Louis Leithold
  • Cálculo a Uma Variável — Volumes 1 e 2 — Iaci Malta, Sinésio Pesco, Hélio Lopes.
  • Álgebra Linear — Uma Introdução Moderna — David Poole
  • Álgebra linear e suas aplicações — Gilbert Strang

Sites, Blogs e Artigos Técnicos

Canais e Vídeos

Cursos

Ciência de Dados, Machine Learning, Inteligência Artificial (geral)

Deep Learning, Processamento de Linguagem Natural e Text Mining

Python

R

Power BI