Nvidia AI Conference — 24 cases brasileiros de Deep Learning.

Source: Deep Learning on Medium

Nvidia AI Conference — 24 cases brasileiros de Deep Learning. Parte 1 — Soluções de Transfer Learning

Em setembro ocorreu no Rio de Janeiro o evento da NVidia www.aiconference.com.br onde o público pode conferir 24 cases de empresas brasileiras baseados em Deep Learning/Machine Learning. Nesta primeira parte falarei um pouco sobre 2 cases apresentados que utilizaram Transfer Learning e explicar o porquê dessa técnica ser tão importante.

O que seria Transfer Learning?

Durante os primeiros anos de nossa vida nosso cérebro está aprendendo uma infinidade de informações: formas, comportamentos, reações… e uma das grandes capacidades que ele possui é a transferência de informação de um domínio para o outro. Para explicar vamos falar sobre nosso processo de aprender a identificar animais: começamos com espécies do nosso cotidiano como cachorro, gato, cavalo, peixe e aprendemos a identificar os olhos, nariz e demais partes desses animais, esteja este de frente, lado ou costas. Porém se você mostrar a uma criança um animal novo como um hipopótamo de frente, e exibir depois uma foto de animais de costas ela vai conseguir identificar o hipopótamo mesmo sem nunca ter visto um animal desta espécie de costas. Nosso cérebro utiliza o que aprendemos ao vermos outros animais para inferir como deve ser as costas de um animal que ele nunca viu, isso é transfer learning ocorrendo em nosso cérebro.

Como utilizamos Transfer Learning na inteligência artificial?

Hoje é possível encontrar disponível na Internet implementações dos principais algoritmos de inteligência artificial. São implementações de modelos no estado da arte em Deep Learning sendo treinados com grandes bases públicas de dados. Acontece que quando queremos utilizar em nossas empresas algum desses algoritmos frequentemente queremos roda-lo num cenário ligeiramente diferente daquele que ele foi treinado. Queremos aproveitar tudo que o algoritmo aprendeu anteriormente e apenas aprimora-lo para aprender um novo padrão sem precisar ser retreinado do zero. Isso é possível “apagando” alguns neurônio finais ou adicionando alguns novos e rodando o modelo para treinar com novos dados. O fato da maioria dos neurônios já ter sido ensinados anteriormente reduz drasticamente a quantidade de dados e de processamento necessários.

Confira 2 cases utilizando essa técnica.

Case 1 — Inteligência Artificial na identificação de veículos para a engenharia de tráfego— Empresa DBA Tecnologia

Empresas de engenharia de tráfego fazem contagem e classificação de veículos que passam em rodovias, categorizando motos, carros, caminhões de 1, 2 ou 3 eixos, entre outros. Esse tipo de informação pode ser utilizada por exemplo para estimar o fluxo e o tipo de veículos que entram em um determinado bairro, para ajudar a projetar o tipo de asfalto necessário naquela região ou estimar o possível impacto no trânsito que um determinado desvio pode ocasionar. Neste caso a DBA começou utilizando algoritmos padrão de detecção de objetos como o YOLO ( https://towardsdatascience.com/yolo-v3-object-detection-53fb7d3bfe6b ) disponíveis open source.

Acontece que esses algoritmos conseguem identificar praticamente qualquer veículo mas não qual o tipo de veículo. Para isso a DBA criou um sistema que inicialmente apenas identificava os veículos que passavam na via e exibia para um funcionário indicar manualmente, num sistema próprio da empresa, qual o tipo de veiculo da imagem (um caminhão 2 eixos por exemplo). Após taggear manualmente centenas de veículos a DBA utilizou essas novas imagens para realizar o transfer learning do algoritmo inicial e ensiná-lo a identificar e classificar cada veiculo.

Case 2 — Segurança do trabalho — Empresa Displace e Ambev

O segundo case vem de um projeto da Displace com a Ambev para identificar o uso de equipamentos de segurança.

Esse projeto teve um fator bacana que é a excelente solução de utilizar o Amazon Mechanical Turk para ajudar a fazer a marcação das imagens de uma maneira bem eficiente e barata. Para quem não conhece esse produto nele você contrata pessoas ao redor do mundo para realizar tarefas simples e manuais a preços baixos. No caso desse projeto foi solicitado que os usuários identificassem na imagem o equipamento de segurança do funcionário (o capacete por exemplo). Depois foi só utilizar essas imagens classificadas manualmente para alimentar o algoritmo de deep learning e ensiná-lo a identificar automaticamente esses equipamentos.