ESRGAN — Utilizando machine learning para aprimorar imagens e realizar upscaling com maior…

Source: Deep Learning on Medium

Ultimamente o aprendizado de máquina (machine learning) tem sido cada vez mais utilizado e aprimorado, e não seria diferente na realidade de aprimoramento e remasterização de imagens/jogos, atualmente começaram a utilizar esta poderosa ferramenta para aprimorar texturas antigas de imagens ou jogos com baixa resolução, gerando um upscale de até 2x, inclusive com qualidade superior a resolução inicial.

Amostra de tentativas de possíveis soluções de upscale

Machine Learning & ESRGAN

Bom, para que você entenda como isto funciona deve antes entender como o aprendizado de máquina é utilizado e como ele funciona, de um modo bem resumido o machine learning nada mais é que deixar uma tarefa para a sua máquina (seu computador por exemplo) tentar fazer, porém você irá mostrar para ela o que é um resultado bom e o que é um resultado ruim, desta forma toda vez que ela fizer algo que não bata com os padrões de algo bom ela irá entender que aquilo ficou ruim e irá tentar novamente utilizando outras possíveis soluções. Desta forma a máquina vai separando erros e acertos, melhorando seus acertos cada vez mais até chegar em um ponto em que o resultado seja “perfeito”.

Sabendo disso agora é mais fácil para você entender que o ESRGAN nada mais é que deixar a máquina fazendo diversas tentativas de upscaling e aprimoramento de imagem até que ela chegue em um ponto e defina que aquilo está bom. Este método pode até parecer simples mas na realidade demanda um conhecimento profundo pois o aprendizado de máquina é uma área com diversos conteúdos e subcategorias e demanda conhecimentos de estatística e programação.

Caso tenha interesse em testar e entender melhor o ESRGAN basta acessar o github do projeto: https://github.com/xinntao/ESRGAN

Também pode conferir um artigo sobre ESRGAN que explica detalhadamente cada passo de como foi estudado e desenvolvido esta tecnologia: https://arxiv.org/pdf/1609.04802.pdf

Exemplos

Aqui estão alguns exemplos de como esta tecnologia pode revolucionar em diversos setores em que o aprimoramento de imagem é necessário, destacando aqui a área de jogos, pois muitos jogos antigos poderão ter sua resolução e sua qualidade extremamente melhorada:

Exemplo 1 — GIF
Exemplo 2 — Imagem Original
Exemplo 2 — Imagem com ESRGAN
Exemplo 3 — GIF
Exemplo 4 — GIF
Exemplo 5 — GIF — Tentativas

Nvidia e sua ferramenta GameWorks

Sabendo do surgimento deste poderoso motor movido a “IA” a Nvidia está criando o GameWorks, uma ferramenta para possibilitar a utilização do “ESRGAN” de forma mais simples e intuitiva (pois como citei antes, o processo de machine learning não é tão simples de fazer/entender).

Definição das funções do GameWorks da Nvidia

Caso tenha interesse em acompanhar o desenvolvimento, e até mesmo testar esta ferramenta da Nvidia, basta fazer a inscrição para o beta aqui: https://developer.nvidia.com/gwmt

Fontes: