Esperimenti domenicali con le GAN (Generative Adversarial Networks)

Original article was published on Deep Learning on Medium

🚀🚀🚀 Esperimenti domenicali con le GAN (Generative Adversarial Networks)

(Photo Credit — Karras+ Arxiv 2019)

Le GAN sono reti neurali in grado di generare automaticamente del contenuto (audio, video, foto, etc) a partire da dati di partenza coerenti rispetto quelli che gli si vuol far generare.

In concreto si può usare, ad es., per creare fotografie di soggetti totalmente inventati (esseri umani, animali etc), per aumentare artificialmente i dati da utilizzare durante il training di altre reti neurali (con benefici su efficacia, riduzione bias, etc).

Ma si possono pensare anche a scenari applicativi diversi ad esempio legati a pubblicità, post su Social Networks, cinema, etc 🎬

La loro architettura è molto interessante: esistono due reti una Generatrice e una Discriminatrice… avversarie fra di loro (da cui il nome).

La Generatrice deve produrre oggetti il più possibile verosimili (A) cercando di ingannare quella Discriminatrice che invece deve cercare di “beccare” i falsi (… d’autore?) dai reali ©. Le due reti, che sono costruite utilizzando delle tecniche standard, sono in competizione fra di loro e cercano entrambe di migliorarsi durante il processo di training.

Nella foto che segue ad es. la Generatrice è riuscita da ingannare la Discriminatrice, ed in effetti la foto del bambino sembra molto verosimile (mentre in effetti non lo è!).

L’argomento è vasto, la ricerca è in fermento e anche i possibili campi di applicazione che possono estendersi ai video come nel caso dei DeepFake: video che sono manipolati da una GAN in maniera quasi indistinguibile (se non da una GAN stessa) come ad esempio quello che segue di Mark Zuckerberg (fake video parte di un progetto artistico).

Oppure nel caso seguente dove tramite un’altra GAN una foto in bianco e nero viene colorata a partire da un processo che, semplificandolo, è:

1) La rete Generatrice analizza la foto in bianco e nero e capisce di che oggetti è composta

2) Sulla base della conoscenza che ho della realtà la Generatrice “sa” che un prato è verde, il cielo e blu etc etc

3) Infine applica i colori sulla base del punto 2 in aggiunta a cercare di rispettare livelli di saturazione, luminosità, etc

L’effetto è strabiliante non soltanto per l’aspetto tecnico ma perché in effetti se prendete foto molto vecchie che sono state sempre e solo b&n anche nei vostri ricordi, in realtà quello che succede è che la AI vi sta mostrando per la prima volta quel mondo a colori 🙂

Ovviamente, come spesso accade con la AI, le opportunità sono molte e i punti d’attenzione altrettanti. Ma questo argomento merita un articolo a parte.