StyleGAN di Nvidia – Lo Stato dell’Arte dell’A.I. generativa applicata ai Volti Umani
Nel 2018 Nvidia ha creato una I.A. generativa potentissima, in grado di creare dal nulla dei volti umani inventati di sana pianta, talmente realistici da essere praticamente indistinguibili dai volti umani reali. L’addestramento di questo cervellone elettronico è stato fatto con centinaia di migliaia di foto di volti prese da Flickr. Da allora ci sono stati due aggiornamenti per eliminare gli artefatti e le deformazioni che comparivano in determinate situazioni. Ed ora ...
del 21/06/23 - di Mario Ceccherini
… il software pre-addestrato di questa meraviglia tecnologica in grado di generare volti umani apparentemente indistinguibili dalla realtà. E’ diventato Open Source nel 2019 ed è possibile scaricarlo da GitHub e, se si è capaci, è altresì possibile metterci mano per efficientarlo ulteriormente.
Alla fine dell’articolo metteremo un po’ di risorse utili, compreso un sito dove è possibile generare volti umani “random”, in alta risoluzione, con un semplice click.
Cos’è StyleGAN?
Per dirla con termini tecnici, StyleGAN è una rete generativa avversaria (GAN) introdotta dai ricercatori di Nvidia nel dicembre 2018 e, come già detto, resa disponibile come sorgente nel febbraio 2019.
StyleGAN è nata da una collaborazione tra il software CUDA di Nvidia, dalle sue GPU, da TensorFlow di Google o da PyTorch di Meta AI, che sostituisce TensorFlow come libreria di implementazione ufficiale nelle ultime versioni.
Al momento questa rete neurale artificiale è stata addestrata per riconoscere e ad elaborare statisticamente infiniti volti umani, ed è in grado di creare apparentemente dal nulla dei visi di una perfezione difficilmente riscontrabile in altri software similari. Verrebbe da dire… Midjourney spostati proprio!
Un po’ di storia.
La prima versione, StyleGAN-1, utilizzava un meccanismo di crescita progressiva in cui ogni immagine generata passava attraverso blocchi di stile che applicavano un vettore latente di stile per trasformarla. Durante l'addestramento, vennero utilizzati uno o due vettori latenti di stile per immagine.
StyleGAN-2 migliora successivamente il processo applicando i vettori latenti di stile direttamente ai pesi dei livelli di convoluzione, risolvendo il problema dei "blob" indesiderati. Viene anche introdotta la connessione residua per evitare il bloccaggio delle caratteristiche a intervalli di pixel specifici.
StyleGAN-3 risolve il problema dell' "attaccamento alla texture" introducendo filtri di "lowpass" tra i livelli del generatore. Questo consente al generatore di operare sui pixel in modo fedele ai segnali continui che rappresentano, evitando l'attaccamento indesiderato alle texture nelle immagini generate.
Per ora StyleGAN è stata addestrata a lavorare sui volti umani, ma nulla impedisce di utilizzarla per volti di cani, gatti, cavalli, animali in genere o per cose, tipo automobili, biciclette, barche, case montagne, paesaggi ecc… Il motore c’è, funziona molto bene, mancano solo i volontari che scarichino l’applicativo e lo facciano lavorare su centinaia di migliaia di immagini coerenti per consentire l’apprendimento statistico del programma.
Risorse Utili:
Ecco dove scaricare il software Open Source (con le istruzioni per utilizzarlo):
https://github.com/NVlabs/stylegan
Qui trovate la lista delle versioni:
https://nvlabs.github.io/stylegan2/versions.html
Se volete vederlo al lavoro, eccolo mentre genera volti umani incredibilmente perfetti, in alta risoluzione, con un click:
https://www.boorp.com/face_generator_free.html
Se volete giocare ad indovinare qual è il volto vero e quello sintetico, ecco questo simpatico giochetto creato da Jevin West and Carl Bergstrom dell’Università di Washington:
https://whichfaceisreal.com/index.php
Se volete saperne di più vi rimando a Wikipedia:
https://en.wikipedia.org/wiki/StyleGAN
Photo by: Creata con StyleGAN (Open Source)