
SALMAN SHAHID E LA SUA AI ART CON WOMBO DREAM
L’intelligenza artificiale sogna pecore elettriche? Sì, se glielo diciamo.



Queste pecore sono state create da Dream , un’app di WOMBO che utilizza l’intelligenza artificiale (AI) per generare intricate opere d’arte. L’utente inserisce semplicemente un prompt (o sceglie dai suggerimenti di Dream, come “Futuristic City”, “Crawling Brains” o “Diamond Trees”) e seleziona uno stile artistico, come Dali, Fantasy, Ukiyo-e o Steampunk. Quindi, guardano in tempo reale mentre Dream crea un’opera d’arte basata su questi input. Gli utenti sono così entusiasti delle loro creazioni che sono nate comunità vivaci sui social media e Discord, dove condividono con entusiasmo i loro “sogni”.
“Sono un grande fan dell’arte rinascimentale italiana” – ha dichiarato Salman Shahid, che si definisce ingegnere dei sogni – “e penso che la prima volta che ho visto The School of Athens , ne sono rimasto ipnotizzato. Ho chiesto a WOMBO Dream che aspetto avesse The School of Athens nello stile Synth Wave. È stato piuttosto interessante”.
Da quando è entrato a far parte del team di WOMBO, Shahid ha lavorato sui modelli di apprendimento automatico di entrambe le applicazioni di WOMBO: Dream, pubblicato alla fine del 2021, e la prima app dell’azienda, WOMBO, che anima la foto di un utente per sincronizzare una canzone a sua scelta . Il team comprende designer di applicazioni, creatori di contenuti, product manager, ingegneri di app mobili e web e ingegneri di intelligenza artificiale, come Shahid.
“Apprezziamo davvero la democratizzazione della creatività utilizzando l’intelligenza artificiale”, afferma Shahid. “Lavoriamo per astrarre la complessità e portare modelli di intelligenza artificiale davvero interessanti a milioni di utenti in tutto il mondo”.
L’algoritmo Dream utilizza un approccio guidato da CLIP, una rete neurale open source (un algoritmo disponibile gratuitamente che apprende i modelli nei dati) del laboratorio di ricerca OpenAI. La rete è addestrata sugli abbinamenti immagine-didascalia trovati su Internet e può valutare quanto bene le didascalie fornite dagli utenti siano pertinenti alle immagini.



Per generare le sue opere d’arte, il modello Dream parte da un vettore generato casualmente, una rappresentazione matematica di un’immagine. Ogni voce nel vettore corrisponde a un minuscolo dettaglio dell’immagine. Alcuni potrebbero corrispondere al colore, altri alla forma, altri a significati più astratti. Spesso, il vettore casuale corrisponde prima a un blob grigio di pixel. L’algoritmo utilizza quindi CLIP per accertare quanto bene l’immagine vettoriale corrente corrisponda al prompt dell’utente e migliora la corrispondenza su diverse iterazioni. L’utente osserva l’algoritmo condurre questo processo in tempo reale; l’app crea più immagini prima che appaia il prodotto finale. La casualità del processo significa che Dream non produce mai la stessa opera d’arte due volte.
“L’applicazione si chiama Dream perché abbiamo scoperto che era un’interpretazione giocosa di come crediamo siano i sogni dell’IA…. la rappresentazione interna non è qualcosa che guidiamo specificamente, dove diciamo che un attributo dovrebbe riferirsi a una cosa specifica. È solo qualcosa che il modello impara durante il suo periodo di addestramento…. Il vettore stesso non è leggibile dall’uomo in alcun senso”.
WOMBO Dream si è recentemente ampliato per offrire supporto multilingue. Il suo modello ora può ricevere suggerimenti in una vasta gamma di lingue, tra cui giapponese, hindi e indonesiano. Oltre a offrire più lingue, l’app offrirà presto funzionalità social, come la possibilità di vedere e mettere “mi piace” ai sogni di altri utenti se scelgono di condividerli. Il team sta anche sperimentando animazioni 3D di sogni in modo che gli utenti possano attraversare i sogni che creano nella realtà virtuale.