L’ultima onda dell’AI generativa
Una nuvola di applicazioni per i creativi
Qualcosa di nuovo
Non abbiamo ancora la tecnologia per il metaverso, come mostrano le tribolazioni di Meta. Così come non l’abbiamo per l’auto senza guidatore, come mostrano i frequenti glitch di Tesla Autopilot. Qualcuno però sta lavorando alacremente per portare queste tecnologie fuori dai laboratori e forse presto vedremo accadere qualcosa anche nella nostra esperienza. Si tratta di tecnologie importanti, trasformative e generali che richiedono il loro bravo tempo di sviluppo.
Nel frattempo però possiamo godere di alcuni premi di consolazione dell’AI. Si tratta di tecnologie ibride o vassalle delle maggiori ancora imperfette Tra queste ce ne sono alcune che strappano un “vow”, come l’AI generativa che è la nuova ondata nell’oceano dell’intelligenza artificiale.
Strappa un “vow” anche perché è una tecnologia aperta e può accrescere il livello creativo delle nostre produzioni e portare dei benefici a tutti e non solo all’élite dell’high tech.
Scrive Kevin Roose, il technology columnist for The New York Times,
“In Silicon Valley, crypto and the metaverse are out. Generative A.I. is in.”
Il lato creativo dell’AI
L’AI generativa è un termine “ombrello” che comprende una branca dell’intelligenza artificiale, diciamo il lato creativo. Questo tipo di AI può produrre autonomamente testi, immagini, video e codice a partire da semplici input in linguaggio naturale, cioè in inglese. Per ora l’aspetto che funziona meglio è quello delle creazione immagini che va ad aggiungersi a quello della produzione di testi, già in giro da diversi anni.
Ecco un esempio di descrizione testuale di un’immagine che vogliamo far produrre da DALL-E 2 (si pronuncia Dalì), una delle applicazioni più diffuse.
In una casella di testo si può descrivere ciò che vorremmo ottenere, per esempio:
“A bowl of soup that is a portal to another dimension as a digital art”.
Ricevuto questo input il sistema produce un’immagine iper-realistica come quella mostrata in copertina. DALL-E ha una database di 650 milioni di immagini dove andare a prendere i soggetti per poi fonderli con una tecnica che si chiama diffusion model.
Stupefacente, no? Non stupisce che questa tecnologia sia diventata l’avanguardia dell’AI.
Un successo immediato
Il 2022 sembra proprio essere stato l’anno decisivo per le applicazioni di AI generativa. A differenza degli NFT e del metaverso che sono un fenomeno ancora di élite, queste applicazioni hanno numeri impressionanti di utilizzatori.
DALL-E 2, il generatore di immagini che OpenAI (un laboratorio legato a Microsoft con Elon Musk tra i suoi fondatori) ha reso disponibile nel gennaio 2021, ha già quasi due milioni di utenti che creano più di tre milioni di immagini al giorno.
Midjourney, un’altra applicazione di generazione di immagini (più versata nella creazione artistica), è stato presentato nel maggio 2022 e oggi dichiara di avere già più di quattro milioni di utenti che si riversano sul suo server Discord.
Anche Google, Meta e Microsoft hanno costruito i loro generatori di immagini, ma non li hanno ancora resi pubblici. Si chiamano rispettivamente Imagen, Make-A-Scene e NUWA-Infinity.
L’AI generativa era diventata popolare diversi anni fa con il rilascio di strumenti per la generazione di testi anche complessi come il software GPT-3, che ha dato la sensazione a un ingegnere di Google, che lo stava utilizzando in profondità, di trovarsi di fronte a una “cosa” senziente.
In un intervento su Wired il futurologo Kevin Kelly parla di oltre 20 milioni di immagini prodotte al giorno con le applicazioni di AI generativa come Midjourney, Stable Diffusion, Artbreeder e DALL-E e commenta:
“Con un pennello in mano, l’intelligenza artificiale è diventata un motore di wow”.
Un nuovo FoMO
Questi numeri sono sollucchero per i palati degli investitori di ventura sempre all’inseguimento del notorio FoMO (Fear of Missing Out) che spesso risulta essere un “trita capitali”.
Stability, riferisce Roose, la startup che solo qualche mese fa ha presentato Stable diffusion, un algoritmo di generazione di immagini, ha recentemente raccolto oltre 100 milioni di finanziamento con una valutazione che ne fa già un unicorno.
Sempre Roose riferisce che Jasper, un’applicazione per il copywriting destinata ai professionisti del marketing, ha messo insieme 125 milioni di dollari e ottenuto una valutazione di 1,5 miliardi di dollari.
Altre start-up hanno raggranellato risorse ingenti per applicazioni in settori come il gioco, la programmazione e la pubblicità. Sequoia Capital, una delle maggiori aziende di venture capital, ha scritto, in un post sul proprio blog, di ritenere che l’AI generativa possa dar luogo a “valore economico dell’entità di trilioni di dollari”.
Il caso di Stable Diffusion
Fino a oggi nessun progetto di AI generativa ha creato tanto clamore quanto Stable Diffusion.
Questo è dovuto innanzitutto al fatto che, a differenza di molti progetti simili accuratamente presidiati dai loro creatori, Stable Diffusion è un progetto open-source di libero utilizzo. Questo significa che chiunque può accedere al codice sorgente, può scaricarlo e svilupparne una versione modificata.
Secondo l’azienda, più di 200.000 persone si sono impossessate del codice da quando è stato rilasciato in estate e milioni di immagini sono state create utilizzando strumenti basati sull’algoritmo di Stable Diffusion.
E fin qui tutto bene. C’è però un aspetto che sta creando non pochi problemi a Stability. Si tratta di problemi che conosciamo bene quanto sono in azione strumenti di pubblico dominio.
A differenza di altri generatori di immagini, che hanno regole severe (tramite black list di parole) per impedire agli utenti di produrre immagini con contenuti violenti, pornografici o irrispettosi del copyright, Stable Diffusion è dotato di filtro di sicurezza molto lasco, il quale può essere facilmente disattivato dagli utenti che creano le proprie versioni dell’applicazione.
E la produzione di contenuti borderline che, secondo l’indagine di Roose, sta già accadendo in modo massiccio al punto che la società, preoccupata delle conseguenze, è intervenuta rivolgendo un invito agli utenti: “non creare niente che metterebbe in imbarazzo vostra madre”, senza però introdurre dei filtri stringenti.
Il fondatore e CEO di Stability, Emad Mostaque, ha rigettato l’idea di introdurre restrizioni di contenuto perché la libertà creativa radicale è uno dei pre-requisiti per costruire una intelligenza artificiale non sottomessa al dominio delle grandi società di Internet che hanno costruito un sistema panottico.
Mostaque si dice convinto che mettere l’intelligenza artificiale generativa nelle mani di miliardi di persone porterà a un’esplosione di nuove opportunità. Succederà certamente.
La ricaduta sulle professioni creative
Per anni, la convinzione diffusa è stata quella che l’intelligenza artificiale e l’automazione avrebbero determinato la scomparsa delle professioni legate ai lavori manuali ripetitivi. Si pensava che trasportatori, cassieri, magazzinieri, operai alle catene di montaggio avrebbero perso il lavoro a causa dei robot, mentre i lavoratori dei settori creativi come l’arte, l’intrattenimento e i media sarebbero rimasti al di fuori delle conseguenze occupazionali prodotte dall’AI.
Ebbene, di recente si è verificato un fatto inaspettato: l’intelligenza artificiale ha fatto il suo ingresso nelle professioni liberali e creative.
Scrive a questo proposito Kevin Roose:
“È ancora presto per dire se questa nuova ondata di applicazioni finirà per costare il lavoro ad artisti e illustratori. Ciò che sembra chiaro, tuttavia, è che questi strumenti vengono già utilizzati nelle industrie creative”.
Ed è proprio così. Una raffigurazione generata con DALL-E 2, che consiste in un’opera fittizia che fonde in modo impressionante il capolavoro di Jan Vermeer, La ragazza del latte (Rijksmuseum, Amsterdam) con porzioni di dipinti di scuola fiamminga, è servita all’agenzia Ogilvy Paris, che fa parte di WPP, la più grande società di ADV del mondo, per la campagna pubblicitaria della linea di prodotti “La Laitiére” della Nestlé destinata al mercato francese.
Esempi di utilizzo dell’AI generativa nell’industria creativa
Il giornalista del “New York Times” riporta cinque casi di professionisti dell’industria creativa che stanno regolarmente utilizzando una qualche applicazione di AI generativa nella loro attività.
Collin Waldoch, 29 anni, un designer di videogiochi di Brooklin, utilizza Dream Studio per creare personaggi e oggetti da utilizzare nel gaming online. Costo: pochi minuti di lavoro più qualche centesimo per l’utilizzo delle immagini. Queste applicazioni hanno un sistema di billing a crediti. Per esempio 30 crediti di DALL-E (che permettono di utilizzare 30 immagini) costano 15 dollari.
Isabella Orsi, 24 anni, designer di interni di San Francisco, utilizza l’AI generativa per creare mock-up di ambienti arredati. Carica sull’app Interior AI le foto degli ambienti che il cliente intende arredare e gli applica dei filtri per ottenere dei rendering coi nuovi arredi.
Patrick Clair, 40 anni, filmmaker di Sydney in Australia, utilizza DALL-E 2 per preparare delle presentazioni di scenografie virtuali da sottoporre alle case di produzione. Trova questo tool ampiamente superiore a qualsiasi altro strumento disponibile per creare adattamenti virtuali e scenografia.
Jason Carmel, 49 anni, è executive all’agenzia pubblicitaria Wunderman di New York. Alle volte il suo team si trova nella necessità di dover creare di sana pianta un’immagine, come per esempio quella di un cane a un tavolo da poker. Realizzarla nei modi tradizionali richiederebbe un intero giorno di lavoro di un disegnatore, magari per poi rendersi che non funziona. Bene con DALL-E 2 può essere realizzata in pochi secondi. E ne possono essere fatte n-versioni.
Sarah Drummond, 33 anni, che lavora in un service grafico di Londra, usa Midjourney o DALL-E 2 per disegnare delle vignette in bianco e nero per cartellonistica. Prima impiegava molto tempo a preparare dei bozzetti, cosiddetti “blob drawings”. Con le applicazioni di AI generativa adesso impiega pochi minuti.
… e le conseguenze?
In ogni caso tutti questi professionisti concordano nel rilevare che l’AI generativa è uno strumento utilissimo nel lavoro creativo, ma non sostituirà mai interamente le professioni di questo settore. Almeno per ora, aggiungerei.
C’è comunque un bel “però” da metterci davanti il quale scaturisce da un novero di difficili domande legate al plagiarismo, all’autorialità, alla proprietà artistica e al mondo del lavoro. Forse ce n’è una più grande di tutti, scrive Tom Faber sul “Financial Times”, questa:
“È la l’inizio della fine della creatività umana?”.
Una bella domanda e forse la cosa migliore è neppure farsela. Una cosa però è certa: la storia dell’arte e della creatività è indissolubilmente intrecciata con la tecnologia non solo nelle tecniche ma anche nel contenuto. E l’arte, pero ora, non è mai stata soppiantata o sussunta dalla tecnologia.
Fonti
Kevin Roose, A Coming-Out Party for Generative A.I., Silicon Valley’s New Craze, The New York Times, 21 ottobre 2022
Kevin Roose, A.I.-Generated Art Is Already Transforming Creative Work, The New York Times, 21 ottobre 2022
Tom Faber, The golden age of AI-generated art is here. It’s going to get weird, The Financial Times, 27 ottobre 2022
Kevin Kelly, Picture Limitless Creativity at Your Fingertips, Wired, 17 novembre 2022