L’intelligenza artificiale crea testi e immagini; adesso produce anche video e riproduce voci. Se ciò che si legge può essere messo in discussione, esercitare l’arte del dubbio di fronte a ciò che si vede o che si sente è molto più difficile. L’unico antidoto è allenare sempre la coscienza critica.
Sono passati più di due anni da quando, a fine ‘22, ChatGPT è entrato a gamba tesa nel mondo digitale – già fin troppo dinamico e mutevole – sconvolgendone le prospettive. Da quel momento, le novità si sono accavallate a gran velocità. L’Ia generativa, di cui ChatGP è solo uno dei protagonisti, si è espansa a nuovi media, ha proposto nuove applicazioni, ha coinvolto nuovi attori. Portando opportunità, ma anche minacce. Proviamo a fissare qualche punto fermo, se qui di punti fermi si può parlare.
Immagini, video, fatti e opinioni
Nella rassegna pubblicata solo pochi mesi fa, accennavamo alla generazione di immagini a partire da un prompt testuale, che alcuni sistemi, come Copilot di Microsoft, mettono a disposizione di tutti. Basta scrivere “Disegna questo e quello” per ottenere immagini – tutto sommato niente male – in pochi secondi. Oggi la funzione è disponibile (gratis) nella maggior parte dei servizi di Ia generativa e in molti software grafici, preoccupando non poco disegnatori e fotografi, che vedono ridotte le opportunità di lavoro. ma dovremmo rifletterci su anche noi tutti, perché la novità coinvolge un tema vasto e profondo: il rapporto con i media e con il modo con cui separiamo i fatti dalle opinioni. Da quando non usiamo più come attestato di verità il “c’è scritto sul giornale” o “l’hanno detto al TG”, dividiamo le informazioni in due categorie:
- quello che ci viene detto, che riteniamo più o meno vero in base a criteri come l’autorevolezza dell’autore, il modo con cui viene comunicato o la fascinazione del medium. Si tratta di testi, voci di persone, disegni e altri media che sappiamo essere prodotti da qualcuno per i propri scopi. Per questo, applichiamo almeno un barlume di pensiero critico;
- quello che ci viene mostrato, con fotografie, filmati, registrazioni audio e altro. Sono media che consideriamo in qualche misura “oggettivi”. Anche qui, sappiamo che l’informazione proviene da qualcuno, con obiettivi non sempre trasparenti, ma la cosa passa in secondo piano, perché tendiamo a considerare foto, video e registrazioni uno specchio della realtà. Abbiamo visto con i nostri occhi, sentito con le nostre orecchie. E il pensiero critico si prende una vacanza. Restando nel mondo delle immagini, conosciamo le foto costruite con soggetti in posa e alterando l’ambiente, conosciamo i fotomontaggi, ma sono facili da individuare “a occhio”. Oggi, però, che le foto si possono inventare, le cose sono cambiate.
Ho fatto qualche prova su un terreno senza troppe implicazioni politico-culturali, chiedendo ad alcune intelligenze artificiali una ricostruzione storica di antichi edifici, dei quali conosciamo bene la struttura e l’aspetto che avevano il giorno dell’inaugurazione:
- disegna un nuraghe sardo, di quelli realizzati nel secondo millennio avanti Cristo, come era appena costruito. Non quindi come si presenta adesso, tremila anni dopo. ecco i risultati (vedi FOTO 2), tra i quali ho inserito un’immagine che invece è frutto di un attento studio storico, basato su evidenze archeologiche e su antichi modellini arrivati fino a noi.
Cosa ne deduciamo? Sono immagini molto diverse tra loro. Troppo. La 2 e la 3 sono fotorealistiche, la altre appaiono come disegni. La 2 assomiglia a un castello, la 3 a un trullo, le altre ai ruderi che conosciamo oggi. ma tre su quattro saltano a piè pari la letteratura scientifica. ecco l’aspetto inquietante: anche quando sembrano foto (il cui realismo non potrà che aumentare nel tempo), in queste immagini la verità non ha alcun peso. Per la cronaca, la ricostruzione “vera” è quella che sembra meno verosimile: la numero 2, il nuraghe Arrubiu di Orroli.
Fin qui poco male: stiamo solo giocando. ma le immagini fake hanno già invaso i social a supporto della disinformazione e si preparano a dare l’assalto ai media tradizionali. Qualche tentativo di fermare il fenomeno ci sarebbe, come la proposta di identificare con una filigrana le immagini realizzate con l’Ia. O il rifiuto di rappresentare soggetti sconvenienti. Ma sono contromisure lasciate alla buona volontà (o all’arbitrio) dei padroni del digitale.
Ho fatto un altro esperimento proponendo ad alcune Ia un prompt decisamente provocatorio: disegna, con stile fotografico, Donald Trump cha bacia Elon Musk. Ho ricevuto una serie di cortesi rifiuti da Gemini
“mi spiace, non possono generare immagini per le domande rischiose”,
chatGPT
“non posso creare immagini di personaggi pubblici in situazioni non reali…”
e Copilot
“non posso generare immagini di persone reali in situazioni compromettenti”.
Ma, gira gira, alla fine quello che volevo l’ho ottenuto da Qwen chat. Paladini della libertà di espressione? Non proprio: il sistema è di proprietà di Alibaba, un’azienda simile ad Amazon. ma cinese. Le foto sono solo l’inizio.
Video e voci
Se possiamo ottenere una “fotografia” partendo da una descrizione testuale, dovremmo riuscirci anche con i filmati. Infatti, è possibile, ma servono risorse di calcolo molto maggiori. con un motore di ricerca, spunta un lungo elenco di siti che permettono di creare brevi clip. Per esempio, il generatore video di Canva (noto software di progettazione grafica), che è utile provare per farsi un’idea. Come al solito è tutto molto semplice: si descrive quello che si vuole ottenere (ma “usando più di cinque parole”), si clicca su “Genera video” e il gioco è fatto.
La tecnologia è ancora acerba: la produzione richiede un paio di minuti (un tempo lunghissimo), per un videoclip non così perfetto di pochi secondi. e poi il sistema funziona a crediti. Ce ne sono a disposizione solo 50 al mese, segno che l’elaborazione è piuttosto onerosa e il “tutto gratis senza limiti” non è sostenibile. ma la partenza zoppicante non ci tragga in inganno, perché nel digitale vale il principio “tutto quello che non funziona o lo fa in modo scadente, presto lo farà benissimo”. Ne sono una prova la voci dei navigatori satellitari, che non assomigliano più a quelle metalliche dei robot dei film di fantascienza anni ’50.
La tecnologia TTS (Text To Speech) oggi è matura, al punto di riprodurre le sfumature emotive della voce. Chi vuole provare può rivolgersi a siti come TextToSpeech, inserire un testo (fino a 2.000 caratteri) e ricavarne gratuitamente un file audio (mp3), anche in italiano, con una voce a scelta (quasi tutte generate con l’Ia). Comodo e utile, ma non è tutto. ci sono sistemi che consentono di clonare voci reali. Per esempio, Speechify, che a differenza di altri sistemi TTS, permette di campionare la voce parlando per qualche secondo o caricando un file. Se ne ricava un file audio con la nostra voce o con quella di chi vogliamo con Focuson.
L’intelligenza artificiale non è più una questione tecnologica… È un nuovo terreno di scontro su cui si decide una parte rilevante degli equilibri geopolitici mondiali. Con una qualità sorprendentemente buona possiamo realizzare prodotti multimediali personalizzandoli con voci “vere”. Vere, ma non per questo sono veritiere, visto che ci vuole poco per far dire a chiunque qualunque cosa. e spacciare un audio artefatto per una preziosa testimonianza di prima mano.
Serve altro per dimostrare la potenza e la prepotenza dell’Ia?
Dal wow! al pensiero critico
L’ intelligenza artificiale non è più una questione tecnologica. non è solo l’ultimo giocattolo proveniente dalla Silicon Valley che fa dire “wow!” e sognare profitti miliardari. È un nuovo terreno di scontro su cui si decide una parte rilevante degli equilibri geopolitici mondiali. Su questo settore, la nuova amministrazione Usa ha annunciato 500 miliardi di dollari di investimenti, suscitando un proporzionale entusiasmo nelle aziende del settore. Entusiasmo che pochi giorni dopo si è trasformato in delusione, quando dalla Cina è arrivato DeepSeek, con prestazioni paragonabili a chatGPT, ma costato (pare) solo 6 milioni di dollari.
Anche se fossero 60, sarebbe un risultato tale da cambiare le regole del gioco. DeepSeek è stata per alcuni giorni l’app più scaricata dagli store di Google e Apple, fino a quando non è arrivato il blocco da parte di molti Paesi con l’accusa di inviare in Cina i dati degli utenti (ma, ho controllato, continua a funzionare per chi ce l’ha). nel frattempo, l’Europa sta proponendo le sue Ia (tra tutte la francese Mistral) e ha annunciato a sua volta 200 miliardi di investimenti, tanto per non perdere il treno. E con l’Ia act ha avviato il primo, benemerito (e finora unico) tentativo di regolamentare il settore, mentre il resto del mondo tuona contro la presunta limitazione alla ricerca.
È solo un problema di dati degli utenti? Basta chiedere a chatGPT di produrre immagini “sconvenienti” o alle cinesi DeepSeek e Qwen chat notizie sui fatti di Piazza Tienanmen per rendersi conto che il vero oggetto del contendere è la gestione dell’informazione e, quindi, il controllo delle coscienze. ma noi che siamo in mezzo al campo di battaglia, qualcosa la possiamo fare: conoscere e usare le Ia per farle nostre (giocando con le varie funzioni, come sto proponendo in queste pagine). e considerare anche quello che viene mostrato con “prove” audiovideo alla stregua di quello che viene scritto o disegnato.
In fondo, dobbiamo solo lasciare il pensiero critico sempre acceso.
INFOGRAFIA
• Canva, generatore video, sito ufficiale.
• ChatGPT, sito ufficiale.
• Consiglio dell’Unione europea (2024), “Regolamento sull’intelligenza artificiale (Ia)”: il consiglio dà il via libera definitivo alle prime regole per l’Ia al mondo.
• Copilot, sito ufficiale.
• DeepSeek, sito ufficiale.
• Vindice Deplano, 2024, “Intelligenze artificiali generative: panorama 2024”, Docete, n. 41; Caos Management 153
• Gemini, sito ufficiale.
• Invideo, sito ufficiale.
• Qwenchat, sito ufficiale.
• Speechify, sito ufficiale.
• TextToSpeech, sito ufficiale.
• Vindice Deplano 2024, “Una questione di prompt”, Docete, anno X, numero 42, novembre-dicembre 2024
* “Gli orizzonti in chiaroscuro dell’IA generativa” Docete (numero 44).