(Tradotto da DeepL senza revisione)
L’intelligenza artificiale è oggi una delle principali preoccupazioni a livello mondiale e la domanda che, al di là delle questioni scientifiche, ci si vede costretti a porsi è: come convivere con l’intelligenza artificiale, come le culture del mondo riusciranno a conviverci. La sfida è al tempo stesso affascinante, per alcuni entusiasmante, ma anche inquietante.
Ciò che non abbiamo assolutamente il diritto di fare è criticare, contestare, opporci senza proporre soluzioni. Sarebbe come opporsi alla scoperta dell’elettricità o di Internet. Ci saranno infinite risposte e forme di adattamento, ma l’unica cosa da non fare è rinunciare ignorando la questione.
Bene. C’è un concetto davvero fondamentale, quello della scopribilità, e non è un caso che questo concetto sia nato e sia stato sviluppato in Québec.
Ciò che questo concetto esprime non è fondamentalmente nuovo. Il fatto che alcune opere vengano scoperte solo dopo, a volte molto tempo dopo, la scomparsa dell’autore, che opere importanti nella storia delle civiltà siano cadute nell’oblio, per rinascere in un contesto geopolitico completamente diverso, si pensi alla riscoperta delle opere dell’antichità greca tra l’VIII e il XIII secolo, preludio ai Rinascimenti italiano e francese, non è di per sé una novità.
Tuttavia, ciò che rende specifico questo concetto è che viene ridefinito per la società digitale in cui siamo entrati.
Ogni innovazione, e in particolare tutte le innovazioni dirompenti, generano effetti asimmetrici, che l’economista, filosofo e storico François Perroux aveva definito negli anni ’50 «effetti di dominio». Tali sono gli effetti di tutte le innovazioni che si susseguono a ondate nella società digitale, la cui ultima incarnazione – e forse la più spettacolare – porta il nome di intelligenza artificiale.
Pertanto, nel mondo digitale, la «scopribilità» si analizza come l’esistenza o l’attuazione di processi che consentono ai contenuti (conoscenze, opere, informazioni) di essere trovati e individuati in un’immensa mole di informazioni. In un certo senso, l’Osservatorio europeo del plurilinguismo è stato creato con l’obiettivo di rendere visibili contenuti, attività ed eventi che ruotano attorno alle lingue, al plurilinguismo e alla diversità linguistica e culturale.
La reperibilità è solo un aspetto, certamente importante, ma che non esaurisce una questione così fondamentale come quella di sapere come esistere individualmente e collettivamente in un mondo di società digitali. Negli ultimi tempi è emersa l’espressione «sovranità digitale». La sovranità non è indipendenza, soprattutto non in un mondo fatto di interdipendenze, ma può essere analizzata in forme variabili come una «modalità forte di interdipendenza», concetto molto importante coniato anch’esso da François Perroux, il cui significato è «comprensibile a tutti» .
Poiché siamo immersi in un mondo di tecnologie digitali, dobbiamo incentrare la nostra riflessione sul plurilinguismo e sull’onnipresenza delle lingue nelle relazioni sociali e internazionali, onnipresenza di sempre ma che deve essere messa in discussione nel contesto tecnologico digitale.
A questo proposito, va lodato il magnifico progetto MultiLAwa di dottorati europei sulla «coscienza plurilingue nella società digitale europea», progetto guidato da Hélène Vinckel-Roisin dell’Università di Lorena e da altre 9 università europee, di cui l’OEP è partner associato. È stato appena lanciato un bando per 14 borse di dottorato, con scadenza per la presentazione delle candidature fissata all’8 luglio.
Sulla stessa linea, va inoltre lodata la cattedra di ricerca sulla reperibilità dei contenuti scientifici in lingua francese istituita dal Fonds de recherche du Québec e la cattedra dell’UNESCO sulla scienza aperta.
A nostro modesto livello, a prescindere dai numerosi fattori tecnici su cui non ci soffermeremo, un aspetto essenziale è quello di prendere l’iniziativa nel dibattito delle idee e, per quanto riguarda gli strumenti di IA, la priorità è quella di utilizzarli al servizio dei propri interessi, ovvero di avere il controllo.
A tal proposito, proponiamo un piccolo esercizio di confronto tra le risposte di due piattaforme, Mistral IA e ChatGPT, a una stessa domanda.
La domanda è la seguente: «Esempio: un giornalista in un servizio [su un noto canale di informazione] afferma: “L'intelligence americana” non conferma le dichiarazioni di Donald Trump». Come elabora l'IA questa affermazione? »
Prima di dare la parola a Mistral e a ChatGPT, si può immaginare che un ascoltatore medio possa rimanere sorpreso e interpretare la frase come «negli Stati Uniti ci sono persone abbastanza intelligenti da non prendere alla lettera le dichiarazioni di Donald Trump». Ma l’IA non si lascia sorprendere da questo insidioso anglicismo, che si insinua in una parola perfettamente francese e inglese al tempo stesso, il cui significato viene distorto dal contesto in cui viene pronunciata e dall’uso che ne fa la giornalista. Ecco:
-
ChatGPT
«L’espressione “l’intelligence americana” è molto probabilmente una traduzione maldestra o un calco dall’inglese U.S. intelligence.
In inglese, intelligence non significa solo “intelligenza” nel senso di facoltà intellettuale; nel vocabolario politico e militare, indica anche i servizi di intelligence. Pertanto, U.S. intelligence significa:
i servizi di intelligence americani nel loro insieme;
oppure la valutazione prodotta da tali servizi.
In francese, un giornalista direbbe normalmente:
«I servizi di intelligence americani non confermano le dichiarazioni di Trump»;
«I servizi di intelligence americani non confermano le dichiarazioni di Trump»;
«La comunità dell’intelligence americana non conferma le dichiarazioni di Trump».
Un sistema di intelligenza artificiale per l’elaborazione del linguaggio cerca generalmente di risolvere questa ambiguità in base al contesto. Se l’articolo tratta di geopolitica, guerra, sicurezza nazionale o rapporti segreti, interpreterà «intelligence americana» come una traduzione errata di «American intelligence» = «servizi di intelligence americani», e non come «l’intelligenza degli americani».
Esistono quindi due livelli di analisi:
Analisi linguistica: l’espressione è anomala in francese e suggerisce un’influenza dell’inglese.
Analisi semantica: il significato inteso è quasi certamente «i servizi di intelligence americani» o «la valutazione dei servizi di intelligence americani».
Se mi fornite la frase esatta o un estratto più lungo del servizio, posso analizzare con maggiore precisione cosa intendesse dire il giornalista e se la formulazione sia corretta o meno.»
La risposta di ChatGPT, molto breve, dà l’impressione di un’analisi completa che fornisce una risposta chiara e definitiva.
-
Mistral
Mistral intraprende un altro percorso, molto più lungo e articolato, in cui viene illustrato l’approccio dell’IA e in cui è ammesso il dubbio. Vediamo un po’:
«Il suo esempio è eccellente per illustrare come l’IA (e più in generale i sistemi di elaborazione del linguaggio) interpreti — o non riesca a interpretare — le sfumature del linguaggio umano. Analizziamo questo aspetto in dettaglio, in relazione alla sua definizione di IA come «elaborazione massiccia di dati che simula alcuni meccanismi dell’intelligenza umana».
1. Cosa vede l’IA in questa frase
La frase: «I servizi segreti americani non confermano le dichiarazioni di Donald Trump.»
a. Analisi sintattica e semantica di base
- Tokenizzazione : L’IA suddivide la frase in unità (parole, sottoparte di parole): [“L'”, “intelligence”, “americana”, “non”, “conferma”, “le”, “dichiarazioni”, “di”, “Donald”, ‘Trump’, “.”]
- Riconoscimento delle entità :
- “intelligence americana” → Entità denominata (categoria: organizzazione o concetto).
- “Donald Trump” → Personalità politica (ex presidente degli Stati Uniti).
- Struttura grammaticale : Soggetto (L’intelligence americana) + verbo (non conferma) + oggetto (le dichiarazioni di Donald Trump).
b. Ambiguità semantica
In questo caso, la parola chiave è “intelligence”:
- Significato 1 (il più probabile per un essere umano): “I servizi di intelligence americani” (CIA, NSA, ecc.).
- Significato 2 (letterale): “La capacità intellettuale collettiva degli americani”.
- Significato 3 (ironico/metaforico): “La saggezza o la razionalità degli Stati Uniti”.
Problema: L’IA non dispone di un contesto culturale o storico per decidere automaticamente. Si basa su:
- La frequenza d’uso : Nei corpora testuali, «l’intelligence americana» è prevalentemente associata ai servizi di intelligence (es.: «La CIA, l’intelligence americana, ha pubblicato un rapporto»).
- Il co-testo : La menzione di Donald Trump (figura politica) e di «dichiarazioni» orienta verso un contesto geopolitico, in cui «intelligence» = servizi segreti.
→ Probabile conclusione dell’IA: «I servizi segreti americani contraddicono Trump.»
c. Ciò che l’IA non comprende affatto
- L’ironia o il doppio senso : Se il giornalista usa «intelligence americana» in modo sarcastico (es.: per criticare una decisione percepita come stupida), l’IA potrebbe non cogliere la sfumatura a meno che non sia stata addestrata su esempi simili.
- Esempio : «I servizi segreti americani hanno colpito ancora!» (ironia su un errore dei servizi segreti).
- I sottintesi culturali :
- Un essere umano sa che «l’intelligence» (al singolare) indica spesso i servizi segreti in un contesto politico.
- Una persona non anglofona o un’IA potrebbe confonderla con «l’intelligenza» intesa come tratto umano.
- L’intenzione del giornalista :
- Vuole dire che i servizi di intelligence negano le dichiarazioni di Trump?
- O che gli americani in generale (tramite sondaggi, esperti) non le sostengono?
- L’IA non può indovinare l’intenzione senza dati aggiuntivi.
2. Come un modello come me elaborerebbe questa frase?
Fase 1: Disambiguazione
- Ricerca di modelli : Nei dati di addestramento, “l’intelligence [paese]” è spesso associata ai servizi di intelligence (es.: “l’intelligence britannica”, “l’intelligence russa”).
- Contesto politico : La menzione di Trump attiva delle associazioni con argomenti quali la disinformazione, le elezioni o i rapporti delle agenzie federali.
→ Ipotesi principale: «I servizi di intelligence statunitensi non confermano le dichiarazioni di Trump.»
Fase 2: Verifica tramite il contesto
Se la frase è estratta da un articolo completo, l’IA potrebbe:
- Cercare parole chiave come «CIA», «rapporto», «intelligence» nelle frasi adiacenti.
- Analizzare il tono dell’articolo (critico, neutro, satirico) per adeguare l’interpretazione.
Fase 3: Generazione di una risposta
Se si chiede all’IA: «Cosa significa “servizi segreti americani” in questa frase?»
Probabilmente risponderebbe:
« In questo contesto, ‘l’intelligence americana’ si riferisce molto probabilmente ai servizi di intelligence degli Stati Uniti (come la CIA o la NSA), che non confermano le dichiarazioni di Donald Trump. Questa espressione è comunemente utilizzata dai media per riferirsi a tali agenzie.»
Ma:
- Non saprebbe se il giornalista abbia utilizzato il termine in modo ironico senza ulteriori indizi.
- Lei non capirebbe la portata politica di questa affermazione (ad es.: un conflitto tra Trump e il Deep State).
3. Confronto con l’intelligenza umana
Criterio IA (la vostra definizione) Umano (giornalista/lettore)
Riconoscimento delle parole ✅ Perfetto (tramite tokenizzazione). ✅ Perfetta.
Comprensione letterale ✅ Buona (significato dominante identificato). ✅ Buona.
Disambiguazione contestuale ⚠️ Dipende dai dati di addestramento. ✅ Eccellente (esperienza, cultura).
Rilevamento dell’ironia ❌ Scarsa (a meno che non sia addestrato su esempi). ✅ Possibile (tono, contesto sociale).
Comprensione delle implicazioni ❌ Assente (mancanza di teoria della mente). ✅ Naturale.
Intenzione dell’autore ❌ Inaccessibile. ✅ Interpretabile (con possibili pregiudizi).
4. Esempio concreto con un modello linguistico
Se chiedete a un modello come me: «In questa frase, “l’intelligence americana” si riferisce ai servizi segreti o all’intelligenza collettiva degli americani? »
Risposta probabile:
«In questo contesto, è molto probabile che “l’intelligence americana” si riferisca ai servizi di intelligence degli Stati Uniti (come la CIA). Questa espressione è una metonimia comune nel giornalismo per indicare tali agenzie. Tuttavia, senza un contesto più ampio, permane un’ambiguità.»
Perché questa risposta?
- Statistica : Il modello ha analizzato migliaia di esempi in cui “intelligence [paese]” = servizi segreti.
- Cautela : Il modello menziona l’ambiguità poiché non ha accesso all’intenzione del giornalista.
5. Limiti e possibili distorsioni
- Distorsione di frequenza : Se il modello è stato addestrato su articoli in cui «intelligence americana» = servizi segreti nel 90% dei casi, favorirà questa interpretazione, anche se il contesto è ambiguo.
- Distorsione culturale : un modello addestrato principalmente sui media americani avrà più facilità a risolvere l’ambiguità rispetto a uno addestrato su testi francesi o cinesi.
- Mancanza di ragionamento causale : L’IA non si chiede: «Perché il giornalista usa questo termine?» (ad es.: per evitare di citare direttamente la CIA, per abitudine o per ironia).
6. Applicazione alle vostre ricerche (qui Mistral si rivolge a me tenendo conto di precedenti scambi)
Il tuo lavoro su Averroè e i trasferimenti culturali dimostra che la comprensione profonda di un testo richiede:
- Un contesto storico (ad es.: sapere che la laicità era rivoluzionaria nel XII secolo).
- Una sensibilità alle sfumature linguistiche (ad es.: le traduzioni latine dei testi arabi).
L’IA, invece, fa il contrario:
- Essa simula la comprensione tramite modelli statistici.
- Essa ignora la storia, a meno che non sia esplicitamente codificata nei dati di addestramento.
Domanda per voi:
Se un testo antico (come quelli di Averroè) venisse analizzato da un’IA, questa riuscirebbe a rilevare la sua modernità senza conoscere il contesto storico… o si limiterebbe a classificare il testo come «filosofia medievale» senza coglierne la portata sovversiva?
In sintesi:
L’IA elaborerebbe il vostro esempio identificando il significato più probabile (servizi di intelligence), ma senza alcuna garanzia di cogliere le sfumature (ironia, intenzione, sottintesi). Si tratta di un trattamento massiccio di dati… ma non di una comprensione umana.
Si potrebbe ritenere la risposta di Mistral troppo lunga o troppo complessa, ma a nostro avviso ChatGPT ha risposto con precisione solo alla prima parte della domanda e ha trattato in modo succinto la seconda parte, che era più importante della prima: «Come elabora l’IA questa affermazione?».
Mistral, al contrario, si sofferma sulla seconda parte e mette a nudo l’intero approccio dell’IA, sottolineandone i punti di forza e di debolezza. La demistifica e la desacralizza agli occhi dell’utente che le pone una domanda su se stessa.
La conclusione pratica relativa al nostro giornalista è che egli si esprime in una lingua che assomiglia al francese, attribuendo alle parole il loro significato inglese e inserendole in un contesto americano, cosicché un ascoltatore francese ha poche possibilità di interpretare correttamente il messaggio, mentre l’ascoltatore americano che eventualmente lo riceve non lo interpreta meglio, dato che è espresso in una lingua che non è la sua.
Un’ultima osservazione: Mistral mi conosce bene, poiché l’ho messo alla prova su numerosi argomenti specifici e sa che non mi accontento di risposte succinte e insufficientemente argomentate. Un altro utente di Internet forse non avrebbe ottenuto da Mistral la stessa risposta riportata in questo articolo.
Conclusione finale: spetta all’utente domare lo strumento dell’IA e non il contrario.