Quando le macchine parlano senza senso: le regole segrete dietro il linguaggio umano e quello dell’IA

Che cosa significa quando sia le persone sia l’IA possono dire “Il frambolo è uno storno” - e perché conta per il futuro dell’intelligenza?

Immagina questa scena: chiedi a un amico di inventare una frase come “Il gatto è nero”. Senza battere ciglio, risponde: “Il frambolo è sturnio”. Le parole sono un nonsenso, ma la frase è impeccabile. Ora chiedi la stessa cosa a un modello linguistico all’avanguardia. Inventa lo stesso identico nonsenso - grammaticale, sensato nella forma, ma pieno di termini inventati. Stanno entrambi seguendo le stesse regole? O c’è qualcosa di più strano in gioco nella rete intricata del linguaggio e dell’intelligenza artificiale?

Fatti rapidi

Sia gli esseri umani sia i grandi modelli linguistici (LLM) possono creare frasi grammaticalmente corrette con parole inventate.
Gli LLM generalizzano i pattern linguistici in modo statistico, non memorizzando regole grammaticali esplicite.
Gli esseri umani spesso affermano di usare regole grammaticali, ma la ricerca suggerisce che gran parte del nostro uso del linguaggio è inconscio e automatico.
Studi di probing mostrano che le rappresentazioni interne degli LLM contengono informazioni sintattiche recuperabili, ma non è chiaro se questo guidi la loro produzione.
Filosofi e scienziati discutono se “seguire una regola” sia davvero una distinzione significativa sia per gli esseri umani sia per le macchine.

Dentro il paradosso: regole, pattern e lo specchio dell’IA

A prima vista, il linguaggio sembra semplice: mettiamo insieme parole secondo regole che abbiamo imparato a scuola. Ma la storia reale è molto più criptica. Per gli esseri umani, la capacità di produrre frasi corrette - anche con parole inventate - si basa su pattern profondamente interiorizzati, non sull’applicazione consapevole dei manuali di grammatica. I bambini, per esempio, parlano fluentemente molto prima di saper spiegare anche una sola regola grammaticale.

Gli LLM come GPT-4 funzionano in modo diverso ma arrivano a risultati simili. Addestrati a prevedere la parola successiva in vasti mari di testo, assorbono regolarità statistiche - come “articolo + nome + è + aggettivo” - e possono applicarle a parole nuove, persino senza senso. Non è memorizzazione meccanica: è generalizzazione probabilistica, una creatività combinatoria radicata nella statistica. Il probing dei loro strati neurali rivela tracce di sintassi, ma se queste vengano “usate” nella generazione o siano semplicemente presenti è ancora oggetto di dibattito.

Sia per gli esseri umani sia per le macchine, la narrazione del “seguire regole” è fragile. Filosofi come Kripke e Wittgenstein hanno messo in luce l’impossibilità di dimostrare che qualcuno stia davvero seguendo una regola e non stia semplicemente agendo in un modo che si adatta a un pattern. In pratica, sia i cervelli sia gli algoritmi si adattano a istruzioni esplicite - come evitare una certa parola - ma, per lo più, operano in una zona grigia tra regola e pattern.

Il dibattito si contorce ulteriormente quando marketing e paura si scontrano. Le Big Tech esaltano l’“intelligenza” dell’IA, mentre i critici si affrettano a difendere l’unicità umana. Ma la realtà è più ambigua. Come sosteneva decenni fa il pioniere della cibernetica Gotthard Günther, forse abbiamo bisogno di nuove categorie - né “macchina” né “mente” - per descrivere sistemi che generano informazione significativa senza un sé cosciente.

Conclusione: ripensare l’intelligenza oltre il manuale delle regole

Quando sia le persone sia le IA possono dire “Il frambolo è sturnio” e far sì che abbia perfettamente senso dal punto di vista grammaticale, è il momento di mettere in discussione che cosa significhino davvero regole, intelligenza e persino “pensare”. I confini tra algoritmo e mente sono più sfumati che mai. Invece di chiederci se le macchine “pensano”, forse dovremmo inventare nuovi modi per descrivere ciò che loro - e noi - facciamo davvero quando diamo senso al nonsenso.

WIKICROOK

Grande modello linguistico (LLM): Un grande modello linguistico (LLM) è un’IA addestrata a comprendere e generare testo simile a quello umano, spesso usata in chatbot, assistenti e strumenti per i contenuti.
Morfosintassi: La morfosintassi studia come le forme delle parole e la struttura della frase interagiscono, un concetto usato nella cybersecurity per analizzare e rilevare minacce basate sul linguaggio.
Probing: Il probing consiste nello scandagliare sistemi o reti per raccogliere informazioni su vulnerabilità, servizi o difese, aiutando sia gli attaccanti sia i professionisti della sicurezza.
Generalizzazione: La generalizzazione è la capacità di applicare pattern di sicurezza appresi a minacce nuove e non viste, aiutando i sistemi ad adattarsi e a rilevare nuovi attacchi informatici.
Connessionismo: Il connessionismo modella i processi cognitivi usando reti di unità semplici, ispirando le reti neurali nell’IA e nella cybersecurity per il rilevamento adattivo delle minacce.