LA TEORIA DEGLI PSEUDOTESTI

 1. Problemi inerenti al metodo degli pseudotesti

 Questo scritto ha come scopo una spiegazione approfondita del metodo degli pseudotesti. Nel libro “La mente intralinguistica” ho illustrato solo brevemente questo tipo di analisi e i suoi vantaggi, avendo voluto privilegiare nell’esposizione della teoria soprattutto lo studio semantico del testo. Il metodo degli pseudotesti, per alcune sue intrinseche difficoltà, non appare sempre comprensibile nei suoi importanti significati. Nelle conversazioni o discussioni con persone interessate allo studio degli anagrammi ho constatato un’ampia varietà di atteggiamenti nell’affrontare gli assunti teorici di questo metodo: alcuni ritengono subito evidente la procedura proposta, fondata sul principio di falsificazione; altri invece pongono molte obiezioni, che richiedono spiegazioni dettagliate sull’analisi anagrammatica eseguita dal calcolatore sul testo, e che solo dopo essere state chiarite permettono di concentrarsi sulle caratteristiche del metodo.

 Le persone interessate alla comprensione approfondita degli pseudotesti sono, presumibilmente, i linguisti particolarmente attenti all’importanza di una dimostrazione sicura dei fenomeni anagrammatici, e gli stessi statistici: per motivi diversi, essi possono interrogarsi sulla effettiva validità o sui limiti di questo metodo. Poiché il metodo degli pseudotesti ha origine, come vedremo, da alcune difficoltà dei metodi statistici più semplici, lo scopo di questo scritto è anche quello di incoraggiare l’approfondimento delle procedure di analisi statistica del contenuto anagrammatico del testo, in modo che esse diventino col tempo il più possibile adeguate alla complessità del problema.

 Il criterio più semplice per introdurre a questo metodo è, innanzitutto, spiegare le ragioni teoriche che spingono ad interrogarsi sulla dimostrabilità delle tensioni anagrammatiche, e descrivere poi il modo stesso con cui i limiti e le contraddizioni di alcuni approcci statistici intuitivi conducono a questo tipo di procedura.

 2. La dimostrabilità delle tensioni anagrammatiche

 Alla base del metodo degli pseudotesti vi è la necessità di fornire una risposta corretta all’obiezione principale posta in genere all’analisi intralinguistica. Gli anagrammi, secondo l’ipotesi fondamentale della teoria, vengono trovati in una sequenza continua delle lettere dell’enunciato, unificando cioè tutte le parole: questo processo d’analisi fa rintracciare un numero di anagrammi molto maggiore di quello tra le sole parole intere, poiché essi possono formarsi anche a cavallo delle parole: poiché inoltre ne travalicano i confini essi possono risultare anche molti lunghi. Può allora essere avanzato il dubbio che l’importanza attribuibile ai numerosi anagrammi del testo poetico non abbia un significato reale: i fenomeni anagrammatici possono essere ritenuti, al contrario, solo illusorii, e prodotti dalla semplice ricombinabilità delle lettere della lingua.

 In questi anni è sempre stata questa l’obiezione mossa alla teoria: anche persone che, per l’evidenza di alcune strutture, ritengono plausibile o addirittura già dimostrata la teoria intralinguistica, si trovano, ad un certo momento, a porre tale domanda, assegnandovi un’importanza prioritaria: fino a che punto, cioè, i fenomeni non possano essere ritenuti l’effetto di una pura combinatoria della lingua. L’obiezione, inoltre, non è spesso presentata in forma diretta, ma sottintesa in un’altra, quella su una possibile scelta soggettiva, perciò opinabile, delle reti anagrammatiche mostrate a riprova della teoria: viene richiesta, allora, la garanzia di una reale oggettività, che i fenomeni anagrammatici evidentemente sollecitano per la loro novità o stranezza.

 Io stesso ho attraversato un periodo di sfiducia nella possibilità di fornire una prova attendibile della tensione anagrammatica in poesia, non disponendo di alcun strumento, per molti anni dopo l’inizio della ricerca, che mi permettesse di definire con esattezza il potenziale combinatorio della lingua. Ricordo che all’inizio, nel 79, ero guidato nello studio solo dall’intuizione, e rintracciavo gli anagrammi a mano: spesso mi appariva impossibile poter scoprire anagrammi lunghi più di quattro-cinque lettere. Benché gli anagrammi trovati fossero complessivamente pochi, ero però continuamente sorpreso della ricchezza anagrammatica di un testo poetico, e ciò mi convinceva di una sua intrinseca densità combinatoria. Non potendo accertare la reale numerosità degli anagrammi, per lungo tempo ho potuto utilizzare come criterio di studio solo l’analisi semantica del testo.

 Il problema di fornire una dimostrazione delle tensioni intralinguistiche mi è divenuto evidente nell’88, quando ho fatto progettare il primo programma, per calcolatore, di ricerca completa degli anagrammi: il loro numero si rivelò subito enorme, sia nel testo poetico che in quello non poetico, senza che si potesse evidenziare una chiara diversità. Questo fatto dava perciò apparentemente ragione ai sostenitori di una casualità combinatoria, anche se era possibile mostrare molte differenze qualitative. Alcuni fenomeni anagrammatici, infatti, divenivano più chiari quando si disponeva di tutti gli anagrammi, come ad esempio i nuclei di densità terminale del primo verso, significativi per il loro intrinseco valore formale; ugualmente accadeva per alcune reti chiaramente dotate di tensione proiettiva dall’inizio alla fine del testo. Inoltre anche lo studio delle varianti indicava con precisione come le correzioni del poeta riguardassero specifiche tensioni anagrammatiche. Ho mostrato molti di questi processi formali, e il loro significato strutturale e semantico, nel libro, cui rinvio per la loro completa trattazione.

 Rimaneva però l’impossibilità a confutare l’obiezione sulla natura casuale dei fenomeni combinatori del testo: decisi perciò di approfondirne il significato per la teoria intralinguistica. Distinsi nel mio lavoro tre diversi metodi d’analisi: il primo rimase quello semantico-strutturale, il secondo fu il criterio delle varianti, il terzo divenne il metodo statistico. Rispetto ai primi due, tipicamente qualitativi, l’ultimo, quantitativo, era volto a verificare se l’apparente non-diversità tra testo poetico e non poetico non dipendesse da una particolare abilità del poeta nel servirsi di nascoste tensioni combinatorie della lingua. L’accertamento accurato delle diversità anagrammatiche tra i testi poetici e non poetici avrebbe permesso di definire, in ogni caso, i limiti degli altri due metodi, e il tipo di validità attribuibile, in generale, allo studio anagrammatico del testo.

 In quel periodo, in cui si erano accumulate molte difficoltà per la pubblicazione dei miei studi, poter stabilire questi limiti mi appariva indispensabile per decidere il futuro della ricerca, soprattutto ove non avessi trovato alcun tipo di conferma della presenza di particolari tensioni anagrammatiche nel testo poetico. Questa premessa può spiegare l’importanza che ho assegnato a un criterio di validazione, e i criteri successivamente adottati, e gradualmente confluiti nella teoria degli pseudotesti.

  3. Le grandezze anagrammatiche del testo: N e A

 Il primo criterio di studio è stato assai semplice, un accertamento statistico sufficientemente rappresentativo della ricchezza anagrammatica di testi comuni, non poetici: in confronto alla quale poter evidenziare con accuratezza eventuali specificità anagrammatiche dei testi poetici. Queste specificità riguardano alcune grandezze che si possono rilevare nello studio degli anagrammi, come ad esempio il numero totale di anagrammi di un testo, o altre grandezze derivate da queste, illustrate in seguito.

 Una poesia, ad esempio, che presentasse un elevatissimo numero di anagrammi rispetto a un testo comune, fornirebbe già una prova di una specificità anagrammatica, soprattutto se riconducibile ad una chiara valutazione statistica; lo stesso accadrebbe, infine, per qualsiasi altra grandezza che si potesse dimostrare significativa nel testo poetico. Vediamo dapprima come il calcolatore esprime le prime due grandezze importanti nello studio di un testo, il numero N di anagrammi, e la tensione anagrammatica A. Consideriamo dapprima N, il numero totale di anagrammi di un testo.

 Il calcolatore esegue la ricerca degli anagrammi a partire da un rango minimo (in genere 3 per testi brevi, 4 o 5 per testi lunghi). La scelta del rango minimo dipende da motivi di studio, poiché il numero degli anagrammi, come vedremo tra poco, cresce rapidamente all’aumentare del testo. Il calcolatore fornisce di tutti gli anagrammi trovati le rispettive posizioni di partenza e di arrivo, la lunghezza in lettere dell’anagramma (il Rango), ecc.

Un esempio di questo tipo di lista è presentato qui sotto, e riguarda l’analisi Alla luna, di Leopardi, di cui sono riportati gli anagrammi prodotti dai primi dieci caratteri, con gli indirizzi di partenza e di arrivo:

    1   O graziosa luna, io mi rammento
   
   26   che, or volge l’anno, sovra questo colle
   
  57   o venia pien d’angoscia a rimirarti:
   
   87   e tu pendevi allor su quella selva
   
115   siccome or fai, che tutta la rischiari.
   
146   Ma nebuloso e tremulo dal pianto
   
173   che mi sorgea sul ciglio, alle mie luci
   
204   il tuo volto apparia, ché travagliosa
   
235   era mia vita: ed è, nè’ cangia stile,
   
261   o mia diletta luna. E pur mi giova
   
287   la ricordanza, e il noverar letate
   
315   del mio dolore. Oh come grato occorre
   
345   nel tempo giovanil, quando ancor lungo
   
377   la speme e breve ha la memoria il corso,
   
408   il rimembrar delle passate cose
   
435   ancor che triste, e che l’affanno duri.

 

Il primo di questi anagrammi, OGR-ORG, di Rango 3, ha origine da OGR-aziosa, cioè dalla prima lettera del testo, e giunge sulla lettera 179, s-ORG-ea; il secondo, GRA-ARG, ha origine dalla seconda lettera, GRA-ziosa, e giunge sulla 333, GRA-to, ecc.

Questi dati[1] sono indispensabili per la costruzione particolareggiata delle reti del testo, da cui dipende la sua corretta interpretazione semantica, argomento che non è trattato in questo scritto, e per cui rinvio al libro La mente intralinguistica.

 Il calcolatore riassume poi sinteticamente l’analisi suddividendo gli anagrammi per Ranghi, in una linea del seguente tipo, ottenuta in questo esempio dall’analisi di “Alla luna” (per R>=3); questa linea permette di capire come vengono trovate le prime due importanti grandezze N e A:

In “Alla luna” vi sono 179 anagrammi di 3 lettere, 42 di 4, 25 di 5, ecc; il massimo anagramma, unico, è di 8 lettere. La somma dei numeri dei vari ranghi è 256, che rappresenta appunto la grandezza N, il numero complessivo di anagrammi della poesia, per R>=3. Vediamo ora rapidamente come viene calcolato A.

 Come si può osservare, la sequenza 179-42-25-7-2-1 segnala che gli anagrammi diventano rari al crescere del rango: questo fenomeno è di carattere generale, cioè riscontrabile in tutti i testi, dipendendo essenzialmente da caratteristiche combinatorie della lingua, che rendono sempre più improbabile la ricombinazione di sequenze lunghe. Nei testi poetici è però rilevabile, talvolta, un numero elevato di tali anagrammi, che suggeriscono una tensione particolare nel controllo di queste sequenze articolatorie rare. Poiché la grandezza N non tiene conto della diversa importanza loro attribuibile, appare conveniente definire un’altra grandezza, ottenuta assegnando un valore crescente agli anagrammi di rango maggiore, in modo da segnalare l’influenza di queste tensioni articolatorie. Questa grandezza è appunto A.

 Il tipo di valutazione che ho ritenuto maggiormente utile per definire la grandezza A è “quadratica”, cioè crescente con il quadrato del rango: in questo modo un anagramma di 6 lettere vale 4 volte un anagramma di 3 lettere (essendo 62=36 e 32=9), e un anagramma di 12 lettere ben 16 volte un anagramma di 3 lettere. Nella tabella qui sotto sono indicati i pesi adottati per ogni Rango, crescenti in modo quadratico:

Tali pesi, attribuiti rispettivamente a 179, 42, 25 ecc., danno perciò la grandezza finale A=166.1.[2] La grandezza A, pur da sola, può talvolta permettere un importante confronto tra testi, già di significato qualitativo. Ad esempio in testi aventi N eguale ma A diverso, un valore particolarmente alto di A indica subito la presenza di anagrammi di rango elevato, e quindi una maggior tensione articolatoria: per questo motivo A è definita “tensione anagrammatica”, una grandezza che riassume sia il numero totale degli anagrammi sia la distribuzione dei loro ranghi. Alcuni testi poetici, come vedremo, possono risultare significativi per questa grandezza, e non per quella più semplice, N.

 È importante osservare subito che queste due grandezze, da sole (cioè senza il riferimento ad un’opportuna statistica), non permettono di comprendere se un testo poetico è significativo, perché i testi non sono in genere della stessa lunghezza, e quindi non sono subito confrontabili: un testo lungo, come vedremo tra poco, tende inevitabilmente ad avere più anagrammi, e ciò comporta, anche quando le lunghezze differiscono di poco, valutazioni solo approssimative.

 Consideriamo, perciò, le seguenti quattro poesie, l’idillio di Leopardi “Alla luna”, il sonetto di Zanzotto “Dello schivarsi e dell’inchinarsi”, il secondo sonetto de “La vita Nova” di Dante, e la poesia di Montale “Il fuoco”, la cui lunghezza è, rispettivamente, di 464, 445, 402, 354 lettere:

                ALLA LUNA                             DELLO SCHIVARSI E DELL’INCHINARS

O graziosa luna, io mi rammento                   Galatei, sparsi enunciati, dulcedini
   
che, or volge l’anno, sovra questo colle         di giusto a voi, fronde e ombre, egregio codice..
   
io venia pien d’angoscia a rimirarti:                codice di cui pregno o bosco godi
    e tu pendevi allor su quella selva                    e abbondi e incombi, in nascite e putredini..
    siccome or fai, che tutta la rischiari. 
    Ma nebuloso e tremulo dal pianto                  Lasciate ovunque scorrere le redini 
    che mi sorgea sul ciglio, alle mie luci               intricando e sciogliendo glomi e nodi... 
    il tuo volto apparia, ché travagliosa                 Svischiate ovunque forze e glorie, o modici 
    era mia vita: ed è, né cangia stile,                    bollori d’ingredienti, indici, albedini... 
    o mia diletta luna. E pur mi giova 
    la ricordanza, e il noverar l’etate                     Non più che in brezze regna, o filigrana 
    del mio dolore. Oh come grato occorre          dubbiamente filmata in echi e luci 
    nel tempo giovanil, quando ancor lungo           sia il tuo schivarti, penna, e l’inchinarti... 
    la speme e breve ha la memoria il corso, 
    il rimembrar delle passate cose                       Non sia peso nei rai che da te emanano 
    ancor che triste, e che l’affanno duri.               prescrivendo e secando; a te riduci 
                                                                         segno, te stesso, e le tue labili arti... 

 SONETTO II DE LA VITA NOVA                    IL FUOCO

Piangete amanti poi che piange amore,             Il fuoco che scoppietta
    udendo qual cagion lui fa plorare.                     nel caminetto verdeggia
    Amor sente a pietà donne chiamare,                 e un’aria oscura grava
    mostrando amaro duol per li occhi fore,            sopra un mondo indeciso. Un vecchio stanco
                                                                           dorme accanto a un alare
    perché villana morte in gentil core                     il sonno dell’abbandonato.
    ha miso il suo crudele adoperare,                     In questa luce abissale
    guastando ciò che al mondo è da laudari           che finge il bronzo, non ti svegliare
    in gentile donna sovra de l’onore.                     addormentato! E tu camminante
                                                                           procedi piano; ma prima
    Audite quanto amor le fece orranza,                 un ramo aggiungi alla fiamma
    ch’io ‘l vidi lamentare in forma vera                  del focolare e una pigna
    sovra la morte imagine avvenente:                     matura alla cesta gettata
                                                                           nel canto: ne cadono a terra
    e riguardava ver lo cielo sovente,                      le provvigioni serbate
    ove l’alma gentil già locata era,                         pel viaggio finale. 
    che donna fu di sì gaia sembianza. 

Osserviamo ora i valori che assumono le grandezze N e A nelle quattro poesie:

Di questi quattro testi si può ad esempio dire che il secondo, che è più breve del primo, lo supera comunque in entrambi i valori N e A (304 e 214.8 contro 256 e 166.1), ed è quindi, nel confronto, interpretabile come più ricco di anagrammi e di tensione anagrammatica. Lo stesso si può dire, inoltre, del terzo rispetto al primo, per ragioni simili. Il confronto tra il secondo e il terzo suggerisce inoltre che la vicinanza dei due valori A (214.8 e 209.1) comporti proprio nel terzo testo la tensione A più rilevante. Queste osservazioni sono però solo intuitive, e non precisano né l’effettiva validità di questi confronti, né il significato realmente attribuibile alle grandezze trovate. Ad esempio il quarto testo ha N e A inferiori agli altri, ma anche la sua lunghezza è inferiore, e non è quindi possibile valutare in alcun modo i valori trovati.

 Vediamo ora, però, come queste due grandezze possano in realtà essere effettivamente utilizzate in un primo modello statistico per lo studio del testo poetico. 

 4. Un modello semplice di analisi statistica  

 Come si sa, i procedimenti statistici consistono, nelle loro linee generali, nell’accertare con metodi matematici se una certa grandezza, che caratterizza il fenomeno da studiare, sia effettivamente rara. Occorre, pertanto, poter confrontare quella grandezza con altre simili, riferibili a fenomeni dello stesso tipo ma supposti casuali, in modo da definire l’effettiva improbabilità del fenomeno studiato. La sua misura è chiamata la “significatività” statistica, tanto più attendibile quanto più essa si avvicina a 100% (il primo livello di significatività è del 95%, il secondo è del 99%, il terzo del 99.9%: già il secondo è ritenuto molto significativo e il terzo rarissimo).

 Per valutare, perciò, se i valori N e A della poesia “Alla luna”, appena visti, sono significativi, occorre conoscere i valori N e A di un numero sufficiente (ad esempio 50 o 100) di testi non poetici, in modo da procedere al calcolo: questi, inoltre, vanno scelti di ugual lunghezza di quello originario, per le ragioni appena viste, in modo da ottenere una statistica non influenzata da errori dovuti a lunghezze differenti. In linea teorica, perciò, per ogni testo bisognerebbe predisporre una statistica idonea. Ma si può procedere, in via più generale, con un metodo più semplice, utilizzabile per tutti testi poetici. Esso consiste nello studiare dapprima la statistica di testi non poetici di una lunghezza standard (ad esempio 100 testi di 125 lettere, 100 testi di 250 lettere, 100 testi di 375 lettere, 100 testi di 500 lettere ecc.), in modo da esplorare, all’aumentare del testo, l’andamento generale del fenomeno combinatorio: se questo può essere sintetizzato in una forma semplice, ad esempio in un grafico, ci si può servire di quest’ultimo per il confronto con un testo poetico di lunghezza qualsiasi.

 I testi non poetici vanno perciò scelti a caso: per lo studio statistico che origina, ad esempio, il grafico delle pagine seguenti essi sono stati estratti da vari articoli di giornale, da riviste, da libri, avendo cura di non esercitare, fin dove possibile, una selezione preventiva, problema che discuterò tra poco per il suo rilievo teorico. Lo studio statistico di questi testi permette di avere un primo inquadramento dei fenomeni combinatori della lingua. Ciò che subito si può evidenziare sono gli aspetti tipici dei fenomeni casuali, e che riassumo brevemente:

Casella di testo: FREQUENZE  RELATIVE %

 1-Ognuna di queste statistiche fornisce valori N o A che hanno distribuzioni simili: molti valori sono concentrati attorno alla media, mentre pochi sono quelli bassi o alti. La loro rappresentazione è un grafico di frequenze (chiamato istogramma) di questo tipo (alcuni esempi sono a pg. 38,39,42,43,47,58,59):
Casella di testo: FREQUENZE  RELATIVE %

Questo tipo di andamento, quando se ne studia matematicamente la forma, è riconducibile a quello classico della distribuzione gaussiana, il cui grafico teorico è il seguente:

 2-Caratterizza la distribuzione gaussiana un semplice parametro “ σ “, che permette di capire quando un certo dato diviene significativo rispetto alla curva di distribuzione: quanto più il dato si scosta di σ dalla media, tanto più esso è situato negli estremi della curva, quindi raro. Per il calcolo statistico interessato all’estremo destro della curva, dove cadono i dati più alti (con cui confrontare quelli di N e A in poesia), un dato maggiore di 1.65σ della media è già significativo al 95%: questo numero sta infatti ad indicare che il 95% degli eventi casuali è inferiore al dato di confronto. Poiché negli estremi della curva i dati si rarefanno rapidamente, valori ancora più distanti dalla media diventano molto significativi: un dato che si scosti di 2.33σ ha una significatività del 99%, e uno che si scosti di 3.1σ ha una significatività del 99.9%, già indicativa di un dato molto raro[3] (esso segnala che solo un evento su 1000 ha probabilità di superarlo). Il rapidissimo crescere della significatività all’aumentare della distanza della media va tenuto presente, perché esso indica come i fenomeni statistici siano assai sensibili al rarefarsi degli estremi della curva: e come, perciò, eventuali errori nella scelta del campione statistico dei testi casuali possano indurre attribuzioni scorrette di significatività. È, come vedremo, la difficoltà ad un controllo completo su questi tipi di errori che poi inducono ad optare per la teoria degli pseudotesti.

 5. Caratteristiche generali della statistica di riferimento 

 Vediamo ora come queste considerazioni teoriche permettano, una volta ottenute le distribuzioni statistiche dei testi casuali di 125, 250, 375 lettere ecc, di valutare la significatività di un testo poetico. Le singole distribuzioni sono caratterizzate, ognuna, da valori medi di N e A, e daI corrispondenti valori di σ, riassunti nella seguente tabella:


Se riportiamo questi valori in funzione della lunghezza del testo, e uniamo i punti, possiamo tracciare due curve (tratteggiate) che rappresentano il crescere di N e A al crescere del testo: insieme a queste, possiamo anche tracciare le curve ottenute aggiungendo o sottraendo rispettivamente 1.65σ e 2.33σ, cioè i valori del I e II livello di significatività.

 1-L’area compresa tra le due curve interne indica perciò i valori che non sono significativi.

 2-L’area compresa tra le curve esterne indica invece i valori significativi tra 95% e 99%.[4]

 3-L’area esterna alle curve i valori ancora più significativi, cioè più rari del 99%.

 Le curve che interessano la statistica di N e A sono in genere le due superiori del punto 2, poiché i valori di N e A sono supposti alti nel testo poetico. I due grafici indicano due caratteristiche generali dei fenomeni combinatori, confermate dallo studio statistico anche di testi di maggior lunghezza (di 1000, 2000, 4000 lettere, ecc.), e che discuto brevemente.

 1-La prima caratteristica è il rapido crescere di N e A all’aumentare del testo. Le curve sono di tipo “quadratico”, cioè N e A risultano valori proporzionali non alla sola lunghezza del testo, ma al suo quadrato: questo andamento è prevedibile teoricamente,[5] e le curve ne danno una conferma. Questa caratteristica permette perciò di prevedere che un testo di 500 lettere ha mediamente, rispetto ad un testo di 250 lettere, quattro volte più anagrammi: un testo di mille lettere (quindi quattro volte maggiore) ne ha mediamente 16 volte di più. È questa rapida crescita, dunque, che suggerisce, nei testi lunghi, di procedere all’analisi partendo da ranghi maggiori di R=3: in un canto di Dante, infatti, la cui lunghezza è mediamente di 4000 lettere, ci si può attendere per R>=3 ben 20.000 anagrammi. Anche aumentando il rango di partenza, però, la quantità di anagrammi può rimanere considerevole: per R>=5, in un canto di Dante possono trovarsi 2.000 anagrammi. Questa strordinaria ampiezza è il risultato più stupefacente dell’analisi statistica, e tanto più singolare appare il fatto, come vedremo, che è possibile dimostrare in questi testi così lunghi un’effettiva tensione articolatoria di tipo non casuale, ma anzi straordinariamente significativa.


 2-La seconda caratteristica è più importante per la comprensione delle pagine seguenti, e riguarda l’esiguità della fascia compresa tra le due curve interne del primo livello di significatività. In quest’area cadono la maggior parte dei testi, e il fatto che essa sia piccola indica che i fenomeni combinatori sono assai poco liberi, poiché i valori di N e A oscillano in un’ampiezza relativamente ristretta nell’intorno della loro media: questo fenomeno diventa più chiaro ampliando l’esplorazione della statistica anche a testi più lunghi, come si può vedere, ad esempio, nel grafico di A esteso fino a 1000 lettere.

La casualità dei processi combinatori anagrammatici è dunque vincolata ad un’oscillazione ristretta: proprio questo fenomeno permette di capire come, senza un’opportuna attenzione alle proprietà statistiche dell’anagramma, dati molto significativi possano risultare a prima vista poco distinguibili da dati che non sono significativi, potendo i loro valori differire di poco. Soprattutto, la ristrettezza dell’oscillazione chiarisce l’importanza delle osservazioni che verranno fatte nelle pagine seguenti: piccoli errori nel modo con cui la statistica viene eventualmente costruita non producono necessariamente piccoli effetti, ma possono risultare molto fuorvianti per l’attribuzione di una corretta significatività di N o A di un testo poetico. 

 6. La valutazione statistica  


 Vediamo ora come si utilizzano questi grafici per verificare la significatività dei quattro testi poetici visti prima. È sufficiente riportare, in corrispondenza alle diverse quattro lunghezze dei testi, i rispettivi N e A, e osservare se essi cadono nelle fascie di significatività. 

 Secondo la curva statistica, i più significativi sono i valori N e A del sonetto di Dante, che cadono ben oltre la seconda curva di significatività: sono meno significativi i valori N e A del sonetto di Zanzotto, situati tra le curve del primo e secondo livello di significatività. Gli altri valori sono invece interni alla fascia di non significatività, e quindi possono essere ritenuti non significativi.

 Secondo questo metodo statistico, è dunque possibile introdurre un criterio oggettivo che permette un confronto adeguato tra caratteristiche anagrammatiche dei testi casuali e dei testi poetici, e che permette anche un confronto tra testi poetici di diversa lunghezza: ciò consente di inaugurare l’esplorazione del significato attribuibile sia alla significatività dei testi poetici (come per le due poesie di Dante e Zanzotto), sia alla loro non significatività (come per le due poesie di Leopardi e Montale). I due esempi di significatività apparirebbero, comunque, la prova che in alcuni testi poetici esistono effettivamente tensioni anagrammatiche non casuali.

 Vediamo ora perché questo procedimento, per quanto teoricamente corretto, non dia garanzie sufficienti per uno studio che si voglia ritenere il più possibile accurato.

 7.1. Gli errori del metodo statistico: la ridondanza nei testi della statistica di riferimento 

 Il motivo più semplice per cui questo metodo non risulta esente da errori dipende da alcune ripetitività della lingua ordinaria e della lingua poetica che non è possibile controllare adeguatamente, e che inducono possibili errori sia nella scelta casuale dei testi con cui viene costruita la statistica di riferimento, sia nell’interpretazione della significatività dei testi poetici.

 Queste ripetitività sono indotte, ad esempio, dalla ridondanza di parole uguali o di sintagmi fatti di parole uguali, presente sia nei testi comuni che in quelli poetici, e dalla ripetizione, tipicamente strutturale, dei segmenti delle parole in rima nei testi poetici: il calcolatore tratta infatti queste ripetizioni come anagrammi, che vengono computati anch’essi nel calcolo finale, sovrapponendosi ai valori dovuti solo ai fenomeni combinatori. Attorno alle parole ripetute, inoltre, così come ai segmenti identici delle rime, possono formarsi ampi anagrammi, favoriti dalla presenza di queste sequenze di lettere identiche, che influenzano anch’essi i valori finali. In genere solo lo studio completo degli anagrammi di un testo fa comprendere quante facilitazioni al formarsi di anagrammi possano venire indotte dalla ripetizione delle sequenze identiche che, nel modo più vario, sono presenti nella lingua.

 Con alcuni esempi farò vedere dapprima come questo problema influenzi inevitabilmente la statistica dei testi casuali.

 Ho detto prima come sia importante scegliere i testi che servono alla costruzione della statistica di confronto in modo che non vi sia un selezione preventiva di testi particolari, dovendo la lingua essere rappresentata con completezza. In realtà i testi di carattere scientifico sono tipicamente anomali rispetto ai testi comuni, essendo ricchi di ripetizioni. Consideriamo, ad esempio, due brevi brani tratti dall’inizio del paragrafo 4 di questo stesso scritto:

Brano I: Come si sa, i procedimenti statistici consistono, nelle loro linee generali, nell’accertare con metodi matematici se una certa grandezza, che caratterizza il fenomeno da studiare, sia effettivamente rara. Occorre, pertanto, poter confrontare quella grandezza con altre simili, riferibili a fenomeni dello stesso tipo ma supposti casuali, in modo da definire l’effettiva improbabilità del fenomeno studiato.

Brano II: I testi non poetici vanno perciò scelti a caso: per lo studio statistico che origina, ad esempio, il grafico delle pagine seguenti essi sono stati estratti da vari articoli di giornale, da riviste, da libri, avendo cura di non esercitare, fin dove possibile, una selezione preventiva, problema che discuterò tra poco per il suo rilievo teorico. Lo studio statistico di questi testi scelti a caso permette di avere un primo inquadramento dei fenomeni combinatori della lingua. Ciò che subito si può evidenziare sono gli aspetti tipici dei fenomeni casuali, e che riassumo brevemente.

 Le analisi di questi due brani sono riassunte qui di seguito, insieme a quelle dei quattro testi poetici precedenti:

 I valori N dei due brani, quando vengono disposti nel grafico, non risultano significativi. Sono invece molto significativi i valori di A: ciò dipende dal fatto che nei due testi compaiono, come si può osservare nella linea di distribuzione dei ranghi, anagrammi di grande lunghezza (di 15 lettere e più). Questo risultato è però ingannevole, essendo dovuto all’influenza di ripetizioni lessicali.

 Ad esempio, nel primo testo, si ha sia la ripetizione di “grandezza” (..certa grandezza che...quella grandezza con..) sia quella di “fenomeno” (..il fenomeno da studiare... riferibili a fenomeni dello stesso ...improbabilità del fenomeno studiato). Queste ripetizioni sono trattate appunto come anagrammi, ma è importante osservare come esse possano sostenere anche anagrammi più lunghi delle stesse ripetizioni. Si forma, ad esempio, un anagramma di 15 lettere tra “IL FENOMENO DA STU-diare” e “de-L FENOMENO STUDIA-to”, e uno di ben 17 lettere tra “riferibil-I AFENOMENI DELLO ST-esso” e “improbab-ILITÀ DEL FENOMENO S-tudiato”. 

 Nel secondo testo, oltre alla ripetizione di “testi”(i testi non poetici... testi scelti a caso) si ha quella del sintagma “dei fenomeni” (dei fenomeni combinatori... dei fenomeni casuali), del sintagma “scelti a caso” (vanno perciò scelti a caso... questi testi scelti a caso) e del sintagma “lo studio statistico” (per lo studio statistico che... teorico. Lo studio statistico di questi). Si osservi però, per quest’ultimo sintagma, come abbiano origine dalla sua ripetizione ben tre anagrammi: oltre alla semplice sequenza ripetuta di “lo studio statistico”, di 18 lettere, il calcolatore coglie anche due sequenze di 19 lettere, che si formano nel suo intorno e che, essendo comunque diverse da essa per il tipo di sequenza individuata, vengono trattate separatamente.[6]

  Per lo studio statistico che …                     teorico Lo studio statisti

LO STUDIO STATISTICO               LO STUDIO STATISTICO
   R LO STUDIO STATISTICO          RICO LO STUDIO STATISTICO
     LO STUDIO STATISTICO C          CO LO STUDIO STATISTICO

 Queste osservazioni suggeriscono, perciò, di non servirsi di testi scientifici per costruire una statistica di tipo casuale, essendo la loro natura combinatoria fortemente influenzata da ripetitività lessicali e sintagmatiche, necessarie al tipo di struttura esplicativa, ridondante, che caratterizza questo tipo di testo.

 Questa esclusione non appare però, alla lunga, potersi limitare solo ai testi scientifici: anche testi comuni, come quelli giornalistici, sono frequentemente ridondanti. Il problema, nei testi di cui si può comunemente disporre, diventa molto evidente appena il testo cresce oltre la misura della frase: la continuità semantica che è necessaria al mantenimento del significato viene affidata sempre più a ripetizioni lessicali o a sequenze di parole, che saldano le frasi tra loro, e periodi a periodi. Poiché la combinatoria anagrammatica è molto influenzabile da queste ripetizioni, anche i testi comuni, perciò, appaiono spesso una fonte di valutazioni erronee, e non adatti alla costruzione di una statistica mirata allo studio della sola ricombinazione delle lettere.

 La statistica utilizzata in queste pagine è, in effetti, ottenuta da testi valutati intuitivamente poco ripetitivi, poiché essi sono sufficientemente brevi da limitare i fenomeni di ridondanza lessicale. Testi più lunghi possono essere ottenuti, in modo artificioso, accorpando testi brevi di origine diversa, e quindi limitando la possibilità di ripetizioni di parole o sintagmi uguali indotte dai legami anaforici e dalla continuità semantica. Questi metodi facilitano lo studio della componente combinatoria, ma introducono opzioni non controllabili, perché appunto soggettive, anche se un numero elevato di testi casuali permette comunque di attenuare l’influenza di tali procedure imprecise di selezione.

7.2. Gli errori del metodo statistico: la ridondanza poetica

 Effetti simili di ridondanza sono però presenti, e in misura non inferiore, anche nei testi poetici, sia per la ripetizione, spesso, di parole o sintagmi, sia per l’influenza, in questo caso caratteristica del testo poetico, delle ripetizioni di segmenti parziali delle parole in rima: entrambi questi effetti possono perciò rendere, a loro volta, incerta la valutazione della reale componente combinatoria espressa dalle grandezze N e A. Si consideri nuovamente, ad esempio, il sonetto di Dante, che appare il più significativo dei quattro testi poetici analizzati

Piangete amanti poi che piange amore,
udendo qual cagion lui fa plorare.
Amor sente a pietà donne chiamare,
mostrando amaro duol per li occhi fore,

perché villana morte in gentil core
ha miso il suo crudele adoperare,
guastando ciò che al mondo è da laudare
in gentile donna sovra de l’onore.

Audite quanto amor le fece orranza,
ch’io ‘l vidi lamentare in forma vera
sovra la morte imagine avvenente:

e riguardava ver lo cielo sovente,
ove l’alma gentil già locata era,
che donna fu di sì gaia sembianza.

Nel sonetto vi sono le ripetizioni “Piangete... piange”, “amore... amor... amor”, “donne... donna... donna”, “in gentil... in gentile... gentil”. Oltre agli anagrammi dovuti a queste identità lessicali, si formano anagrammi più ampi gravitanti sulle parole ripetute (ad esempio tra “piet-À DONNE CH-iamare” e “CHE DONNA”). Nel sonetto vengono inoltre ovviamente computati come anagrammi le ripetizioni che formano le rime, am-ORE, f-ORE, cu-ORE, on-ORE, plor-ARE, chiam-ARE, ecc, che a loro volta possono sostenere anagrammi più ampi (ad esempio tra plor-ARE/AM-ore e chi-AMARE). L’ovvia influenza di queste ripetizioni sul calcolo di N e A non rende sicura, perciò la significatività trovata per questo sonetto, potendo essa essere attribuita, in mancanza di una più precisa valutazione, a motivi non anagrammatici.

 Si può riflettere che, nei quattro testi poetici, l’altra poesia significativa è ancora un sonetto: alcune sue rime, costituite da segmenti ampi, generano già da sole forti ripetitività:

Galatei, sparsi enunciati, dulcedini
    di giusto a voi, fronde e ombre, egregio codice...
    codice di cui pregno o bosco godi
   
e abbondi e incombi, in nascite e putredini...

Lasciate ovunque scorrere le redini  
    intricando e sciogliendo glomi e nodi... 
    Svischiate ovunque forze e glorie, o modic
    bollori d’ingredienti, indici, albedini... 

Non più che in brezze regna, o filigrana  
    dubbiamente filmata in echi e luci  
   
sia il tuo schivarti, penna, e l’inchinarti... 

Non sia peso nei rai che da te emanano 
    prescrivendo e secando; a te riduci  
    segno, te stesso, e le tue labili arti... 

Ad esse, inoltre, si aggiunge la ripetizione consecutiva di “codice” tra secondo e terzo verso, e l’identità sintagmatica “lasci-ate ovunque... svischi-ate ovunque”, oltre che la rima interna “schiv-arti …inchin-arti…arti” e la ripetizione dei gerundi “intri-cando, se-cando, sciogli-endo, prescriv-endo,”. Si può riflettere, viceversa, che le altre due poesie non significative, di Leopardi e Montale, hanno minori ridondanze di questo tipo. La prima è senza rime mentre la seconda ne ha solo alcune, ed entrambe sono praticamente prive di ridondanza lessicale. Si osservi, infatti, il testo di Montale:

Il fuoco che scoppietta
nel caminetto verdeggia
e un’aria oscura grava
sopra un mondo indeciso. Un vecchio stanco
dorme accanto a un alare
il sonno dell’abbandonato.
In questa luce abissale
che finge il bronzo, non ti svegliare
addormentato! E tu camminante
procedi piano; ma prima
un ramo aggiungi alla fiamma
del focolare e una pigna
matura alla cesta gettata
nel canto: ne cadono a terra
le provvigioni serbate
pel viaggio finale.

Producono ridondanze solo le rime “al-are svegli-are” (con la rima interna focol-are), “abiss-ale fin-ale” e la rima interna “abbandon-ato addorment-ato”. Per le osservazioni precedentemente fatte, perciò, la non significatività di questo testo assume un significato diverso: essa non sta necessariamente ad indicare che le grandezze N e A non hanno alcun rilievo statistico, ma piuttosto che esse, assai probabilmente, si riferiscono in questo caso alla mancanza di effetti marcati di ridondanza. Se perciò la statistica di riferimento, per il modo casuale con cui è stata costruita, è comprensiva di alcuni effetti di ridondanza lessicale, essa penalizza questo tipo di testo, favorendone una valutazione di significatività inferiore o, in ogni caso, erronea.

 8. Il problema teorico della depurazione della ridondanza

 Queste considerazioni, come possiamo vedere, rendono molto incerta la costruzione di una statistica valida per ogni tipo di testo. Statistiche fatte di testi casuali, naturalmente ridondanti, sono metodologicamente corrette, ma all’atto pratico teoricamente inutilizzabili: la ridondanza lessicale e sintagmatica dei testi ordinari è infatti, in genere, maggiore di quella dei testi poetici, e tende a farli apparire poco significativi. Viceversa una selezione più accorta dei testi che costruiscono la statistica, mirata ad attenuare l’influenza della ridondanza lessicale, è utile per lo studio della significatività dei testi poetici, ma non offre le garanzie di una metodologia del tutto oggettiva, se non dopo la definizione teorica di una “ridondanza media”. Anche qualora fosse possibile, però, definire una misura di ridondanza media, accettabile nella preparazione della statistica di controllo, alcuni testi poetici, del tutto privi di ridondanza, non potrebbero essere valutati adeguatamente, poiché facilmente potrebbero apparire non significativi.

 Si potrebbe ovviare a questi problemi, in via teorica, introducendo un calcolo correttivo, che depuri tutti gli effetti di ridondanza lessicale, sia dei testi utilizzati nella statistica di riferimento, sia dei testi poetici: sarebbe così possibile studiare solo la parte effettivamente “reale” della combinatoria anagrammatica del testo poetico.

 Ciò è possibile, ma con alcune incertezze: in poesia non è mai chiaro se la ridondanza lessicale abbia necessariamente solo il significato grammaticale e sintattico che ha nel testo ordinario, e non è quindi valutabile a priori se la componente anagrammatica prodotta da essa non sia di tipo strutturale, e quindi da conservare: ad esempio gli anagrammi che si formano sulle rime potrebbero essere ritenuti un’estensione e un rinforzo di questo legame acustico (mostro molti di questi fenomeni nel libro La mente intralinguistica), e il depurarli equivarrebbe allora a una limitazione del processo formale che organizza le rime, che è fondato su un tipico controllo articolatorio intenzionale.

 Ma soprattutto il fatto che piccoli errori nella depurazione della statistica di riferimento possano indurre, per i motivi precedentemente visti, forti errori nella valutazione di significatività, non rende praticabile questo calcolo, per l’incertezza che esso comporta: come vedremo, invece, la teoria degli pseudotesti permette di definire correttamente il controllo della depurazione anagrammatica dovuta alla ridondanza.

 Altri problemi teorici, infine, si presentano nello studio anagrammatico del testo poetico, chiarendo i limiti ultimi di questo tipo di statistica, e le proprietà richieste invece a un metodo statistico sufficientemente generale e affidabile.

 9. Problemi interenti alle grandezze qualitative: B e C

 Le due grandezze anagrammatiche N e A che caratterizzano un testo sono valutazioni di tipo essenzialmente quantitativo. Ma nel testo poetico possono essere definite, come ora mostrerò, altre grandezze anagrammatiche, che si riferiscono alla posizione degli anagrammi nei versi: queste grandezze, cioè, dipendono strettamente dal dispositivo formale del testo, e sono quindi tipicamente qualitative. I testi poetici, ad esempio, possono differire fortemente, a parità di lunghezza totale, nella organizzazione formale della versificazione: possono essere fatti di versi tendenzialmente uguali (come ad esempio nel sonetto), o di versi differenti per lunghezza (come ad esempio nelle canzoni). La differente collocazione degli anagrammi nei versi caratterizza queste grandezze qualitative, ciò che permette di studiare le tensioni anagrammatiche nel dispositivo formale.

 La necessità di valutare correttamente queste grandezze, perciò, evidenzia un’altra variabile che andrebbe controllata nella costruzione di una statistica di riferimento: i testi di questa dovrebbero avere la stessa struttura formale del testo poetico esplorato, per essere certi di misurare, nel confronto, le identiche grandezze.

 Vediamo due di queste nuove grandezze, e verifichiamo poi con alcuni esempi quanto esse possano effettivamente mutare al variare del dispositivo formale di un testo.

 -Una grandezza molto importante, B, misura come la tensione degli anagrammi, A, è localizzata nelle estremità del verso. Questa particolare valutazione può essere fatta assegnando all’anagramma un valore che dipende da curve di “pesatura” crescenti agli estremi del verso:

            

La grandezza B, quindi, esprime come la grandezza A viene concentrata, nel testo, all’inizio o alla fine dei versi, nelle due posizioni che caratterizzano percettivamente il dispositivo formale: in testi aventi A uguale, valori più alti di B indicano una maggior dipendenza del sistema anagrammatico dal sistema formale. Lo studio del testo tramite queste curve di pesatura permette pertanto di evidenziare come A, una grandezza solo quantitativa, assuma una funzione qualitativo-formale nel dispositivo della versificazione.

 -Un’altra grandezza, C, misura come la tensione anagrammatica A venga ordinata, invece, secondo l’allineamento verticale degli anagrammi. Questa valutazione può essere fatta assegnando all’anagramma un valore crescente (secondo opportune funzioni) al diminuire di una distanza d così definita:

            

La grandezza C, quindi, esprime come la tensione anagrammatica A viene ordinata lungo la verticale, ciò che può interessare ancora il dispositivo formale del testo. In testi aventi A uguale, valori più alti di C indicano pertanto tensioni anagrammatiche volte ad un maggior ordine verticale, ciò che, come vedremo, caratterizza in modo specifico alcuni testi.

 Entrambe queste grandezze, B e C, sono grandezze derivate da A, di cui evidenziano aspetti qualitativo-formali. Altre grandezze qualitative (derivate da A e da N), e importanti come queste, verranno indicate in seguito. 

 10. La dipendenza di B e C dal dispositivo formale

 È, ora, molto facile constatare come le due nuove grandezze, B e C, dipendano strettamente dal dispositivo formale del testo. Consideriamo, ad esempio, il quarto dei testi poetici fin qui esplorati, la poesia di Montale “Il fuoco che scoppietta”:

 Il fuoco che scoppietta
nel caminetto verdeggia
e un’aria oscura grava
sopra un mondo indeciso. Un vecchio stanco
dorme accanto a un alare
il sonno dell’abbandonato.
In questa luce abiss
che finge il bronzo, non ti svegliare
addormentato! E tu camminante
procedi piano; ma prima
un ramo aggiungi alla fiamma
del focolare e una pigna
matura alla cesta gettata
nel canto: ne cadono a terra
le provvigioni serbate
pel viaggio finale.

Ricomponiamo questo testo con una versificazione differente, nei due modi seguenti:

 

Il fuoco che scoppietta
nel caminetto verdeggia
e un’aria oscura grava
sopra un mondo indeciso.
Un vecchio stanco dorme
accanto a un alare
il sonno dell’abbandonato.
In questa luce abissale
che finge il bronzo,
non ti svegliare
addormentato! E tu
camminante procedi piano;
ma prima un ramo aggiungi
alla fiamma del focolare
e una pigna matura alla cesta
gettata nel canto: ne cadono
a terra le provvigioni
serbate pel viaggio finale.

Il fuoco che scoppietta nel caminetto verdeggia
e un’aria oscura grava sopra un mondo indeciso
Un vecchio stanco dorme accanto a un alare
il sonno dell’abbandonato. In questa luce abissale
che finge il bronzo, non ti svegliare
addormentato! E tu camminante procedi piano;
ma prima un ramo aggiungi alla fiamma del focolare
e una pigna matura alla cesta gettata nel canto: ne cadono
a terra le provvigioni serbate pel viaggio finale.

 Mettiamo ora a confronto i valori di B e C del testo originario e di queste due versioni, differenti nel solo dispositivo formale:

Poiché il testo è rimasto identico, permangono uguali i valori di N e A: mutano, però, al cambiare del dispositivo formale, i valori delle due nuove grandezze B e C.

 La prima di queste, la tensione anagrammatica a fine verso, diminuisce, soprattutto nella seconda ricomposizione formale; ma già nella prima il lieve mutamento nella disposizione dei versi ne attenua il valore: come poi vedremo, è appunto questa grandezza uno degli elementi specifici della struttura formale del testo. La seconda grandezza, la tensione anagrammatica dell’ordinamento verticale cresce lievemente nella prima e si attenua nella seconda: questo mutamento è dovuto al fatto che l’ordinamento anagrammatico verticale migliora, come è possibile dimostrare dal punto di vista teorico, quando il dispositivo formale è fatto di versi brevi e tendenzialmente uguali, mentre diminuisce all’allungarsi dei versi.

 Questo semplice esempio, dunque, mostra come le due grandezze B e C dipendano fortemente dal dispositivo formale del testo, e come perciò esse non possano essere valutate con la precedente statistica, costruita senza tener conto di alcun tipo di organizzazione formale dei testi casuali. Teoricamente, per valutare queste due nuove grandezze, anche i testi casuali dovrebbero avere lo stesso dispositivo formale del testo originario: poiché, però, ciò comporta necessariamente che tutti testi siano di egual lunghezza, non è possibile in alcun modo costruire una statistica di carattere generale, ma soltanto, di volta in volta, statistiche particolari.

 11. Le altre grandezze qualitative: D, E, IE, b, Ib, c, Ic.

 L’importanza del dispositivo formale del testo poetico diviene meglio comprensibile considerando altre grandezze qualitative, ognuna in grado di definire funzioni anagrammatiche dipendenti dalla struttura formale. Vediamone dapprima altre due, derivate ancora dalla grandezza A:

 -La grandezza D misura la tensione di A che contemporaneamente è concentrata negli estremi del verso e allineata lungo la verticale. D sintetizza perciò le due grandezze B e C, entrambe riferibili al dispositivo formale del testo: a parità di A, valori più alti di D indicano la cooperazione delle due tensioni qualitative B e C, e quindi la dipendenza generale della tensione A dal sistema formale.

 -La grandezza E è una valutazione della grandezza D che tiene conto della distanza coperta dagli anagrammi nel testo: essa esprime, tramite una funzione della lunghezza del testo, se la grandezza D è meglio riferita a tensioni formali tra versi vicini o lontani. La grandezza E permette perciò di studiare la localizzazione della tensione D in aspetti formali specifici sia dei testi brevi che lunghi.

 Oltre a queste due nuove grandezze, è poi utile un indicatore generale di struttura formale, dipendente da E e A:

 -IE=E/A è l’indice di formalizzazione del testo, che deriva dal rapporto di E e A . Poiché E riassume tutte la valutazioni formali di A, il rapporto E/A indica, sinteticamente, il grado di formalizzazione globale del sistema anagrammatico nel testo. Valori alti di IE segnalano pertanto un indice di tensione qualitativa elevata, ciò che in alcuni testi può verificarsi in modo significativo anche per valori bassi di A, o B, C, D.

 Oltre alle grandezze B, C, D, E, e IE, possono essere definite infine le ultime quattro grandezze qualitative, b, c, e Ib, Ic: esse simili a B e C, esprimono funzioni formali di N:

 -b è la grandezza che misura globalmente come gli N anagrammi sono concentrati agli estremi del verso. Diversamente da B, che misura anche la tensione A, la grandezza b tiene quindi conto solo del peso derivante dalla posizione nel verso: essa è volta alla valutazione più qualitativa del sistema anagrammatico nella versificazione, in cui anche gli anagrammi molto piccoli possono avere la stessa importanza di quelli grandi.

 -Ib=b/N è l’indice ottenuto dal rapporto tra b e N: questa grandezza misura perciò il valore medio dello spostamento anagrammatico agli estremi dei versi. Valori alti di questo indice possono segnalare, anche in assenza di grandezze significative di b o B, concentrazioni formali rilevanti.

 -c è la grandezza che misura globalmente come gli N anagrammi sono ordinati lungo la verticale. Diversamente da C, che misura anche la tensione A, la grandezza c tiene quindi conto solo del peso derivante dall’allineamento verticale: essa è volta alla valutazione dell’aspetto più qualitativo della distribuzione formale verticale, in cui anagrammi piccoli e grandi possono avere la stessa importanza.

 -Ic=c/N è l’indice ottenuto dal rapporto tra c e N: questa grandezza misura perciò il valore medio dell’allineamento verticale degli anagrammi. Valori alti di questo indice possono segnalare, anche in assenza di grandezze significative di c o C, ordinamenti formali rilevanti. Come vedremo, l’indice Ic è talvolta importante per rintracciare la presenza di strutture singolarmente qualitative in testi anagrammaticamente poco appariscenti.

 Altre grandezze, infine, possono essere derivate da opportune combinazioni delle undici grandezze qui presentate: esse, globalmente, rendono possibile uno studio sufficientemente ampio degli aspetti quantitativi e qualitativi delle tensioni anagrammatiche, permettendo una valutazione spesso molto accurata dei diversi tipi di strutture formali evidenziabili nel testo poetico. Delle undici grandezze dò qui le definizioni riassuntive:

 N : è il numero totale degli anagrammi 

 A : indica la tensione anagrammatica totale

 B : indica la localizzazione agli estremi dei versi della tensione A

 C : indica l’ordinamento verticale della tensione A

 D : indica la cooperazione congiunta delle tensioni B e C

 E : indica la proiezione prossimale o distale della tensione D

 IE : è l’indice di formalizzazione globale

 b : è il valore totale degli spostamenti agli estremi dei versi degli N anagrammi

 Ib : è l’indice di spostamento medio agli estremi dei versi

 c :è il valore totale degli ordinamenti verticali degli N angrammi

 Ic : è l’indice di ordinamento verticale medio 

 

 12. Il sistema delle grandezze e il dispositivo formale  

 Vediamo, ora, come cambia, nelle due diverse ricomposizioni del testo di Montale, il quadro globale delle undici grandezze:

 

Tranne che per la quarta grandezza, tutti i valori diminuiscono, segnalando una evidente specificità della struttura originaria: il mutare dei valori in questo sistema di grandezze appare perciò utile per evidenziare alcune caratteristiche di un testo poetico. Verifichiamo anche, per le quattro poesie viste, i valori delle rispettive undici grandezze:

Nei quattro testi esse misurano tensioni anagrammatiche che appaiono profondamente diverse: ovviamente i valori non possono, però, essere confrontati tra loro, sia per la differente lunghezza dei testi, sia per la loro differente struttura formale.

 Come ho rilevato prima, una valutazione corretta delle grandezze qualitative potrebbe essere fatta, teoricamente, costruendo statistiche di testi casuali aventi ugual dispositivo formale del testo poetico: ma esso dovrebbe, per i testi in rima, avere anche un sistema di rime equivalente. Le rime infatti, come ho fatto osservare, facilitano il formarsi di anagrammi, che pertanto influenzano sia la valutazione della loro densità all’estremo del verso, sia il loro allineamento verticale, e perciò tutte le grandezze di tipo qualitativo: il dispositivo formale dei testi casuali dovrebbe perciò conservare il sistema stesso di rime originario, per non introdurre modificazioni erronee nel dispositivo formale, ciò che non appare realizzabile.

 È in questo contesto di difficoltà praticamente ineliminabili che il metodo degli pseudotesti appare, per contrasto, semplice, poiché consente di risolvere i problemi più importanti emersi in questa discussione: 

 1-Lo studio e la depurazione dei tre principali tipi di ridondanza del testo: lessicale, sintagmatica, e delle rime.

 2-Lo studio della significatività statistica delle grandezze, quantitative e qualitative, caratteristiche del sistema formale.

 Vediamo perciò ora in dettaglio la natura degli pseudotesti e gli aspetti teorici che ne giustificano l’uso statistico

 13. Lo pseudotesto: requisiti formali e possibilità di studio.

 Nella statistica degli pseudotesti si utilizzano, come testi di confronto, non testi casuali estratti da libri, giornali, ecc., ma semplici ricombinazioni casuali del testo originario, che ne riproducano però anche il dispositivo formale della versificazione. Questi testi hanno quindi necessariamente ugual lunghezza di quello originario, essendo costituiti dalle sue stesse parole, disposte solo in ordine diverso; sono contemporaneamente costituiti da versi uguali a quelli originari: soddisfano perciò ai due requisiti essenziali per il tipo di statistica discussa prima, l’identità di lunghezza e di struttura formale nella versificazione.


 La ricombinazione riguarda in genere tutte le parole: ma, in particolare, si può evitare di ricombinare quelle in rima, mantenendole nella posizione originaria e conservando quindi interamente la struttura formale. Ne possiamo vedere un esempio nel confronto di questi due diversi pseudotesti (liberi e in rima) della poesia “Il fuoco” di Montale, che mantengono entrambi il dispositivo formale originario, fatto di versi di lunghezza differente: mentre il primo, però, ricombina interamente il testo, il secondo ne conserva le rime (le parole lasciate nella posizione originaria sono evidenziate in maiuscolo). 

Costruendo, perciò, due diverse statistiche con questi due tipi di pseudotesti, il sistema formale può essere studiato nelle sue due componenti strutturali fondamentali, la disposizione delle lunghezze dei versi, e la posizione delle parole in rima: il loro confronto permette di definire la depurazione degli effetti dovuti ai segmenti identici nel sistema formale, discussi nei paragrafi precedenti.

 Non vi è necessità, invece, di depurare, negli pseudotesti, gli effetti combinatori dovuti alla ripetizione di parole, poiché l’eventuale ridondanza anagrammatica indotte da queste è potenzialmente uguale in ogni testo, essendo ognuno di essi costituito dalle identiche parole: la ridondanza, perciò, essendo comune in tutti i testi, non influenza la statistica. Questa particolare facilitazione offerta dagli pseudotesti riguarda inoltre anche la ridondanza di sintagmi costituiti da più parole, che può essere facilmente ricondotta, con l’unificazione in una unica sequenza delle parole del sintagma, a quella delle parole uguali: più avanti mostrerò alcuni esempi tipici di questi criteri correttivi. 

 Come si può dunque vedere in questa breve presentazione, i vantaggi teorici degli pseudotesti sono molti, e ne constateremo la reale validità nello studio dei testi poetici. La natura combinatoria degli pseudotesti può, però, suscitare qualche perplessità, che richiede un chiarimento preliminare, potendo apparire troppo anomalo il tipo di testi ottenuti.

 14. La natura teorica dello pseudotesto: la verifica dell’ordine articolatorio sintagmatico.

 Può contrastare infatti con il senso comune l’utilizzo di testi ricavati solo dalla ricombinazione casuale del testo originario, ciò che produce testi non grammaticali. La natura teorica degli pseudotesti però non è volta a indagare la struttura grammaticale del testo, ma solo quella combinatoria, in modo da verificare l’obiezione discussa lungamente all’inizio di questo scritto: se cioè gli anagrammi del testo siano solo l’effetto di ricombinazioni casuali delle lettere della lingua. Ricordo che, per la teoria intralinguistica, gli anagrammi si formano in una sequenza continua delle lettere del testo, e che la tensione articolatoria dipende, perciò, dal susseguirsi delle parole nell’ordine scelto dal poeta. La particolare statistica degli pseudotesti ha come scopo, pertanto, di accertare solo la significatività della tensione articolatoria del testo originario, verificando che essa muta, appunto significativamente, quando si modifica la disposizione delle parole, e quindi la sequenza originaria delle lettere del testo.

 Questo particolare approccio teorico, che è a fondamento della teoria degli pseudotesti, e che ne giustifica alcuni limiti precisati successivamente, può essere capito in dettaglio con uno degli esempi introduttivi del libro, il famoso verso di Virgilio:

   ibANT OBSCUri solA SUB NOCTe

Questo verso ha la caratteristica di presentare un’inversione nel legame aggettivale (l’oscurità è attribuita al soggetto, e la solitudine alla notte). L’inversione viola le regole semantiche ordinarie: il grande anagramma, di otto lettere, che compare tra le parole, suggerisce perciò che nel verso possa aver operato in senso costrittivo il legame combinatorio. Secondo questa osservazione, a una regolarità semantico-grammaticale si sostituisce il controllo articolatorio di una sequenza sintagmatica ampia, in grado di sovradeterminare tutto il verso, e la stessa inversione aggettivale.

 L’obiezione a questa ipotesi riguarda la natura solo casuale dell’anagramma, dovuto alla facilità con cui i legami combinatori si formano tra le parole: è questa obiezione che, nel caso del verso, si può dimostrare non provata. Ricombinando in ordine differente le cinque parole possiamo infatti ottenere in tutto 120 versi, e verificare se effettivamente si formano anagrammi simili a quello originario: essi, però, sono rari, e tutti di lunghezza inferiore. Ciò dimostra, in questo esempio, che dal punto di vista statistico la tensione articolatoria originaria, essendo massima, non può essere ritenuta casuale, poiché decade se si ricombinano in ordine diverso le parole: la sequenza anagrammatica può allora essere considerata, in questo caso, dipendente dalla sequenza lessicale, cioè dall’ordine delle parole voluto dal poeta.

 Dal punto di vista della teoria intralinguistica questo tipo di legame tra le due sequenze è facilmente giustificabile, ed è appunto alla base della teoria: durante l’ideazione la mente del poeta non controlla solo la sequenza delle parole, ma anche, inconsciamente, la sequenza di lettere formate dal susseguirsi delle parole, ritagliandovi anagrammi utili al coordinamento testuale. Il poeta, dunque, secondo questa ipotesi, porta inconsapevolmente a cooperazione due tipi di sequenze, tra loro compenetrate: quelle lessicali, costituite da unità grammaticali già preformate, e quelle anagrammatiche, ottenute da sequenze risegmentate dall’unificazione di quelle preformate, e conseguenti appunto al loro particolare ordine.

 Per questo motivo, secondo la teoria degli pseudotesti, il cambiamento casuale nell’ordine delle parole può mettere in luce le tensioni originarie anagrammatiche del testo: queste, nell’ipotesi della teoria, vengono costruite insieme all’ordine grammaticale, e dipendono dalla sequenza voluta dal poeta. Mutare l’ordine delle parole comporta quindi anche la perdita dell’ordine anagrammatico. Se perciò negli pseudotesti, in cui l’ordine delle parole è ricomposto casualmente, non permangono tensioni anagrammatiche simili a quelle originarie, ciò permette di stabilire che queste ultime non sono attribuibili ai soli fenomeni combinatori, casuali, della lingua: ma, viceversa, sono da ritenersi specifiche della struttura ordinata della sequenza di lettere del testo. Il testo, allora, può essere considerato di tipo anagrammatico.

 Nella statistica degli pseudotesti, dunque, l’agrammaticalità dei testi non è importante, essendo prioritaria l’esplorazione della potenzialità combinatoria della lingua del testo, e i suoi effetti sulla validità attribuibile alle misure delle grandezze anagrammatiche del sistema formale.

 Soprattutto, poiché il contenuto lessicale degli pseudotesti è identico a quello del testo di partenza, non vi è il rischio, come per le altre statistiche discusse prima, di introdurre elementi arbitrari non controllabili: il disordine combinatorio, proprio perché disgrega una struttura grammaticale e anagrammatica supposta unitaria, permette di concentrarsi sugli effetti dovuti al solo decadere dell’ordine anagrammatico originario. Questo consiste, a tutti gli effetti, nel depauperarsi delle funzioni strutturali anagrammatiche che la mente del poeta può affidarvi inconsciamente, e che l’analisi statistica può rendere, in molti casi, particolarmente evidente.

 Vediamo ora, all’atto pratico, come utilizzare il metodo degli pseudotesti, e alcune delle procedure che permettono di definire i tipi di depurazione discussi nelle pagine precedenti.

 15.1. La preparazione del testo: le depurazioni sintagmatiche.

 Consideriamo perciò nuovamente il sonetto di Dante, per studiarne ora la reale significatività statistica:

Piangete amanti poi che piange amore,
udendo qual cagion lui fa plorare.
Amor sente a pietà donne chiamare,
mostrando amaro duol per li occhi fore,

perché villana morte in gentil core
ha miso il suo crudele adoperare,
guastando ciò che al mondo è da laudari
in gentile donna sovra de l’onore.

Audite quanto amor le fece orranza,
ch’io ‘l vidi lamentare in forma vera
sovra la morte imagine avvenente:

e riguardava ver lo cielo sovente,
ove l’alma gentil già locata era,
che donna fu di sì gaia sembianza.

Come ho precisato prima, gli pseudotesti sono ricombinazioni casuali del testo, che il calcolatore produce riordinando in ordine diverso le parole, ma rispettando il dispositivo formale originario, sia conservando la lunghezza dei singoli versi, sia eventualmente anche la disposizione delle rime.

 Prima che il calcolatore ricombini il testo, esso va però preparato per ottenere pseudotesti il più possibili corretti dagli errori che influenzerebbero il loro studio statistico. Essi derivano dalle due ridondanze, lessicale e sintagmatica, già accennate prima, e da alcuni legami sintagmatici tra articoli, preposizioni e parole, non ancora discussi. Vediamo questi tre punti ordinatamente.

 1-Nel sonetto, come si è visto, vi sono le ripetizioni “Piangete... piange”, “amore... amor... amor”, “donne... donna... donna”, “in gentil... in gentile... gentil”, che influenzano le grandezze anagrammatiche. Queste ridondanze sono o lessicali, causate cioè da parole ripetute (piangete, piange, amore amor amor, donne, donna, donna) o sintagmatiche, cioè causate da più parole consecutive ripetute (in gentile, in gentil).

 Come ho spiegato, non è necessario depurare la ridondanza più semplice, lessicale, essendo essa comune al testo originario e agli pseudotesti: la sua influenza nel sistema combinatorio anagrammatico, poiché è distribuita uniformemente, non determina errori nella statistica.

 2-Diverso è il caso della ridondanza sintagmatica (in gentile, in gentil). Negli pseudotesti questi legami più ampi, dovuti alla successione di parole uguali, vengono rotti, poiché la ricombinazione casuale separa le parole del sintagma: in questo caso si hanno errori statistici, perché scompare negli pseudotesti una sequenza estesa di lettere, presente invece nel testo originario. In testi poetici in cui vi sono molte ripetizioni di sintagmi fatti di più parole, quindi assai ampi, questo tipo di errore, se non corretto, può generare una grande sovravalutazione delle grandezze del testo originario, perché gli pseudotesti vengono privati di questo tipo di ridondanza combinatoria, e risultano quindi meno ricchi di tensioni anagrammatiche.

 Questo tipo di errore, però, può essere facilmente corretto trattando il sintagma come un’unica parola, cioè unificando le parole consecutive che lo formano (ingentile, ingentil): in questo modo, nella ricombinazione casuale, vengono conservati i sintagmi originari anche negli pseudotesti, e l’influenza anagrammatica indotta dai sintagmi, essendo ora distribuita uniformemente, non determina sovravalutazioni erronee nel testo originario.

 3-Questo criterio correttivo è particolarmente importante per trattare i legami sintagmatici sostenuti da cesure ed elisioni tra articoli, preposizioni e parole, ecc. Nel sonetto un sintagma come “l’onore”, se lasciato in questa forma, viene ricombinato come due unità separabili, “l” e “onore”, ciò che può produrre negli pseudotesti sequenze di lettere estranee alla lingua: ad esempio la lettera “l”, se posta nella ricombinazione “ingentiL L CRrudele” vi determina la sequenza LLCR, che non appartiene alla lingua italiana. Analogamente nel sonetto il sintgma “ch’io ‘l”, così scritto, verrebbe separato nelle unità CH IO L: la ricombinazione casuale di ch davanti a ogni parola avente una consonante iniziale (ad esempio ch piangete) darebbe ugualmente luogo ad una sequenza di lettere anomala nella lingua.

 La presenza eventuale negli pseudotesti di tali sequenze, non appartenenti alla lingua, sfavorisce però il formarsi degli anagrammi, la cui probabilità dipende strettamente dai legami di successione più frequente tra le lettere: successioni anomali rendono più difficile la ricomparsa di tali ricombinazioni di lettere, e ciò diminuisce il numero di anagrammi degli pseudotesti, generando per contrasto una significatività maggiore del testo originario. Questo fenomeno, come vedremo, è molto importante per il confronto delle caratteristiche anagrammatiche di lingue diverse, e verrà approfondito più avanti.

 La correzione degli errori dovuti alla rottura di questi legami sintagmatici può essere fatta, però, come nel punto 2: sintagmi come l’albero, l’alma, ch’io ‘l vengono unificati in un’unica parola (lalbero, lalma, chiol), ciò che impedisce il formarsi di sequenze di lettere anomale negli pseudotesti, permettendo una presenza uniforme di questi legami sintagmatici nella statistica.

 La procedura preparatoria porta a questa rappresentazione scritturale del sonetto, costituito di parole e sintagmi:

Piangete amanti poi che piange amore,
udendo qual cagion lui fa plorare.
Amor sente a pietà donne chiamare,
mostrando amaro duol per li occhi fore,

perché villana morte ingentil core
ha miso il suo crudele adoperare,
guastando ciò che al mondo è da laudari
ingentile donna sovra de lonore.

Audite quanto amor le fece orranza,
chiol vidi lamentare in forma vera
sovra la morte imagine avvenente:

e riguardava ver lo cielo sovente,
ove lalma gentil già locata era,
che donna fu di sì gaia sembianza.

 15.2. La preparazione del testo: ricombinazione libera o con dispositivo formale.

 Da questa forma scritturale si possono ottenere, come già visto nell’esempio della poesia “Il fuoco” di Montale, due tipi di pseudotesti, quelli in cui vengono ricombinate tutte le parole (pseudotesti liberi), o quelli in cui le rime vengono conservate nella posizione originaria (pseudotesti in rima); qui di seguito possiamo vedere, per il sonetto di Dante, due di questi diversi tipi di pseudotesti (le parole conservate in rima, come già precisato, sono evidenziate in maiuscolo). Più avanti vedremo come, per motivi di studio, possano venire conservate anche le disposizioni formali di altre parole importanti del testo


Vediamo ora come, quando si è preparato il testo, si proceda all’analisi statistica.

16. Metodo d’analisi: statistica con pseudotesti liberi o con dispositivo formale

 La procedura d’analisi è semplice, e sostanzialmente simile a quella delle pagine iniziali, ma applicata ora agli pseudotesti: per verificare la significatività statistica del testo, il calcolatore produce un certo numero di pseudotesti (in genere da 50 a 100), in ciascuno dei quali valuta le grandezze quantitative e qualitative illustrate nelle pagine precedenti. Confronta poi le grandezze del testo originario con quelle degli pseudotesti, indicando per ciascuna di esse la sua significatività rispetto a quelle corrispondenti degli pseudotesti. Questo procedimento può essere attuato sia con gli pseudotesti “liberi” che “in rima”, permettendo così di studiare anche l’eventuale influenza del sistema delle rime.

 Per facilitare la comprensione di questo procedimento, riporto qui di seguito, dalla statistica del sonetto di Dante ottenuta da 100 pseudotesti liberi, i valori delle grandezze originarie e quelle corrispondenti dei suoi primi dieci pseudotesti:


 ...............

In questi primi dieci dati di confronto, tutte le grandezze del testo originario, quantitative e qualitative, risultano superiori: pochi dei restanti 90 psudotesti, inoltre, li sopravanzano, segnalando intuitivamente la significatività del sonetto. Di ognuna di queste grandezze, però, ora il calcolatore può dare un’effettiva valutazione statistica: ogni dato originario del testo (ad esempio N=286) viene confrontato con la serie dei dati, nella colonna, corrispondenti agli pseudotesti (255, 271, 261, 263, 264...), e ne viene calcolata, secondo regole statistiche, la significatività. Vediamole dapprima in questo quadro generale:

              

Come si può constatare, si tratta di valori tutti (tranne il quarto) significativi, con livelli per qualche grandezza, come b e Ib , eccezionalmente elevati.

 Prima di discuterne il significato confrontiamo subito questi valori con quelli ottenuti dalla statistica degli pseudotesti in rima, cioè gli pseudotesti che, al contrario dei precedenti, conservano l’apparato formale delle rime. Vediamo i dati dei primi dieci pseudotesti:

Già dal confronto di questi primi dieci dati si può notare come alcune grandezze originarie, soprattutto qualitative, non siano più massime, evidenziando una statistica differente. Osserviamo i nuovi valori di significatività, e mettiamoli a confronto con quelli precedenti: 

 Tranne i valori simili delle due prime grandezze, tutti gli altri diminuiscono. Il confronto tra le due diverse statistiche, e il suo significato strutturale, può essere capito dal lettore se egli tiene presente la differenza tra pseudotesti liberi e in rima.

 17. L’influenza strutturale anagrammatica del dispositivo formale. La significatività del sonetto di Dante.

 Nella prima statistica solo il testo originario conserva il dispositivo delle rime, che è invece ricombinato casualmente anch’esso negli pseudotesti, di tipo libero. La grande significatività delle grandezze qualitative del testo originario risulta quindi dipendere dalla tensione strutturante delle rime, assente negli pseudotesti, la quale evidentemente nel testo originario dà un contributo determinante nell’organizzare il sistema anagrammatico.

 Viceversa, nella statistica degli pseudotesti in rima, la conservazione del dispositivo strutturale delle rime rende tendenzialmente comune a tutti i testi le tensioni di tipo più qualitativo-formale.

 Il confronto tra le due statistiche permette, perciò, di valutare in questo sonetto l’influenza del sistema formale delle parole in rima, indicando quelle grandezze che si possono ritenere significative con certezza, e anche il significato attribuibile alla grande significatività del primo tipo di statistica:

 -Sono certamente significative nel sonetto le prime due grandezze, N e A: esse sono simili nelle due statistiche, essendo tipicamente quantitative, e quindi non influenzate dal sistema formale. Delle due, la prima grandezza è la più significativa e segnala che Dante ha operato con una grande numerosità di anagrammi. Dal punto di vista di questa teoria, la significatività di entrambe le grandezze può perciò essere interpretata come una prova di tensioni anagrammatiche dipendenti strettamente dall’ordine sintagmatico grammaticale, poiché queste tensioni decadono al ricombinarsi non più ordinato delle parole del testo.

 In questo testo, perciò, non si può assumere come vera l’ipotesi di una semplice casualità dei fenomeni combinatori, ma al contrario viene confermata l’ipotesi opposta, quella di una specifica significatività nel controllo, da parte del poeta, di sequenze sovrasegmentali, sovraordinanti la sequenza lessematica.

 -Nel sonetto la diversità tra le due statistiche indica quanto l’influenza del sistema delle rime sovradetermini la struttura anagrammatica formale-qualitativa. Il decadere di significatività nella seconda statistica non va interpretata, perciò, come un’assenza di struttura formale anagrammatica nel sonetto, ma come essa venga a dipendere in modo prevalente dal sistema delle parole in rima.

 La grande significativà nella prima statistica suggerisce quindi, dal punto di vista della teoria intralinguistica, che il sistema delle rime possa servire da ordinatore naturale, inconscio, del sistema formale anagrammatico. Questo tipo di riflessione può venire ampliata, come vedremo, ad altri testi, in cui è possibile dimostrare diversi tipi di organizzazione formale, sia in presenza che in assenza del sistema delle rime.

 Può essere utile, per il lettore, vedere nei due grafici seguenti come si dispongono i dati originari di N e A del sonetto di Dante rispetto a quelli degli pseudotesti liberi. Il primo rappresenta l’istogramma del numero N di anagrammi trovati negli pseudotesti:

          

I dati N degli pseudotesti variano tra gli estremi 230 e 280. Il valore N=289 del sonetto di Dante (indicato con il segno ) è appena esterno a questa statistica, ma ciò è già sufficiente per segnalarne l’elevata significatività (99.450). Il secondo grafico rappresenta l’istogramma delle tensioni A degli pseudotesti, che variano tra 155 e 215:

         

 Il valore del sonetto 209.1, pur essendo interno a questa statistica (quattro dati lo superano), si colloca nel suo estremo destro, e raggiunge perciò il primo livello di significatività (96.291).

 Questi diagrammi riesprimono, ma in modo ora corretto, il significato della statistica studiata in precedenza: i dati oscillano in un’ampiezza ristretta, ed è sufficiente scostarsene di poco per raggiungere elevate significatività. Più avanti vedremo altri esempi di questa rappresentazione grafica, che chiarisce l’elevatissima significatività di alcuni testi poetici. 

8. La significatività del sonetto di Zanzotto.

 Osserviamo ora, per confrontarle con quelle del sonetto di Dante, le significatività delle due statistiche ottenibili dal sonetto di Zanzotto:

 Nella statistica ottenuta dagli pseudotesti liberi sono significative solo alcune grandezze qualitative; come per il sonetto di Dante, esse decadono nella statistica degli pseudotesti in rima.

 L’influenza del dispositivo formale delle rime appare pertanto confrontabile con quello del sonetto di Dante ma, diversamente da questo, nel sonetto di Zanzotto non è possibile accertare con sicurezza delle significatività statistiche: N e A, le uniche grandezze non qualitative, non risultano significative, e i valori di B, D, b, Ib, ottenuti dagli pseudotesti liberi, per quanto elevati, non raggiungono quelli del sonetto di Dante.

 Questa diversità segnala, dal punto di vista anagrammatico, una minor tensione articolatoria sovrasegmentaria del sonetto di Zanzotto e, comunque, l’impossibilità a dimostrarne in senso statistico la dipendenza dall’ordine lessematico. Secondo questo modello d’analisi, pertanto, il sonetto non può essere definito anagrammatico.

 L’analisi statistica ottenuta dagli pseudotesti mostra bene, in questo caso, i limiti del metodo statistico presentato nelle prime pagine, per il quale i valori N e A del sonetto di Zanzotto risultavano significativi: essi appariono tali, rispetto ai testi casuali utilizzati in quel tipo di statistica, per l’influenza della ridondanza lessematica e sintagmatica, e per l’influenza dei segmenti comuni nelle rime, che inducono forti sovravalutazioni rispetto ai testi casuali comuni. Queste influenze, ora, non si riflettono nella validità della statistica degli pseudotesti, perché comuni a tutti i testi.

 È questa correzione automatica della ridondanza, dunque, che mette in evidenza nel sonetto di Zanzotto la minore significatività della componente combinatoria sovralessicale, invece dimostrabile nel sonetto di Dante.

 19.1. Studio della significatività nella poesia “Il fuoco”.

 Veniamo, ora, al testo di Montale, che permette di comprendere più in dettaglio come questo metodo statistico possa evidenziare le tensioni qualitative affidate al dispositivo formale del testo. Come ho mostrato in precedenza, mutando il dispositivo formale di questo testo si ottengono valori inferiori nelle grandezze qualitative delle due versioni modificate. L’effettiva riduzione di significatività statistica di queste grandezze può essere dimostrata, ora, con gli pseudotesti. Vediamo dapprima la significatività del testo originario.

 La poesia ha nel dispositivo formale alcune rime, e quindi si può procedere all’analisi con i due tipi di pseudotesti, in rima e no, per valutare l’influenza del sistema delle rime:

Diversamente che nei due precedenti sonetti, le due statistiche del testo di Montale non presentano grandi differenze: quasi tutte le grandezze, quantitative e qualitative, hanno infatti valori simili di significatività, e in genere assai elevati. La tendenziale uguaglianza nelle grandezze qualitative indica perciò, in questa poesia, che il sistema delle rime non è determinante per la significatività della struttura formale anagrammatica, che dipende evidentemente dall’intero dispositivo della versificazione. Le due statistiche, osservate attentamente, permettono già di definire alcuni aspetti strutturali anagrammatici del testo:

 -Sono significative le prime due grandezze N e A. La maggior significatività di A indica che la tensione articolatoria sovrasegmentaria opera con anagrammi tendenzialmente lunghi.

-In entrambe le statistiche la significatività cresce passando da A a B, che rappresenta la tensione anagrammatica a fine verso: questa perciò caratterizza un aspetto qualitativo anagrammatico del testo. Anche la significatività della densità anagrammatica a fine verso b conferma questo aspetto strutturale. Entrambi questi valori si abbassono nella statistica degli pseudotesti in rima, per la comune identità formale, ma permangono significativi: ciò indica appunto che anche le parole terminali dei versi non in rima contribuiscono alla significatività di queste grandezze.

-In entrambe le statistiche i valori inferiori di significatività si riferiscono alle grandezze degli allineamenti verticali, C, c, Ic.[7] Ciò indica che questo tipo di ordine non interviene significativamente nella struttura delle tensioni anagrammatiche del testo.

- In entrambe le statistiche i valori massimi di significatività si hanno per la grandezza E: poiché per questo testo è stata utilizzata una pesatura maggiore per gli anagrammi distali, ciò indica che la tensione formale ha la sua massima proiezione a fine testo.

 Il testo, come possiamo vedere, è significativo per molte grandezze: la numerosità N degli anagrammi, la tensione articolatoria A, lo spostamento B degli anagrammi a fine verso, una proiezione E del sistema formale globale a fine testo.

 Le ultime due grandezze sono qualitative, e il fatto che la loro significatività sia molto elevata, e maggiore di quella delle due grandezze quantitative, permette dunque di affermare che gli elementi determinanti della tensione anagrammatica non sono quantitativi, ma inerenti alla struttura del dispositivo formale che il poeta assegna al testo: il poeta cioè, vincola la tensione anagrammatica all’ordine sintagmatico del lessico, e contemporaneamente all’ordine formale del lessico nei versi; proietta inoltre questa tensione verso la fine testo.

 Osserviamo ora come si dispongono i due valori A e E del testo rispetto agli istogrammi ottenuti dagli psudotesti in rima. La significatività di A (98.416) ha origine dalla sua posizione nell’estremo destro della curva:                

                    

Il valore di E è, invece, nettamente esterno alla distribuzione statistica, e questa posizione sta ad indicare la sua elevatissima significatività (99.998):[8]

                

            Questa eccezionale significatività dimostra la particolare rilevanza della proiezione del sistema formale a fine testo.

 19.2. Lo studio de “Il fuoco” al mutare del dispositivo formale.

 L’importanza delle tensioni qualitative diviene ancora più evidente studiando la significatività delle grandezze delle due versioni del testo con il dispositivo di versificazione mutato. Limito qui il confronto alle sole statistiche degli pseudotesti in rima:

Nelle tre statistiche le significatività di N e A sono simili, trattandosi di grandezze quantitative: tutte le altre grandezze qualitative però diminuiscono la loro significatività.

 Si osservi ad esempio come la significatività della grandezza B (99.551) si abbassi già nella prima ricomposizione (96.989), solo poco diversa da quella originaria, e come essa decada del tutto nella seconda (94.485): la tensione B, perciò, non caratterizza più le fine-verso del secondo dispositivo formale, che è radicalmente mutato. Nel confronto globale sono gli indici di tipo qualitativo quelli che più facilmente segnalano il depauperarsi della struttura formale originaria: Ib (98.051), il valore medio di spostamento a fine verso, è già non significativo nella prima ricomposizione (38.460), e ugualmente si può dire di IE, l’indice generale di struttura formale, che passa da 99.614 a 71.264 e poi decade a 25.849.

 Questo confronto tra dispositivi formali diversi dello stesso testo chiarisce l’importanza del dispositivo formale dal punto di vista anagrammatico, e l’utilità degli pseudotesti nello studio dei vari tipi di tensione, quantitativa e qualitativa, che possono organizzare la struttura del testo poetico. In questo testo la tensione articolatoria risulta organizzata dal dispositivo formale: essa si manifesta, pertanto, nel suo più importante aspetto qualitativo-strutturale, la compenetrazione di ordine sintagmatico lessicale e di ordine sovrasegmentario anagrammatico di tipo formale.

 20.1. Lo studio delle tensioni locali: il nucleo de “Il fuoco”. 

 Nelle pagine che seguono presenterò alcuni esempi particolari dello studio statistico degli pseudotesti, che permettono di definire, anche se in modo ancora incompleto, tipi diversi di procedure di dimostrabilità della tensione intralinguistica. Vediamo innanzitutto l’analisi delle tensioni locali, che spesso mettono in rilievo con più precisione la complessità dell’organizzazione intralinguistica del testo.

 Alcuni testi, quando se ne studia in dettaglio la distribuzione di densità anagrammatica, mostrano infatti nuclei molto ricchi di anagrammi, spesso in posizione formalmente interessante. Ne mostro tre esempi, il primo nella poesia appena analizzata, il secondo in un’altra poesia di Montale, il terzo in una poesia di Ungaretti.

 Osserviamo il diagramma della densità anagrammatica della poesia di Montale: esso mostra come ogni singola lettera dell’enunciato è impegnata dagli anagrammi che si formano in quel tratto, e come, quindi, la tensione anagrammatica è distribuita localmente nel testo.

              

 Tra la fine del primo verso e l’inizio del secondo compare il primo addensamento locale della poesia. Come ho spiegato nel libro, la presenza di un nucleo gravitante sulla fine del primo verso ha un significato teorico importante, perché la prima fine-verso è il demarcatore formale di maggior rilievo, indicando sia per l’autore che per il lettore un’organizzazione del testo caratterizzata specificamente in senso poetico.

 La sua evidenza strutturale può, perciò, favorire l’attenzione inconscia del poeta nell’addensarvi molti anagrammi, per sostenere, fin dall’inaugurarsi del sistema formale, legami utili all’organizzazione del testo. Quando nelle poesie, pertanto, si rintracciano nuclei di questo tipo, è importante verificare se sono effettivamente rari: essi riguardano ora tensioni anagrammatiche non più distribuite nell’intero testo, ma localizzate, e interpretabili come specifiche dell’organizzazione formale.

 Lo studio di questi nuclei è molto semplice, risultando un caso particolare dello studio statistico dell’intero testo. Il testo viene esplorato ora, dal calcolatore, solo per il tratto dell’enunciato da cui dipende il nucleo, e ugualmente viene fatto negli pseudotesti, in corrispondenza allo stesso tratto del testo originario: in questo modo si può verificare se in quella posizione si formano nuclei di uguale densità. Si ottengono così, per le undici grandezze del nucleo, statistiche di confronto simili a quelle già viste, ma ora relative non all’intero testo, ma solo a un suo tratto.

 Ecco, ad esempio, i valori relativi ai primi 20 pseudotesti del testo di Montale, che mostrano subito, anche solo intuitivamente, la significatività di molte grandezze del nucleo originario:

Il calcolo della significatività di queste grandezze è, per i nuclei, leggermente diverso da quello delle precedenti statistiche, non essendo sempre di tipo gaussiano.[9] Do, qui di seguito, alcuni valori sufficientemente precisi per alcune delle undici grandezze quantitative e qualitative:

 Può essere utile per il lettore, allo scopo di cogliere meglio la grande significatività della grandezza E del testo, vedere la sua rappresentazione nel grafico che riassume i corrispondenti valori di E degli pseudotesti.

                   

 Il dato originario si stacca vistosamente dagli altri: ciò indica che la tensione del nucleo è specifica del testo, e quindi strutturalmente dipendente dal dispositivo formale. Non solo, pertanto, la densità del nucleo risulta significativa, ma, ancor più, lo è la sua struttura formale.

 20.2. Il nucleo della poesia di Ungaretti “Nascita d’Aurora”.

 Il testo di Montale, come ora si può constatare, è significativo in due diversi aspetti strutturali: sia nelle tensioni anagrammatiche globali, sia in quelle locali del nucleo terminale del primo verso. Non sempre, però, un testo presenta entrambi i tipi di significatività: alcuni, ad esempio, se esplorati globalmente, non appaiono significativi, mentre mostrano, invece, forti tensioni localizzate, perciò significative, in nuclei simili a quello appena studiato. Questa diversità è uno degli aspetti strutturali dei testi poetici che introduce altri criteri per dimostrare i fenomeni anagrammatici.

 Questo secondo tipo di testi, infatti, esemplifica l’aspetto più qualitativo della organizzazione anagrammatica, una tensione diffusa non uniformemente nell’intero testo ma, viceversa, concentrata in tratti dell’enunciato formalmente e strutturalmente importanti. Proprio questa differenza spiega perché molti testi poetici possano non risultare significativi: il poeta può condensare in un tratto privilegiato gli anagrammi, rarefacendoli nel resto del testo.

 Consideriamo, ad esempio, la distribuzione di densità nella lirica di Ungaretti “Nascita d’Aurora”, analizzata dal punto di vista semantico nel libro:

                

Nella poesia il nodo di maggior densità è chiaramente situato alla fine del primo verso, in una posizione formale ancora più precisa di quella della precedente poesia.

 Consideriamo dapprima l’analisi statistica dell’intero testo, per R>=3, ottenuta dal confronto con duecento pseudotesti:

 Come si può vedere, nessuna delle grandezze, quantitative o qualitative, risulta significativa: attenendosi, perciò, a questi soli dati, il testo non potrebbe venir ritenuto anagrammatico. Diversamente accade, però, per il nucleo: la sua analisi risulta infatti significativa nelle grandezze N, A, B e b; la rarità dei valori del nucleo originario può essere valutata dallo stesso lettore osservando quelli corrispondenti ai duecento pseudotesti, riassunti qui in ordine crescente: i valori del nucleo, contrassegnati con un asterisco, tendono ad essere i massimi. Poiché gli pseudotesti sono duecento, questi dati indicano, anche senza ricorso ad una precisa valutazione matematica, che le significatività sono superiori al 99%:[10]

  Due sono le principali grandezze che caratterizzano il nucleo, la tensione A e lo spostamento degli anagrammi agli estremi dei versi, segnalato da B e b. Poiché b tende ad assumere il valore maggiore tra gli pseudotesti, questa grandezza qualitativa dimostra come gli anagrammi proiettati dal nucleo definiscano soprattutto gli estremi del dispositivo formale: il nucleo, pertanto, assolve a una funzione formale-strutturale del testo.

 L’importanza della significatività del nucleo consiste dunque, in questo caso, nell’evidenziare un aspetto eminentemente qualitativo della tensione anagrammatica, non riconoscibile alla sola osservazione statistica delle grandezze globali del testo: l’esempio suggerisce che molti testi poetici possano non apparire significativi per ragioni simili, poiché l’organizzazione non uniforme delle tensioni anagrammatiche può venir rilevata solo con procedure particolari.

 Come spiego in dettaglio nel libro, sono importanti, per lo studio delle tensioni qualitative di questo tipo, l’intero primo verso e l’intero ultimo verso, con i nuclei di densità che eventualmente vi compaiono; anche le organizzazioni anagrammatiche gravitanti sul dispositivo formale permettono uno accertamento accurato delle tensioni localizzate; è infine importante, ma per motivi più specifici, lo studio delle varianti, che può mostrare come i mutamenti lessicali locali siano correlati con precisione a riorganizzazioni anagrammatiche statisticamente significative.

 Un modello di studio completo delle tensioni tipicamente qualitative di un testo, discusso nel libro in vari aspetti (semantico, statistico, variantistico) è l’analisi di “Alla luna”, in cui è possibile dimostrare, benché il testo non sia globalmente significativo, specifiche significatività localizzate in importanti nuclei formali. 

 20.3. Lo studio del nucleo di “Noi non sappiamo”, di Montale.

 Come ultimo esempio di analisi di un nucleo osserviamo la distribuzione di densità in questo testo di Montale:

            

 Come si può subito constatare, il nucleo alla fine del primo verso è molto ricco. Contribuiscono certamente alla sua elevata densità le rime di “sortiremo” con “estremo, smarriremo,” e quelle interne con “andremo, serberemo”. Un’attenta lettura delle rimanenti rime del testo permette di rilevare che RIME di “rime, esp-rime” è, a sua volta, anagramma di IREM di sort-IREM-o: la densità terminale del nucleo dipende perciò, certamente, sia dalle rime del testo, sia da questa duplice relazione anagrammatica. Come però si può osservare, il nucleo è anche esteso a sinistra, e perciò è localizzato in un tratto dell’enunciato, qu-ALESORT-iremo, che non è correlabile a richiami riconoscibili nel testo: questo segmento particolare può, quindi, essere ritenuto strettamente anagrammatico.

 Il nucleo può essere studiato in questo suo complesso aspetto strutturale con due diverse statistiche, una relativa all’intero nucleo, l’altra al tratto anagrammatico. La situazione statisticamente più sfavorevole è quella in cui gli pseudotesti conservano il sistema formale, e quindi mantengono anche la parola “sortiremo” nella posizione alla fine del primo verso: in questo caso i nuclei degli pseudotesti ricevono dal sistema delle rime lo stesso contributo del testo originario. Se il nucleo della poesia rimane significativo, ciò allora dimostra che la densità del nucleo non dipende solo dal sistema delle rime, ma anche dall’intero testo, e che quindi ha un significato strutturale più ampio.

 Studiamo però, dapprima, la significatività globale del testo:

 La poesia, dunque, non risulta significativa in nessuna delle grandezze. Osserviamo, invece le due statistiche del nucleo, una relativa all’intero tratto terminale [17-25], l’altra al solo segmento iniziale [17-21]: per la sua posizione quest’ultimo non include l’influenza delle rime in REMO del dispositivo formale:

 -In entrambe le statistiche la grandezza più significativa è la tensione anagrammatica A, ma essa è maggiore nella seconda, che riguarda appunto il tratto non interessato dalle rime.

 -Dalle due statistiche si può vedere inoltre come il tratto antecedente la rima, più ricco di tensione quantitativa, sia meno significativo nelle grandezze qualitative: la sua tensione è meno diretta alla costruzione del dispositivo formale rispetto a quella dell’intero nucleo.

 -Benché le due statistiche siano ottenute entrambe da pseudotesti in rima, la prima, soprattutto, mostra bene come il permanere del dispositivo formale non elimini la significatività formale del nucleo originario, ad esempio nelle grandezze C e E.

 La particolare tensione quantitativa del tratto 17-21 e il permanere delle tensioni qualitative nel tratto 17-25 sono dunque i risultati più salienti dell’analisi del nucleo. Essi indicano come la grande significatività globale del nucleo solo in apparenza sia dovuta all’apporto del tratto terminale che sostiene le rime, ma dipenda anche dal tratto anteriore, che mantiene una ricca articolazione anagrammatica nel testo: il nucleo globale, inoltre, ha funzioni formali anche indipendenti dalle rime.

 La mente del poeta costruisce perciò il nucleo in prossimità del termine del verso, e in funzione della rima, ma ne estende l’influenza, quantitativa e qualitativa, ben prima: questo processo di ampliamento inconsapevole è la dimostrazione, secondo la teoria intralinguistica, di una identità strutturale tra rima e anagramma, poiché nel nucleo questi due tipi di tensione articolatoria vengono portati a cooperazione.

 La grande significatività formale del nucleo è evidenziabile nella statistica degli pseudotesti liberi: la struttura originaria, ora totalmente dispersa negli pseudotesti, produce per contrasto gli elevati valori, progressivamente crescenti, nelle grandezze N, A, B, C, D, E.

  

 Dal confronto delle tre statistiche, perciò, la struttura del nucleo risulta molto complessa. Benché l’influenza del dispositivo formale sia evidente, le funzioni del nucleo non possono essere riferite solo al sistema delle rime: la mente del poeta, piuttosto, appare aver fatto dipendere da diverse caratteristiche del nucleo l’organizzazione del dispositivo formale del testo. Il nucleo dimostra come funzioni qualitative delle tensioni localizzate possano interessare l’intero testo, pur rimanendo invisibili nella sua esplorazione statistica globale.

 21.1. La significatività di grandezze qualitative singole. La poesia “Arano” di Pascoli 

 Il metodo degli pseudotesti offre, come possiamo vedere, molte possibilità di studio del testo, sia accertando la significatività di tensioni generali, sia di tensioni localizzate. Dal punto di vista della teoria, un testo può perciò essere ritenuto anagrammatico quando è possibile dimostrare che alcune grandezze sono sicuramente significative, o nella generalità del testo, o in un suo tratto specifico. Ovviamente i testi significativi in molte grandezze offrono la garanzia migliore per confutare l’obiezione sulla casualità dei fenomeni anagrammatici: ma anche una sola grandezza può risultare, in molti casi, sufficientemente rappresentativa di una tensione non casuale. Ne mostro due esempi particolari, entrambi relativi a una delle grandezze qualitative più singolari rintracciabili in un testo, l’ordinamento verticale degli anagrammi. Consideriamo, infatti, questo breve testo di Pascoli:

 Al campo, dove raggio nel filare

qualche pampano brilla, e dalle fratte
 sembra la nebbia mattinal fumare,

 arano: a lente grida, uno le lente

 vacche spinge; altri semina; un ribatte
 le parche con sua marra paziente;

 ché il passero saputo in cor già gode,
 e il tutto spia dai rami irti del moro;
 e il pettirosso: nelle siepi s’ode

 il suo sottil tintinno come d’oro.

L’analisi statistica degli pseudotesti, fatti conservando il dispositivo delle rime, indica questi valori di significatività:

Caratteristica di questo testo è perciò l’assenza di significatività in tutte le grandezze, tranne per c e Ic, che valutano l’allineamento verticale degli anagrammi: delle due, il valore medio dell’allineamento è il più significativo. Poiché gli pseudotesti sono in rima, questi valori sono depurati dagli effetti del dispositivo formale, e riguardano il restante sistema lessematico: l’analisi statistica di questo testo indica perciò che tra le parole esistono effettive tensioni anagrammatiche, ma rilevabili solo nell’ordine verticale.

 L’analisi del testo, però, segnala anche un’altra significatività, nella grandezza A, ma di tipo inverso: essa interessa, con il suo valore molto basso (4.213), l’altro estremo della curva statistica, che diviene significativo sotto il 5%. Il testo originario è perciò caratterizzato anche da una rarefazione significativa della tensione anagrammatica A: gli anagrammi del testo originario possono essere ritenuti intenzionalmente piccoli; essi, inoltre, operano nell’interno delle parole, perché gli pseudotesti mostrano una maggior tensione sovrasegmentaria, che travalica quindi le parole ricombinate.

 Nel testo originario, possiamo dedurre, il poeta riduce al minimo la componente sovrasegmentaria, mentre istituisce, in compenso, un ordine privilegiato verticale nei piccoli anagrammi tra le parole. È quest’ordine particolare che viene messo in luce, nella ricombinazione lessematica degli pseudotesti, dalla grande significatività di C e Ic.

 Il processo evidenziato, eminentemente qualitativo, riguarda pertanto la combinazione strutturale di due tipi diversi di tensione, uno minimo e l’altro massimo, che caratterizzano questo testo in una specificità rispetto ad altri testi visti.

 21.2. Lo studio dell’allineamento verticale nella poesia “Bibe a Ponte all’asse” di Montale 

 Un esempio più semplice del precedente si ha in questo testo di Montale:

 Bibe, ospite lieve, la bruna tua reginetta di Saba
     mesce sorrisi e rufina di quattordici gradi.

 Si vede in basso rilucere la terra fra gli aceri radi
    e un bimbo curva la canna sul gomito della greve.

Osserviamone la statistica, ottenuta da pseudotesti in rima, per gli anagrammi da R>=2:

Nel testo sono significative le grandezze IE, c, Ic: gli anagrammi del testo sono quindi ordinati anch’essi lungo la verticale. Poiché, in questo caso, la tensione anagrammatica A non è bassa come nella precedente poesia, A e c determinano insieme il grande incremento della grandezza C. La non significatività dello spostamento b negli estremi dei versi non differenzia C e D (86.332, 85.435): una proiezione distale, invece, amplifica il valore di D nella grandezza E. Come possiamo vedere, in questo testo la grandezza della tensione A, bassa (34.233), viene trasformata dal sistema formale nella grandezza E, elevata (90.694): per questo motivo l’indice IE (96.589) è significativo.

 Il testo è dunque significativo nell’indice formale generale, ma elemento principale della formalizzazione anagrammatica è l’indice Ic, che permette di definire chiaramente questo testo come ordinato lungo gli allineamenti verticali. Il poeta controlla quest’ordine fino agli anagrammi di R=2, cioè al livello minimo della frammentazione combinatoria.

 Di questo ordine possiamo dimostrare anche in un altro modo la significatività provando a ricomporre diversamente il testo, per accertare se il tipo di versi adottato dal poeta è determinante per l’organizzazione dell’ordine verticale. Dividiamo in due, perciò, ogni verso, ottenendo questo nuovo dispositivo formale:

Bibe, ospite lieve, la bruna
    tua reginetta di Saba
    mesce sorrisi e rufina 
    di quattordici gradi.

Si vede in basso rilucere
    la terra fra gli aceri radi
    e un bimbo curva la canna 
    sul gomito della greve

Mettiamo ora a confronto la precedente statistica con la nuova:

Rimangono uguali i valori di N e A, ma decadono progressivamente B, C, D, E, e l’indice formale IE. Decade, soprattutto, la grande significatività di c e Ic, che definiscono il tipo di ordine anagrammatico del testo: esso, evidentemente, dipende dalla lunghezza dei versi adottata dal poeta, poiché la loro suddivisione destruttura il sistema anagrammatico degli allineamenti verticali. Il testo, dunque, è costruito intenzionalmente, anche se inconsapevolmente, in funzione di un ordine anagrammatico verticale vincolato al suo dispositivo formale.

 22. Lo studio dei flussi di linee

 Alcuni testi, infine, presentano fenomeni anagrammatici diversi da quelli fin qui trattati, e cioè tensioni organizzate non da anagrammi singoli, ma da concatenamenti di anagrammi, che originano flussi di linee di grande importanza formale e strutturale. Anche questo tipo di tensione, per la cui completa definizione teorica rinvio al libro, può essere studiato con gli pseudotesti, permettendo di definire altri processi anagrammatici, e di dimostrarne la significatività.

 Vediamo di questa tensione un solo esempio, riferito ad una poesia presentata nel libro, “La frangia dei capelli”:

La frangia dei capelli che ti vela
la fronte puerile, tu distrarla
con la mano non devi. Anch’essa parla
di te, sulla mia strada e tutto il cielo, 
la sola luce con le giade ch’ai 
accerchiate sul polso, nel tumulto
del sonno la cortina che gli indulti 
tuoi distendono, l’ala onde tu vai, 
trasmigratrice Artemide ed illesa,
tra le guerre dei nati-morti; e s’ora 
d’aeree lanugini s’infiora
quel fondo, a marezzarlo sei tu, scesa 
d’un balzo, e irrequieta la tua fronte 
si confonde con l’alba, la nasconde.

     La statistica di questo testo, fatta con pseudotesti liberi, dà questi valori:

 Si tratta perciò di un testo che, pur studiato con pseudotesti liberi, i quali favoriscono il dispositivo formale originario, non presenta alcuna significatività: l’indice di struttura formale IE tende anzi al limite inferiore.

 Se si esplora, però, il flusso di linee, si può constatare che un gran numero di esse giunge esattamente sull’ultimo carattere del testo. Alcune di queste, inoltre, hanno origine proprio dalla prima lettera, e quindi collegano con un flusso particolare l’inizio con la conclusione: entrambi questi aspetti formali del flusso appaiono intuitivamente rari, e soprattutto il secondo è rilevante dal punto di vista strutturale, potendo essere riferito a una tensione volta ad unificare in modo rapido il testo. Mostro una di queste linee, e i legami di concatenamento tra i vari anagrammi:

Per l’importanza intuitiva di questo tipo di linee, possiamo verificare se anche negli pseudotesti siano presenti flussi simili, allo scopo di accertarne l’effettiva significatività: lo studio può essere fatto con diversi tipi di concatenamento e di rango. Qui di seguito mostro gli istogrammi ottenuti dagli pseudotesti per il concatenamento=2 nel sistema di R>=3; il primo riguarda tutte le linee che confluiscono esattamente a fine testo:

                     

 Il secondo istogramma riguarda quelle linee che, in particolare, hanno anche origine dalla prima lettera:

                   

 In entrambi gli istogrammi il numero delle linee del testo originario è maggiore di quelle degli pseudotesti, e quindi statisticamente significativo.

 Flussi significativi di linee simili a questo, riscontrabili anche in altri testi (ad esempio nel sonetto “Il cigno” di Mallarmè, appaiono importanti perché suggeriscono, soprattutto nelle linee che hanno origine dal primo carattere e confluiscono sull’ultimo, il tipo di tensione più complesso che il poeta può portare a cooperazione nel testo poetico: una direttività anagrammatica che lega rapidamente l’inizio e la fine dell’enunciato, in modo da unificare subito l’organizzazione del testo. Questa direttività può, in effetti, venire evidenziata anche in altre forme strutturali, come nel caso di flussi aventi origine da nuclei posti nella fine del primo verso, nella posizione in cui operano tipicamente i nodi di densità.

 I processi formali e strutturali mantenuti dai flussi di linee sono anch’essi aspetti di tensioni articolatorie particolari del testo, non individuabili con le statistiche usuali riferite ai soli anagrammi, come si è appena visto per questa poesia. I processi qualitativi del testo poetico, per quanto descritto in queste pagine, sono perciò molto complessi, e si può supporre che quelli qui evidenziati non ne individuino che gli aspetti più riconoscibili: il loro studio appare fondamentale per la comprensione di strutture eminentemente qualitative, che implicano la non-casualità dell’anagramma in tipi di tensioni molto diverse da quelle attribuibili ai legami più semplici rintracciabili nella combinatoria delle lettere.

23. Lo studio statistico del testo lungo: la preparazione del dispositivo formale nel I  canto de “L’Inferno” di Dante.

 Gli esempi che ho mostrato riguardano testi brevi, dove ci si può attendere che con più facilità la mente del poeta possa attuare un controllo inconscio della tensione articolatoria. Ma anche nei testi lunghi è possibile dimostrare la presenza di tensioni quantitative e formali molto significative, ed in misura inaspettata. La lunghezza di questi testi è in un certo senso la garanzia migliore di una procedura volta a dimostrare la non casualità dei fenomeni combinatori, poiché essi vi si manifestano con un numero di anagrammi eccezionalmente grande: il controllo inconscio delle sequenze delle lettere diventa quindi ancora più evidente, interessando gli anagrammi di rango elevato, e tensioni sempre più sovrasegmentarie.

 La procedura di preparazione di questi testi, per adattarli all’analisi degli pseudotesti, può essere problematica, per evitare una sovravalutazione del testo originario. Come ho precisato nelle pagine precedenti, bisogna rispettare, unificandoli, i legami sintagmatici sostenuti da cesure ed elisioni tra articoli, preposizioni e parole; è necessario, inoltre, porre attenzione alla ripetizione di parole consecutive, che vanno anch’esse unificate in un unico sintagma; nei testi lunghi questa seconda correzione può risultare difficile, poiché le relazioni sintagmatiche di più parole sono poco avvertibili quando si ripetono a grande distanza nel testo.

 Ma, in particolare, le ripetizioni sintagmatiche possono contribuire nascostamente al dispositivo formale: esse, talvolta, sono nell’inizio del verso, nella posizione complementare del sistema delle rime. Questo tipo di ordine appare esteso, spesso, anche alla ripetizione, nella posizione iniziale del verso, di parole singole, che perciò possono contribuire anch’esse al dispositivo formale. Nello studio statistico del testo che utilizza gli pseudotesti dotati di sistema formale, non è sufficiente, pertanto, conservare solo il sistema delle rime, ma è necessario mantenere nella stessa posizione anche il sistema di ripetizioni: poiché esso raccoglie su di sé una parte degli anagrammi del testo, può influenzare infatti le grandezze B, C, D, b, c, Ib, Ic, tutte sensibili alla posizione dell’anagramma nell’inizio del verso, e al suo parallelismo verticale.

 Questa risulta, ad esempio, la preparazione del I Canto dell’Inferno; il dispositivo formale complessivo vi è segnato in maiuscolo:

nel mezzo del cammin di nostra VITA
mi ritrovai per una selva OSCURA
CHELA diritta via era SMARRITA.
ah quanto a dir qual era e cosa DURA
esta selva selvaggia e aspra e FORTE
CHE nel pensier rinnova la PAURA.
tanto e amara che poco e piu MORTE;
ma per trattar del ben chio vi TROVAI
diro de laltre cose chio vho SCORTE.
io non so ben ridir comio VENTRAI,
tantera pieno di sonno a quel PUNTO
CHELA verace via ABBANDONAI.
ma poi chio fui al pie dun colle GIUNTO,
la dove terminava quella VALLE
CHE mavea di paura il cor COMPUNTO
guardai in alto e vidi le sue SPALLE
vestite gia dei raggi del PIANETA
CHE mena dritto altrui per ogni CALLE.
ALLOR fu la paura un poco QUETA
che nel lago del cor mera DURATA
la notte chio passai con tanta PIETA.
e come quei che con lena AFFANNATA
uscito fuor del pelago alla RIVA,
SIVOLGE a lacqua perigliosa e GUATA,
cosi lanimo mio, che ancor FUGGIVA,
SIVOLSE a dietro a rimirar lo PASSO
CHE non lascio giammai persona VIVA.
poi chei posato un poco il corpo LASSO,
ripresi via per la piaggia DESERTA,
si che il pie fermo sempre era il piu BASSO.
ed ecco, quasi al cominciar de LERTA,
una lonza leggiera e presta MOLTO
CHE di pel maculato era COPERTA;
e non mi si partia dinanzi al VOLTO,
anzi impediva tanto il mio CAMMINO
CHIO fui per ritornar piu volte VOLTO.
tempo era dal principio del MATTINO,
e il sol montava in su con quelle STELLE
CHERAN con lui quando lamor DIVINO
mosse da prima quelle cose BELLE,
si che a bene sperar mera CAGIONE
di quella fera alla gaietta PELLE
lora del tempo e la dolce STAGIONE;
ma non si che paura non mi DESSE
la vista che mapparve dun LEONE.
QUESTI pareache contra me VENESSE
con la testalta e con rabbiosa FAME,
si che pareache laere ne TEMESSE.
e duna lupa, che di tutte BRAME
sembiava carca ne la sua MAGREZZA,
e molte genti fe’ gia viver GRAME.
QUESTA mi porse tanto di GRAVEZZA
con la paura che uscia di sua VISTA,
CHIO perdei la speranza de LALTEZZA.
e qual e quei che volentieri ACQUISTA
e giugne il tempo che perder lo FACE,
CHE in tutti i suoi pensier piange e SATTRISTA
tal mi fece la bestia senza PACE,
CHE venendomi incontro a poco a POCO
mi ripigneva la dove il sol TACE.
mentre chio rovinava in basso LOCO
dinanzi a gli occhi mi si fu OFFERTO
chi per lungo silenzio parea FIOCO.
QUANDIO vidi costui nel gran DISERTO
‘miserere di me’ gridai a LUI
‘qual che tu sii, od ombra o uomo CERTO’.
RISPOSEMI ‘non uomo, uomo gia FUI,
e li parenti miei furon LOMBARDI
e mantovani per patria AMBEDUI.
nacqui sub iulio, ancor che fosse TARDI,
e vissi a rom a sotto il buono AUGUSTO,
al tempo de li dei falsi e BUGIARDI.
poeta fui e cantai di quel GIUSTO
figliuol danchise che venne da TROIA
poi che il superbo ilion fu COMBUSTO.
ma tu perche ritorni a tanta NOIA?
perche non sali il dilettoso MONTE
CHE principio e cagion di tutta GIOIA?
‘or sei tu quel virgilio e quella FONTE
CHE spandi di parlar si largo FIUME?’
RISPOSI io lui con vergognosa FRONTE.
o de gli altri poeti onore e LUME,
vagliami il lungo studio e il grande AMORE
CHE mha fatto cercar lo tuo VOLUME.
TUSEI lo mio maestro el mio AUTORE;
TUSEI solo colui da cui io TOLSI
lo bello stile che mha fatto ONORE.
vedi la bestia per cui io mi VOLSI:
aiutami da lei, famoso SAGGIO,
CHELLA mi fa tremar le vene e i POLSI’.
‘a te convien tenere altro VIAGGIO’
RISPOSE poi che lagrimar mi VIDE,
‘se vuoi campar desto loco SELVAGGIO;
CHEQUELLA bestia per la qual tu GRIDE,
non lascia altrui passar per la sua VIA,
ma tanto limpedisce che LUCCIDE;
e ha natura si malvagia e RIA,
CHE mai non empie la bramosa VOGLIA,
e dopo il pasto ha piu fame che PRIA.
 molti sono gli animali a cui SAMMOGLIA,
e piu saranno ancora, in fin che il VELTRO
verra che la fara morir con DOGLIA.
QUESTI non cibera terra ne PELTRO,
ma sapienza, amore e VIRTUTE,
e sua nazion sara tra feltro e FELTRO.
di quellumile italia fia SALUTE
per cui mori la vergine CAMILLA,
eurialo e turno e niso, di FERUTE.
QUESTI la caccera per ogni VILLA
fin che lavra rimessa ne LINFERNO,
la onde invidia prima DIPARTILLA.
ondio per lo tuo me’ penso e DISCERNO
CHETUMI segui; ed io saro tua GUIDA
e trarrotti di qui per loco ETERNO,
ove udirai le disperate STRIDA,
vedrai gli antichi spiriti DOLENTI
CHELA seconda morte ciascun GRIDA;
e vederai color che son CONTENTI
nel foco, perche speran di VENIRE,
QUANDO che sia, a le beate GENTI.
a le qua’ poi se tu vorrai SALIRE,
anima fia a cio piu di me DEGNA:
con lei ti lascero nel mio PARTIRE;
CHEQUELLO imperador che lassu REGNA,
perchio fui ribellante a la sua LEGGE,
non vuol che in sua citta per me si VEGNA.
in tutte parti impera e quivi REGGE;
quivi e la sua citta e lalto SEGGIO:
o elice colui cui ivi ELEGGE’.
e io a lui ‘poeta io ti RICHIEGGIO
per quello dio che tu non CONOSCESTI,
a cio chio fugga questo male e PEGGIO,
CHETUMI meni la dovor DICESTI,
si chio veggia la porta di san PIETRO
e color cui tu fai cotanto MESTI’.
ALLOR si mosse ed io li tenni RETRO.

Si hanno, nell’inizio dei versi, molte ripetizioni di parole singole (che, allor, questi-questa, risposemi-risposi-rispose, ecc.), e molte ripetizioni di sintagmi (che la, si volge-si volse, tu sei, che tu mi, che quello-che quella, ecc.).

 Lo studio del Canto, fatto con gli pseudotesti liberi e con gli pseudotesti che conservano questo ampio dispositivo formale permette di definire le caratteristiche strutturali del testo:

     

Come si può subito osservare, il Canto è in ogni caso estremamente significativo per le due grandezze N e A. Le altre grandezze, B, C, D, E, sono maggiori nella statistica degli pseudotesti liberi, ma permangono comunque significative anche in quella degli pseudotesti con dispositivo formale: poiché la grandezza C rimane praticamente inalterata, ciò permette di affermare che il principale ordine del testo è la tensione anagrammatica del parallelismo verticale degli anagrammi; questo tipo di ordine formale può essere rilevato anche nel maggior valore di c e Ic in entrambe la statistiche rispetto ai valori di b e Ib. 

 24. La correzione della ridondanza: “La pioggia nel pineto”, di D’Annunzio.

 La preparazione del testo lungo può essere, in qualche caso, estremamente difficile, se si vuole garantire una depurazione il più possibile corretta degli errori dovuti alla ridondanza.

 Un esempio chiarificatore è rappresentato da “La pioggia nel pineto”, dove la frequente ripetizione di sintagmi, e i vincoli delle parole in rima, lasciano libera una parte così esigua del testo da rendere ardua la sua ricombinazione negli pseudotesti in cui si vuole conservare il dispositivo formale orginario (nel testo sono stati addirittura tolti i versi finali 116-128, ripetizione dei versi 20-32):


taci. sule SOGLIE

del bosco non ODO

PAROLE che DICI

umane ma ODO

PAROLE piu NUOVE

che parlano gocciole e FOGLIE
lontane.

ASCOLTAPIOVE

dalle nuvole SPARSE.
PIOVESULETAMERICI

salmastre ed ARSE,
PIOVESUIPINI

scagliosi ed IRTI
PIOVESUIMIRTI

DIVINI,

SUL E ginestre FULGENTI

di fiori ACCOLTI,

SUI ginepri FOLTI

di coccole AULENTI,
PIOVESUINOSTRIVOLTI

SILVANI,

PIOVESULE nostre MANI

IGNUDE,

SUINOSTRIVESTIMENTI

LEGGIERI,

SUI freschi PENSIERI

che lanima SCHIUDE

NOVELLA,

SULA favola BELLA

che IERI

tilluse, che oggi MILLUDE,

o ERMIONE.

odi? la pioggia CADE

SULASOLITARIA

VERDURA

con un crepitio che DURA

e varia NELLARIA

secondo le FRONDE

piu rade, men RADE.
ASCOLTARISPONDE

al pianto il canto

delle CICALE

che ilpianto AUSTRALE

non IMPAURA,

ne’ il ciel CINERINO.

e il PINO

ha un SUONOEILMIRTO
ALTROSUONOEIL ginepro

ALTRO ancora, STROMENTI

DIVERSI

sotto innumerevoli dita.

e IMMERSI

noi siam nello SPIRTO
SILVESTRE,

darborea vita VIVENTI;

e il tuo volto ebro

e’ molle di PIOGGIA

come una FOGLIA,

e le tue CHIOME

auliscono COME

le chiare GINESTRE,

o creatura TERRESTRE

che hai NOME

ERMIONE.

ASCOLTAASCOLTALACCORDO

delle aeree CICALE

APOCOAPOCO

PIUSORDO

si fa sotto ilpianto

CHE CRESCE;

MA UN CANTO VI SI MESCE

piu’ ROCO

che di laggiu’ SALE,

dallumida ombra REMOTA.

PIUSORDO e piu’ FIOCO

sal lenta, SISPEGNE.

sola una NOTA

ancora TREMASISPEGNE,

risorge, TREMASISPEGNE.

NONSODE voce del MARE.

ORSODE su tutta la FRONDA
CROSCIARE

largentea PIOGGIA

che MONDA,

il croscio che VARIA

secondo la FRONDA

piu’ folta, men FOLTA.

ASCOLTA.

LAFIGLIADELLARIA

e’ muta; ma LAFIGLIA

del limo LONTANA,

la RANA,

canta nellombra piu’ FONDA,
CHISADOVECHISADOVE!

e PIOVESULETUECIGLIA,

ERMIONE.

PIOVESULETUECIGLIA nere

si’ che par tu pianga

ma di piacere; non bianca

ma quasi fatta VIRENTE,

par da scorza tu ESCA.

e tutta la vita e’ in noi FRESCA
AULENTE,

il cuor nel petto e’ come PESCA
INTATTA,

tra le palpebre gli OCCHI

son come palle tra LERBE,

i denti negli ALVEOLI

son come mandorle ACERBE.

e andiam di FRATTAINFRATTA,

or congiunti or DISCIOLTI

(e il verde vigor RUDE

ci allaccia i MALLEOLI

cintrica i GINOCCHI).

 

 Ciononostante la statistica degli pseudotesti ottenuti mantenendo questo complesso sistema formale coglie ancora con grande evidenza l’influenza sovrasgmentaria dell’ordine lessicale originario:

Benché la grandezza N non sia significativa, sono significative A, B, C, D, E, i cui valori crescono gradualmente, permettendo di dimostrare l’organizzazione formale della tensione articolatoria anagrammatica.

 25. Caratteristiche di significatività nei testi lunghi: i Canti di Dante.

 L’analisi statistica dei testi lunghi, come si può vedere in questi due esempi, fornisce una dimostrazione molto evidente della realtà della tensione anagrammatica che può organizzare un testo poetico. Alcuni di questi fenomeni, in particolare, appaiono interpretabili con una certa sistematicità.

 Consideriamo, ad esempio, le statistiche, ottenute da pseudotesti con dispositivo formale, dei canti I, II, III, V, VI della Divina Commedia[11]:

I primi quattro canti sono tutti eccezionalmente significativi, in quasi tutte la grandezze: spicca, per contrasto, la non significatività del canto VI, tranne per la grandezza C, dell’ordinamento verticale. Un esame attento dei valori delle grandezze dei vari Canti permette di rilevare che proprio la grandezza C è in genere la più significativa: questo ordinamento preferenziale può essere colto confrontando i valori di Ic con quelli di Ib, sistematicamente inferiori. L’allineamento verticale appare perciò prioritario rispetto a quello dello spostamento agli estremi dei versi; il fenomeno appare intenzionale soprattutto se si osserva che i valori di Ib tendono anch’essi ad essere significativi, ma in senso opposto, cioè inferiori a 5%: questo doppio ordinamento è molto evidente nel II Canto, dove è massima la differenza tra il valore basso di Ib (1.059) e il valore alto di Ic (92.52). Queste osservazioni, pertanto, suggeriscono che un sistematico ordinamento anagrammatico di tipo verticale organizzi i Canti di Dante.

 Solo un esame completo delle tre Cantiche può, ovviamente, permettere di accertare con sicurezza questa ipotesi: ma se ne può vedere, intanto, un esempio particolarmente chiaro nel Canto III del Paradiso:

Le grandezze del Canto sono tutte estremamente significative: ma in particolare si può osservare il contrasto tra la grande significatività di Ic (99.975) e quella, invertita, di Ib (2.23).

 26. Lo studio della partizione del testo nei Canti di Dante.

 Insieme a queste considerazioni di ordine generale, lo studio di questi Canti permette di affrontare, anche se in modo provvisorio, il problema della unità strutturale anagrammatica del testo poetico lungo: ciò può essere fatto, ad esempio, studiando separatamente alcune parti del testo, per verificare se le tensioni anagrammatiche vi sono distribuite uniformemente. La tabella che segue riguarda il tipo di partizione più semplice, la divisione dei Canti in due metà, le cui due statistiche possono essere messe a confronto con quella del testo intero:

 In tutti Canti, come si può vedere, la tensione anagrammatica risulta distribuita in modo non uniforme, poiché le statistiche danno valori diversi nelle due metà, e non sempre significativi, come la seconda parte dei Canti I, II, III, VI, e la prima parte del Canto V. Inoltre la statistica dei Canti interi appare in genere più significativa di quella delle sue partizioni, come nei Canti I, II, III, V: fa eccezione solo il Canto VI, che è poco significativo per intero, e risulta invece più significativo nella prima metà.

 L’abbassarsi della significatività nelle due metà dei Canti I, II, III, V ha come spiegazione la scomparsa dei legami anagrammatici tra prima e seconda parte: essi, evidentemente, sono importanti, poiché contribuiscono alla maggior significatività unitaria del canto; questo semplice fenomeno segnala perciò come la tensione anagrammatica possa rendere coeso l’intero testo. Essa, però, può distribuirsi diversamente nelle sue parti: ad esempio nel Canto VI l’ordine verticale, determinante per la significatività della grandezza C, è concentrato nella prima parte, dove è massimo il valore di Ic (98.291).

 Lo studio accurato della tabella conferma il prevalere, in questi Canti, dell’ordine verticale, che anche nelle partizioni risulta maggiore dello spostamento in rima, come si può osservare nel confronto dei valori di Ic e Ib.

 27. L’importanza dell’ordine verticale anagrammatico in alcuni testi lunghi italiani e latini. 

 L’ordine verticale può essere osservato anche in altri testi lunghi, in cui con una certa evidenza assume un valore prioritario per la significatività delle grandezze di tipo qualitativo. Ecco, ad esempio, la statistica dei primi 50 versi de I Sepolcri:

Nell’inizio de I Sepolcri le grandezze N, A non sono significative: questo tratto di testo, dunque, non ha tensioni di tipo quantitativo. Neppure la grandezza B, però, ha rilievo: il testo comincia a diventare significativo con la grandezza C, e questo tipo di ordine dipende appunto dall’importanza preponderante di Ic (99.136).

 Lo studio dell’influenza di Ic è spesso chiarificatore di come è organizzata la tensione anagrammatica del testo. Consideriamo, ad esempio, della poesia “Falsetto” di Montale queste due statistiche (entrambe ottenute da pseudotesti con dispositivo formale), una per gli anagrammi di rango R>=4, l’altra per gli anagrammi di rango R>=5:

Il testo risulta significativo in quasi tutte le grandezze, e maggiormente nella statistica per R>=5: la tensione articolatoria è quindi più forte nei ranghi elevati, come attesta l’aumentata significatività di N. Ma, in particolare, si può osservare come nelle due statistiche il valore di Ib diminuisca (76.508, 40.654), mentre quello di Ic aumenta (80.107, 96.653): il testo, quindi, non solo ha una maggior tensione articolatoria nei ranghi superiori, ma è, in questi, maggiormente ordinato lungo la verticale.

 L’attenzione a questi processi, dunque, permette di cogliere meglio il tipo di ordine che può sottostare a testi poco dotati di tensioni anagrammatiche. Nell’inno sacro di Manzoni “Il Natale” risultano significativi solo c e Ic:

Più evidente ancora è la grande significatività di Ic nelle due ultime strofe della “Palinodia per Giovanni Capponi”, di Leopardi, che contrasta con i bassi valori delle altre grandezze:

 Il testo ha pochissima tensione articolatoria, e ciò si riflette nella non significatività di A, B, C, D, E: ma la netta contrapposizione tra il basso valore di Ib (0.396) e quello alto di Ic (99.749) permette di affermare che il testo è intenzionalmente ordinato negli allineamenti verticali.

 L’allineamento verticale risulta molto evidente in alcuni testi lunghi latini, insieme alla forte tensione articolatoria: mostro qui le statistiche di Attis, di Catullo, di due brani del “De rerum naturae” di Lucrezio, delle ecloghe I, VII, VIII di Virgilio e di un brano dell’Eneide:

Le significatività delle varie grandezze sono tutte molto elevate, soprattutto nell’ordinamento Ic. Nell’ecloga VII, “Melibeo”, questo grande ordinamento di Ic (99.991) e la grande tensione di A (99.827) cooperano all’elevatissimo valore di C (99.99999).

28. La cooperazione tra tipi diversi di tensione.

 Non sempre, naturalmente, è possibile individuare ordini così precisi. Presumibilmente in molti testi la cooperazione di vari tipi di tensione concorre a rendere specifica l’organizzazione anagrammatica. Ad esempio, ne “Le terme di Caracalla” di Carducci, sia Ib che Ic contribuiscono alla significatività di D e E: il testo è molto povero di anagrammi, essendo N assai basso (25.341), e solo gradualmente la tensione A si accresce in B e C, divenendo infine significativa in D e E, e segnalando nell’indice IE la grande formalizzazione del testo:

 Le tensioni quantitative e qualitative del testo lungo, per quanto si può osservare in queste analisi statistiche, possono essere dunque studiate in molti aspetti, anche se non sempre con l’evidenza di questi esempi. Una cooperazione complessa di controlli sovrasgmentali della sequenza articolatoria, capace di indurvi alcuni ordini preferenziali, può mantenere nel testo molti tipi di strutture anagrammatiche, di cui l’esplorazione statistica segnala le caratteristiche più evidenti. Ne mostro alcuni altri esempi nei seguenti testi: “L’inno ai Patriarchi”, “Alla primavera”, “Aspasia”, “Il sogno”, la I strofa de “Le ricordanze”, “A Silvia”, “La sera del dì di festa” (esplorato per R>=4, R>=5, R>=6, R>=7), di Leopardi; “La pentecoste”, “Il coro d’Ermengarda”, di Manzoni; “La sera fiesolana”, di D’Annunzio:

 Nei testi qui mostrati molte grandezze, con la loro elevata significatività, dimostrano l’importanza del controllo articolatorio nel testo lungo: ma, come è facile supporre, la diversità dei dispositivi formali dei vari testi non permette un confronto sempre adeguato tra queste statistiche. Lo studio del testo lungo, come quello del testo breve, è perciò solo indicativo di alcuni processi generali, che poi è necessario approfondire. I valori di queste grandezze anagrammatiche, così rari dal punto di vista statistico, indicano comunque che i fenomeni combinatori della lingua non possono essere ritenuti casuali in molti testi poetici, potendosene dimostrare, con grande accuratezza, la significatività.

 29. L’organizzazione precostituita della successione delle lettere della lingua. 

 A conclusione di questo scritto, che ha lo scopo di illustrare il tipo di procedura statistica e il criterio di studio degli pseudotesti, è importante mostrarne l’utilità per uno studio particolare del potenziale combinatorio della lingua, che travalica quello del testo poetico.

 Esso riguarda alcune caratteristiche combinatorie più generali del linguaggio che non è possibile cogliere intuitivamente, e cioè l’organizzazione precostituita, nel sistema lessicale della lingua, delle probabilità di successione delle singole lettere. Proprio con gli pseudotesti è possibile mostrare come esso sia importante, e come influenzi le statistiche utilizzate all’inizio di questo scritto, rendendole inaffidabili.

 Consideriamo, perciò,i fenomeni combinatori del testo da un punto di vista dapprima astratto, quello della probabilità teorica generale della ricorrenza del suo sistema di lettere, per dedurne poi quella che, all’atto pratico, il testo può manifestare con gli anagrammi.

 Nello studio teorico della potenzialità combinatoria di un testo si potrebbe, ad esempio, provare a prevedere dalla sola frequenza delle sue lettere il tipo di densità anagrammatica che ci si può attendere mediamente nel testo e, confrontala con quella reale, ottenerne subito la significatività.

 La sola frequenza delle singole lettere, però, non permette di predire in modo semplice la probabilità dei fenomeni combinatori, perché essi dipendono, appunto, da legami condizionali che interessano più lettere consecutive: questi legami sono le catene Markoviane di probabilità, che influenzano in modo determinante il formarsi degli anagrammi. L’importanza di questi legami condizionali può essere dimostrata con il metodo degli pseudotesti spezzando ordinatamente la catena sintagmatica di un testo in segmenti di una certa lunghezza, e ricombinandoli negli pseudotesti: quanto più i segmenti sono piccoli, tanto più le statistiche degli pseudotesti si impoveriscono di anagrammi, per l’attenuarsi dei legami naturali di probabilità che operano nelle sequenze di parole della lingua.

 Questo fenomeno risulta ben comprensibile quando si osservano le particolari successioni di lettere prodotte negli pseudotesti dal concatenarsi casuale di questi segmenti. Come possiamo constatare per i seguenti pseudotesti di “Alla luna” (qui trascritti come sequenze ininterrotte di lettere), al progressivo frantumarsi del testo si formano sequenze sempre più estranee alla lingua comune:


PSEUDOTESTO DI SEGM=8 LETT

brevehalalunaiomtedelmios

eancorcuellaselosoetremeorfaich
ioveniapsovraquevoltoappimaneb
uliendangoupendeviannodurilg
elannoulcigliohetristeulodalpia
ntochemirammentuciiltuodile
ttalallemieldoloreohneltempoigi
ovalaassatecoerarletarischiarsa
eramiaravaglioograziosstoc
ollezaeilnovcorlungoricord
anetuttalalrimembrariachetir
artietilcorsoicomegratlaspemee
tileomiaechelaffvitaedenvasiccom
sciaarimunaepurmisorgeasgiovani
lallorsuqamemoriaardellepoc
heorvoquandoanecangiasooccorre

PSEUDOTESTO DI SEGM=3 LETT

alaelmlunrchellsoecomleiq
ueemiaripieimirigelmulisttutsch
mirantosaodaordmegmiasealnoima
ovoeluaioeoraluogipurchememe
mindamemnaeorlcanaffavasicniaap
piaraeirarungpasendovaliolr
icorempai l iodrdestieorratsulci i
miganclleentgiaanzvolorisatleoa
ednebenebraeviammazimeefai

tal tedndohcoosoosaol aogret
aettquaglivracorioveraltoooc
ochtiesorreouloasetuprenltudil
nilalleecetrmiaodugeaetrolorictr
eaarncoeltecoannhelariochuqucig
verovengostoallvehlvavitann
specolscisoibrearlorsachlpiala

PSEUDOTESTO DI SEGM=5 LETT

iosalalameelmiohetriellas

ulosoiccomeiovequestuciilarisce
ndanirartdurilannotochencorchi
arimanebmiramgeasudenecmisor

l novetooccal unassaterarleetremp
arialtoapunaiovolgeigiovqua
ndalariuttalimembioallgoscimori
acordarlungstilefannoramiaelvas
niapiavaglulodadolorietupe
meebllepaiallovaniltuovoso
ilrilcoreltemrevehtatedrarde
angiarsuqumegralciglemielilett
oancocoseamentovitaeepurmcheorol
aspsteeciosaechetrendevomiadpog
ioocollograzsovraorreneorfa
icheteohcohelafnzaeiaarimlpian

PSEUDOTESTO DI SEGM=2 LETT

alehdercueosccleaqletanii
mrieloetretutomulvaulricoleseza
hiucioaihediltunchempiapamttan
enffchomieuoricoarrlepenpoul
oiilgicolmdeaseogrgeelpucollmeg
ieilgrsasleecananaralntosbr
lascteunmenozilaogtarmdoerorcci
gviaratchtiemretrrfetdoiitiners
cocoiaanasamlolnorasteeman
vrhetaamarciangoscanglalai
ppsaanuniolrorteiriaalalovbr
olanarvispiretdenoeeuqmiuendis
emrahesianiaococovooioaniastglev
isemodiltoecvoemraomltlereorloi
avoalvaveduimoaimgoioelsala
vaerupaerdquiolaebsoedarltlloh

PSEUDOTESTO DI SEGM=4 LETT

ehaltedecorcuellosoecalun
comolleaquemielrisciendirarduri
lgelalpihetrtalahiariramisoram
iaantozaeigratdiletecolnoveb
uloappltuoaiomorvopurmaniligioe
tutembrgeasangoamemunaecorl
giaslaffgliovasiniapchetimanlet
atietlaspllepdevigiovuciirsoiil
coempooriadoloardetileasel
comeulcivoltttaldoanassame
ntedenrdanannobrevseanecansa
ereorfvitalrimarimziosograungo
aichtremlmioneltreohsovrochequan
stoceraromiaemeeariaioveooccval
aalleglioorreulodupenchemis
tersuqallosciaechericoannorava

PSEUDOTESTO DI SEGM=1 LETT

lhlruoceqaunailnrahoscavr
aaaslcahleecemeaddafrciuaoinppt
oilgceetrgrenclngngretibsroeae
litnreosotelmmcidhaoitoettie
noeaeeaeeoeuosetoniamgicrrgarps
oscmsoiiaiaaigraautuamlanoc
itcvpaoinomroscvemeoaeolirtoqra
rivirrhlqlaeicmdgcdlauumorahtit
ovecuiecvioraiagpfrislslna
didgoldnpirrteoepaieiaoacn
eniaontnuielsvcnlaerlezgbemo
elfoelsmeammauusclanorhrovsarl
ueiravdoeslceneololeeloeaamitlod
rlamieeluiclestmzooanaevirlaopd
ihaatlrooulioanlallemepiaer
holstlsantmavotivuiimrrlbetoao

 Le statistiche ottenute, per le grandezze quantitative N e A, da questi pseudotesti non più lessicali, ma solo segmentari, mostrano chiaramente come la ricombinabilità anagrammatica diminuisca rapidamente all’incrementarsi della segmentazione: per questo motivo le grandezze del testo che non sono significative in una statistica di pseudotesti ordinari possono invece apparire significative in queste statistiche impoverite di anagrammi.

 Possiamo verificare questo effetto erroneo di valutazione per la grandezza A di “Alla luna”, il cui valore 166.1 cade molto all’interno della statistica dei dati A degli pseudotesti, che sono compresi tra il minimo 136.55 e il massimo 203.55: rispetto ad essi il valore A=166.1 risulta infatti non significativo.

 Nelle statistiche degli pseudotesti segmentari i valori minimi e massimi però diminuiscono progressivamente, come si può vedere nella seguente tabella, favorendo la valutazione statistica del valore originario A=166.1:

Il valore A=166.1 di Alla luna è già significativo nella statistica degli pseudotesti segmentari di 4 lettere, e in quelli inferiori supera ben presto il valore massimo delle rispettive statistiche, apparendo perciò sempre più significativo.

 Questo fenomeno dimostra con grande semplicità l’estrema sensibilità dell’anagramma al minimo mutamento della catena sequenziale, e come, pertanto, non sia possibile costruire nessuna statistica a partire dalle sole lettere del testo. La lingua dispone queste lettere in sequenze già aventi una loro probabilità specifica combinatoria, che è inerente al sistema lessematico. Queste sequenze, proprio perché connaturate alle sequenze reali delle lettere delle parole, rende attenti non solo alle loro frammentazioni abitrarie (corrette con i procedimenti visti), ma anche alle specificità del lessico del testo: i sistemi lessicali di testi diversi non sono confrontabili, perché ognuno di essi è costituito di sequenze già preorganizzate da quel lessico, che determinano la particolare statistica combinatoria di quel testo.

 L’estrema sensibilità dell’anagramma a queste preorganizzazioni di probabilità spiega dunque perché i procedimenti statistici mostrati all’inizio del lavoro non sono utizzabili: essi fanno riferimento a testi lessicalmente diversi, e quindi non confrontabili. Allo stesso modo, sistemi lessematici particolari, come quelli che un poeta adotta in genere per il proprio linguaggio, hanno potenzialità combinatorie altrettanto particolari, che a loro volta caratterizzano le statistiche dei rispettivi testi, non utilizzabili per quelli di altri poeti.

 Questi più specifici motivi, inerenti alla natura dei legami condizionali nella ricorrenza delle sequenze di lettere, spingono a ritenere gli pseudotesti l’unico strumento attendibile nello studio statistico del testo poetico, perché si serve solo del materiale lessematico originario. Similmente, lingue straniere hanno caratteristiche combinatorie specifiche, tra loro non confrontabili: ma per ciascuna di esse, e per ciascun poeta, la statistica degli pseudotesti offre garanzie simili a quelle viste in questo studio.

 La generalità del processo teorico d’analisi, e la possibilità di confronti immediati tra lingue diverse costituisce perciò il pregio degli pseudotesti, che ne giustifica in molti modi l’uso pratico.

30. Conclusioni

 Vorrei ora brevemente riassumere le conclusioni più importanti sulla natura teorica degli pseudotesti. Come spero di aver dimostrato, lo studio statistico condotto con il metodo degli pseudotesti permette molte possibilità d’analisi delle tensioni anagrammatiche, sia quantitative che qualitative: è a fondamento di questo tipo di studio la compenetrazione intenzionale, durante il processo ideativo del testo, delle sequenze di lettere degli anagrammi con le sequenze lessicali. La mente del poeta, secondo questa ipotesi, porta inconsciamente a cooperazione due articolazioni, quella sintattico-grammaticale delle parole, e quella anagrammatica del flusso continuo delle lettere

 La seconda articolazione opera un ritaglio sovrasegmentario nella prima, che travalica i confini tra le parole: questi confini, perciò, sono i punti suturati dalla tensione articolatoria intralinguistica, e dai quali dipende la continuità del flusso intenzionale. Le ricombinazioni di parole del testo disarticolano specificamente questi punti di sutura e, con essi, la struttura sovrasegmentaria che il poeta può avervi affidata inconsciamente. La natura teorica degli pseudotesti si fonda, pertanto, sulla convenienza a operare solo su questi punti, essendo essi la fonte della continuità sintagmatica dell’intero processo di controllo articolatorio secondario: da questo il poeta può ritagliare le specifiche sequenze ricombinate delle tensioni strutturali anagrammatiche.

 Come ho spiegato nel libro “La mente intralinguistica”, la funzione rimica del verso è l’aspetto manifesto del controllo articolatorio con cui il poeta tende a vincolare le parole in una sequenza interamente sovrasegmentaria: il ritmo sutura i punti di discontinuità del verso e del testo, e rende coeso il flusso articolatorio. Questo processo spiega, pertanto, l’aspetto appariscente, presente alla coscienza, della tensione articolatoria complessiva che concorre a determinare, nella mente del poeta, il controllo della continuità articolatoria: la funzione ritmica vincola alle tensioni sovrasegmentarie, ed è a sua volta vincolata dal controllo articolatorio inconscio anagrammatico.

 Dal punto di vista di questa teoria, però, il controllo ritmico non è il responsabile diretto della tensione anagrammatica, ma solo il vertice cosciente di un’attenzione inconsapevole alla cooperazione di tre processi contemporanei: l’articolazione sintattico-grammaticale della sequenza di parole, l’articolazione anagrammatica-combinatoria della sequenza di lettere, l’articolazione ritmica della sequenza di demarcatori acustici nel sistema testuale delle lettere.

 Per la teoria degli pseudotesti, pertanto, la non-grammaticalità dei testi ricombinati comporta necessariamente anche la non-ritmicità dei versi: i testi appaiono strani e bizzarri, ma i più adatti a verificare l’unità del processo generativo che può aver compenetrato, nell’articolazione sintattica e ritmica, anche quella anagrammatica. Lo studio degli pseudotesti, come ho ricordato all’inizio di questo scritto, è volto infatti a dimostrare che l’obiezione sulla natura casuale dell’anagramma può essere confutata: poiché essa è inerente al solo processo combinatorio della lingua, la non-grammaticalità o non-ritmicità non toccano i presupposti teorici del metodo, e permettono di concentrarsi sui soli aspetti strutturali e formali di natura combinatoria.

 L’importanza che si può assegnare a un metodo che dimostri oggettivamente la realtà dei fenomeni anagrammatici dipende da una teoria della lingua, e rinvio per questo punto al mio libro. L’anagramma, però, come si può comprendere intuitivamente, può mutare il modo di interpretazione usuale delle strutture operanti nel testo poetico, e per alcuni aspetti in modo radicale. In un certo senso, la teoria dell’anagramma comporta una grande responsabilità nel proporre una concettualizzazione del testo poetico diversa da quella conosciuta: la mente ordinaria, secondo questa teoria, non è consapevole della forza intenzionale con cui può ordinare in senso anagrammatico un testo e può quindi giustamente dubitare di una affermazione teorica che modifica la propria percezione consapevole della lingua.

 La teoria degli pseudotesti non può risolvere interamente questo dubbio, che ha una sua soluzione accettabile solo in una più ampia teoria della mente linguistica e delle forze inconsce che la sovradeterminano, argomento che ho discusso lungamente nel libro: può, però, offrire un modello di studio che, pur con i suoi limiti, permette di affrontare la natura specifica di questo dubbio, e di verificarne la validità e il significato.

I N D I C E

1. Problemi inerenti al metodo degli pseudotesti
2. La dimostrabilità delle tensioni anagrammatiche
3. Le grandezze anagrammatiche quantitative del testo: N e A
4. Un modello semplice di analisi statistica
5. Caratteristiche generali della statistica diriferimento
6. La valutazione statistica
7.1. Gli errori del metodo statistico: la ridondanza nei testi della statistica di riferimento
7.2. Gli errori del metodo statistico: la ridondanza poetica
8. Il problema teorico della depurazione della ridondanza
9. Problemi inerenti alle grandezze qualitative: B e C
10. La dipendenza di B e C dal dispositivo formale
11. Le altre grandezze qualitative: D, £, lE’ b, lb, C, lc.
12. Il sistema delle grandezze e il dispositivo formale
13. Lo pseudotesto: requisiti formali e possibilità di studio.
14. La natura teorica dello pseudotesto: la verifica dell’ordlne articolatorio sintagmatico.
15.1. La preparazione del testo: le depurazioni sintagmatiche.
15.2. La preparazione del testo: ricombinazione libera o con dispositivo formale.
16.Metodo d’analisi: statistica con pseudotesti liberi o con dispositivo formale
17. L’influenza strutturale anagrammatica del dispositivo formale. La significatività del sonetto di Dante.
18. La significatività del sonetto di Zanzotto.
19.1. Studio della significatività nella poesia Il fuoco.
19.2. Lo studio de Il fuoco al mutare del dispositivo formale.
20.1. Lo studio delle tensioni locali: il nucleo de Il fuoco.
20.2. Il nucleo della poesia di Ungaretti Nascita d’Aurora.
20.3. Lo studio del nucleo di “Noi non sappiamo”, di Montale.
21.1. La significatività di grandezze qualitative singole. La poesia “Arano” di Pascoli
21.2 Lo studio dell’alllneamento verticale nella poesia “Bibe a Ponte all ‘asse” di Montale
22. Lo studio dei flussi di linee.
23. Lo studio statistico del testo lungo: la preparazione del dispositivo formale nel I canto del l’Inferno, di Dante.
24. La correzione della ridondanza: la pioggia nel pineta,di D’Annunzio.
25. Carattenstiche di significatività nei testi lunghi:i Canti di Dante.
26. Lo studio della partizione del testo nei Canti di Dante.
27. L’importanza dell’ordine verticale anagrammatico in alcuni testi lunghi italiani e latini.
28. La cooperazione tra tipi diversi di tensione.
29. L’organizzazione precostituita della successione delle lettere e i problemi dell’analisi statistica anagrammatica.
30. Conclusioni


[1] Alcuni problemi inerenti a diverse depurazioni che possono semplificare, per motivi di studio, i dati raccolti, sono discussi nell’appendice al libro.
[2] Il calcolo è il seguente: 179*0.45 + 42*0.80 + 25*1.25 + 7*1.80 + 2*2.45 + 1*3.20= 166.1

[3] I parametri 1.65, 2.33, 3.1 valgono, come detto, per l’estremo destro della curva, nell’ipotesi di ricerca di significatività dei soli valori alti: quando la ricerca di significatività riguarda sia i valori alti che bassi, essi diventano rispettivamente 1.96, 2.58, 3.30, ecc. Poiché l’analisi statistica eseguita dal calcolatore fa riferimento all’estremo destro, per un confronto adeguato le curve delle pagine seguenti sono costruite con i dati di significatività del primo tipo

[4] Nell’ipotesi di simmetria, questi valori sono, più correttamente, 90% e 98%; valgono 95% e 99% nell’ipotesi di significatività dell’estremo destro, spiegata nella nota precedente

[5] Ogni sequenza di lettere di rango=R ha una probabilità p di anagrammarsi che dipende dal numero di sequenze dello stesso rango presenti nel testo, numero che è proporzionale a L: se perciò la lunghezza del testo diviene nL, la probabilità di ricorrenza di quella sequenza diviene np. Ma in un testo lungo nL vi è, a sua volta, un numero n volte maggiore di sequenze di rango R. Il numero di anagrammi di rango R di un testo lungo nL è perciò nnp, cioè n2p. La probabilità p è specifica di ogni lingua: questo problema è discusso in dettaglio nel paragrafo 29

[6]Non è opportuno eliminare questo tipo di ridondanza, poiché in poesia essa spesso ha un’importanza strutturale.

[7] Il valore di C è inferiore nella statistica degli pseudotesti liberi: questo effetto, invertito rispetto a quanto osservato nei sonetti di Dante e Zanzotto, è prodotto dal non allineamento delle rime lungo la verticale, che sfavorisce il valore C del testo originario nella statistica degli pseudotesti liberi.

[8] Essa segnala che il dato originario ha la probabilità di venire superato in un caso su 50.000

 

[9] Esse corrispondono alle distribuzioni di Poisson
[10] Anche questa statistiche corrispondono alle distribuzioni di Poisson
[11] Il canto IV, lungo circa 4200 lettere, non può essere esaminato per intero dall’attuale programma di calcolo, il cui limite è di 4016 caratteri.