Dati ed analisi sulla morfologia flessionale nell’italiano parlato PDF Stampa E-mail

 

Sabine E. Koesters Gensini
Massimo Aureli

 

La morfologia flessionale nell’italiano parlato: tentativo di un’analisi globale
(file Morfologia flessionale italiano parlato.pdf)

di Sabine E. Koesters Gensini

Si tratta di un’analisi morfologica delle trascrizioni fonetiche di tre testi tratti dalla sezione italiana del corpus C-Oral-Rom, presentate più avanti e scaricabili (cartella trascrizioni fonetiche C-Oral-Rom).
Il lavoro di cui in quel che segue si presentano i risultati si inserisce in un percorso d’indagine entro cui mi muovo ormai da diverso tempo sul componente morfologico nel parlato spontaneo. In studi precedenti è stato mostrato come, in generale, le riduzioni foniche del segnale linguistico tipiche del parlato spontaneo non vengano bloccate dal fatto che la porzione interessata dalla riduzione contenga informazione morfologica. Concretamente, sulla base di diverse analisi di corpora di parlato semi-spontaneo, da un lato si è calcolata l’incidenza statistica delle riduzioni fonico-morfologiche rispetto all’insieme dei morfi presenti nel corpus e, dall’altro, si sono avviate alcune analisi relative ad una possibile connessione tra la riduzione fonico-morfologica e la ridondanza. A questo proposito ci si è chiesti se il tasso della riduzione dell’informazione morfologica sia direttamente correlato con il grado di ridondanza dell’informazione veicolata dal segmento e se, di conseguenza, sia lecito vedere nella riduzione fonico-morfologica un fenomeno che sottosta a parametri fissi oppure se si tratti piuttosto della manifestazione concreta di un carattere intrinsecamente indeterminato del significante nel parlato storico-naturale.

La presente ricerca continua e approfondisce il problema sopra delineato secondo linee diverse ma convergenti:
1. dal punto di vista diafasico: si analizza un tipo di parlato spontaneo, non elicitato;
2. dal punto di vista diatopico: si esamina materiale prevalentemente fiorentino, non romano come in precedenza;
3. dal punto di vista morfosintattico: il tasso di riduzione dell’informazione viene messo in relazione con la composizione interna del sintagma nominale (d’ora in avanti SN);
4. dal punto di vista strettamente morfologico: si distingue tra l’informazione relativa al numero e al genere;
5. dal punto di vista testuale: si indaga l’ambito testuale all’interno del quale è possibile sciogliere l’ambiguità morfologica causata dalla riduzione fonico-morfologica, distinguendo gli ambiti dell’unità tonale, dell’enunciato, del turno (precedente e successivo).

Trascrizioni fonetiche

(cartella Trascrizioni fonetiche C-Oral-Rom.zip).

a cura di Massimo Aureli

È stato selezionato materiale che fornisse una significativa base per un'analisi dei fenomeni di riduzione fonico-morfologica (per cui si veda La morfologia flessionale nell’italiano parlato), a tal fine si è scelto cercato un corpus che avesse due caratteristiche innanzitutto: a) ampia varietà di testi e, in modo particolare, presenza di testi di parlato spontaneo (non elicitato) sufficientemente differenziati tra loro quanto a grado di formalità; b) segnale acustico di livello sufficiente a condurre una trascrizione fonetica.

Corpus di origine

In base ai due criteri esplicitati è stata scelta la sezione italiana del corpus C-ORAL-ROM (Cresti, E. – Moneglia, M. (a cura di), C-ORAL-ROM. Integrated Reference Corpora for Spoken Romance Languages, Benjamins, Amsterdam, 2005) in cui si hanno testi per circa 300.000 parole grafiche e circa 30 ore di registrazione.
Il corpus presenta un'ampia varietà di tipologie testuali: all'interno di una prima differenziazione tra testi informali (informal), formali (formal) e telefonici (telephone) si incontrano numerose sottosezioni: a) la sezione informal è suddivisa innanzitutto in base al contesto di realizzazione del testo (public, family/private) e, all'interno di questa suddivisione raccoglie i testi in base al tipo di interazione tra i parlanti (conversation, dialogue, monologue); b) la sezione formal è articolata in una sottosezione di testi trasmessi (media) e in una di testi realizzati in vari tipi di contesti situazionali (natural context), questi ultimi poi sono ulteriormente suddivisi in base al tipo di interazione (conversation, dialogue, monologue); c) nella sezione di parlato telefonico, infine, sono presenti da un lato comuni dialoghi telefonici, dall'altro registrazioni di interazioni uomo-macchina.
Per quanto riguarda il segnale audio, le registrazioni che compongono il corpus - soprattutto nella sezione informale - sono state realizzate in situazioni molto differenziate, tuttavia molto raramente in ambiente insonorizzato e con microfoni direzionali; del resto il carattere di spontaneità che si richiedeva ai testi da selezionare presupponeva che in essi fosse limitata il più possibile la consapevolezza dei parlanti di essere oggetto di una registrazione.

Materiale selezionato

Per la presente ricerca sono stati presi in considerazione i testi appartenenti alla sezione informal, e si è cercato di selezionarne alcuni in modo da mantenere la varietà dei contesti e delle interazioni comunicative. Tra i testi così selezionati sono stati scelti alcuni per cui l'audio presentasse la minore quantità di disturbi e quelli nei quali – visto che si tratta di registrazioni senza microfoni direzionali e su un solo canale audio - non ci fosse un numero eccessivo di sovrapposizioni.
I testi individuati in base a tali criteri sono tre:uno realizzato in contesto pubblico (una conversazione) gli altri due in ambito familiare/privato (una conversazione e un dialogo). Nel dettaglio si tratta dei testi identificati nel corpus dalle sigle ipubcv04 (1.548 parole grafiche per 9 minuti e 44 secondi), ifamcv16 (1.579 parole grafiche per 8 minuti e 53 secondi) e ifamdl14 (1.540 parole grafiche per 7 minuti e 12 secondi). Si tratta in totale di 4.667 parole grafiche corrispondenti a 25 minuti e 49 secondi.

Criteri della trascrizione

Si è proceduto alla trascrizione fonetica del materiale, materiale che nel corpus è presentato in trascrizione ortografica e in un sistema di allineamento testo-suono che ha come unità di riferimento l'enunciato. Date le caratteristiche dell'audio non è stato possibile realizzare una trascrizione fonetica che si basasse sull'analisi dello spettro, si è trattato dunque di una trascrizione basata sull'analisi uditiva delle registrazioni, mentre l'osservazione dello spettro ha potuto fornire un sostegno significativo solo in casi limitati.
Dal momento che doveva fornire la base per un'analisi della presenza di riduzioni fonico-morfologiche, si è scelto di realizzare una trascrizione in cui venissero registrati i fenomeni di cancellazione e segnalate le effettive realizzazioni delle porzioni vocaliche; mentre non sono stati presi in considerazione altri fenomeni fortemente legati alla provenienza (prevalentemente toscana) dei parlanti.