Modelli e sistemi di annotazione prosodica di un corpus di parlato PDF Print E-mail
There are no translations available.

 

Renata Savy

Claudia Crocco 
Leandro D'Anna 
Barbara Gili Fivela 
Massimo Petrillo 
Carmela Napoletano

 


Descrizione

Il progetto di ricerca (finanziato dall'Ateneo salernitano) è stato diretto da Renata Savy (Dipartimento di Studi Linguistici e Letterari) con la collaborazione del Gruppo NLP del Dipartimento di Scienze Fisiche dell'Università di Napoli "Federico II".

Il progetto è nato dalla necessità di studiare e mettere a punto metodologie specifiche per una annotazione integrata del piano prosodico di un corpus
Allo stato attuale, infatti, nonostante le numerose soluzioni adottate nei vari progetti nazionali ed internazionali, non esiste un sistema di annotazione completamente standardizzato né tantomeno un corpus sufficientemente ampio codificato a livello intonativo-melodico e ritmico. Sul piano teorico descrittivo, al contrario, abbondano gli studi e le proposte più disparate per la rappresentazione dell'intonazione (si veda per esempio Hirst&Di Cristo [eds], 1998, Intonation Systems. A Survey of Twenty Languages, Cambridge, Cambridge University Press), non sempre adeguate al trattamento interlinguistico e frequentemente non supportate da un confronto puntuale con il dato reale offerto dalla lingua parlata in tutte le sue forme.

La ricerca si è svolta su due versanti, uno più "operativo", l'altro speculativo.
Sul piano operativo, a partire dal corpus Clips, è stato selezionato un campione di 3 dialoghi e vario materiale di parlato letto e radiotelevisivo, appartenente a 3 diverse varietà diatopiche (Roma, Napoli e Palermo).
Su questo campione sono state effettuate etichettature del piano ACCENTUALE e TONALE tramite:

a) individuazione dei confini di unità intonative maggiori (TU);
b) determinazione dei gradi di prominenza ritmica e melodica (ACC);
c) descrizione fonetica della curva tonale secondo il modello IntSint (INT);

Collateralmente sono stati messi a punto strumenti software e algoritmi per l'Annotazione Prosodica Automatica (APA) che si avvalgono dei risultati metodologici e dei risvolti applicativi dei modelli teorici di annotazione.

E' stata effettuata, inoltre, l'etichettatura SILLABICA di un campione significativo di materiali, stratificato in diafasia (parlato letto e dialogico-spontaneo) e diamesia (parlato radiotelevisivo). Questa parte del lavoro ha richiesto un'ulteriore attività di riflessione teorica e di definizione di specifiche norme di segmentazione e codifica, basate sui correnti modelli fonologici di sillabificazione (applicati alla lingua italiana) e, contemporaneamente, sulla necessità di tener conto della sostanza fonetica degli enunciati reali e dell'etichettatura segmentale precedentemente effettuata. L'etichettatura sillabica manuale, oltre a costituire un livello di annotazione necessario e indispensabile come trait d'union tra il piano segmentale e soprasegmentale, ha anche la funzione di testare e validare gli algoritmi di segmentazione sillabica automatica, basati sull'analisi del pattern energetico del segnale.

Il materiale etichettato è confluito quasi interamente nel progetto "Parlaritaliano"; ha costituito, infatti, la base per la preparazione del corpus SpIt-MDb (corpus di annotazioni multilivello). Nella sezione DATI sono invece disponibili le etichettature sillabiche in formato TIMIT non comprese in SpIt-MDb.

L'intento di un confronto puntuale tra i diversi schemi di annotazione e dell'eventuale integrazione degli stessi in un unico modello di rappresentazione ha poi condotto all'organizzazione di un simposio (curato da Renata Savy, Claudia Crocco e Barbara Gili Fivela) all'interno del II Convegno Nazionale dell'AISV. La Tavola Rotonda sul tema "Modelli di analisi e sistemi di annotazione prosodica a confronto" ha visto la partecipazione di studiosi italiani e stranieri esperti nel settore. I relatori Mariapaola d'Imperio, Daniel Hirst e Philippe Martin, sono stati volutamente scelti quali rappresentanti di diverse "scuole prosodiche" e invitati a discutere alcune questioni di fondamentale importanza per qualsiasi analisi prosodico-intonativa:

1. la decisione sul livello di pertinenza (fonetico o fonologico) di un fenomeno prosodico;
2. l'esplicitazione dei criteri di introduzione di categorie fonologiche nell'analisi contrastiva;
3. la scelta e/o l'adeguatezza del tipo di campione soggetto all'analisi;
4. il rapporto tra variazione fonetica, fenomeni pragmatici o paralinguistici e rappresentazione.

La discussione sul tema, a seguito degli interventi, ha messo esplicitamente in evidenza l'esigenza di un più facile confronto tra le diverse analisi dei fenomeni prosodico-intonativi.

La sezione degli Atti del Convegno, curati da Renata Savy e Claudia Crocco, dedicata alla Tavola Rotonda contiene i contributi completi dei relatori e dei partecipanti alla discussione.

Gli Atti del convegno, realizzati con la collaborazione dell'AISV (Associazione Italiana di Scienze della Voce) sono disponibili sul sito alla sezione DATI.

Bibliografia

R.Savy, C. Crocco, 2006, Analisi prosodica: teorie, modelli e sistemi di annotazione, Atti del II convegno nazionale AISV, Salerno, 30 novembre-2 dicembre 2005, Padova, EDK Editore.

R. Giordano, R. Savy, 2003, "The intonation of instruct and explain in neapolitan italian" 15th International Congress of Phonetic Sciences (3-9 august 2003) pp. 603-606 in M.J. Solé, D. Recasens & J. Romero (eds). pubblicazione in CDRom

C. Crocco, in stampa, 'Phonetic aspects of a non-final prosodic contour in Neapolitan and Pisa Italian', presentato al Septième Rencontre du Réseau de Phonologie Français, 2-5/6 2005, Aix-en-Provence (Francia).

C. Crocco, 2006, Prosodic and informational aspects of polar questions in Neapolitan Italian, Speech Prosody 2006, 2-6/5 2006 Dresda, Germania.

C. Crocco, 2004, Analisi prosodica dei profili sospensivi, in De Dominicis A., Mori L., Stefani M. (a cura di), Costituzione, gestione e restauro di corpora vocali, Atti delle XIV Giornate del GFS, Viterbo 4-6 dicembre 2003, Roma, Esagrafica, pp. 221- 226.

L. D'Anna, M. Petrillo, 2004, Sistemi automatici per la segmentazione in unità tonali, in De Dominicis A., Mori L., Stefani M. (a c. di), Costituzione, gestione e restauro di corpora vocali, Atti delle XIV Giornate del GFS, Viterbo 4-6 dicembre 2003, Roma, Esagrafica, pp. 285- 290.

M. Petrillo, 2004, 'An algorithmic approach to speech processing: an example from syllable segmentation', paper submitted to ACM Transaction on speech and language processing.
di parlato, al fine di poter disporre di un'ampia base di dati sulla quale operare analisi quantitative e verificare l'adeguatezza dei modelli teorico-descrittivi a render conto delle manifestazioni reali del parlato.