Archivi dell'Italiano Orale PDF Print E-mail
There are no translations available.

 

Emanuela Cresti

 

Descrizione

Il progetto prevede la realizzazione di banche dati elettroniche di lingua orale italiana, sulla base di attività condotte da docenti e ricercatori afferenti al Dipartimento di Italianistica e al Dipartimento di Linguistica dell'Università di Firenze. Tali ricerche, con specifico riguardo al settore orale, di cui identificano rispettivamente il livello spontaneo e il livello trasmesso della comunicazione, s'inseriscono in un ambito di studio relativo all'italiano contemporaneo.
Finalità primaria del progetto strategico è la digitalizzazione e la realizzazione di formati multimediale (in associazione testo/suono) per la pubblicazione di selezioni significative dei corpora di lingua orale spontanea e radiofonica. Le basi di dati (circa 300 ore il corpus parlato; circa 150 ore il corpus radiofonico) erano già esistenti e raccolte in archivi magnetici conservati presso il Dipartimento di Italianistica.
Il progetto è articolato in due sottoprogetti, accomunati dall'accesso a strumentazioni e metodologie comuni:
A - Intonazione e corpus multimediale dell'italiano parlato
B - Lessico e corpus multimediale dell'italiano radiofonico

La parte dedicata allo spontaneo ha coinvolto:

Emanuela Cresti - LABLITA, Dipartimento di Italianistica, Università di Firenze

Massimo Moneglia - LABLITA, Dipartimento di Italianistica, Università di Firenze

Danilo Romei -Dipartimento di Medioevo e Rinascimento, Università di Firenze

Antonietta Scarano - Dipartimento di Linguistica, Università di Firenze

Philippe Martin - Dipartimento di Francese, Università di Toronto

Carla Bazzanella - Dipartimento di Ermeneutica, Università di Torino

La parte dedicata al trasmesso (anche finanziata con progetti MURST) è stata diretta da Nicoletta Maraschio e ha coinvolto molti ricercatori di diverse università:

Massimo Fanfani - Dipartimento di Italianistica, Università di Firenze

Patrizia Bellucci - Dipartimento di Linguistica, Università di Firenze

Monica Pratesi - Dipartimento di Statistica, Università di Firenze

Stefania Stefanelli - Scuola Normale Superiore di Pisa

Cinzia Avesani - CNR di Padova

Anna Antonini - Scuola Normale Superiore di Pisa

Enrico Paradisi - Scuola Normale Superiore di Pisa

Mario Vayra - Scuola Normale Superiore di Pisa

Umberto Parrini - Scuola Normale Superiore di Pisa

Eugenio Picchi - CNR di Pisa

Gabriella Alfieri - Dipartimento di Italianistica, Università di Catania

Il sottoprogetto A. prevede la realizzazione di un corpus di riferimento di italiano parlato, a partire dal corpus già conservato e analizzato presso LABLITA secondo tecnologie avanzate di archiviazione elettronica (formato CHAT) e di analisi acustica (Winpitch). Il corpus è stato implementato con circa 50 ore di parlato adulto più 7 ore (15 registrazioni ) di parlato infantile (23-36 mesi). L'audio dell'intero corpus del parlato spontaneo di LABLITA è stato digitalizzato.
Il progetto prevede la pubblicazione di una selezione di testi in una versione multimediale, con associazione di:
1) trascrizione codificata dei testi orali;
2) segnale sonoro;
3) analisi dei principali parametri acustici (frequenza fondamentale, durata, intensità e spettro).
La selezione è finalizzata a raccogliere esempi di due diverse tipologie: a) una campionatura molto variata per tipologia comunicativa e di uso, ma che al tempo stesso presenti caratteristiche costanti di non programmazione; b) una campionatura che comprenda esempi non spontanei (cinema, televisione, linguaggio pubblico), o finalizzati ad usi particolari (parlato adulto-bambino) allo scopo di evidenziare meglio la specificità del parlato spontaneo.
Il corpus è stato pubblicato in cartaceo ed in elettronico per un campionamento nell'opera:

Cresti, E. (2000), Corpus di italiano Parlato. Vol I, Introduzione, pp. 282; Vol II, Campioni, pp. 389; CD-ROM multimediale. Accademia della Crusca: Firenze.

Il sottoprogetto B. prevede la costituzione del corpus LIR (Lessici dell'Italiano Radiofonico). Esso consta di circa 150 ore di registrazioni di trasmissioni radiofoniche di alta qualità acustica (fornite direttamente da una serie di emittenti selezionate per la costituzione del corpus). Il corpus è stato costituito sia da campioni tratti dall'emittenza pubblica (distinta in Radio1 Radio2 e Radio3) e da campioni tratti da emittenti private che abbiano diffusione nazionale, distinte a loro volta in Radio di flusso (musicali) e Radio di palinsesto (non musicali). La scelta delle emittenti private è fondata sia sui dati dell'ascolto per le radio di flusso (Radio DJ, Radio 105, RTL, Radio Kiss Kiss) sia sulla rappresentatività politico-culturale per le radio a palinsesto (Radio radicale, Radio Vaticana, Italia Radio).
Di queste ore è stato effettuato un campionamento, statisticamente significativo, che ha ridotto la base dati destinata alla pubblicazione e alla formazione di un lessico di frequenza del parlato radiofonico a circa un terzo (cinquanta ore di trasmissioni corrispondenti a circa 500.000 occorrenze). Le registrazioni sono state interamente trascritte ed è stata effettuata la sincronizzazione voce-parola.

Pubblicazioni e prodotti del progetto:
CRESTI, E. (2000), Corpus di italiano Parlato. Vol I, Introduzione, pp. 282; Vol II, Campioni, pp. 389; CD-ROM multimediale. Accademia della Crusca: Firenze. MARASCHIO, N. et alii (in preparazione), LIR: Lessici di frequenza dell'italiano radiofonico.