Corpora

Attraverso questa pagina è possibile scaricare le risorse per lo studio del parlato curate e messe a disposizione dai partecipanti al progetto. I materiali sono corredati della documentazione eventualmente necessaria alla consultazione e all’uso.
Si possono effettuare ricerche per “Titolo”, riempiendo il campo liberamente.


Cerca
Titolo

inizia per                 



Corpus PENELOPE



SpIt-MDb (Spoken Italian - Multilevel Database)


Contiene un corpus campione di dialoghi annotati a più livelli e relative etichettature TIMIT ed XML, più un database in XML usufruibile tramite AG-SpIt..

Corpus PraTiD


Corpus di dialoghi task oriented (Test delle differenze), etichettati secondo uno schema di annotazione pragmatica (PraTiD) appositamente realizzato.

Corpus bilanciato consultabile LABLITA


Corpus di parlato raccolto a Firenze nel 1965.

Selezione dal "Corpus di parlato telegiornalistico. Anni Sessanta vs. 2005"


Questa selezione è tratta dal corpus di registrazioni dei telegiornali RAI degli anni ’60 e del telegiornale fittizio registrato nel 2005, ed è corredata di trascrizioni ortografiche su base acustica e di una prima elaborazione dei dati, per un confronto tra il parlato degli anni ’60 e quello odierno.

Corpus AN.ANA.S. 3


Testi di parlato radiotelevisivo, tratti dal corpus CLIPS, e di scritto non d’autore, tratti dal Corpus Penelope, annotati sintatticamente con AN.ANA.S. 3.

Lessico e sintassi (leggibilità del linguaggio politico-parlamentare)


Corpus di TESTI del Senato della Repubblica della XIV e XV legislatura. Con la formula Èulogos-CENSOR, che utilizza l’indice di leggibilità Gulpease (Lucisano-Piemontese, 1988) e il Vocabolario di base della lingua italiana (De Mauro, 1980¹-2004¹²), è stata condotta l’analisi della leggibilità dei testi che compongono il corpus.

Corpus AVIP-API


Il corpus qui pubblicato è copia del DVD “API – Archivio del Parlato Italiano” a cura di Claudia Crocco, Renata Savy, Francesco Cutugno, distribuito dal CIRASS (ora esaurito).

Corpus LIPS


Il corpus LIPS contiene trascrizioni di italiano L2 parlato

Corpus CLIPS


I dati del corpus sono interamente scaricabili all'indirizzo www.clips.unina.it Si fornisce qui una breve descrizione della composizione del corpus

Corpus PraTiD nelle lingue europee


Si ringrazia Mikaela Cordisco, Beatrice Wilke, Gisella Maiello e Filipa Andreia Matos Martins per l'aiuto e la collaborazione che hanno prestato in fase di raccolta e registrazione del corpus.

Corpus Italiano scritto L2