Corpus PENELOPE
| SpIt-MDb (Spoken Italian - Multilevel Database)
Contiene un corpus campione di dialoghi annotati a più livelli e relative etichettature TIMIT ed XML, più un database in XML usufruibile tramite AG-SpIt.. | Corpus PraTiD
Corpus di dialoghi task oriented (Test delle differenze), etichettati secondo uno schema di annotazione pragmatica (PraTiD) appositamente realizzato. | Corpus bilanciato consultabile LABLITA
Corpus di parlato raccolto a Firenze nel 1965. | Selezione dal "Corpus di parlato telegiornalistico. Anni Sessanta vs. 2005"
Questa selezione è tratta dal corpus di registrazioni dei telegiornali RAI degli anni ’60 e del telegiornale fittizio registrato nel 2005, ed è corredata di trascrizioni ortografiche su base acustica e di una prima elaborazione dei dati, per un confronto tra il parlato degli anni ’60 e quello odierno. | Corpus AN.ANA.S. 3
Testi di parlato radiotelevisivo, tratti dal corpus CLIPS, e di scritto non d’autore, tratti dal Corpus Penelope, annotati sintatticamente con AN.ANA.S. 3. | Lessico e sintassi (leggibilità del linguaggio politico-parlamentare)
Corpus di TESTI del Senato della Repubblica della XIV e XV legislatura. Con la formula Èulogos-CENSOR, che utilizza l’indice di leggibilità Gulpease (Lucisano-Piemontese, 1988) e il Vocabolario di base della lingua italiana (De Mauro, 1980¹-2004¹²), è stata condotta l’analisi della leggibilità dei testi che compongono il corpus. | Corpus AVIP-API
Il corpus qui pubblicato è copia del DVD “API – Archivio del Parlato Italiano” a cura di Claudia Crocco, Renata Savy, Francesco Cutugno, distribuito dal CIRASS (ora esaurito). | Corpus LIPS
Il corpus LIPS contiene trascrizioni di italiano L2 parlato | Corpus CLIPS
I dati del corpus sono interamente scaricabili all'indirizzo www.clips.unina.it
Si fornisce qui una breve descrizione della composizione del corpus | Corpus PraTiD nelle lingue europee
Si ringrazia Mikaela Cordisco, Beatrice Wilke, Gisella Maiello e Filipa
Andreia Matos Martins per l'aiuto e la collaborazione che hanno
prestato in fase di raccolta e registrazione del corpus.
| Corpus Italiano scritto L2
|
|