Quaderni di Parlaritaliano

LOGIN

Tags Cloud

ANANAS: annotazione e analisi sintattica PDF Print E-mail
There are no translations available.

 

Miriam Voghera

Francesco Cutugno

Giusy Turco

Renata Savy

Annamaria Landolfi

Carmela Sammarco

 

Descrizione

AN.ANA.S (Annotazione e analisi sintattica) è un sistema di etichettatura sintattica, originariamente pensato e creato per l’analisi del parlato, ma realizzato in modo tale da consentire l'analisi di qualunque tipo di testo, anche scritto.

Principali caratteristiche di AN.ANA.S:

1) può essere applicato all’analisi di testi parlati e scritti;

2) può essere applicato all’annotazione di testi di lingue diverse perché non ha etichette specificamente legate ad una lingua;

3) usa un’annotazione sintattica text- e time-aligned;

4) può essere applicato su testi parlati non depurati dai tipici fenomeni del parlato, quali disfluenze, ripetizioni, cambi di progetto ecc.;

5) in caso di annotazione dei dialoghi, rispetta l’alternanza dei turni;

6) si basa su un insieme di simboli e regole che sono rappresentati in un una struttura di metadati formale espressa in termini di elementi, sottoelementi, attributi e dipendenze tra costituenti in formato XML ;

7) ha un’interfaccia interrogabile;

8) è pensato per essere usato da linguisti con poche competenze informatiche.

Per garantire la massima comparabilità intermodale e interlinguistica ANANAS offre uno schema di annotazione che presenta una basso grado di complessità strutturale utilizzabile nell’ambito di diversi approcci teorici. Questa scelta ha l’ulteriore vantaggio di ridurre il numero delle etichette dei costituenti e degli attributi, rendendo il processo di annotazione più economico e intersoggettivamente condivisibile.

L’architettura dell’annotazione può essere suddivisa in due parti: a) caratteristiche testuali pertinenti per la forma sintattica del materiale annotato; b) caratteristiche sintattiche e informazioni lessicali.

Nella sezione Strumenti è possibile scaricare l’ultima versione di AN.ANA.S. (AN.ANA.S._4) con il Manuale utente. Nella sezione Corpora presentiamo dei campioni del Corpus ANANAS Multilingue (ANANAS_MT).

Bibliografia

F. Cutugno, M. Voghera, AN.ANA.S.: "Analisi sintattica e annotazione XML a contatto". In Albano Leoni, F., Cutugno, F., Pettorino, M. e Savy R. (a cura di), 2004, Il parlato italiano. Atti del Convegno Nazionale, Napoli, D'Auria Editore, 2004. CD-rom, M03. Disponibile nell'area Pubblicazioni.


M. Voghera, G. Basile, F. Cutugno, G. Fiorentino, 2005, "Sintassi in AN.ANA.S", in Albano Leoni, F.,Giordano, R., Italiano parlato. Analisi di un dialogo, Napoli, Liguori, pp. 189-211. Disponibile nell'area Pubblicazioni.

 

M. Voghera, G. Basile, D. Cerbasi, G. Fiorentino, 2004, “La sintassi della clausola nel dialogo”, in Albano Leoni F., Cutugno F., Pettorino M. e Savy R. (a cura di), Il parlato italiano. Atti del Convegno Nazionale, Napoli, D’Auria Editore. CD-rom, B17.

M. Voghera, G. Turco, 2008, “Il peso del parlare e dello scrivere”, in Pettorino M., Giannini A., Vallone M. Savy R. (a cura di), La comunicazione parlata, Tomo I, Napoli, Liguori, pp. 727-760.

A. Landolfi, C. Sammarco, M. Voghera, 2010, “Verbless Clauses in Italian, Spanish and English: a Treebank annotation”, in Bolasco S., Chiari I., Giuliano L. (a cura di), Statistical Analysis of Textual Data. Proceedings of the 10th International Conference Journèes d’Analyse statistique des données Textuelles, LED, Milan, 201, pp. 1187-1194.

R. Savy, M. Voghera, 2010, A corpus-based study on syntactic and phonetic prosodic phrasing boundaries in spontaneous Italian speech, in Hasegawa-Johnson M. (ed.), Proceedings of Speech Prosody 2010.

M. Voghera, F. Cutugno, 2010, “AN.ANA.S.: aligning text to temporal syntagmatic progression” in  Mahlberg M., González-Díaz V., Smith C. (a cura di), On-line Proceed. 5th Corpus Linguistics Conference, http://ucrel.lancs.ac.uk/publications/cl2009/, article 209.

 
 

Search