Corpus Italiano scritto L2 PDF Print E-mail
There are no translations available.

 

Miriam Voghera
Giusy Turco

 

Il Corpus Italiano scritto L2 è costituito da testi scritti prodotti da apprendenti dell'italiano come lingua seconda presso l’Università di Greenwich, Londra. Il corpus comprende 227 testi per un totale di 22.931 parole ed è classificato in base al tipo di testo e al livello di competenza linguistica. Per il tipo di testo, si riconoscono tre categorie principali di appartenenza: descrittivo, narrativo, argomentativo; per i livelli di competenza linguistica, si distinguono: il livello beginner che, rispetto al Quadro comune di riferimento europeo, corrisponde al macroprofilo A2; il livello intermediate che coincide con il macroprofilo B2; il livello advanced che corrisponde a quello C1. Tutti i testi sono stati annotati sintatticamente attraverso il sistema di annotazione e analisi sintattica, AN.ANA.S.L2 , di cui si fornisce la descrizione nel Manuale utente qui scaricabile.

Dei testi scritti si fornisce:
- i testi raccolti nel database Corpus Italiano scritto L2, interrogabile sulla base del livello di competenza, il tipo di testo e la lingua madre dell’apprendente (si veda la Guida alla consultazione).
- l’etichettatura sintattica in formato xml, apribile con il software XGate .
Tutti i testi in formato xml sono interrogabili attraverso il sistema di queries Xpath presente in XGate.