|
There are no translations available.
Massimo Vedovelli
Alessandro Pallassini Sabrina Machetti Monica Barni Carla Bagna Simone Pieroni Francesca Gallina
Descrizione
Il progetto è condotto dall'unità di ricerca dell'Università per Stranieri di Siena coordinata da Massimo Vedovelli e composta da ricercatori, tecnici e assegnisti di ricerca afferenti al Dipartimento di scienze dei linguaggi e delle culture e al Centro di Eccellenza della ricerca - Osservatorio linguistico permanente dell'italiano diffuso fra stranieri e delle lingue immigrate in Italia dello stesso ateneo.
Il progetto si basa su un corpus di parlato di italiano L2 (LIPS - Lessico Italiano Parlato da Stranieri) costruito inizialmente col fine di analizzare le più generali caratteristiche dell'italiano parlato da apprendenti stranieri e in seguito ampliato con il fine di osservare in particolar modo il lessico utilizzato nel parlato italiano di non-nativi. I testi che compongono il corpus sono stati ricavati dall'archivio delle prove d'esame CILS - Certificazione di Italiano come Lingua Straniera dell'Università per Stranieri di Siena.
Il progetto può contribuire a una migliore conoscenza del parlato dell'italiano contemporaneo, estendendo il campo di quest'ultimo fino a comprendere anche il parlato degli stranieri. In tal modo si potranno ampliare le conoscenze sulle dinamiche evolutive dello spazio linguistico italiano, assumendo il peso di fattori di innovazione quali quelli costituiti dal contatto con le lingue dei gruppi immigrati.
L'obiettivo del progetto è l'analisi del parlato italiano di stranieri, e in particolare del lessico dell'italiano parlato da non-nativi soprattutto in relazione al confronto con i nativi, e delle conseguenze applicative in vista dell'elaborazione di strumenti e linee di intervento a livello linguistico, secondo le linee del Quadro Comune Europeo di Riferimento per le lingue. In particolare l'obiettivo del progetto è quello di osservare i tratti lessicali dei processi di apprendimento in stadi diversi, da quelli di livello iniziale (profilo A del Quadro Comune Europeo di Riferimento per le lingue, 2001) a quelli di livello avanzato (profilo C del Quadro Comune Europeo di Riferimento per le lingue, 2001), osservandone le dinamiche nei processi sia di acquisizione spontanea, sia di apprendimento guidato. L'indagine vuole misurare il peso di tratti specifici dei percorsi di apprendimento lessicale, come l'input linguistico-comunicativo cui sono esposti gli apprendenti e l'influenza di tale input sullo sviluppo della competenza lessicale e della più generale competenza linguistico-comunicativa.
La ricerca si articola in diversi sottonuclei di indagine, tra i quali possiamo individuare i seguenti: verifica del peso della L1 sullo sviluppo del parlato e in particolare della competenza lessicale seguendo un continuum che va dai livelli basici a quelli in cui la competenza è assimilabile a quella di un parlante quasi nativo, osservazione dei tempi e delle modalità di apprendimento e infine quali fattori sono capaci di influire sull'evoluzione della competenza linguistica di apprendimento della L2. In particolare ci si propone di considerare sia modalità di apprendimento formale e guidato sia modalità di acquisizione spontanea, per verificare le ipotesi acquisizionali di sviluppo interlinguistico in contesti differenti anche per quanto concerne il lessico, non perché siano fenomeni che danno luogo a risultati inconciliabili, ma per riconoscerne, al contrario, i punti di contatto. Le ipotesi che il progetto vuole verificare sono di carattere acquisizionale, nel tentativo di allargare lo studio dei tratti acquisizionali dall'ambito della morfosintassi a quello lessicale e di coniugare così una prospettiva e un oggetto di studio che finora raramente si sono incontrati. La ricerca può così assumere una duplice prospettiva: da un lato uno studio quantitativo e dall'altro uno studio qualitativo del lessico, nel tentativo di definire una sequenza di apprendimento vicina ai modelli tradizionali della linguistica acquisizionale. In particolare, il presente progetto si propone di verificare l'ipotesi acquisizionale secondo cui le parole aumentano quantitativamente passando dai livelli basici a quelli avanzati, ma soprattutto si propone di indagare quali parole entrino nel vocabolario parlato degli stranieri all'avanzare dello stato della competenza, quali siano i tratti semantici di cui si arricchiscono le parole che sono parte del vocabolario dei locutoriapprendenti stranieri nei diversi livelli di apprendimento e infine con quale ritmo si sviluppi la progressione lungo il continuum lessicale di apprendimento. L'interesse del progetto è pertanto duplice: da un lato è di carattere teorico, teso a verificare le caratteristiche dei tratti lessicali che caratterizzano il parlato di non-nativi, quale che sia la lingua del locutore e il suo livello di competenza; dall'altro, l'interesse riguarda la puntualizzazione dei fattori acquisizionali che orientano i processi di apprendimento della L2. Questo secondo nucleo di interesse ha anche ricadute di carattere applicativo nella costruzione di percorsi di apprendimento in contesto formativo e implicazioni descrittive e interpretative riguardo le dinamiche evolutive dell'italiano di stranieri.
Dall'archivio CILS, che comprende tutte le prove dei candidati agli esami a partire dalla prima sessione del 1993, sono state estratte 1960 prove di diversi candidati accomunati dal fatto di avere svolto almeno due prove in successione delle sei prove CILS tra il 1993 e il 2006. Attualmente il corpus è composto da circa 700.000 occorrenze su cui è già stata fatta una prima analisi lessicale per stilare una lista di frequenza e che costituiscono dati sull'apprendimento sia in contesto formale che informale. Si tratta pertanto del più ampio corpus di apprendimento ad oggi esistente per l'italiano L2. Sono state selezionate solo le due prove orali di ciascun esame, costituite rispettivamente da uno scambio bidirezionale faccia a faccia con presa di parola libera (dialogo) e uno scambio unidirezionale in presenza del destinatario (monologo). Oltre a queste due tipologie di genere testuale, che rappresentano le attività della parte orale dell'esame CILS, sono stati individuati anche altri generi di discorso, seguendo quanto già emerso nell'ambito della ricerca sul LIP. È stato infatti possibile riconoscere anche testi in cui il dialogo fosse interrotto a favore di parti monologiche, che pur essendo quantitativamente meno estese erano comunque riconoscibili per le proprie norme interne differenti da quelle dello scambio bidirezionale. È stato possibile individuare anche testi monologici in cui sezioni di dialogo hanno trovato spazio, anche se in misura ridotta, e quindi hanno attirato l'attenzione della nostra analisi rendendo necessaria un'ulteriore distinzione rispetto ai generi già individuati. Infine alcune prove in cui le parti monologiche erano quantitativamente equivalenti alle parti dialogiche sono state distinte ulteriormente dalle quattro tipologie di testi già riconosciuti. Sui cinque tipi di testo così focalizzati (dialogo, molologo, dialogo con inserzioni di monologo, monologo con inserzioni di dialogo e testi in cui dialogo e monologo si alternano in egual misura) è possibile svolgere dei confronti basati sulla distinzione tipologica, che possono quindi arricchire ulteriormente la nostra analisi lessicale del corpus basandola non solo sulla progressione per livelli, ma anche per genere testuale.
Per quanto concerne le prove d'esame del corpus, sono state selezionate prove relative a sessioni d'esame differenti, per cui gli input delle varie prove sono eterogenei da una sessione all'altra e permettono così di basare il corpus su argomenti differenti. Per le caratteristiche intrinseche dell'esame CILS, si tratta comunque di input che attivano una produzione relativa ad argomenti di carattere generale, non specialistico, e quindi alla portata di tutti i candidati anche senza una preparazione specifica soprattutto nei livelli iniziali, mentre in quelli più avanzati è richiesta una maggiore formalità e si ampliano i domini e i contesti d'uso.
Le prove raccolte su supporto audio che appartengono all'archivio CILS sono state in seguito trascritte seguendo le norme di trascrizione già adottate per il LIP, cui si rimanda. L'attività di trascrizione ha prestato particolare attenzione al fine ultimo dell'analisi delle caratteristiche del parlato e in particolare dell'analisi lessicale, optando così per un trascrizione di tipo ortografico, facendo attenzione a rispettare il più fedelmente possibile e a non normalizzare le produzioni originali degli apprendenti. Si sono così tralasciati in molti casi alcuni aspetti di maggiore pertinenza per analisi fonetiche, morfologiche o di altro genere, preferendo invece mettere in evidenza gli aspetti lessicali del corpus.
Dopo aver trascritto le prove si è proceduto alla lemmatizzazione automatica tramite un annotatore grammaticale di tipo stocastico (Tree Tagger di Schmid, 1994) e a una fase di revisione integrale delle prove lemmatizzate, resa necessaria dal fatto di operare su un corpus di apprendenti che per le proprie caratteristiche intrinseche devianti rispetto allo standard è difficilmente trattabile con un programma automatico.
Sono state quindi elaborate le liste di frequenza e di uso sia per il corpus nel suo complesso sia per i sottocorpora creati seguendo due linee di indagine: i livelli di competenza degli apprendenti e la sede di svolgimento delle prove CILS. Per realizzare le liste di frequenza si è fatto uso di un software, creato in seno all'unità di ricerca senese, in grado di analizzare un testo di un parlante non nativo e capace di essere interrogato su dati relativi agli aspetti lessicali dell'italiano parlato da stranieri, stilando formari e lemmari di parole e permettendo di incrociare i dati relativi a input di ricerca differenti. In questo modo il software che raccoglie tutto il corpus permette lo svolgimento di analisi lessicali differenziate anche su porzioni del corpus stesso.
Sono state inoltre applicate al corpus alcune misure di ricchezza lessicale (lexical variety, lexical density, numero di hapax, ecc.) e sono state confrontate le liste ottenute dal corpus LIPS con il LIP e con il LIF. Infine per verificare l'aderenza del parlato degli stranieri al parlato dei nativi si è confrontato il LIPS con il VdB.
È prevista la pubblicazione sul sito della trascrizione delle prove che ampliano il corpus LIPS. Oltre alla pubblicazione del corpus si prevede di inserire nel sito anche i risultati delle analisi, con particolare riguardo alle liste di frequenza e uso.
Il progetto è condotto dall'unità di ricerca dell'Università per Stranieri di Siena coordinata da Massimo Vedovelli e composta da ricercatori, tecnici e assegnisti di ricerca afferenti al Dipartimento di scienze dei linguaggi e delle culture e al Centro di Eccellenza della ricerca - Osservatorio linguistico permanente dell'italiano diffuso fra stranieri e delle lingue immigrate in Italia dello stesso ateneo. Il progetto si basa su un corpus di parlato di italiano L2 (LIPS - Lessico Italiano Parlato da Stranieri) costruito inizialmente col fine di analizzare le più generali caratteristiche dell'italiano parlato da apprendenti stranieri e in seguito ampliato con il fine di osservare in particolar modo il lessico utilizzato nel parlato italiano di non-nativi. I testi che compongono il corpus sono stati ricavati dall'archivio delle prove d'esame CILS - Certificazione di Italiano come Lingua Straniera dell'Università per Stranieri di Siena. Il progetto può contribuire a una migliore conoscenza del parlato dell'italiano contemporaneo, estendendo il campo di quest'ultimo fino a comprendere anche il parlato degli stranieri. In tal modo si potranno ampliare le conoscenze sulle dinamiche evolutive dello spazio linguistico italiano, assumendo il peso di fattori di innovazione quali quelli costituiti dal contatto con le lingue dei gruppi immigrati. L'obiettivo del progetto è l'analisi del parlato italiano di stranieri, e in particolare del lessico dell'italiano parlato da non-nativi soprattutto in relazione al confronto con i nativi, e delle conseguenze applicative in vista dell'elaborazione di strumenti e linee di intervento a livello linguistico, secondo le linee del Quadro Comune Europeo di Riferimento per le lingue. In particolare l'obiettivo del progetto è quello di osservare i tratti lessicali dei processi di apprendimento in stadi diversi, da quelli di livello iniziale (profilo A del Quadro Comune Europeo di Riferimento per le lingue, 2001) a quelli di livello avanzato (profilo C del Quadro Comune Europeo di Riferimento per le lingue, 2001), osservandone le dinamiche nei processi sia di acquisizione spontanea, sia di apprendimento guidato. L'indagine vuole misurare il peso di tratti specifici dei percorsi di apprendimento lessicale, come l'input linguistico-comunicativo cui sono esposti gli apprendenti e l'influenza di tale input sullo sviluppo della competenza lessicale e della più generale competenza linguistico-comunicativa. La ricerca si articola in diversi sottonuclei di indagine, tra i quali possiamo individuare i seguenti: verifica del peso della L1 sullo sviluppo del parlato e in particolare della competenza lessicale seguendo un continuum che va dai livelli basici a quelli in cui la competenza è assimilabile a quella di un parlante quasi nativo, osservazione dei tempi e delle modalità di apprendimento e infine quali fattori sono capaci di influire sull'evoluzione della competenza linguistica di apprendimento della L2. In particolare ci si propone di considerare sia modalità di apprendimento formale e guidato sia modalità di acquisizione spontanea, per verificare le ipotesi acquisizionali di sviluppo interlinguistico in contesti differenti anche per quanto concerne il lessico, non perché siano fenomeni che danno luogo a risultati inconciliabili, ma per riconoscerne, al contrario, i punti di contatto. Le ipotesi che il progetto vuole verificare sono di carattere acquisizionale, nel tentativo di allargare lo studio dei tratti acquisizionali dall'ambito della morfosintassi a quello lessicale e di coniugare così una prospettiva e un oggetto di studio che finora raramente si sono incontrati. La ricerca può così assumere una duplice prospettiva: da un lato uno studio quantitativo e dall'altro uno studio qualitativo del lessico, nel tentativo di definire una sequenza di apprendimento vicina ai modelli tradizionali della linguistica acquisizionale. In particolare, il presente progetto si propone di verificare l'ipotesi acquisizionale secondo cui le parole aumentano quantitativamente passando dai livelli basici a quelli avanzati, ma soprattutto si propone di indagare quali parole entrino nel vocabolario parlato degli stranieri all'avanzare dello stato della competenza, quali siano i tratti semantici di cui si arricchiscono le parole che sono parte del vocabolario dei locutoriapprendenti stranieri nei diversi livelli di apprendimento e infine con quale ritmo si sviluppi la progressione lungo il continuum lessicale di apprendimento. L'interesse del progetto è pertanto duplice: da un lato è di carattere teorico, teso a verificare le caratteristiche dei tratti lessicali che caratterizzano il parlato di non-nativi, quale che sia la lingua del locutore e il suo livello di competenza; dall'altro, l'interesse riguarda la puntualizzazione dei fattori acquisizionali che orientano i processi di apprendimento della L2. Questo secondo nucleo di interesse ha anche ricadute di carattere applicativo nella costruzione di percorsi di apprendimento in contesto formativo e implicazioni descrittive e interpretative riguardo le dinamiche evolutive dell'italiano di stranieri. Dall'archivio CILS, che comprende tutte le prove dei candidati agli esami a partire dalla prima sessione del 1993, sono state estratte 1960 prove di diversi candidati accomunati dal fatto di avere svolto almeno due prove in successione delle sei prove CILS tra il 1993 e il 2006. Attualmente il corpus è composto da circa 700.000 occorrenze su cui è già stata fatta una prima analisi lessicale per stilare una lista di frequenza e che costituiscono dati sull'apprendimento sia in contesto formale che informale. Si tratta pertanto del più ampio corpus di apprendimento ad oggi esistente per l'italiano L2. Sono state selezionate solo le due prove orali di ciascun esame, costituite rispettivamente da uno scambio bidirezionale faccia a faccia con presa di parola libera (dialogo) e uno scambio unidirezionale in presenza del destinatario (monologo). Oltre a queste due tipologie di genere testuale, che rappresentano le attività della parte orale dell'esame CILS, sono stati individuati anche altri generi di discorso, seguendo quanto già emerso nell'ambito della ricerca sul LIP. È stato infatti possibile riconoscere anche testi in cui il dialogo fosse interrotto a favore di parti monologiche, che pur essendo quantitativamente meno estese erano comunque riconoscibili per le proprie norme interne differenti da quelle dello scambio bidirezionale. È stato possibile individuare anche testi monologici in cui sezioni di dialogo hanno trovato spazio, anche se in misura ridotta, e quindi hanno attirato l'attenzione della nostra analisi rendendo necessaria un'ulteriore distinzione rispetto ai generi già individuati. Infine alcune prove in cui le parti monologiche erano quantitativamente equivalenti alle parti dialogiche sono state distinte ulteriormente dalle quattro tipologie di testi già riconosciuti. Sui cinque tipi di testo così focalizzati (dialogo, molologo, dialogo con inserzioni di monologo, monologo con inserzioni di dialogo e testi in cui dialogo e monologo si alternano in egual misura) è possibile svolgere dei confronti basati sulla distinzione tipologica, che possono quindi arricchire ulteriormente la nostra analisi lessicale del corpus basandola non solo sulla progressione per livelli, ma anche per genere testuale. Per quanto concerne le prove d'esame del corpus, sono state selezionate prove relative a sessioni d'esame differenti, per cui gli input delle varie prove sono eterogenei da una sessione all'altra e permettono così di basare il corpus su argomenti differenti. Per le caratteristiche intrinseche dell'esame CILS, si tratta comunque di input che attivano una produzione relativa ad argomenti di carattere generale, non specialistico, e quindi alla portata di tutti i candidati anche senza una preparazione specifica soprattutto nei livelli iniziali, mentre in quelli più avanzati è richiesta una maggiore formalità e si ampliano i domini e i contesti d'uso. Le prove raccolte su supporto audio che appartengono all'archivio CILS sono state in seguito trascritte seguendo le norme di trascrizione già adottate per il LIP, cui si rimanda. L'attività di trascrizione ha prestato particolare attenzione al fine ultimo dell'analisi delle caratteristiche del parlato e in particolare dell'analisi lessicale, optando così per un trascrizione di tipo ortografico, facendo attenzione a rispettare il più fedelmente possibile e a non normalizzare le produzioni originali degli apprendenti. Si sono così tralasciati in molti casi alcuni aspetti di maggiore pertinenza per analisi fonetiche, morfologiche o di altro genere, preferendo invece mettere in evidenza gli aspetti lessicali del corpus. Dopo aver trascritto le prove si è proceduto alla lemmatizzazione automatica tramite un annotatore grammaticale di tipo stocastico (Tree Tagger di Schmid, 1994) e a una fase di revisione integrale delle prove lemmatizzate, resa necessaria dal fatto di operare su un corpus di apprendenti che per le proprie caratteristiche intrinseche devianti rispetto allo standard è difficilmente trattabile con un programma automatico. Sono state quindi elaborate le liste di frequenza e di uso sia per il corpus nel suo complesso sia per i sottocorpora creati seguendo due linee di indagine: i livelli di competenza degli apprendenti e la sede di svolgimento delle prove CILS. Per realizzare le liste di frequenza si è fatto uso di un software, creato in seno all'unità di ricerca senese, in grado di analizzare un testo di un parlante non nativo e capace di essere interrogato su dati relativi agli aspetti lessicali dell'italiano parlato da stranieri, stilando formari e lemmari di parole e permettendo di incrociare i dati relativi a input di ricerca differenti. In questo modo il software che raccoglie tutto il corpus permette lo svolgimento di analisi lessicali differenziate anche su porzioni del corpus stesso. Sono state inoltre applicate al corpus alcune misure di ricchezza lessicale (lexical variety, lexical density, numero di hapax, ecc.) e sono state confrontate le liste ottenute dal corpus LIPS con il LIP e con il LIF. Infine per verificare l'aderenza del parlato degli stranieri al parlato dei nativi si è confrontato il LIPS con il VdB. È prevista la pubblicazione sul sito della trascrizione delle prove che ampliano il corpus LIPS. Oltre alla pubblicazione del corpus si prevede di inserire nel sito anche i risultati delle analisi, con particolare riguardo alle liste di frequenza e uso.
|