|
There are no translations available.
Claudio Iacobini Anna Adinolfi
Il corpus è formato da tutte le parole del LIP che terminano con una stringa ortografica corrispondente a uno dei ventitré suffissi selezionati, per un totale di 2.982 lemmi e 21.510 occorrenze. I suffissi sono: -aggio, -aio, -ale, -anza, -ario, -bile, -enza, eria, -ese, -evole, -ezza, -ico, -ismo, -ista, -ità, -ivo, -mento, -oso, -sione, -tore, -trice, -tura, -zione. I suffissi sono stati scelti in base a tre criteri principali: a) la frequenza alta e media (così da garantire una buona rappresentatività); b) la rappresentatività dei tipi di significato espressi dai suffissi che formano nomi e/o aggettivi; c) la possibilità di confrontare i dati sul parlato con quelli disponibili sullo scritto. Per ogni lemma viene fornita indicazione della parte del discorso, frequenza delle forme e frequenza cumulativa (così come ricavabile dal LIP), struttura morfologica; per quei lemmi che coincidono con quelli presenti nel Vocabolario di base dell’italiano (cfr. De Mauro 1980),vengono fornite altre indicazioni ricavate dal data-base BDVDB (cfr. Thornton, Iacobini, Burani 1997): lunghezza in grafemi, numero di sillabe, struttura accentuale, parte del discorso, classe flessiva, genere (per i nomi), origine etimologica, data di prima attestazione, fascia di frequenza nel vocabolario di base. L’individuazione della struttura morfologica derivazionale permette di separare le parole suffissate trasparenti (es., abolizione, accettabile, accompagnatore, adeguatezza, affaticamento, affinità, alcolismo, alternanza, ambientale, anarchico, ancoraggio, angoscioso, autista, bellezza, bolognese) da quelle terminanti con una stringa omografa ai suffissi (es., carezza, elemento, fico, amico, canale, cucchiaio, male, pista, raggio, sale, sposo, vivo), e costituisce anche la premessa per l’individuazione di un punto di discrimine nel continuum che va dalla massima trasparenza morfosemantica e morfotattica fino ai casi di massima opacizzazione semantica o allomorfica (per queste nozioni, cfr. Dressler 1985). Per comodità di consultazione il data-base fornisce in un apposito campo una classificazione tripartita: 1) lemmi morfologicamente trasparenti, 2) lemmi terminanti con stringhe omografe a suffissi, 3) lemmi con un basso grado di opacità semantica (es. abitazione, creatura) o con un basso grado di opacità morfotattica (es. assoluzione, ateniese, calabrese, conduzione, consequenziale, mondiale, prosecuzione, comprensibile). I criteri per individuare quest’ultima classe (quella dei lemmi che si situano a un livello intermedio tra la piena trasparenza e l’opacità morfotattica o morfosemantica) sono gli stessi impiegati da Gaeta e Ricca (2003). Ciò permette una più facile confrontabilità tra i dati sul parlato e quelli sullo scritto.
Bibliografia.
De Mauro 1980 De Mauro, T. 1980 (199111; 200312). Guida all’uso delle parole. Roma: Editori Riuniti.
Dressler, W. U. 1985. On the predictiveness of Natural Morphology, «Journal of Linguistics», 21: 321-337.
Gaeta L. e D. Ricca 2003. Frequency and productivity in Italian derivation: A comparison between corpus-based and lexicographical data, «Rivista di Linguistica», 15.1: 63-98.
Thornton A. M., C. Iacobini e C. Burani 1997. BDVDB. Una base di dati per il Vocabolario di base della lingua italiana. Roma: Bulzoni.
|