Programma di Linguistica Generale E Applicata B:

OBIETTIVI FORMATIVI:  Il corso si propone di offrire una panoramica introduttiva sugli strumenti per l’analisi dei corpora e sui modelli di base per il trattamento automatico delle lingue e del linguaggio.   

CONOSCENZA E CAPACITÀ DI COMPRENSIONE:  Comprendere i concetti fondamentali della linguistica computazionale, comprese le tecniche di base dell’elaborazione del linguaggio naturale.  

CAPACITÀ DI APPLICARE CONOSCENZA E COMPRENSIONE:  Usare i corpora e gli strumenti di base per l’elaborazione e l’analisi computazionale dei dati e dei fenomeni linguistici.  

AUTONOMIA DI GIUDIZIO:  Valutare criticamente le applicazioni di base del trattamento automatico del linguaggio e i loro limiti.  

ABILITÀ COMUNICATIVE:  Descrivere e spiegare i concetti di base della linguistica computazionale e il funzionamento dei principali metodi del trattamento automatico del linguaggio.  

CAPACITÀ DI APPRENDIMENTO:  Acquisire gli strumenti necessari per approfondire in autonomia aspetti teorici e pratici della linguistica computazionale e per applicarli a nuovi contesti di ricerca.  

 

Prerequisiti

È richiesta una comprensione dei concetti di base della linguistica generale. Non sono richieste conoscenze pregresse di programmazione in Python o di sviluppo di modelli e applicazioni NLP.

 

Programma

Il corso si propone di fornire un’introduzione teorica e pratica alla linguistica computazionale e al trattamento automatico del linguaggio. Nella prima parte del corso si illustreranno le metodologie per la raccolta, la compilazione e la gestione dei corpora. Verranno approfondite le tecniche di (pre-)elaborazione del testo (ad es., tokenizzazione, stemming, lemmatizzazione, rimozione stopword, ecc.) e di annotazione linguistica (ad es., POS-tagging, annotazione semantica, ecc.). L’analisi dei dati e dei fenomeni linguistici sarà affrontata attraverso lo studio delle co-occorrenze, delle analisi frequentiste e dell’estrazione dei pattern dai corpora. Saranno, inoltre, introdotti i modelli di base per la rappresentazione del testo, come il Bag-of-Words e il TF-IDF. Infine, il corso offrirà un’introduzione pratica all’uso di Python per il trattamento automatico del linguaggio, con particolare attenzione alle librerie NLTK e spaCy. Durante le attività pratiche, gli studenti e le studentesse avranno la possibilità di usare le conoscenze acquisite, lavorando da soli/e o in piccoli gruppi su task di raccolta, annotazione e analisi di corpora attraverso strumenti e tecniche della linguistica computazionale.

 

MODALITA' DI VALUTAZIONE: 

L’esame si compone di due parti: un progetto scritto, concordato con la docente e incentrato su uno degli argomenti del corso, e una prova orale. Il progetto scritto va consegnato almeno una settimana prima della data dell’appello a cui si è iscritti/e. Chi non consegna il progetto scritto non può sostenere la prova orale.  

CRITERI DI VERIFICA DI APPRENDIMENTO:  Durante la prova orale, gli studenti e le studentesse discuteranno il progetto scritto e risponderanno a domande sul programma d’esame. L’esame coprirà sia i temi trattati a lezione sia quelli lasciati allo studio individuale. Saranno oggetto di esame anche i testi di riferimento indicati nel presente syllabus. Le domande saranno di tipo teorico e/o argomentativo. Il voto terrà conto del progetto e dell’accuratezza e delle completezza delle risposte date alla prova orale, oltre che della correttezza terminologica e adeguatezza espositiva. La valutazione dell’esame viene espressa attraverso un voto in trentesimi.  

 

Testi adottati:

Nissim, Malvina & Pannitto, Ludovica. (2022). Che cos’è la linguistica computazionale. Roma: Carocci. [tutto]  

Lenci, Alessandro, Montemagni, Simonetta, & Pirrelli, Vito (2016). Testo e computer: Elementi di linguistica computazionale. Roma: Carocci. [capitoli: 1, 2, 4, 7, 8, 9]  

 

Bibliografia di riferimento:

I due manuali indicati sotto la voce “Testi adottati”, le slides ed eventuale altro materiale fornito dalla docente.

 

Descrizione della modalità di svolgimento e metodi didattici adottati:

Lezioni frontali ed esercitazioni pratiche.

 

Descrizione della modalità di frequenza:

La frequenza è facoltativa e il programma è identico per frequentanti e non-frequentanti. Gli studenti e le studentesse non-frequentanti dovranno contattare la docente con congruo anticipo per ottenere le istruzioni necessarie alla realizzazione del progetto scritto.