Navigazione di Sezione:
Programma di Data Mining E Analisi Dei Dati Testuali E Visive:
Il modulo approfondisce l’intero ciclo di analisi: esplorazione, pulizia, modellazione di base e comunicazione dei risultati su dati testuali e visivi. Si parte dall’EDA guidata da domande, con sintesi numeriche e grafici, per individuare pattern, outlier e problemi di qualità. Si introducono strategie di encoding e pipeline supervisionate con scikit-learn e metriche di valutazione, insistendo su validazione e interpretabilità. Per il testo, si trattano tokenizzazione, normalizzazione (stopword, lemmi), rappresentazioni bag-of-words e TF–IDF, fino a un classificatore baseline con analisi degli errori e ispezione dei pesi. Per le immagini, si presentano i fondamenti, l’estrazione di feature semplici e un confronto tra scelte di feature in un compito di classificazione di piccola scala. I laboratori richiedono notebook riproducibili con tracciabilità delle decisioni e riflessione etica su privacy. L’esame prevede un progetto applicato (testo oppure immagini) e una discussione orale mirata a motivare le scelte metodologiche e i limiti dell’approccio. Al termine, gli studenti sapranno progettare una pipeline end-to-end, valutare in modo critico i risultati, stimare incertezza e robustezza e redigere brevi report tecnici.
 
                 English
 English Italiano
 Italiano