Programma di Metodi Di Ottimizzazione Per Big Data:

Introduzione all'ottimizzazione: approccio modellistico   Problemi di ottimizzazione: classificazione   Problemi di Programmazione Matematica: condizioni di esistenza della soluzione Ottimizzazione non vincolata: condizioni di ottimo, algoritmi di soluzione: condizioni di convergenza globale, ricerca di linea, cenni sul metodo del gradiente.  Ottimizzazione vincolata: condizioni di ottimo e algoritmi di soluzione Duale di Wolfe e SVM. Algoritmi per SVM: SVM_light e metodo delle coordinate duali. Clustering non supervisionato: formulazione e algoritmo k-means batch e on line. Algoritmo k-medoids. Clustering gerarchico agglomerativo e divisivo   Alberi di decisione: Alberi di decisione e classificazione. CART (Classification And Regression Trees). Induction task: TDIDT e approccio Top-Down. Scelta dello split test. Misure di “impurità” ai nodi: Gini index, Chi-quadro, Entropia, Information Gain, Gain Ratio ed Errore di Classificazione. Cenni di complessità computazionale. Disegno di un Optimal Classification Tree (OCT) come problema di ottimizzazione intera (MIO). Modello di Bertsimas e Dunn: OCT-MIO. Caso univariato: Definizione delle variabili. Modellare la struttura ad albero. Pruning. Consistenza con l’output dei test. Assegnamento di class-label ai nodi foglia. Estensione di OCT-MIO al caso multivariato: OCT-H.