Navigazione di Sezione:
Web Mining And Retrieval 2012/2013
Sezione I: Machine Learning e Learning basato su kernel.
Richiami. Metodi Supervised. Metodi probabilistici e generativi. Metodi Unsupervised. Clustering. Metriche di similarità semantica. Metodi agglomerativi. K-mean.
Modelli Markoviani. Hidden Markov Models.
Kernel-based Learning. Kernel polinomiali e RBF. String Kernels. Tree kernels. Latent Semantic kernels. Semantic kernels. Applicazioni.
Sezione II: Statistical Language Processing
Supervised Language Processing tools. HMM-based POS tagging. Named Entity Recognition.
Statistical parsing. PCFGs: Charniak parser. Modelli di Parsing Lessicalizzati.
Shallow Semantic Parsing: kernel based semantic role labeling.
Information Extraction.
Sezione III: Web Mining & Retrieval.
Modelli di ranking per il Web. Introduzione alla Social Network Analysis: rango, centralità.
Modelli di random walk: Page Rank. Motori di ricerca. SEO. Google.
Sistemi di Question Answering. Open-domain Information Extraction.
Acquisizione di Conoscenza da Wikipedia. Social Web. Algoritmi su grafi per la community detection.
Introduzione all’Opinion Mining e al Sentiment Analysis.
Testi
- Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008. Consultabile on-line
- C.M. Bishop "Pattern Recognition and Machine Learning" Springer, 2006
- Roberto Basili, Alessandro Moschitti, Text Categorization: from Information Retrieval to Support Vector Learning, ARACNE Editore, 2005.
- Bing Liu, Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data. 2nd Edition, July 2011, Springer.
- Note del docente e articoli scientifici distribuite durante il corso.
Comunicazioni Per una migliore fruizione del Corso è fortemente consigliata la sua associazione con i Corsi di Machine Learning e Information Retrieval del Semestre 1. E’ inoltre fortemente consigliata la fruizione del Corso di Natural Language Processing durante lo stesso Semestre 2. Strumenti e tool per la progettazione di sistemi di Web retrieval basati su Machine learning verranno resi disponibili durante il Corso in lezioni di laboratorio dedicate. In progetti dedicati verranno progettate e sperimentate piattaforme per task di Statistical Natural Language Processing, Link Analysis ed Opinion Mining nell’ambito dei Web-based Content Management Systems.