Web Information Retrieval
Docente
Prof. Stefano Mizzaro stefano.mizzaro@uniud.it sito web
Crediti
6 CFU
Finalità
L'information Retrieval (IR) è una disciplina che è importante storicamente e che ha ricevuto un forte impulso in seguito all'avvento del Web. Il corso mira a presentare gli aspetti concettualmente più importanti dei sistemi d'IR, con particolare attenzione ai motori di ricerca sul Web. Vengono discussi sia argomenti di base sia le correnti linee di ricerca e le tendenze future.
Programma
- IR classico: modelli formali dell'IR; struttura di un indice invertito; interfacce utente per l'IR; classificazione e clustering; valutazione (fondamenti, metodologie, metriche).
- Web IR: grafo del Web; analisi dei link; crawling; spam; architettura di un motore di ricerca.
- Casi di studio e approfondimenti.
Prerequisiti
Conoscenze di base di Programmazione, Algoritmi e strutture dati, Tecnologie Web.
Bibliografia
- R. Baeza-Yates, B. Ribeiro-Neto, Modern Information Retrieval, 2a edizione, 2011
- C. D. Manning, P. Raghavan e H. Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008. http://nlp.stanford.edu/IR-book/
- B. Croft, D. Metzler, T. Strohman. Information retrieval in practice, Addison Wesley, 2009
- Altri testi e materiale segnalato a lezione
Modalità d'esame
Orale su appuntamento ed attività extra opzionale (seminario, approfondimento, ecc.) su un argomento specifico da concordare con il docente. È possibile su richiesta sostenere l’esame con il programma di una delle annualità passate.