Web Information Retrieval
Docente
Prof. Stefano Mizzaro
Indirizzo e-mail
stefano.mizzaro@uniud.it
Indirizzo Pagina Web Personale
http://www.dimi.uniud.it/mizzaro/
Crediti
6 CFU
Finalità
L'information Retrieval (IR) è una disciplina che è importante storicamente e che ha ricevuto un forte impulso in seguito all'avvento del Web. Il corso mira a presentare gli aspetti concettualmente più importanti dei sistemi d'IR, con particolare attenzione ai motori di ricerca sul Web. Vengono discussi sia argomenti di base sia le correnti linee di ricerca e le tendenze future.
Programma
* IR classico: modelli formali dell'IR; struttura di un indice invertito; interfacce utente per l'IR; classificazione e clustering; valutazione (fondamenti, metodologie, metriche).
* Web IR: grafo del Web; analisi dei link; crawling; spam; architettura di un motore di ricerca.
* Casi di studio e approfondimenti.
Bibliografia
* R. Baeza-Yates, B. Ribeiro-Neto, Modern Information Retrieval, 2a edizione, 2011
* Altri testi e materiale segnalato a lezione
Modalità d'esame
Orale su appuntamento ed attività extra opzionale (seminario, approfondimento, ecc.) su un argomento specifico.
*************************************************************************************
Aims
Information Retrieval (IR) is a discipline that has a high historical importance and has received an even increased attention after the coming of the Web. The course aims to present the main conceptual issues underlying IR systems, with particular emphasis on Web search engines. Both basic topics and advanced research trends are discussed.
Program
* Classical IR: formal IR models; structure of the inverted index; user interfaces for IR; classification and clustering; evaluation (foundations, methodologies, metrics).
* Web IR: Web graph; link analysis; crawling; spam; search engine architecture.
* Case studies and specific issues.
References
* R. Baeza-Yates, B. Ribeiro-Neto, Modern Information Retrieval, 2nd edition, 2011
* Other textbooks and papers provided during lectures.
Exams
Oral exam plus an extra small term project (talk, homework, etc.) on a specific topic.