Web Information Retrieval

Programma dell'insegnamento - Corso di laurea in Informatica Magistrale internazionale

 

Docente

Prof. Stefano Mizzaro

Indirizzo e-mail
stefano.mizzaro@uniud.it

Indirizzo Pagina Web Personale
http://www.dimi.uniud.it/mizzaro/

Crediti

6 CFU

Finalità

L'information Retrieval (IR) è una disciplina che è importante storicamente e che ha ricevuto un forte impulso in seguito all'avvento del Web. Il corso mira a presentare gli aspetti concettualmente più importanti dei sistemi d'IR, con particolare attenzione ai motori di ricerca sul Web. Vengono discussi sia argomenti di base sia le correnti linee di ricerca e le tendenze future.

Programma

* IR classico: modelli formali dell'IR; struttura di un indice invertito; interfacce utente per l'IR; classificazione e clustering; valutazione (fondamenti, metodologie, metriche).
* Web IR: grafo del Web; analisi dei link; crawling; spam; architettura di un motore di ricerca.
* Casi di studio e approfondimenti.

Bibliografia

* R. Baeza-Yates, B. Ribeiro-Neto, Modern Information Retrieval, 2a edizione, 2011
* Altri testi e materiale segnalato a lezione

Modalità d'esame

Orale su appuntamento ed attività extra opzionale (seminario, approfondimento, ecc.) su un argomento specifico.

*************************************************************************************

Aims 

Information Retrieval (IR) is a discipline that has a high historical importance and has received an even increased attention after the coming of the Web. The course aims to present the main conceptual issues underlying IR systems, with particular emphasis on Web search engines. Both basic topics and advanced research trends are discussed.

Program 

* Classical IR: formal IR models; structure of the inverted index; user interfaces for IR; classification and clustering; evaluation (foundations, methodologies, metrics).
* Web IR: Web graph; link analysis; crawling; spam; search engine architecture.
* Case studies and specific issues.

References 

* R. Baeza-Yates, B. Ribeiro-Neto, Modern Information Retrieval, 2nd edition, 2011
* Other textbooks and papers provided during lectures.

Exams 

Oral exam plus an extra small term project (talk, homework, etc.) on a specific topic.