Studiare
In questa sezione è possibile reperire le informazioni riguardanti l'organizzazione pratica del corso, lo svolgimento delle attività didattiche, le opportunità formative e i contatti utili durante tutto il percorso di studi, fino al conseguimento del titolo finale.
Piano Didattico
Queste informazioni sono destinate esclusivamente agli studenti e alle studentesse già iscritti a questo corso.Se sei un nuovo studente interessato all'immatricolazione, trovi le informazioni sul percorso di studi alla pagina del corso:
Laurea magistrale in Ingegneria e scienze informatiche - Immatricolazione dal 2025/2026Il piano didattico è l'elenco degli insegnamenti e delle altre attività formative che devono essere sostenute nel corso della propria carriera universitaria.
Selezionare il piano didattico in base all'anno accademico di iscrizione.
1° Anno
Insegnamenti | Crediti | TAF | SSD |
---|
2° Anno Attivato nell'A.A. 2016/2017
Insegnamenti | Crediti | TAF | SSD |
---|
Insegnamenti | Crediti | TAF | SSD |
---|
Insegnamenti | Crediti | TAF | SSD |
---|
Insegnamenti | Crediti | TAF | SSD |
---|
Due insegnamenti a scelta
Legenda | Tipo Attività Formativa (TAF)
TAF (Tipologia Attività Formativa) Tutti gli insegnamenti e le attività sono classificate in diversi tipi di attività formativa, indicati da una lettera.
Sistemi di elaborazione di grandi quantita' di dati (2016/2017)
Codice insegnamento
4S001412
Docente
Coordinatore
Crediti
6
Lingua di erogazione
Italiano
Settore Scientifico Disciplinare (SSD)
INF/01 - INFORMATICA
Periodo
I sem. dal 3 ott 2016 al 31 gen 2017.
Obiettivi formativi
Il corso fornisce un'ampia introduzione ai concetti fondamentali dei sistemi di calcolo distribuiti che devono gestire grandi quantità di dati.
Al termine dell'insegnamento lo studente dovrà dimostrare di essere in grado di comprendere il funzionamento di un sistema di analisi di grandi mole di dati, valutando i benefici e le limitazioni delle possibili alternative.
Programma
* Framework di programmazione:
-- Filesystem distribuiti (HDFS);
-- Analisi di dati e grafi (MapReduce, Pregel);
-- Sistemi SQL-like (Pig, Hive);
-- Sistemi NoSQL (HBase, Cassandra).
* Algoritmi:
-- Progettazione di algoritmi per l'analisi dei testi;
-- Algoritmi per l'indicizzazione (inverted indexing);
-- Analisi dei grafi (PageRank).
* Architetture dei data center:
-- Struttura e organizzazione di un data center;
-- Connettività di rete;
-- Gestione degli errori e dei guasti.
Autore | Titolo | Casa editrice | Anno | ISBN | Note |
---|---|---|---|---|---|
Jimmy Lin, Chris Dyer | Data-Intensive Text Processing with MapReduce (Edizione 1) | Morgan & Claypool Publishers | 2010 | 978-1608453429 | |
Tom White | Hadoop: The Definitive Guide (Edizione 3) | Oreilly & Associates Inc | 2012 | 978-1449311520 |
Modalità d'esame
L'esame consiste nello svolgimento di un progetto e relativa documentazione. Obiettivo del progetto è quello di accertare la comprensione dei contenuti del corso e la capacità di applicare tali contenuti nella risoluzione di problemi. Il tema del progetto viene concordato con il docente e riguarda l'applicazione delle nozioni viste durante il corso in casi di studio specifici. Lo svolgimento del progetto include la valutazione delle prestazioni al variare delle dimensioni dell'input da analizzare, nonché la valutazione delle possibili alternative implementative. Dopo una valutazione della documentazione, è possibile sostenere una prova orale in cui viene discusso il progetto stesso.
Materiale e documenti
-
00 - Calendario (html, it, 31 KB, 1/9/17)
-
01a - Introduction (pdf, it, 216 KB, 9/30/16)
-
01b - MapReduce (pdf, it, 320 KB, 9/30/16)
-
01c - Hadoop (pdf, it, 1413 KB, 9/30/16)
-
02a - Basic Algorithm Design (pdf, it, 837 KB, 10/25/16)
-
02b - Graph Algorithms (pdf, it, 1164 KB, 10/19/16)
-
03a - Relational algebra (pdf, it, 120 KB, 11/22/16)
-
03b - Pig / Hive (pdf, it, 300 KB, 11/22/16)
-
04a - Datacenters (pdf, it, 5178 KB, 12/6/16)
-
04b - Cloud Computing (pdf, it, 2464 KB, 12/6/16)
-
05a - NoSQL systems (pdf, it, 1282 KB, 12/6/16)
-
05b - HBase, MongoDB (pdf, it, 2445 KB, 12/6/16)
-
06 - Spark (pdf, it, 2269 KB, 1/16/17)
-
-- - Esempi di progetti (pdf, it, 83 KB, 1/25/17)
-
-- - LAB1a MapReduce (Instruction) (pdf, it, 196 KB, 10/13/16)
-
-- - LAB1b Bare source code (x-gzip, it, 5 KB, 10/13/16)
-
-- - LAB1c - Sample Graphs (x-gzip, it, 31 KB, 10/13/16)
-
-- - LAB2 Pig (pdf, it, 137 KB, 11/22/16)
-
-- - LAB3a - Redis (Instructions) (pdf, it, 188 KB, 12/6/16)
-
-- - LAB3b - Redis (tinyURL java code) (x-gzip, it, 0 KB, 12/6/16)
-
-- - LAB3c - MongoDB (instructions) (pdf, it, 117 KB, 1/9/17)
-
-- - LAB3d - MongoDB (ecommerce java code) (x-gzip, it, 1 KB, 1/9/17)
-
-- - LAB4a - Spark (instructions) (pdf, it, 104 KB, 1/19/17)
-
-- - LAB4b - Spark (tstat data) (x-gzip, it, 2793 KB, 1/19/17)