Laurea magistrale in Data Science (LM-91)

Studiare

In questa sezione è possibile reperire le informazioni riguardanti l'organizzazione pratica del corso, lo svolgimento delle attività didattiche, le opportunità formative e i contatti utili durante tutto il percorso di studi, fino al conseguimento del titolo finale.

Calendario Didattico Docenti Insegnamenti Ulteriori attività formative Prova Finale Gestione carriere Erasmus+ e altre esperienze all’estero Modalità e sedi di frequenza

Piano Didattico

Il piano didattico è l'elenco degli insegnamenti e delle altre attività formative che devono essere sostenute nel corso della propria carriera universitaria.
Selezionare il piano didattico in base all'anno accademico di iscrizione.

1° Anno

Insegnamenti	Crediti	TAF	SSD

Business organisation and management

SECS-P/08

Probability for data science

MAT/06

Programming and database

INF/01

2° Anno Attivato nell'A.A. 2021/2022

Insegnamenti	Crediti	TAF	SSD

Ethics and law of data protection

B/C

IUS/01 ,M-FIL/03

Training

Final exam

Insegnamenti	Crediti	TAF	SSD

Business organisation and management

SECS-P/08

Probability for data science

MAT/06

Programming and database

INF/01

Attivato nell'A.A. 2021/2022

Insegnamenti	Crediti	TAF	SSD

Ethics and law of data protection

B/C

IUS/01 ,M-FIL/03

Training

Final exam

Insegnamenti	Crediti	TAF	SSD

Tra gli anni: 1°- 2°

1 module among the following (1st year: Big Data epistemology and Social research; 2nd year: Cybercrime, Data protection in business organizations, Comparative and Transnational Law & Technology)

Big data epistemology

M-FIL/02

Comparative and transnational law & technology

IUS/02

Cybercrime

IUS/17

Data protection in business organizations

IUS/04

Social research

SPS/07

Tra gli anni: 1°- 2°

2 courses among the following (1st year: Business analytics, Digital Marketing and market research; 2nd year: Logistics, Operations & Supply Chain, Digital transformation and IT change, Statistical methods for Business intelligence)

Business analytics

SECS-P/10

Digital marketing and market research

SECS-P/08

Digital transformation and IT change

SECS-P/10

Logistics, operations & supply chain

SECS-P/08

Statistical methods for business intelligence

SECS-S/01

Tra gli anni: 1°- 2°

2 courses among the following (1st year: Complex systems and social physics, Discrete Optimization and Decision Making, 2nd year: Statistical models for Data Science, Continuous Optimization for Data Science, Network science and econophysics, Marketing research for agrifood and natural resources)

Complex systems and social physics

FIS/02

Continuous optimization for data science

MAT/08

Discrete optimization and decision making

MAT/09

Marketing research for agrifood and natural resources

AGR/01

Network science and econophysics

FIS/02

Statistical models for data science

MAT/06

Tra gli anni: 1°- 2°

2 courses among the following (1st year: Data Visualisation, Data Security & Privacy, Statistical learning, Mining Massive Dataset, 2nd year: Machine Learning for Data Science)

Data security & privacy

INF/01

Data visualisation

INF/01

Machine learning for data science

ING-INF/05

Mining massive datasets

ING-INF/05

Statistical learning

INF/01

Tra gli anni: 1°- 2°

Activities to be chosen by the student

Legenda | Tipo Attività Formativa (TAF)

TAF (Tipologia Attività Formativa) Tutti gli insegnamenti e le attività sono classificate in diversi tipi di attività formativa, indicati da una lettera.

A Attività di base

B Attività caratterizzanti

C Attività formative affini o integrative

D Attività a scelta dello studente

E Prova finale

F Altre attività formative

S Stage e tirocini presso imprese, enti pubblici o privati, ordini professionali

Codice insegnamento

4S009067

Crediti

Coordinatore

Alessandro Farinelli

Lingua di erogazione

Inglese

Settore Scientifico Disciplinare (SSD)

INF/01 - INFORMATICA

Moodle Seminari 0

L'insegnamento è organizzato come segue:

Teoria

Crediti

Periodo

II semestre

Docenti

Alberto Castellini, Alessandro Farinelli, Matteo Garbelli

Orario Lezioni

Laboratorio

Crediti

Periodo

II semestre

Docenti

Alessandro Farinelli

Orario Lezioni

Obiettivi formativi

L’insegnamento si propone di introdurre gli studenti ai modelli statistici utilizzati in data science. Si svilupperanno le fondamenta dell’apprendimento statistico (supervisionato e non supervisionato) ponendo l’enfasi sulle basi matematiche delle differenti metodologie allo stato dell’arte. Inoltre si punta a fornire derivazioni rigorose dei metodi correntemente utilizzati nelle applicazioni industriali e scientifiche per consentire agli studenti di comprenderne i requisiti per il corretto utilizzo. Sessioni di laboratorio complementari illustreranno l’utilizzo di fondamentali algoritmi e casi di studio industriali in cui lo studente potrà imparare ad analizzare dataset reali per mezzo di software Python.

Al termine del corso lo studente dovrà dimostrare di:

● conoscere le fasi principali di: analisi e preparazione dei dati
● saper utilizzare i principali modelli di regressione
● saper sviluppare soluzioni pro-feature selection
● saper utilizzare metodi di regolarizzazione, e.g., ridge regression, LASSO, elastic net, least angle regression, e classificazione
● conoscere metodi non supervisionati
● conoscere e saper sviluppare algoritmi in ambito riduzione della dimensionalità, analisi delle componenti principali (PCA), K-means clustering, Clustering gerarchico, e cross-validation

Programma

-- Modelli lineari per la regressione (regressione lineare, selezione delle variabili, regolarizzazione)
-- Modelli di classificazione (Regressione logistica, Analisi lineare discriminante (LDA))
-- Metodi basati su alberi (alberi di decisione, "bagging", "random forest", "boosting")
-- Metodi non supervisionati (Analisi delle componenti principali (PCA), approccio "K-Means" per il partizionamento dei dati, partizionamento dei dati gerarchico)
-- Valutazione e selezione del modello (convalida incrociata)
-- Introduzione alle reti neurali (reti neurali a strato singolo, addestrare una rete neurale)

Laboratorio:
- Regressione lineare, metodi di selezione delle variabili, regolarizzazione (in Python)
- Classificazione con regressione logistica (in Python)
- Partizionamento dei dati con approcci k-means e gerarchico (in Python)
- Reti neurali artificiali (in Python)

Modalità d'esame

L'esame è costituito da una prova orale e dalla realizzazione di un progetto applicativo relativo ad uno specifico caso di studio per l'analisi statistica dei dati.

Le/gli studentesse/studenti con disabilità o disturbi specifici di apprendimento (DSA), che intendano richiedere l'adattamento della prova d'esame, devono seguire le indicazioni riportate QUI