Studiare
In questa sezione è possibile reperire le informazioni riguardanti l'organizzazione pratica del corso, lo svolgimento delle attività didattiche, le opportunità formative e i contatti utili durante tutto il percorso di studi, fino al conseguimento del titolo finale.
Piano Didattico
Il piano didattico è l'elenco degli insegnamenti e delle altre attività formative che devono essere sostenute nel corso della propria carriera universitaria.
Selezionare il piano didattico in base all'anno accademico di iscrizione.
1° Anno
Insegnamenti | Crediti | TAF | SSD |
---|
2° Anno Attivato nell'A.A. 2021/2022
Insegnamenti | Crediti | TAF | SSD |
---|
Insegnamenti | Crediti | TAF | SSD |
---|
Insegnamenti | Crediti | TAF | SSD |
---|
Insegnamenti | Crediti | TAF | SSD |
---|
1 module among the following (1st year: Big Data epistemology and Social research; 2nd year: Cybercrime, Data protection in business organizations, Comparative and Transnational Law & Technology)
2 courses among the following (1st year: Business analytics, Digital Marketing and market research; 2nd year: Logistics, Operations & Supply Chain, Digital transformation and IT change, Statistical methods for Business intelligence)
2 courses among the following (1st year: Complex systems and social physics, Discrete Optimization and Decision Making, 2nd year: Statistical models for Data Science, Continuous Optimization for Data Science, Network science and econophysics, Marketing research for agrifood and natural resources)
2 courses among the following (1st year: Data Visualisation, Data Security & Privacy, Statistical learning, Mining Massive Dataset, 2nd year: Machine Learning for Data Science)
Legenda | Tipo Attività Formativa (TAF)
TAF (Tipologia Attività Formativa) Tutti gli insegnamenti e le attività sono classificate in diversi tipi di attività formativa, indicati da una lettera.
Statistical learning (2020/2021)
Codice insegnamento
4S009067
Crediti
6
Lingua di erogazione
Inglese
Settore Scientifico Disciplinare (SSD)
INF/01 - INFORMATICA
L'insegnamento è organizzato come segue:
Teoria
Laboratorio
Obiettivi formativi
L’insegnamento si propone di introdurre gli studenti ai modelli statistici utilizzati in data science. Si svilupperanno le fondamenta dell’apprendimento statistico (supervisionato e non supervisionato) ponendo l’enfasi sulle basi matematiche delle differenti metodologie allo stato dell’arte. Inoltre si punta a fornire derivazioni rigorose dei metodi correntemente utilizzati nelle applicazioni industriali e scientifiche per consentire agli studenti di comprenderne i requisiti per il corretto utilizzo. Sessioni di laboratorio complementari illustreranno l’utilizzo di fondamentali algoritmi e casi di studio industriali in cui lo studente potrà imparare ad analizzare dataset reali per mezzo di software Python.
Al termine del corso lo studente dovrà dimostrare di:
● conoscere le fasi principali di: analisi e preparazione dei dati
● saper utilizzare i principali modelli di regressione
● saper sviluppare soluzioni pro-feature selection
● saper utilizzare metodi di regolarizzazione, e.g., ridge regression, LASSO, elastic net, least angle regression, e classificazione
● conoscere metodi non supervisionati
● conoscere e saper sviluppare algoritmi in ambito riduzione della dimensionalità, analisi delle componenti principali (PCA), K-means clustering, Clustering gerarchico, e cross-validation
Programma
-- Modelli lineari per la regressione (regressione lineare, selezione delle variabili, regolarizzazione)
-- Modelli di classificazione (Regressione logistica, Analisi lineare discriminante (LDA))
-- Metodi basati su alberi (alberi di decisione, "bagging", "random forest", "boosting")
-- Metodi non supervisionati (Analisi delle componenti principali (PCA), approccio "K-Means" per il partizionamento dei dati, partizionamento dei dati gerarchico)
-- Valutazione e selezione del modello (convalida incrociata)
-- Introduzione alle reti neurali (reti neurali a strato singolo, addestrare una rete neurale)
Laboratorio:
- Regressione lineare, metodi di selezione delle variabili, regolarizzazione (in Python)
- Classificazione con regressione logistica (in Python)
- Partizionamento dei dati con approcci k-means e gerarchico (in Python)
- Reti neurali artificiali (in Python)
Modalità d'esame
L'esame è costituito da una prova orale e dalla realizzazione di un progetto applicativo relativo ad uno specifico caso di studio per l'analisi statistica dei dati.