Studiare
In questa sezione è possibile reperire le informazioni riguardanti l'organizzazione pratica del corso, lo svolgimento delle attività didattiche, le opportunità formative e i contatti utili durante tutto il percorso di studi, fino al conseguimento del titolo finale.
Piano Didattico
Il piano didattico è l'elenco degli insegnamenti e delle altre attività formative che devono essere sostenute nel corso della propria carriera universitaria.
Selezionare il piano didattico in base all'anno accademico di iscrizione.
1° Anno
Insegnamenti | Crediti | TAF | SSD |
---|
2° Anno Attivato nell'A.A. 2022/2023
Insegnamenti | Crediti | TAF | SSD |
---|
Insegnamenti | Crediti | TAF | SSD |
---|
Insegnamenti | Crediti | TAF | SSD |
---|
Insegnamenti | Crediti | TAF | SSD |
---|
1 module among the following (1st year: Big Data epistemology and Social research; 2nd year: Cybercrime, Data protection in business organizations, Comparative and Transnational Law & Technology)
2 courses among the following (1st year: Business analytics, Digital Marketing and market research; 2nd year: Logistics, Operations & Supply Chain, Digital transformation and IT change, Statistical methods for Business intelligence)
2 courses among the following (1st year: Complex systems and social physics, Discrete Optimization and Decision Making, 2nd year: Statistical models for Data Science, Continuous Optimization for Data Science, Network science and econophysics, Marketing research for agrifood and natural resources)
2 courses among the following (1st year: Data Visualisation, Data Security & Privacy, Statistical learning, Mining Massive Dataset, 2nd year: Machine Learning for Data Science)
Legenda | Tipo Attività Formativa (TAF)
TAF (Tipologia Attività Formativa) Tutti gli insegnamenti e le attività sono classificate in diversi tipi di attività formativa, indicati da una lettera.
Statistical learning (2021/2022)
Codice insegnamento
4S009067
Crediti
6
Coordinatore
Lingua di erogazione
Italiano
Offerto anche nei corsi:
- Statistical learning - PART II del corso Laurea magistrale in Mathematics [LM-40]
L'insegnamento è organizzato come segue:
Obiettivi formativi
L’insegnamento si propone di introdurre gli studenti ai modelli statistici utilizzati in “data science”. Si svilupperanno le fondamenta dell’apprendimento statistico (supervisionato e non supervisionato) ponendo l’enfasi sulle basi matematiche delle differenti metodologie allo stato dell’arte. Inoltre si punta a fornire derivazioni rigorose dei metodi correntemente utilizzati nelle applicazioni industriali e scientifiche per consentire agli studenti di comprenderne i requisiti per il corretto utilizzo. Sessioni di laboratorio complementari illustreranno l’utilizzo di fondamentali algoritmi e casi di studio industriali in cui lo studente potrà imparare ad analizzare data-set reali per mezzo di software Python. Al termine del corso lo studente dovrà dimostrare di: - conoscere le fasi principali di preparazione dei dati, costruzione e valutazione del modello; - saper sviluppare soluzioni per la selezione delle “feature”; - conoscere e saper utilizzare i principali modelli di regressione e regolarizzazione (e.g., LASSO, “Ridge Regression”); - conoscere e sapere utilizzare i principali metodi per la riduzione della dimensionalità (e.g., “Principal Component Regression”, “Partial Least Squares”); - conoscere e saper utilizzare i principali metodi per la classificazione (e.g., KNN, “Logistic Regression”, LDA) - conoscere e saper utilizzare i principali metodi di regressione e classificazione basati su alberi (e.g., alberi di decisione, “random forest”) - conoscere e saper utilizzare i principali metodi per l’analisi dei dati non supervisionati (e.g., “K-means clustering”, Clustering gerarchico)
Programma
-- Modelli lineari per la regressione (regressione lineare, selezione delle variabili, regolarizzazione)
-- Modelli di classificazione (Regressione logistica, Analisi lineare discriminante (LDA))
-- Metodi basati su alberi (alberi di decisione, "bagging", "random forest", "boosting")
-- Metodi non supervisionati (Analisi delle componenti principali (PCA), approccio "K-Means" per il partizionamento dei dati, partizionamento dei dati gerarchico)
-- Valutazione e selezione del modello (convalida incrociata)
-- Introduzione alle reti neurali (reti neurali a strato singolo, addestrare una rete neurale)
Laboratorio:
- Regressione lineare, metodi di selezione delle variabili, regolarizzazione (in Python)
- Classificazione con regressione logistica (in Python)
- Partizionamento dei dati con approcci k-means e gerarchico (in Python)
- Reti neurali artificiali (in Python)
Modalità d'esame
L'esame è costituito da una prova orale e dalla realizzazione e presentazione di una delle esercitazioni svolte in laboratorio sull'analisi di dati tramite metodi di statistical learning.