Studiare
In questa sezione è possibile reperire le informazioni riguardanti l'organizzazione pratica del corso, lo svolgimento delle attività didattiche, le opportunità formative e i contatti utili durante tutto il percorso di studi, fino al conseguimento del titolo finale.
Tipologia di Attività formativa D e F
Offerta formativa da definire
Foundations of data analysis (2024/2025)
Codice insegnamento
4S008278
Docente
Coordinatore
Crediti
6
Offerto anche nei corsi:
- Continuous Optimization del corso Laurea magistrale in Artificial Intelligence [LM-18]
- Continuous optimization for data science del corso Laurea magistrale in Data Science
- Continuous optimization for data science del corso Laurea magistrale in Data Science (LM-91)
Lingua di erogazione
Inglese
Settore Scientifico Disciplinare (SSD)
MAT/08 - ANALISI NUMERICA
Periodo
I semestre dal 1 ott 2024 al 31 gen 2025.
Corsi Singoli
Autorizzato
Obiettivi di apprendimento
Al termine di questo insegnamento gli studenti dovranno essere in grado di capire ed applicare le nozioni di base, i concetti e i metodi dell’algebra lineare computazionale, e dell’ottimizzazione numerica applicate all’analisi dei dati. In particolare, dovranno padroneggiare il metodo della decomposizione ai valori singolari e delle matrici random per la rappresentazione di dati in dimensione bassa, le nozioni fondamentali dei problemi di ricostruzione di dati sparsi (ad esempio compressed sensing, ricostruzione di matrici di rango basso, dictionary learning algorithms). Saranno in grado anche di trattare la rappresentazione di dati come cluster attorno a varietà in dimensione alta ed in grafi random e apprenderanno tecniche per costruire carte locali e cluster di dati. Verranno visti i fondamenti di ottimizzazione convessa e non-convessa, e le principali tecniche numeriche con applicazione alle tecniche di apprendimento supervisionato in analisi dei dati (macchine a vettori di supporto, reti neurali e metodi di kernel). Nelle sessioni di laboratorio gli studenti familiarizzeranno con gli strumenti e gli ambienti di programmazione utili ad affrontare alcuni casi di studio. Per superare l'esame, lo studente deve dimostrare di : - avere compreso gli aspetti fondanti della algebra lineare computazionale, dell’ottimizzazione numerica e della geometria differenziale applicata all’analisi dei dati. - essere in grado di presentare gli argomenti di discutere in modo organico e preciso sui vari argomenti del corso senza divagazioni. - di sapere come applicare le metodologie e concetti appresi per risolvere specifici problemi nella forma di esercizi, domande o progetti.
Prerequisiti e nozioni di base
Calcolo differenziale, algebra lineare, basi di analisi numerica,
conoscenza base di un linguaggio di programmazione
Programma
*Introduzione all’ottimizzazione:
- condizioni di ottimalitá
- Metodi numerici
* Singular Value Decomposition:
- Best k-rank approximation, Randomize SVD
- Principal Component Analysis, pseudo inversa
* Compressed Sensing
- Basis pursuit problem: l1-minimization and sparse recovery
- Ricostruzione di immagini da dati sparsi.
* Analisi Dati
- Riduzione della dimensionalità (Local Linear Embedding, ISOMAP, diffusion map).
- Apprendimento supervisionato: Support Vector Machine (SVM).
- Apprendimento non supervisionato: K-means.
- Rete Neurali Artificiali e applicazioni.
Bibliografia
Modalità didattiche
* Lezioni frontali ed esercizi per casa
* Sviluppo di codice ed esempi
* Progetti singoli o di gruppo
Saranno specificamente tutelati gli studenti e le studentesse in situazioni di limitazione agli spostamenti per effetto di disposizioni nazionali di contrasto al COVID o in situazioni particolari di fragilità. In questi casi gli studenti e le studentesse sono invitati a contattare direttamente il docente per organizzare le modalità di recupero più opportune.
Modalità di verifica dell'apprendimento
Per superare l'esame gli studenti dovranno dimostrare di:
- aver compreso i principi alla base dell’algebra lineare computazionale, dell’ottimizzazione convessa e della geometria differenziale applicate all’analisi dei dati.
- essere in grado di esporre argomentazioni sulle tematiche del corso in modo preciso e organico senza divagazioni
- saper applicare le conoscenze acquisite per risolvere problemi applicativi presentati sotto forma di esercizi, domande e progetti.
L'esame consiste in una prova orale con domande scritte e discussione.
Si incoraggia lo sviluppo di un progetto (non obbligatorio) ad integrazione dell'esame orale.
Criteri di valutazione
Lo studente dovrà essere in grado di formalizzare e risolvere problemi di analisi dati adoperando, adattando e sviluppando i metodi numerici avanzati nell'ambito dell'ottimizzazione, dell'algebra lineare numerica visti durante l’insegnamento.
Criteri di composizione del voto finale
Esame orale con domande scritte (85%), risoluzione degli esercizi e progetto per casa (15%)
Lingua dell'esame
Inglese