Studiare

In questa sezione è possibile reperire le informazioni riguardanti l'organizzazione pratica del corso, lo svolgimento delle attività didattiche, le opportunità formative e i contatti utili durante tutto il percorso di studi, fino al conseguimento del titolo finale.

Piano Didattico

Queste informazioni sono destinate esclusivamente agli studenti e alle studentesse già iscritti a questo corso.
Se sei un nuovo studente interessato all'immatricolazione, trovi le informazioni sul percorso di studi alla pagina del corso:

Laurea magistrale in Medical bioinformatics - Immatricolazione dal 2025/2026

Il piano didattico è l'elenco degli insegnamenti e delle altre attività formative che devono essere sostenute nel corso della propria carriera universitaria.
Selezionare il piano didattico in base all'anno accademico di iscrizione.

2° Anno  Attivato nell'A.A. 2020/2021

InsegnamentiCreditiTAFSSD
Final exam
24
E
-
Attivato nell'A.A. 2020/2021
InsegnamentiCreditiTAFSSD
Final exam
24
E
-
Insegnamenti Crediti TAF SSD
Tra gli anni: 1°- 2°
English B2
4
F
-
Tra gli anni: 1°- 2°
Tra gli anni: 1°- 2°
Other activities
2
F
-

Legenda | Tipo Attività Formativa (TAF)

TAF (Tipologia Attività Formativa) Tutti gli insegnamenti e le attività sono classificate in diversi tipi di attività formativa, indicati da una lettera.




S Stage e tirocini presso imprese, enti pubblici o privati, ordini professionali

Codice insegnamento

4S004548

Crediti

12

Coordinatore

Rosalba Giugno

Lingua di erogazione

Inglese en

Settore Scientifico Disciplinare (SSD)

INF/01 - INFORMATICA

L'insegnamento è organizzato come segue:

Laboratorio

Crediti

6

Periodo

I semestre, II semestre

Teoria

Crediti

6

Periodo

I semestre, II semestre

Obiettivi formativi

Il corso ha l’obiettivo di fornire gli strumenti di programmazione necessari per l’analisi di dati genomici, trascrittomici e proteomici provenienti dalle tecnologie di ultima generazione.

Conoscenza e capacità di comprensione L'insegnamento ha l'obiettivo di fornire allo studente la conoscenza e comprensione dei paradigmi e strumenti di programmazione avanzata per la gestione di dati e informazioni biomediche/bioinformatiche.

Conoscenze applicate e capacità di comprensione Lo studente sarà dunque in grado di a) applicare i paradigmi e strumenti di programmazione avanzata per l’analisi di dati genomici, trascrittomici e proteomici; b) applicare l'analisi delle prestazioni del codice e individuazione di criticità e loro ottimizzazione.

Autonomia di giudizio Capacità di proporre in modo autonomo soluzioni efficaci ed efficienti per il dominio applicativo biomedico e bioinformatico; capacità di individuare le criticità per il trattamento di problemi complessi di bioinformatica.

Abilità comunicative Lo studente sarà, inoltre, in grado di interagire con interlocutori vari in un ambito multidisciplinare biomedico e bioinformatico, relazionarsi con i colleghi nello svolgimento di lavori in gruppo, e relazionarsi con gli interlocutori nell'ambiente lavorativo o di ricerca.

Capacità di apprendere Capacità di comprendere la letteratura scientifica nel processo di interpretazione dei risultati o soluzione proposta, e di svolgere lavori di approfondimento individuale e di gruppo volti ad affrontare problemi dal mondo della ricerca e aziendale.

Programma

Programmazione in R
Panoramica e storia di R
Workspace and Files
Oggetti e strutture dati
Valori mancanti
Sequenza di numeri
Subsetting
Le funzioni Split-Apply-Combines
Simulazione
Leggere dati tabulari
Logica
Strutture di controllo
Operazioni di I / O
Funzioni
Grafica di base
Grafica avanzata

Bash: linguaggio di scripting
Panoramica del linguaggio di scripting
Varabili
Matrici indicizzate
Matrici associative
Dichiarazioni e operatori condizionali
Operatori di confronto
Loops
I / O da file
Funzioni

R per bioinformatica
Panoramica di BioConductor
Strutture dati di base BioConductor: IRanges e GenomicRanges
Classi e funzioni per rappresentare le stringhe biologiche: Biostrings
Classi e funzioni per rappresentare i genomi: BSgenome, GenomicRanges,
Funzioni di annotazione e panoramica degli strumenti web di annotazione

Analisi dei dati RNA-SEQ utilizzando R / Python e strumenti web
Introduzione alle tecnologie NGS e progettazione sperimentale
Preprocessing dei dati, da Fastq a BAM
Indexing Reference Genome
La mappatura dei reads su un genoma di riferimento
Indicizzazzione e ordinamento negli allineamenti
Controllo della qualità della mappatura
Scoperta di varianti e call set di perfezionamento
Analisi differenziale
Limma, Glimma, EdgeR
DESeq2
Pratica su RNA codificante e non codificante

Statistiche applicate per High-Throughput Data Mining
Introduzione alle variabili e alla distribuzione
Modellazione lineare
Modellazione lineare e generalizzata
Matrici modello e formule modello
Analisi delle variabili categoriali, analisi dei dati esplorativi, test multipli
Analisi unsupervised
Distanza in alte dimensioni
Principali analisi dei componenti e ridimensionamento multidimensionale
Clustering
Metodi di partizione
Metodi gerarchici
Metodi basati sulla densità
Effetti batch

Analisi avanzate dei dati biologici in R: metodi per grafici e reti.
Reti in igraph
Crea reti
Edge, vertice e attributi di rete
Grafi e modelli di grafi specifici
Lettura di grafi dai file
Trasformare le reti in oggetti igraph
Visualizzare le reti con igraph
Descrittive di rete e nodi
Distanze e percorsi
Sottogruppi e comunità
Assortatività e omofilia
Ricostruzione e analisi di reti co-regolatorie e co-espresse

Il corso include seminari su argomenti avanzati come i metodi computazionali per l'analisi di dati di singole cellule, graph mining e reti multistrato. Gli argomenti sono definiti ogni anno in base alle tendenze attuali nella ricerca in bioinformatica medica. Gli studenti avranno la possibilità di utilizzare software relativi agli argomenti scelti e analizzare casi reali.

Bibliografia

Testi di riferimento
Attività Autore Titolo Casa editrice Anno ISBN Note
Laboratorio Rafael A Irizarry and Michael I Love Data Analysis for the Life Sciences https://leanpub.com/dataanalysisforthelifesciences/ 2015
Laboratorio Roger D. Peng Exploratory Data Analysis with R https://leanpub.com/exdata 2016
Laboratorio Michael I. Love, Simon Anders, Vladislav Kim, Wolfgang Huber RNA-Seq workflow: gene-level exploratory analysis and differential expression https://f1000research.com/articles/4-1070/v1 2015
Laboratorio Kolaczyk, Eric D., Csárdi, Gábor Statistical Analysis of Network Data with R Springer 2014
Teoria Rafael A Irizarry and Michael I Love Data Analysis for the Life Sciences https://leanpub.com/dataanalysisforthelifesciences/ 2015
Teoria Roger D. Peng Exploratory Data Analysis with R https://leanpub.com/exdata 2016
Teoria Michael I. Love, Simon Anders, Vladislav Kim, Wolfgang Huber RNA-Seq workflow: gene-level exploratory analysis and differential expression https://f1000research.com/articles/4-1070/v1 2015
Teoria Kolaczyk, Eric D., Csárdi, Gábor Statistical Analysis of Network Data with R Springer 2014

Modalità d'esame

L’esame consiste di una parte scritta (A) e di una progettuale (B). (A) consiste nello sviluppo in aula nelle date di esame di un programma in R per la risoluzione di un problema su dati genomici, trascrittomici o proteomici. (B) consiste nello sviluppo di un progetto concordato con il docente previo richiesta via email e appuntamento per l’elaborazione delle specifiche (il progetto ha validità tutto l’anno accademico). I progetti hanno diversi livelli di difficoltà. Ad ogni difficoltà corrisponde un valore massimo di valutazione.

Il voto per le parti (A) e (B) è espresso in trentesimi.

Il voto finale è calcolato come min(31, ((A+B)/2)+C).
C è espresso nell'intervallo[-4,+4] è riflette la maturazione e autonomia scientifica acquisita durante lo sviluppo delle prove e del progetto, nell’esposizione e nell’interpretazione della letteratura scientifica e del contesto scientifico del progetto.

Le/gli studentesse/studenti con disabilità o disturbi specifici di apprendimento (DSA), che intendano richiedere l'adattamento della prova d'esame, devono seguire le indicazioni riportate QUI