Formazione e ricerca
Attività Formative del Corso di Dottorato
This page shows the courses and classes of the PhD programme for the academic year 2023/2024. Additional courses and classes will be added during the year. Please check for updates regularly!
Non monotonic reasoning
Crediti: 3
Lingua di erogazione: English
Docente: Matteo Cristani
Sustainable Embodied Mechanical Intelligence
Crediti: 3
Lingua di erogazione: English
Docente: Giovanni Gerardo Muscolo
Brain Computer Interfaces
Crediti: 3
Lingua di erogazione: English
Docente: Silvia Francesca Storti
A practical interdisciplinary PhD course on exploratory data analysis
Crediti: 4
Lingua di erogazione: Inglese
Docente: Prof. Vincenzo Bonnici (Università di Parma)
Multimodal Learning and Applications
Crediti: 5
Lingua di erogazione: Inglese
Docente: Cigdem Beyan
Introduction to Blockchain
Crediti: 3
Lingua di erogazione: English
Docente: Sara Migliorini
Autonomous Agents and Multi-Agent Systems
Crediti: 5
Lingua di erogazione: English
Docente: Alessandro Farinelli
Cyber-Physical System Security
Crediti: 3
Lingua di erogazione: English/Italian
Docente: Massimo Merro
Foundations of quantum languages
Crediti: 3
Lingua di erogazione: English
Docente: Margherita Zorzi
Advanced Data Structures for Textual Data
Crediti: 3
Lingua di erogazione: English
Docente: Zsuzsanna Liptak
AI and explainable models
Crediti: 5
Lingua di erogazione: English
Docente: Gloria Menegaz, Lorenza Brusini
Automated Software Testing
Crediti: 4
Lingua di erogazione: English
Docente: Mariano Ceccato
Elements of Machine Teaching: Theory and Appl.
Crediti: 3
Lingua di erogazione: English
Docente: Ferdinando Cicalese
Introduction to Quantum Machine Learning
Crediti: 4
Lingua di erogazione: English
Docente: Alessandra Di Pierro
Laboratory of quantum information in classical wave-optics analogy
Crediti: 3
Lingua di erogazione: English
Docente: Claudia Daffara
Advanced Data Structures for Textual Data (2023/2024)
Docente
Referente
Crediti
3
Lingua di erogazione
English
Frequenza alle lezioni
Scelta Libera
Sede
VERONA
Obiettivi di apprendimento
Introduzione agli indici testuali (strutture dati per i dati testuali di grandi dimensioni)
Prerequisiti e nozioni di base
Algoritmi e strutture dati
Programma
Dati testuali di dimensioni genomiche (cioé di varie giga- o terabyte) si trovano ovunque intorno a noi. In questa categoria cadono le sequenze biologiche (dati genomici, sequenze proteiche), libri digitali, web crawl data, le collezioni di email, dati musicali, e tanti altri. Oggi la vera sfida non è più di come memorizzare questi dati, ma di come memorizzarli tale che si possano elaborare e interrogare efficaciemente. Indici testuali sono strutture dati per gestire grandi moli di dati testuali. Negli ultimi anni sono stati fatti enormi progressi in questo campo, spinto da una parte dalle necessità della biologica computazionale, e dall'altra di quelle della ricerca web.
In questo corso, studieremo alcuni di questi indici testuali. Inizieremo con un'introduzione breve al suffix array, una struttura dati classica per stringhe, studieremo le sue proprietà, alcune delle sue applicazioni, e gli algoritmi per la sua costruzione efficiente. Dopodiché vedremo due array di supporto, l'LCP-array e la Burrows-Wheeler Transform (BWT). La proprietà della BWT chiamata "clustering property" fa sì che la BWT si presti per la costruzione degli indici testuali compressi. Chiudiamo con lo studio di alcuni tali indici: la FM-index, la RLFM-index, e la r-index.
A seconda delle conoscenze degli studenti, alcuni degli argomenti sopra possono essere sostituiti da altri, per es. da un trattamento più approfondito di wavelet trees (WT) o di extended BWT (eBWT). Il primo è una struttura dati molto potente che viene usato nell'FM-index e r-index, il secondo una variante della BWT per le collezioni di stringhe. Collezioni di stringhe sono di interesse fondamentale, essendo il tipo di dati primario che si trovano a giorno di oggi, ad esempio pangenomi, dati di version control, dati web crawl, etc.
Day 1: Introduction to problems on textual data, pattern matching, suffix arrays (SA)
Day 2: efficient SA construction, LCP-array
Day 3: BWT, backward search, wavelet trees
Day 4: FM-index, RLFM-index, r-index
Bibliografia
Modalità didattiche
lezioni frontali con slide e/o lavagna
Modalità di verifica dell'apprendimento
esercizi da risolvere a casa
Valutazione
capacità di applicare gli algoritmi e stutture dati studiati su esempi concreti; capacità di sviluppare nuovi algoritmi usando gli indici testuali
Criteri di composizione del voto finale
n.a.
Sustainable Development Goals - SDGs
Questa iniziativa contribuisce al perseguimento degli Obiettivi di Sviluppo Sostenibile dell'Agenda 2030 dell'ONU.Maggiori informazioni su www.univr.it/sostenibilita