Formazione e ricerca

Attività Formative del Corso di Dottorato

This page shows the courses and classes of the PhD programme for the academic year 2023/2024. Additional courses and classes will be added during the year. Please check for updates regularly!

Non monotonic reasoning

Crediti: 3

Lingua di erogazione: English

Docente:  Matteo Cristani

Sustainable Embodied Mechanical Intelligence

Crediti: 3

Lingua di erogazione: English

Docente:  Giovanni Gerardo Muscolo

Brain Computer Interfaces

Crediti: 3

Lingua di erogazione: English

Docente:  Silvia Francesca Storti

A practical interdisciplinary PhD course on exploratory data analysis

Crediti: 4

Lingua di erogazione: Inglese

Docente:  Prof. Vincenzo Bonnici (Università di Parma)

Multimodal Learning and Applications

Crediti: 5

Lingua di erogazione: Inglese

Docente:  Cigdem Beyan

Introduction to Blockchain

Crediti: 3

Lingua di erogazione: English

Docente:  Sara Migliorini

Autonomous Agents and Multi-Agent Systems

Crediti: 5

Lingua di erogazione: English

Docente:  Alessandro Farinelli

Cyber-Physical System Security

Crediti: 3

Lingua di erogazione: English/Italian

Docente:  Massimo Merro

Foundations of quantum languages

Crediti: 3

Lingua di erogazione: English

Docente:  Margherita Zorzi

Advanced Data Structures for Textual Data

Crediti: 3

Lingua di erogazione: English

Docente:  Zsuzsanna Liptak

AI and explainable models

Crediti: 5

Lingua di erogazione: English

Docente:  Gloria Menegaz, Lorenza Brusini

Automated Software Testing

Crediti: 4

Lingua di erogazione: English

Docente:  Mariano Ceccato

Elements of Machine Teaching: Theory and Appl.

Crediti: 3

Lingua di erogazione: English

Docente:  Ferdinando Cicalese

Introduction to Quantum Machine Learning

Crediti: 4

Lingua di erogazione: English

Docente:  Alessandra Di Pierro

Laboratory of quantum information in classical wave-optics analogy

Crediti: 3

Lingua di erogazione: English

Docente:  Claudia Daffara

Crediti

3

Lingua di erogazione

English

Frequenza alle lezioni

Scelta Libera

Sede

VERONA

Obiettivi di apprendimento

Introduzione agli indici testuali (strutture dati per i dati testuali di grandi dimensioni)

Prerequisiti e nozioni di base

Algoritmi e strutture dati

Programma

Dati testuali di dimensioni genomiche (cioé di varie giga- o terabyte) si trovano ovunque intorno a noi. In questa categoria cadono le sequenze biologiche (dati genomici, sequenze proteiche), libri digitali, web crawl data, le collezioni di email, dati musicali, e tanti altri. Oggi la vera sfida non è più di come memorizzare questi dati, ma di come memorizzarli tale che si possano elaborare e interrogare efficaciemente. Indici testuali sono strutture dati per gestire grandi moli di dati testuali. Negli ultimi anni sono stati fatti enormi progressi in questo campo, spinto da una parte dalle necessità della biologica computazionale, e dall'altra di quelle della ricerca web.
In questo corso, studieremo alcuni di questi indici testuali. Inizieremo con un'introduzione breve al suffix array, una struttura dati classica per stringhe, studieremo le sue proprietà, alcune delle sue applicazioni, e gli algoritmi per la sua costruzione efficiente. Dopodiché vedremo due array di supporto, l'LCP-array e la Burrows-Wheeler Transform (BWT). La proprietà della BWT chiamata "clustering property" fa sì che la BWT si presti per la costruzione degli indici testuali compressi. Chiudiamo con lo studio di alcuni tali indici: la FM-index, la RLFM-index, e la r-index.
A seconda delle conoscenze degli studenti, alcuni degli argomenti sopra possono essere sostituiti da altri, per es. da un trattamento più approfondito di wavelet trees (WT) o di extended BWT (eBWT). Il primo è una struttura dati molto potente che viene usato nell'FM-index e r-index, il secondo una variante della BWT per le collezioni di stringhe. Collezioni di stringhe sono di interesse fondamentale, essendo il tipo di dati primario che si trovano a giorno di oggi, ad esempio pangenomi, dati di version control, dati web crawl, etc.
Day 1: Introduction to problems on textual data, pattern matching, suffix arrays (SA)
Day 2: efficient SA construction, LCP-array
Day 3: BWT, backward search, wavelet trees
Day 4: FM-index, RLFM-index, r-index

Bibliografia

Visualizza la bibliografia con Leganto, strumento che il Sistema Bibliotecario mette a disposizione per recuperare i testi in programma d'esame in modo semplice e innovativo.

Modalità didattiche

lezioni frontali con slide e/o lavagna

Modalità di verifica dell'apprendimento

esercizi da risolvere a casa

Le/gli studentesse/studenti con disabilità o disturbi specifici di apprendimento (DSA), che intendano richiedere l'adattamento della prova d'esame, devono seguire le indicazioni riportate QUI

Valutazione

capacità di applicare gli algoritmi e stutture dati studiati su esempi concreti; capacità di sviluppare nuovi algoritmi usando gli indici testuali

Criteri di composizione del voto finale

n.a.

Sustainable Development Goals - SDGs

Questa iniziativa contribuisce al perseguimento degli Obiettivi di Sviluppo Sostenibile dell'Agenda 2030 dell'ONU.
Maggiori informazioni su www.univr.it/sostenibilita