Studiare
In questa sezione è possibile reperire le informazioni riguardanti l'organizzazione pratica del corso, lo svolgimento delle attività didattiche, le opportunità formative e i contatti utili durante tutto il percorso di studi, fino al conseguimento del titolo finale.
Piano Didattico
Il piano didattico è l'elenco degli insegnamenti e delle altre attività formative che devono essere sostenute nel corso della propria carriera universitaria.
Selezionare il piano didattico in base all'anno accademico di iscrizione.
1° Anno
Insegnamenti | Crediti | TAF | SSD |
---|
Insegnamenti | Crediti | TAF | SSD |
---|
Insegnamenti | Crediti | TAF | SSD |
---|
1 course among the following
2 modules among the following (1st year: Knowledge representation, Natural language processing, HCI Intelligent interfaces - 2nd year: AI & Cloud, Visual intelligence, Statistical learning - 1st and 2nd year: Computer Vision & Deep Learning)
2 modules among the following (1st year: Knowledge representation, Natural language processing, HCI Intelligent interfaces - 2nd year: AI & Cloud - 1st and 2nd year: Computer Vision & Deep learning)
2 courses among the following (A.A. 2023/24: Complex systems and Network Science not activated)
Legenda | Tipo Attività Formativa (TAF)
TAF (Tipologia Attività Formativa) Tutti gli insegnamenti e le attività sono classificate in diversi tipi di attività formativa, indicati da una lettera.
Natural Language Processing (2023/2024)
Codice insegnamento
4S010677
Docente
Coordinatore
Crediti
6
Lingua di erogazione
Inglese
Settore Scientifico Disciplinare (SSD)
ING-INF/05 - SISTEMI DI ELABORAZIONE DELLE INFORMAZIONI
Periodo
I semestre dal 2 ott 2023 al 26 gen 2024.
Corsi Singoli
Autorizzato
Obiettivi di apprendimento
Il corso copre le cinque aree base di sviluppo di tecniche di analisi del linguaggio naturale: text analytics, statistical natural language processing, analisi morfosintattica, analisi semantica, natural logic. Nello specifico, lo studente conoscerà le tecniche di segmentazione, stemming, lemmatizzazione, POS tagging, Sentence Split, rappresentazione logica e deduzione language-specifica per le lingue a morfosintassi comune e in generale per le lingue a morfosintassi rappresentata con modelli generativi e a grammatiche categoriali. Metodologie basate su reti neurali, quali i Transformer, verranno anche affrontate nel corso. Tutte le tecniche sopra descritte saranno applicate agli ambiti delle analisi di testi in corpora, a sistemi QA aperti e chiusi, ai sistemi di traduzione automatica ed ai sistemi di gestione della generazione di linguaggio.
Prerequisiti e nozioni di base
Nozioni base di logica e di Machine Learning
Programma
1. Nozioni di base di elaborazione del testo
1.1 Espressioni regolari, Normalizzazione, Edit Distance
1.2 Modelli linguistici N-gram
1.3 Naive Bayes e classificazione dei sentimenti
2. Elaborazione statistica del linguaggio naturale
2.1 Regressione logistica
2.2 Semantica vettoriale e incorporamenti
2.3 Reti neurali e modelli di linguaggio neurale
2.4 Etichettatura della sequenza per parti del discorso e NER
2.5 Traduzione automatica
3. Metodi simbolici per il NLP
3.1 Grammatica dei costituenti
3.2 Analisi del costituenti
3.2 Analisi delle dipendenze
4. Tecnologie semantiche per il linguaggio naturale
4.1 Rappresentazioni logiche del significato di una frase
4.2 Tecnologie semantiche
4.3 Semantica computazionale e analisi semantica
4.3 Estrazione di informazioni
4.4 Word Senses e WordNet
4.5 Etichettatura semantica dei ruoli e struttura degli argomenti
4.6 Lessico per sentimento, affetto e connotazione
5. Problemi avanzati per l'elaborazione del testo
5.1 Risoluzione di riferimento
5.2 Coerenza del discorso
6. Applicazioni del NLP
6.1 Sistemi Q/A
6.2 Chatbot e sistemi di dialogo
Bibliografia
Modalità didattiche
Lezione introduttiva ai singoli argomenti, esercitazioni per i singoli argomenti e ripasso di un gruppo di argomenti come da programma in preparazione alla prova d'esame.
Modalità di verifica dell'apprendimento
Per superare l'esame gli studenti dovranno dimostrare di:
- aver compreso i principi alla base del funzionamento dell'elaborazione automatica del linguaggio naturale
- essere in grado di esporre le proprie argomentazioni in modo preciso e organico senza divagazioni,
- saper applicare le conoscenze acquisite per risolvere problemi applicativi
L'esame consiste in tre lavori assegnati, ed una prova orale facoltativa.
Criteri di valutazione
Correttezza e completezza dello svolgimento delle prove assegnate, correttezza e completezza dell'esposizione orale.
Criteri di composizione del voto finale
Il voto finale si forma mediante la somma delle tre prove assegnate per casa, ciascuna valutata in decimi, cui si aggiunge un punteggio da 0 a 5 che valuta la prova orale, fino a saturazione. Il punteggio di 30 e lode può essere ottenuto solamente se le tre prove assegnate a casa sono valutate 10 ciascuna e la prova orale vale almeno 3.
Lingua dell'esame
English