Partner erogante
Offerente
Descrizione corso
Il corso fornisce conoscenze e competenze per rappresentare il contenuto di immagini e video tramite modelli di machine learning per la computer vision. Affronta la rappresentazione digitale, il confronto di features, metriche di prestazione, CNN per il riconoscimento di oggetti, YOLO-v5, Self-Supervised Learning, memory networks e transformers, con esercitazioni pratiche.
Il corso mira a fornire conoscenze e competenze per la rappresentazione del contenuto di immagini e video attraverso l’impiego di modelli di machine learning applicati alla computer vision.
Principali argomenti trattati nel corso
- Richiami alla rappresentazione digitale di immagini e video
- Rappresentazione e confronto di features
- Misure di distanza e metriche di prestazioni
- Esercitazione Bag of Words con SIFT
- Le Convolutional Neural Networks per l’apprendimento di rappresentazioni di contenuto delle immagini
- Rilevazione e riconoscimento di oggetti attraverso CNN
- Esercitazione su rilevazione di oggetti con YOLO-v5
- Apprendimento di rappresentazioni di contenuto usando Self-Supervised Learning
- Memory networks e transformers per la rappresentazione di contenuto.
Prerequisiti per partecipare al corso: programmazione Python, conoscenza dei formati di rappresentazione digitale di immagini e video.
Dr. Niccolò Biondi, PhD
prof. Federico Pernici
Corso online
Il corso è attivabile, su richiesta, in modo flessibile, preferibilmente nei mesi di gennaio-febbraio o giugno-luglio.
Dettagli del corso
Ore di docenza
Posti disponibili
Lingua/e di docenza
Lingua/e delle slide
Uso di piattaforme online per esercitazioni o questionari
Materiali di studio e di training
Testi di studio
– R. Szeliski, Computer Vision Algorithms and Applications, Springer 2010
(scaricabile a: http://szeliski.org/Book/ )
– I. Goodfellow, Y. Bengio, A. Courville, Deep Learning, MIT Press, 2016
Materiali di training: slides, Notebook Jupyter/Google Colab
Modalità di valutazione
Nessuna