BIOMETRIA E STUDIO DELLE POPOLAZIONI ANIMALI
Anno accademico 2024/2025 - Docente: CARMELO FRUCIANORisultati di apprendimento attesi
Alla fine del corso, gli studenti saranno in grado di:
- Utilizzare svariate tecniche per l’analisi di dati biologici
- Comprendere come tecniche analitiche (incluse tecniche di machine learning) possano essere utilizzate per classificazione, predizione e test di ipotesi in contesti biologici.
- Esplorare e visualizzare dati biometrici utilizzando plot.
- Avere un’ampia conoscenza di casi di applicazione delle tecniche di analisi di dati a sistemi biologici reali da popolazioni naturali
- Utilizzare il software R per task di bassa difficoltà di analisi dei dati (utilizzo di pacchetti esistenti per effettuare le tecniche di analisi apprese)
- Avere una comprensione di come le tecniche di analisi di dati e machine learning apprese siano implementate tipicamente in software ad interfaccia grafica
Modalità di svolgimento dell'insegnamento
- Lezioni frontali: trattazione dei concetti teorici con esempi pratici.
- Laboratori informatici: applicazioni pratiche delle tecniche di analisi dei dati utilizzando software (in particolare R).
Prerequisiti richiesti
- Conoscenze di base di biologia animale.
- Conoscenza della lingua inglese (necessaria per la lettura di articoli scientifici e materiali didattici).
Frequenza lezioni
La
frequenza alle lezioni e ai laboratori è importante per svariate ragioni, tra
cui il fatto che le competenze tecniche apprese durante il corso sono
fondamentali per il superamento della parte pratica.
Contenuti del corso
Modulo 1: Strumenti biometrici
- Introduzione alla biometria e tipi di dati (morfologici, genetici e ambientali) da popolazioni animali
- Analisi dei dati e biometria: statistica, machine learning e intelligenza artificiale
- Esplorazione e visualizzazione dei dati biologici tramite plot (es., box plot, scatterplot, istogrammi)
- Comparare due gruppi: metodi basati su randomizzazione ed altri approcci
- Modelli lineari generali e loro applicazioni
- Analisi delle componenti principali (PCA)
- Classificazione – Analisi discriminante e classificazione in base alle caratteristiche biometriche
- Classificazione – Alberi decisionali e random forest (costruzione di modelli predittivi utilizzando tecniche di machine learning).
- Quantificare la performance dei modelli di classificazione con la validazione incrociata
- Quantificare la variabilità e compararla tra popolazioni
- Altre tecniche basate sulla randomizzazione
- Casi di studio con applicazione di tecniche trattate nel primo modulo
- Applicazioni con utilizzo di dati morfometrici
- Dati ecologici e relative problematiche
- Genetica, genomica e trascrittomica delle popolazioni animali
Testi di riferimento
Non sono previsti testi “adottati” in senso stretto ed il materiale di riferimento principale sarà quello fornito dal docente.
Vengono, comunque, segnalati alcuni testi che possono essere utilizzati per la consultazione e per approfondimenti.
Testi per la consultazione
- Sokal, R.R., Rohlf, F.J. Biometry: The Principles and Practice of Statistics in Biological Research, W.H. Freeman.
- Vu, J., Harrington, D., Introductory Statistics for the Life and Biomedical Sciences. Openintro (disponibile all'indirizzo https://www.openintro.org/book/biostat/)
Verifica dell'apprendimento
Modalità di verifica dell'apprendimento
La
valutazione avverrà mediante esame orale teorico-pratico. Potrà essere previsto
un test scritto di valutazione intermedia riservato agli studenti frequentanti,
le cui modalità e tempistiche verranno comunicate agli studenti durante il
corso.
Esempi di domande e/o esercizi frequenti
- Descrivere come l'analisi delle componenti principali (PCA) può essere utilizzata per esplorare un dataset biometrico.
- Quali sono i vantaggi dell’utilizzo di alberi decisionali e random forest?
- Spiegare come la validazione incrociata può essere impiegata per testare l'accuratezza dei modelli predittivi basati su machine learning.