BIOMETRIA E STUDIO DELLE POPOLAZIONI ANIMALI

Anno accademico 2024/2025 - Docente: CARMELO FRUCIANO

Risultati di apprendimento attesi

Alla fine del corso, gli studenti saranno in grado di:

Utilizzare svariate tecniche per l’analisi di dati biologici
Comprendere come tecniche analitiche (incluse tecniche di machine learning) possano essere utilizzate per classificazione, predizione e test di ipotesi in contesti biologici.
Esplorare e visualizzare dati biometrici utilizzando plot.
Avere un’ampia conoscenza di casi di applicazione delle tecniche di analisi di dati a sistemi biologici reali da popolazioni naturali
Utilizzare il software R per task di bassa difficoltà di analisi dei dati (utilizzo di pacchetti esistenti per effettuare le tecniche di analisi apprese)
Avere una comprensione di come le tecniche di analisi di dati e machine learning apprese siano implementate tipicamente in software ad interfaccia grafica

Modalità di svolgimento dell'insegnamento

Lezioni frontali: trattazione dei concetti teorici con esempi pratici.
Laboratori informatici: applicazioni pratiche delle tecniche di analisi dei dati utilizzando software (in particolare R).

Prerequisiti richiesti

Conoscenze di base di biologia animale.
Conoscenza della lingua inglese (necessaria per la lettura di articoli scientifici e materiali didattici).

Frequenza lezioni

La frequenza alle lezioni e ai laboratori è importante per svariate ragioni, tra cui il fatto che le competenze tecniche apprese durante il corso sono fondamentali per il superamento della parte pratica.

Contenuti del corso

Modulo 1: Strumenti biometrici

Introduzione alla biometria e tipi di dati (morfologici, genetici e ambientali) da popolazioni animali
Analisi dei dati e biometria: statistica, machine learning e intelligenza artificiale
Esplorazione e visualizzazione dei dati biologici tramite plot (es., box plot, scatterplot, istogrammi)
Comparare due gruppi: metodi basati su randomizzazione ed altri approcci
Modelli lineari generali e loro applicazioni
Analisi delle componenti principali (PCA)
Classificazione – Analisi discriminante e classificazione in base alle caratteristiche biometriche
Classificazione – Alberi decisionali e random forest (costruzione di modelli predittivi utilizzando tecniche di machine learning).
Quantificare la performance dei modelli di classificazione con la validazione incrociata
Quantificare la variabilità e compararla tra popolazioni
Altre tecniche basate sulla randomizzazione

Modulo 2: Applicazioni in popolazioni naturali

Casi di studio con applicazione di tecniche trattate nel primo modulo
Applicazioni con utilizzo di dati morfometrici
Dati ecologici e relative problematiche
Genetica, genomica e trascrittomica delle popolazioni animali

Testi di riferimento

Non sono previsti testi “adottati” in senso stretto ed il materiale di riferimento principale sarà quello fornito dal docente.

Vengono, comunque, segnalati alcuni testi che possono essere utilizzati per la consultazione e per approfondimenti.

Testi per la consultazione

Sokal, R.R., Rohlf, F.J. Biometry: The Principles and Practice of Statistics in Biological Research, W.H. Freeman.
Vu, J., Harrington, D., Introductory Statistics for the Life and Biomedical Sciences. Openintro (disponibile all'indirizzo https://www.openintro.org/book/biostat/)

Verifica dell'apprendimento

Modalità di verifica dell'apprendimento

La valutazione avverrà mediante esame orale teorico-pratico. Potrà essere previsto un test scritto di valutazione intermedia riservato agli studenti frequentanti, le cui modalità e tempistiche verranno comunicate agli studenti durante il corso.

Esempi di domande e/o esercizi frequenti

Descrivere come l'analisi delle componenti principali (PCA) può essere utilizzata per esplorare un dataset biometrico.
Quali sono i vantaggi dell’utilizzo di alberi decisionali e random forest?
Spiegare come la validazione incrociata può essere impiegata per testare l'accuratezza dei modelli predittivi basati su machine learning.

ENGLISH VERSION

Corso di laurea magistrale in

Biologia Ambientale