BIOMETRIA E STUDIO DELLE POPOLAZIONI ANIMALI

Anno accademico 2024/2025 - Docente: CARMELO FRUCIANO

Risultati di apprendimento attesi

Alla fine del corso, gli studenti saranno in grado di:

  • Utilizzare svariate tecniche per l’analisi di dati biologici
  • Comprendere come tecniche analitiche (incluse tecniche di machine learning) possano essere utilizzate per classificazione, predizione e test di ipotesi in contesti biologici.
  • Esplorare e visualizzare dati biometrici utilizzando plot.
  • Avere un’ampia conoscenza di casi di applicazione delle tecniche di analisi di dati a sistemi biologici reali da popolazioni naturali
  • Utilizzare il software R per task di bassa difficoltà di analisi dei dati (utilizzo di pacchetti esistenti per effettuare le tecniche di analisi apprese)
  • Avere una comprensione di come le tecniche di analisi di dati e machine learning apprese siano implementate tipicamente in software ad interfaccia grafica

Modalità di svolgimento dell'insegnamento

  • Lezioni frontali: trattazione dei concetti teorici con esempi pratici.
  • Laboratori informatici: applicazioni pratiche delle tecniche di analisi dei dati utilizzando software (in particolare R).

Prerequisiti richiesti

  • Conoscenze di base di biologia animale.
  • Conoscenza della lingua inglese (necessaria per la lettura di articoli scientifici e materiali didattici).

Frequenza lezioni

La frequenza alle lezioni e ai laboratori è importante per svariate ragioni, tra cui il fatto che le competenze tecniche apprese durante il corso sono fondamentali per il superamento della parte pratica.

Contenuti del corso

Modulo 1: Strumenti biometrici

  • Introduzione alla biometria e tipi di dati (morfologici, genetici e ambientali) da popolazioni animali
  • Analisi dei dati e biometria: statistica, machine learning e intelligenza artificiale
  • Esplorazione e visualizzazione dei dati biologici tramite plot (es., box plot, scatterplot, istogrammi)
  • Comparare due gruppi: metodi basati su randomizzazione ed altri approcci
  • Modelli lineari generali e loro applicazioni
  • Analisi delle componenti principali (PCA)
  • Classificazione – Analisi discriminante e classificazione in base alle caratteristiche biometriche
  • Classificazione – Alberi decisionali e random forest (costruzione di modelli predittivi utilizzando tecniche di machine learning).
  • Quantificare la performance dei modelli di classificazione con la validazione incrociata
  • Quantificare la variabilità e compararla tra popolazioni
  • Altre tecniche basate sulla randomizzazione


Modulo 2: Applicazioni in popolazioni naturali


  • Casi di studio con applicazione di tecniche trattate nel primo modulo
  • Applicazioni con utilizzo di dati morfometrici
  • Dati ecologici e relative problematiche
  • Genetica, genomica e trascrittomica delle popolazioni animali


Testi di riferimento

Non sono previsti testi “adottati” in senso stretto ed il materiale di riferimento principale sarà quello fornito dal docente.

Vengono, comunque, segnalati alcuni testi che possono essere utilizzati per la consultazione e per approfondimenti.


Testi per la consultazione

  • Sokal, R.R., Rohlf, F.J. Biometry: The Principles and Practice of Statistics in Biological Research, W.H. Freeman.
  • Vu, J., Harrington, D., Introductory Statistics for the Life and Biomedical Sciences. Openintro (disponibile all'indirizzo https://www.openintro.org/book/biostat/)

Verifica dell'apprendimento

Modalità di verifica dell'apprendimento

La valutazione avverrà mediante esame orale teorico-pratico. Potrà essere previsto un test scritto di valutazione intermedia riservato agli studenti frequentanti, le cui modalità e tempistiche verranno comunicate agli studenti durante il corso.

Esempi di domande e/o esercizi frequenti

  1. Descrivere come l'analisi delle componenti principali (PCA) può essere utilizzata per esplorare un dataset biometrico.
  2. Quali sono i vantaggi dell’utilizzo di alberi decisionali e random forest?
  3. Spiegare come la validazione incrociata può essere impiegata per testare l'accuratezza dei modelli predittivi basati su machine learning.
ENGLISH VERSION