Stampa la pagina Condividi su Google Condividi su Twitter Condividi su Facebook Scheda Docente

GUARRACINO MARIO ROSARIO - Ricercatore

English version

Afferente a: Dipartimento: Economia e Giurisprudenza

Settore Scientifico Disciplinare: SECS-S/01

Orari di ricevimento: Su appuntamento.

Recapiti:
E-Mail: mario.guarracino@unicas.it

  • Insegnamento Statistical Learning and Data Mining (91940)

    Primo anno di Ingegneria Informatica (LM-32), Medical Imaging and Applications (MAIA)
    Crediti Formativi Universitari (CFU): 6,00

    Programma:
    TENTATIVE COURSE SCHEDULE:

    Week 1 (Textbook, chapter 1 and 2)
    Introduction to the Course
    Presentation of the Available materials
    Clear Statement of Expected Mutual Requirements
    Regression and classification problems
    Trade-off’s in statistical learning
    Parametric and non parametric methods
    Supervised vs non supervised

    Week 2 (Textbook, chapters 1 and 2)
    Introduction to the R meta-language
    Measuring errors in regression and classification models

    Week 3 (Textbook, chapter 3)
    Introduction to linear models for regression
    Model fit and inference
    Variance estimator

    Week 4 (Textbook, chapter 3)
    Confidence and prediction intervals
    Algebraic formalization of multiple regression
    Global test and block-based test
    Qualitative predictors and interaction effects

    Week 5 (Textbook, chapter 3)
    Polynomial regression
    Violations of model assumption
    Correlated errors
    Heteroschedasticity
    Multicollinearity

    Week 6 (Textbook, chapter 3)
    Practical examples of linear regression in R
    Implementation and interpretation
    Model diagnostics

    Week 7 (Textbook, chapter 4)
    Classification methods
    Logistic regression
    Link function and model fit
    Linear discriminant analysis
    Bayes rule and difference with logistic approach

    Week 8 (Textbook, chapter 4)
    Multiple LDA and Logit
    Class-specific errors
    Roc curve
    Quadratic discriminant analysis
    Comparison of classification methods

    Week 9 (Textbook, chapter 4)
    Practical examples of classification in R
    Implementation and interpretation
    Model diagnostics

    Week 10 (Textbook, chapters 5 and 6)
    Resampling methods
    Validation approaches
    Bootstrap
    Model selection

    Week 11 (Textbook, chapter 6)
    Shrinkage methods
    Ridge regression
    Lasso regression
    Model selection via regularization

    Testi:
    An Introduction to Statistical Learning, with Applications in R. James, G., Witten, D., Hastie, T. and Tibshirani, R.. Springer, 2021

    Valutazione:
    Elementi che concorrono alla valutazione:
    Partecipazione in classe: rifletterà la tua partecipazione alle discussioni in classe e la tua capacità di cogliere la logica degli argomenti presentati in classe.

    Compiti a casa: i compiti dovrebbero essere restituiti una settimana dopo il loro compito. Saranno assegnati compiti ai partecipanti, facendo riferimento ad aspetti concettuali e applicativi dell'argomento trattato. La parte pratica dei compiti richiederà implementazioni R dei metodi.

    Progetto a medio termine: il partecipante implementerà un'analisi di regressione completa di un set di dati sintetici, dalla fase di pre-elaborazione dei dati alla presentazione e all'interpretazione dei risultati. I risultati saranno classificati in base alla capacità del partecipante di recuperare il modello originale.

    Progetto finale: il partecipante implementerà un'analisi di classificazione completa di un set di dati del mondo reale, dalla fase di pre-elaborazione dei dati alla presentazione e all'interpretazione dei risultati.

    Prova orale: lo studente presenteràil progetto finale e saranno discussi alcuni argomenti teorici trattati nel corso.

  • Insegnamento Statistical Learning and Data Mining (91940)

    Primo anno di Ingegneria Informatica (LM-32), Medical Image Computing (MIC) - Dual Degree con Universitat de Girona
    Crediti Formativi Universitari (CFU): 6,00

    Programma:
    TENTATIVE COURSE SCHEDULE:

    Week 1 (Textbook, chapter 1 and 2)
    Introduction to the Course
    Presentation of the Available materials
    Clear Statement of Expected Mutual Requirements
    Regression and classification problems
    Trade-off’s in statistical learning
    Parametric and non parametric methods
    Supervised vs non supervised

    Week 2 (Textbook, chapters 1 and 2)
    Introduction to the R meta-language
    Measuring errors in regression and classification models

    Week 3 (Textbook, chapter 3)
    Introduction to linear models for regression
    Model fit and inference
    Variance estimator

    Week 4 (Textbook, chapter 3)
    Confidence and prediction intervals
    Algebraic formalization of multiple regression
    Global test and block-based test
    Qualitative predictors and interaction effects

    Week 5 (Textbook, chapter 3)
    Polynomial regression
    Violations of model assumption
    Correlated errors
    Heteroschedasticity
    Multicollinearity

    Week 6 (Textbook, chapter 3)
    Practical examples of linear regression in R
    Implementation and interpretation
    Model diagnostics

    Week 7 (Textbook, chapter 4)
    Classification methods
    Logistic regression
    Link function and model fit
    Linear discriminant analysis
    Bayes rule and difference with logistic approach

    Week 8 (Textbook, chapter 4)
    Multiple LDA and Logit
    Class-specific errors
    Roc curve
    Quadratic discriminant analysis
    Comparison of classification methods

    Week 9 (Textbook, chapter 4)
    Practical examples of classification in R
    Implementation and interpretation
    Model diagnostics

    Week 10 (Textbook, chapters 5 and 6)
    Resampling methods
    Validation approaches
    Bootstrap
    Model selection

    Week 11 (Textbook, chapter 6)
    Shrinkage methods
    Ridge regression
    Lasso regression
    Model selection via regularization

    Testi:
    An Introduction to Statistical Learning, with Applications in R. James, G., Witten, D., Hastie, T. and Tibshirani, R.. Springer, 2021

    Valutazione:
    Elementi che concorrono alla valutazione:
    Partecipazione in classe: rifletterà la tua partecipazione alle discussioni in classe e la tua capacità di cogliere la logica degli argomenti presentati in classe.

    Compiti a casa: i compiti dovrebbero essere restituiti una settimana dopo il loro compito. Saranno assegnati compiti ai partecipanti, facendo riferimento ad aspetti concettuali e applicativi dell'argomento trattato. La parte pratica dei compiti richiederà implementazioni R dei metodi.

    Progetto a medio termine: il partecipante implementerà un'analisi di regressione completa di un set di dati sintetici, dalla fase di pre-elaborazione dei dati alla presentazione e all'interpretazione dei risultati. I risultati saranno classificati in base alla capacità del partecipante di recuperare il modello originale.

    Progetto finale: il partecipante implementerà un'analisi di classificazione completa di un set di dati del mondo reale, dalla fase di pre-elaborazione dei dati alla presentazione e all'interpretazione dei risultati.

    Prova orale: lo studente presenteràil progetto finale e saranno discussi alcuni argomenti teorici trattati nel corso.

  • Insegnamento Statistical Learning and Data Mining (91940)

    Primo anno di Global economy and business (LM-56), Dual Degree with Samara State University of Economics
    Crediti Formativi Universitari (CFU): 6,00

    Programma:
    TENTATIVE COURSE SCHEDULE:

    Week 1 (Textbook, chapter 1 and 2)
    Introduction to the Course
    Presentation of the Available materials
    Clear Statement of Expected Mutual Requirements
    Regression and classification problems
    Trade-off’s in statistical learning
    Parametric and non parametric methods
    Supervised vs non supervised

    Week 2 (Textbook, chapters 1 and 2)
    Introduction to the R meta-language
    Measuring errors in regression and classification models

    Week 3 (Textbook, chapter 3)
    Introduction to linear models for regression
    Model fit and inference
    Variance estimator

    Week 4 (Textbook, chapter 3)
    Confidence and prediction intervals
    Algebraic formalization of multiple regression
    Global test and block-based test
    Qualitative predictors and interaction effects

    Week 5 (Textbook, chapter 3)
    Polynomial regression
    Violations of model assumption
    Correlated errors
    Heteroschedasticity
    Multicollinearity

    Week 6 (Textbook, chapter 3)
    Practical examples of linear regression in R
    Implementation and interpretation
    Model diagnostics

    Week 7 (Textbook, chapter 4)
    Classification methods
    Logistic regression
    Link function and model fit
    Linear discriminant analysis
    Bayes rule and difference with logistic approach

    Week 8 (Textbook, chapter 4)
    Multiple LDA and Logit
    Class-specific errors
    Roc curve
    Quadratic discriminant analysis
    Comparison of classification methods

    Week 9 (Textbook, chapter 4)
    Practical examples of classification in R
    Implementation and interpretation
    Model diagnostics

    Week 10 (Textbook, chapters 5 and 6)
    Resampling methods
    Validation approaches
    Bootstrap
    Model selection

    Week 11 (Textbook, chapter 6)
    Shrinkage methods
    Ridge regression
    Lasso regression
    Model selection via regularization

    Testi:
    An Introduction to Statistical Learning, with Applications in R. James, G., Witten, D., Hastie, T. and Tibshirani, R.. Springer, 2021

    Valutazione:
    Elementi che concorrono alla valutazione:
    Partecipazione in classe: rifletterà la tua partecipazione alle discussioni in classe e la tua capacità di cogliere la logica degli argomenti presentati in classe.

    Compiti a casa: i compiti dovrebbero essere restituiti una settimana dopo il loro compito. Saranno assegnati compiti ai partecipanti, facendo riferimento ad aspetti concettuali e applicativi dell'argomento trattato. La parte pratica dei compiti richiederà implementazioni R dei metodi.

    Progetto a medio termine: il partecipante implementerà un'analisi di regressione completa di un set di dati sintetici, dalla fase di pre-elaborazione dei dati alla presentazione e all'interpretazione dei risultati. I risultati saranno classificati in base alla capacità del partecipante di recuperare il modello originale.

    Progetto finale: il partecipante implementerà un'analisi di classificazione completa di un set di dati del mondo reale, dalla fase di pre-elaborazione dei dati alla presentazione e all'interpretazione dei risultati.

    Prova orale: lo studente presenteràil progetto finale e saranno discussi alcuni argomenti teorici trattati nel corso.

  • Insegnamento Statistical Learning and Data Mining (91940)

    Primo anno di Global economy and business (LM-56), Global Economy and Business
    Crediti Formativi Universitari (CFU): 6,00

    Programma:
    TENTATIVE COURSE SCHEDULE:

    Week 1 (Textbook, chapter 1 and 2)
    Introduction to the Course
    Presentation of the Available materials
    Clear Statement of Expected Mutual Requirements
    Regression and classification problems
    Trade-off’s in statistical learning
    Parametric and non parametric methods
    Supervised vs non supervised

    Week 2 (Textbook, chapters 1 and 2)
    Introduction to the R meta-language
    Measuring errors in regression and classification models

    Week 3 (Textbook, chapter 3)
    Introduction to linear models for regression
    Model fit and inference
    Variance estimator

    Week 4 (Textbook, chapter 3)
    Confidence and prediction intervals
    Algebraic formalization of multiple regression
    Global test and block-based test
    Qualitative predictors and interaction effects

    Week 5 (Textbook, chapter 3)
    Polynomial regression
    Violations of model assumption
    Correlated errors
    Heteroschedasticity
    Multicollinearity

    Week 6 (Textbook, chapter 3)
    Practical examples of linear regression in R
    Implementation and interpretation
    Model diagnostics

    Week 7 (Textbook, chapter 4)
    Classification methods
    Logistic regression
    Link function and model fit
    Linear discriminant analysis
    Bayes rule and difference with logistic approach

    Week 8 (Textbook, chapter 4)
    Multiple LDA and Logit
    Class-specific errors
    Roc curve
    Quadratic discriminant analysis
    Comparison of classification methods

    Week 9 (Textbook, chapter 4)
    Practical examples of classification in R
    Implementation and interpretation
    Model diagnostics

    Week 10 (Textbook, chapters 5 and 6)
    Resampling methods
    Validation approaches
    Bootstrap
    Model selection

    Week 11 (Textbook, chapter 6)
    Shrinkage methods
    Ridge regression
    Lasso regression
    Model selection via regularization

    Testi:
    An Introduction to Statistical Learning, with Applications in R. James, G., Witten, D., Hastie, T. and Tibshirani, R.. Springer, 2021

    Valutazione:
    Elementi che concorrono alla valutazione:
    Partecipazione in classe: rifletterà la tua partecipazione alle discussioni in classe e la tua capacità di cogliere la logica degli argomenti presentati in classe.

    Compiti a casa: i compiti dovrebbero essere restituiti una settimana dopo il loro compito. Saranno assegnati compiti ai partecipanti, facendo riferimento ad aspetti concettuali e applicativi dell'argomento trattato. La parte pratica dei compiti richiederà implementazioni R dei metodi.

    Progetto a medio termine: il partecipante implementerà un'analisi di regressione completa di un set di dati sintetici, dalla fase di pre-elaborazione dei dati alla presentazione e all'interpretazione dei risultati. I risultati saranno classificati in base alla capacità del partecipante di recuperare il modello originale.

    Progetto finale: il partecipante implementerà un'analisi di classificazione completa di un set di dati del mondo reale, dalla fase di pre-elaborazione dei dati alla presentazione e all'interpretazione dei risultati.

    Prova orale: lo studente presenteràil progetto finale e saranno discussi alcuni argomenti teorici trattati nel corso.

  • Insegnamento Statistica (91787)

    Secondo anno di ECONOMIA AZIENDALE FROSINONE - Piazza Marzi, 1 - 03100 (L-18), Economia e management dell'innovazione
    Crediti Formativi Universitari (CFU): 9,00

    Programma:
    Introduzione e raccolta dati - La presentazione dei dati: grafici e tabelle - La statistica descrittiva: indici di posizione e di variabilità - Fondamenti di calcolo delle probabilità - Distribuzioni di probabilità di variabili casuali discrete - La distribuzione normale - Elementi di campionamento e distribuzioni campionarie - Intervalli di confidenza - I fondamenti della verifica delle ipotesi: test basati su un solo campione - Verifica delle ipotesi su due campioni e ANOVA - Il test del chi quadrato - La regressione lineare semplice.

    Testi:
    D. M. Levine - Kathryn A. Szabat - David F. Stephan - Statistica (7/Ed.) - Pearson.
    Il materiale presentato a lezione sarà disponibile sul Google Classroom prima dell'inizio delle lezioni, assieme al materiale per lo studio autonomo, video, dati ed altro.

    Valutazione:
    L'esame comprende una prova scritta ed una orale. La prova scritta consiste nello svolgimento di esercizi simili a quelli proposti durante le esercitazioni del corso. L'orale consiste in una discussione sugli aspetti teorici.
    Durante il corso ci saranno due prove di esonero, il cui superamento permette di sostenere il solo esame orale per la durata della sessione estiva.

  • Insegnamento Statistical Learning and Data Mining (91940)

    Secondo anno di Global economy and business (LM-56), Global Economy and Business
    Crediti Formativi Universitari (CFU): 6,00

    Programma:
    TENTATIVE COURSE SCHEDULE:

    Week 1 (Textbook, chapter 1 and 2)
    Introduction to the Course
    Presentation of the Available materials
    Clear Statement of Expected Mutual Requirements
    Regression and classification problems
    Trade-off’s in statistical learning
    Parametric and non parametric methods
    Supervised vs non supervised

    Week 2 (Textbook, chapters 1 and 2)
    Introduction to the R meta-language
    Measuring errors in regression and classification models

    Week 3 (Textbook, chapter 3)
    Introduction to linear models for regression
    Model fit and inference
    Variance estimator

    Week 4 (Textbook, chapter 3)
    Confidence and prediction intervals
    Algebraic formalization of multiple regression
    Global test and block-based test
    Qualitative predictors and interaction effects

    Week 5 (Textbook, chapter 3)
    Polynomial regression
    Violations of model assumption
    Correlated errors
    Heteroschedasticity
    Multicollinearity

    Week 6 (Textbook, chapter 3)
    Practical examples of linear regression in R
    Implementation and interpretation
    Model diagnostics

    Week 7 (Textbook, chapter 4)
    Classification methods
    Logistic regression
    Link function and model fit
    Linear discriminant analysis
    Bayes rule and difference with logistic approach

    Week 8 (Textbook, chapter 4)
    Multiple LDA and Logit
    Class-specific errors
    Roc curve
    Quadratic discriminant analysis
    Comparison of classification methods

    Week 9 (Textbook, chapter 4)
    Practical examples of classification in R
    Implementation and interpretation
    Model diagnostics

    Week 10 (Textbook, chapters 5 and 6)
    Resampling methods
    Validation approaches
    Bootstrap
    Model selection

    Week 11 (Textbook, chapter 6)
    Shrinkage methods
    Ridge regression
    Lasso regression
    Model selection via regularization

    Testi:
    An Introduction to Statistical Learning, with Applications in R. James, G., Witten, D., Hastie, T. and Tibshirani, R.. Springer, 2021

    Valutazione:
    Elementi che concorrono alla valutazione:
    Partecipazione in classe: rifletterà la tua partecipazione alle discussioni in classe e la tua capacità di cogliere la logica degli argomenti presentati in classe.

    Compiti a casa: i compiti dovrebbero essere restituiti una settimana dopo il loro compito. Saranno assegnati compiti ai partecipanti, facendo riferimento ad aspetti concettuali e applicativi dell'argomento trattato. La parte pratica dei compiti richiederà implementazioni R dei metodi.

    Progetto a medio termine: il partecipante implementerà un'analisi di regressione completa di un set di dati sintetici, dalla fase di pre-elaborazione dei dati alla presentazione e all'interpretazione dei risultati. I risultati saranno classificati in base alla capacità del partecipante di recuperare il modello originale.

    Progetto finale: il partecipante implementerà un'analisi di classificazione completa di un set di dati del mondo reale, dalla fase di pre-elaborazione dei dati alla presentazione e all'interpretazione dei risultati.

    Prova orale: lo studente presenteràil progetto finale e saranno discussi alcuni argomenti teorici trattati nel corso.

  • Insegnamento Data Analytics (92728)

    Secondo anno di Economia e commercio (L-33), Economics and business
    Crediti Formativi Universitari (CFU): 6,00

    Programma:
    Introduzione ai Big Data e Data Analytics, Ciclo di vita dell'analisi dei dati, Revisione dei metodi di analisi dei dati di base mediante R.
    Teoria e metodi analitici avanzati: selezione delle variabili, clustering, regole di associazione, regressione, classificazione, serie storiche, analisi di rete.
    Tecnologia e strumenti: R&Rstudio

    Testi:
    Textbook: Data Science & Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data by Emc Education Services Wiley
    Other sources: An Introduction to Statistical Learning: with Applications in R by di Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani.

    Valutazione:
    La valutazione si basa sul progetto finale e sulla prova orale.
    Il progetto finale è un'attività individuale. Barare non è un'opzione. Il progetto finale consiste nella scelta e nell'analisi di un dataset disponibile in un repository. Il risultato è un PDF con una presentazione (o report) e un programma per computer. Entrambi i file devono essere inviati su Google classroom una settimana prima dell'esame (ad esempio, se l'esame è alle 9:00 del 10° giorno del mese, il progetto deve essere caricato entro le 9:00 del 3° giorno dello stesso mese). Gli studenti dovrebbero:
    1. Comprendi il problema.
    2. Esplora i dati.
    3. Eseguire l'analisi univariata/bivariata sui predittori.
    4. Intraprendere azioni relativamente alla presenza di valori mancanti, valori anomali, normalizzazione o altri problemi relativi ai tipi di dati.
    5. Preparare i dati per la modellazione.
    6. Creare modelli utilizzando almeno due algoritmi trattati nel corso (quando possibile).
    7. Analizzare i risultati, ottimizzare i parametri e selezionare le variabili necessarie.
    8. Confrontare le prestazioni dei diversi modelli utilizzando le metriche trattate nel corso.
    Il mancato rispetto di queste linee guida preclude l'accesso alla parte orale.

    La parte orale consiste in una presentazione del progetto da parte dello studente, una discussione sui risultati e gli aspetti realizzativi (analizzeremo il programma informatico e discuteremo gli aspetti realizzativi), e alcune domande sugli aspetti teorici trattati a lezione, che potrebbe richiedere allo studente di scrivere modelli e formule.
    Verrà inoltre valutata la partecipazione attiva alle lezioni e le soluzioni agli esercizi assegnati.

    Un'ultima nota e qualche consiglio. Gli esami sono un'attività stressante sia per lo studente, sia per me. Il termine per prenotare l'esame è, al momento, tre giorni prima della data dell'esame. Se l'esame è lunedì, saprò quanti studenti si sono iscritti solo il sabato alle 0.00 (mezzanotte), lasciandomi un intero weekend di lavoro per organizzare l'esame. Finora, in media, il 50% degli studenti iscritti agli esami non ha caricato i propri progetti. Il 5% consegna il compito senza leggere le istruzioni, il che comporta la non accettazione alla parte orale. Il 20% non si presenta all'esame. Del restante 25% degli studenti, il 10% si presenta senza una conoscenza di base del contenuto del corso o senza conoscere il contenuto del progetto presentato (ho già detto che barare non è un'opzione?). Ciò lascia solo un 15% del totale degli studenti registrati da esaminare.
    Tuttavia, devo verificare se uno studente ha inviato il progetto a più Google classroom (una per ogni anno accademico), dove il nome dello studente potrebbe essere diverso da quello su gomp (un nome parziale o un diverso ordine di nome/cognome). Poi, per sapere se uno studente iscritto ha già superato l'esame e si è dimenticato di cancellare la prenotazione (alcuni studenti si prenotano, per ogni esame, ogni data d'esame disponibile), devo controllare su gomp tutte le sessioni d'esame precedenti. Ciò significa che spreco l'85% del tempo in attività inutili piuttosto che concentrarmi sulla valutazione.
    Per semplificare gli esami consiglio di:
    - Contattarmi o Venire a una sessione d'esame (come spettatore) per capire come si svolge l'esame e il livello di preparazione necessario per superarlo.
    - Prenotare l'esame *solo* se si è inviato il progetto e si ritiene di poterlo superare.
    - Il giorno dell'esame, arrivare puntuali e rispondere all'appello. Aspettare il proprio turno in aula o nelle immediate vicinanze, per non essere rimandati a fine giornata.
    - Barare ad un'esame è un reato che può portare alla reclusione.

Prenotazione appello

E' possibile prenotarsi ad un appello d'esame, collegandosi al portale studenti.

Elenco appelli d'esame disponibili

    Al momento non ci sono appelli disponibili.

Mario Guarracino è ricercatore associato presso l'Istituto di Calcolo e Reti ad Alte Prestazioni del Consiglio Nazionale delle Ricerche (CNR) e ricercatore (RTDb) presso il Dipartimento di Economia e Giurisprudenza dell'Università degli Studi di Cassino e del Lazio Meridionale. Ha conseguito il Dottorato di Ricerca in Matematica e la Laurea in Matematica Applicata. La sua formazione post-dottorato al CNR si è concentrata sulle architetture ad alte prestazioni a basso costo per il calcolo scientifico. È stato affiliato con il Center for Applied Optimization presso l'Università della Florida da giugno 2005 a dicembre 2013, e con il Laboratory of Algorithms and Technologies for Networks Analysis (LATNA) presso Research University Higher School of Economics (HSE, Russia) da gennaio 2014 a dicembre 2018. Ha insegnato vari corsi in informatica, statistica e matematica in Italia e all'estero.
Da gennaio 2012 a dicembre 2015 ha diretto il Laboratorio di genomica, trascrittomica e proteomica (Lab-GTP), un'iniziativa pubblico-privata per lo sviluppo di metodologie di analisi dei dati per la diagnosi molecolare e la terapia genica delle malattie genetiche rare (teranostica) . Nel laboratorio ha guidato un gruppo di ricerca con diversi ricercatori, dottorandi e postdoc. Da gennaio 2016 è stato alla guida del Computational Data Science Laboratory (CDS-Lab).

La sua ricerca è focalizzata sullo studio e sviluppo di nuovi algoritmi di analisi dei dati, metodologie e strumenti software basati sulla programmazione matematica e sulla teoria dell'apprendimento statistico. Applica le sue competenze per svelare i problemi del mondo reale e il suo obiettivo è aiutare scienziati e professionisti a comprendere meglio i loro problemi, senza la seccatura di integrare e ispezionare grandi quantità di dati provenienti da fonti diverse.

Scholar: https://scholar.google.it/citations?user=4ojMQsIAAAAJ
Orcid: https://orcid.org/0000-0003-2870-8134
Scopus: http://www.scopus.com/inward/authorDetails.url?authorID=15065308300