Laboratorio di analisi dei dati con R (2019/2020)

Obiettivi formativi

Il corso denominato "Laboratorio di analisi dei dati con R" è un'attività (facoltativa) di tipologia f che permette l'assegnazione, tramite prova di accertamento finale, di 3 CFU. Le caratteristiche di questa attività sono le seguenti:

- L'attività è disponibile sia per gli studenti del CdLM in Economics e del CdLM in Banca e Finanza sia per gli studenti delle altre lauree magistrali e triennali della Scuola di Economia e Management.

- Sono disponibili 48 posti. Per partecipare alle lezioni in modo attivo è necessario essere dotati di un proprio computer portatile.

- Le richieste di partecipazione a tale attività verranno soddisfatte in base all’ordine cronologico di iscrizione considerando che verrà data precedenza agli studenti delle lauree magistrali, in particolare agli studenti del CdLM in Economics e del CdLM in Banca e Finanza. Per non perdere il proprio posto in graduatoria è necessario presentarsi alla prima lezione del corso, oppure, in caso di impedimenti, comunicare la propria assenza al tutor tramite email. I posti degli assenti non giustificati verranno riallocati tra gli studenti presenti il primo giorno di lezione.

- Si può partecipare a questa attività anche se non si ha una conoscenza del software R.

- La frequenza alle lezioni/esercitazioni è obbligatoria. Per poter accedere alla prova di accertamento del profitto che si terrà alla fine del corso è necessario aver frequentato almeno i 2/3 delle lezioni/esercitazioni.

Sono previste complessivamente 18 ore di lezioni/esercitazioni (più 2 ore di accertamento finale).

Il calendario di massima del corso è il seguente:

venerdì 15 novembre 2019, ore 15:00-18:00, aula SMT.11;
venerdì 22 novembre 2019, ore 15:00-18:00, aula SPC;
venerdì 29 novembre 2019, ore 15:00-18:00, aula SMT.11;
venerdì 6 dicembre 2019, ore 15:00-18:00, aula SPC;
venerdì 13 dicembre 2019, ore 15:00-18:00, aula SMT.11.
venerdì 20 dicembre 2019, ore 15:00-18:00, aula SMT.11;
(la data della prova finale verrà comunicata a tempo debito).


Tutor: dott. Luca Bisognin

Apertura prenotazioni: 19 ottobre 2019
Chiusura prenotazioni: 14 novembre 2019

La procedura di iscrizione si trova sulla piattaforma elearning del corso.

Programma

R è un software open-source per l’analisi statistica. Nato alla fine degli anni Novanta dal software S, R è un linguaggio multi-paradigma che nell’arco di due decenni ha acquisito un ruolo centrale tra i software che si occupano di analisi statistica, grazie anche al forte sviluppo che ha ricevuto lo sviluppo di pacchetti (attualmente più di 15000) che implementano tecniche e metodi provenienti dai campi più diversi della statistica metodologica e applicata. Negli anni più recenti, grazie allo sviluppo di un’intera famiglia di pacchetti volti a semplificare ed organizzare su nuove basi le modalità di interazione e programmazione con R, il software ha trovato nuovi sbocchi per esprimere al meglio le proprie potenzialità. Il linguaggio R, assieme a Python, è oggi considerato il linguaggio di riferimento nell’ambito della moderna data science e, in particolare, nel machine learning, e si interfacciano agevolmente con molti altri software quali Excel, Tableau, Microsoft Power BI ecc.

Il corso si propone di fornire le basi della programmazione e della logica di funzionamento del software R introducendo al contempo i partecipanti ad alcune delle innovazioni più recenti che lo stanno interessando. Oltre ad un’introduzione al linguaggio R e a R Studio, il corso verterà sui seguenti argomenti: tecniche di trattamento e manipolazione dati (data management), strumenti di grafica avanzata per l’analisi statistica, cenni sulla rappresentazione grafica di informazioni geo-referenziate, analisi di regressione, simulazioni Monte Carlo, cenni sulla reportistica automatica e sulla produzione di documenti interattivi.

Testi di riferimento
Autore Titolo Casa editrice Anno ISBN Note
Hadley Wickham Advanced R (Edizione 1) CRC Press, Taylor & Francis Group 2015 9781466586970
Espa G., Micciolo R. Analisi esplorativa dei dati con R Apogeo 2012 978-88-503-3031-7
Ronald K. Pearson Exploratory Data Analysis Using R (Edizione 1) CRC Press, Taylor & Francis Group 2018 9781138480605
Marco Bee, Flavio Santi Finanza quantitativa con R (Edizione 1) Apogeo Education 2013 9788838787041
Hadley Wickham ggplot2: Elegant Graphics for Data Analysis (Edizione 1) Springer 2009 9780387981413
Francesca Ieva, Chiara Masci, Anna Maria Paganoni Laboratorio di Statistica con R (Edizione 2) Pearson 2016 9788891901521
Giuseppe Espa, Rocco Micciolo Problemi ed esperimenti di statistica con R (Edizione 1) Apogeo Education 2013 9788838786105
Hadley Wickham, Garrett Grolemund R for Data Science (Edizione 1) O'Reilly 2016 9781491910399
Ngai Hang Chan, Hoi Ying Wong Simulation Techniques in Financial Risk Management (Edizione 1) Wiley 2015 9781118735817
M. Bécue-Bertaut Textual Data Science with R (Edizione 1) CRC Press, Taylor & Francis Group 2018 9781138626911
Graham J. Williams The Essentials of Data Science: Knowledge Discovery Using R (Edizione 1) CRC Press, Taylor & Francis Group 2017 9781138088634

Modalità d'esame

Per poter accedere alla prova di accertamento del profitto che si terrà alla fine del corso è necessario aver frequentato almeno i 2/3 delle lezioni/esercitazioni. La prova di accertamento del profitto consiste in una prova pratica e in un eventuale colloquio orale sull’utilizzo del software R. La prova di accertamento del profitto è unica e non sarà possibile risostenerla in una seconda data.