Pubblicazioni

Text Mining in Macroeconomics and Finance Using Unsupervised Machine Learning Algorithms  (2021)

Autori:
Moreno Pérez, Carlos
Titolo:
Text Mining in Macroeconomics and Finance Using Unsupervised Machine Learning Algorithms
Anno:
2021
Tipologia prodotto:
Doctoral Thesis
Lingua:
Inglese
Parole chiave:
COVID 19, EGARCH, Latent Dirichlet Allocation, Machine learning, Natural Language Processing, Coronavirus, Skip Gram, Trade war, Word Embedding, Central Bank of Mexico, Central Bank Communication, Monetary Policy, Structural Vector Autoregressive Model, Text Mining, Central Bank of Brazil.
Abstract (italiano):
Questa tesi presenta tre diverse applicazioni di macroeconomia e finanza delle tecniche di analisi di testi basate su algoritmi di apprendimento automatico non supervisionati. In particolare, queste tecniche di analisi di testi vengono applicate ai documenti ufficiali delle banche centrali e agli articoli di giornale scritti in inglese e spagnolo. L'implementazione di queste tecniche ha comportato un considerevole lavoro di preelaborazione per rimuovere paragrafi e articoli non rilevanti per l'analisi. Ai documenti ufficiali delle banche centrali, abbiamo assegnato etichette ad ogni paragrafo per indicare la data e altra informazione utile. Abbiamo quindi applicato vari algoritmi di apprendimento automatico non supervisionato come Latent Dirichlet Allocation (LDA), il modello Skip-Gram e K-Means per costruire misure di testo. Alcuni di questi algoritmi di apprendimento automatico non supervisionati, che erano già disponibili per la lingua inglese, sono stati adattati alla lingua spagnola. Abbiamo prodotto semplici misure del contenuto della comunicazione per identificare gli argomenti, cioè i temi o soggetti, e il tono, cioè il sentimento o il grado di incertezza del testo. Quindi, abbiamo studiato la relazione tra questi indici di incertezza e le variabili economiche chiave in macroeconomia e finanza utilizzando i modelli VAR strutturale e GARCH esponenziale. Il primo articolo indaga la relazione tra le opinioni espresse nei verbali delle riunioni del Comitato di politica monetaria (COPOM) della Banca Centrale del Brasile e l'economia reale. In primo luogo, deduciamo il contenuto dei paragrafi dei minuti con LDA e poi costruiamo un indice di incertezza per i minuti con Word Embeddings e K-Means. Dopo costruiamo due indici di incertezza per diversi contenuti, Il primo indice di incertezza del tema è costruito da paragrafi con una maggiore probabilità di argomenti relativi alle "condizioni economiche generali", mentre il secondo indice di incertezza del tema è costruito da paragrafi con una maggiore probabilità di argomenti relativi a "inflazione" e “discussione della politica monetaria”. Infine, tramite un VAR strutturale esploriamo gli effetti di questi indici di incertezza su alcune variabili macroeconomiche brasiliane Il secondo articolo studia e misura l'incertezza nei verbali delle riunioni del consiglio di amministrazione della Banca Centrale del Messico e la mette in relazione con le variabili di politica monetaria. In particolare, concepiamo due indici di incertezza per la versione spagnola dei verbali utilizzando tecniche di apprendimento automatico senza supervisione. Il primo indice di incertezza è costruito sfruttando LDA, mentre il secondo utilizza il modello Skip-Gram e K-Means. Costruiamo anche indici di incertezza per le tre sezioni principali del verbale. Troviamo che una maggiore incertezza nei verbali è correlata a un aumento dell'inflazione e della massa monetaria. Il terzo articolo indaga le reazioni dei mercati finanziari statunitensi alle notizie dei giornali dal gennaio 2019 al primo maggio 2020. A tal fine, deduciamo il contenuto e il sentimento delle notizie sviluppando indici dai titoli e dai frammenti del New York Times . In particolare, utilizziamo LDA per dedurre il contenuto degli articoli e gli algoritmi Skip-Gram e K-Means per misurare il loro sentimento (incertezza). In questo modo si arriva alla definizione di una serie di indici giornalieri di incertezza per ogni tema. Questi indici vengono quindi utilizzati per trovare spiegazioni nel comportamento dei mercati finanziari statunitensi implementando una serie di modelli EGARCH. In sostanza, troviamo che due indici di incertezza e argomento, uno relativo alle notizie COVID-19 e l'altro alle notizie sulla guerra commerciale, spiegano gran parte dei movimenti nei mercati finanziari dall'inizio del 2019 fino ai primi quattro mesi del 2020 .
Id prodotto:
120900
Handle IRIS:
11562/1042759
ultima modifica:
3 novembre 2022
Citazione bibliografica:
Moreno Pérez, Carlos, Text Mining in Macroeconomics and Finance Using Unsupervised Machine Learning Algorithms

Consulta la scheda completa presente nel repository istituzionale della Ricerca di Ateneo IRIS

<<indietro
Condividi