In questo periodo mi è venuta voglia di sapere qualcosa di più sull’econometria: cosa ci potrebbe essere di più affascinante per un appassionato di grafici che capire come si studiano statisticamente le serie storiche?
Purtroppo, per quanto appassionato, non ho una grande cultura in campo statistico. Mi sono parse però abbastanza curiose le impressioni che ho avuto su qualche semplice esperimento iniziale. Magari i più esperti si faranno qualche risata, tuttavia è venuto fuori che qualcosa che sembra abbastanza intuitivo, come l’autocorrelazione, in realtà lo è molto meno di quel che si possa pensare.
Per prima cosa ho pensato di costruire un bel correlogramma in Excel. Il difficile è stato più che altro far sì che si potesse esaminare anche solo una parte dei dati senza cambiare le formule. Per fare questo sono diventato scemo con le istruzioni “indiretto” e “indirizzo”, che non conoscevo, anche se io dovrei essere uno che sa programmare! Spero che le formule siano giuste!
Per chi non lo sapesse, lo scopo del correlogramma è la ricerca della memoria nella serie storica attraverso l’autocorrelazione. In pratica vengono rilevate delle correlazioni fra la serie partendo dal punto k e la stessa serie partendo dal punto k+1 (lag 1), poi dal punto k+2 ecc. Il grafico mostra il risultato di tutte queste correlazioni, partendo da 1 (correlazione fra k e lo stesso k) e continuando con gli altri lag che saranno(di solito) sempre inferiori a 1 come risultato. Se il lag è vicino allo zero non c’è memoria, se è significativamente superiore (ci sono delle regole precise) allora c’è memoria.
Qui la prima cosa che mi ha incuriosito è che nel mio manualetto di statistica sapevo che per trovare una correlazione bisogna fare la regressione o interpolazione o dir che si voglia, che comporta una serie di calcoli complicati, però, anche sulla guida di Excel, c’è una semplice formula della covarianza divisa per il prodotto delle deviazioni standard. Beh, ho fatto la prova (con un altro foglio excel) e viene lo stesso. Potenza della matematica! Anzi è meglio perché come la sapevo io il coefficiente viene senza segno, in questo modo invece ha il segno e dice se è una correlazione positiva o negativa.
La prima cosa che mi è venuta in mente è stata quella di mettere nel correlogramma delle serie dei prezzi a 5 minuti, e ho visto una forte memoria, ma poi ho visto che lo stesso veniva anche con serie casuali sul tipo delle chanches semplici alla roulette. A quanto ho capito ciò avviene perché, se la serie di roulette fosse un white noise, da un colpo al successivo l’equity dovrebbe essere tipo +10, -5, +2, invece alle chanches semplici può essere solo –1 o +1. Quindi, incredibile a dirsi, anche questa è una forma di memoria, ma a noi non interessa, perché non si vince niente per prevedere che al prossimo colpo uscirà o rosso o nero! D’altronde, se noi mettiamo su un grafico la serie e la stessa serie al lag1, si vede che i dati, se sono abbastanza, si dispongono attorno a una bella retta con poca dispersione, e questo appunto vuol dire correlazione lineare. Ecco perché per l’analisi delle serie finanziarie si prendono i rendimenti e non i prezzi! Grande scoperta!
Allora ho provato a prendere le differenze dei prezzi o la differenza percentuale o la differenza del logaritmo dei prezzi, cambia poco, mi pare. E qui ho trovato che memoria se ne trova poca, ma non solo, anche in un asset costruito artificialmente che sale più o meno sempre è difficile trovare qualcosa! A essere sincero mi aspettavo molto di più.
Nella serie allegata (il close del fib a 5 minuti del 12 c.m.), mi aspettavo di trovare una forte memoria, magari il fib fosse così tutti i giorni, ma non si vede niente. Inquadrando i dati fino alle 11.45 si nota invece un lag significativo, il 10, e niente nella colonna AC, mah, forse i dati sono troppo pochi, sperando di non aver sbagliato qualcosa. In compenso si nota addirittura una certa antipersistenza ai lag 2 e 3!
Ciò mi ha molto sorpreso: se non si trova memoria nemmeno in una serie che pare prevedibile figuriamoci sulle altre. Mi viene in mente che anziché i semplici rendimenti si potrebbe mettere qualcosa di più complicato nel correlogramma, ma a questo punto, se si deve procedere empiricamente, tanto vale usare l’AT.
Boh, non ne so abbastanza per giudicare, mi sembra che, in ogni caso, sapere qualcosa di econometria dia una buona forma mentis su come guardare un grafico, anche se non si arriva a creare dei modelli econometrici veri e propri. Per quanto ne so sui rendimenti si trova poco, forse qualcosa di più sui dati macroeconomici, oppure sulla volatilità.
Stavolta al posto di un libro di AT penso che prenderò l’Hamilton: “Time series analysis”, tanto il prezzo è lo stesso . Oppure “Econometria delle serie storiche”, che dovrebbe essere lo stesso libro tradotto.
-------------------------------------------------------
Per quanto riguarda il correlogramma:
La serie completa si mette nel foglio “dati”, i dati da analizzare devono essere nella colonna g, a partire da g4.
Nel foglio “AC” “inizio” e “fine” indicano le righe dei dati dalle quali si vuole iniziare e finire. Nelle colonna G vengono “riprodotti” i dati del foglio “dati”.
“Confidenza” indica il livello di significatività dell’autocorrelazione (AC). Per il grado di significatività ho messo il 95%: se i dati nelle colonne J o K diventano verdi allora su quel lag c’è memoria al 95%.
La colonna AC rappresenta l’autocorrelazione per ogni lag.
A fianco della colonna AC ho messo quella della “correlazione”. Se ho ben capito, la correlazione “vera” è la colonna “correlazione”, mentre l’altra (che è quella che viene invece usata di solito)sarebbe la stima, ipotizzando che la serie dei dati sia solo un campione di una popolazione più grande. Quindi se uno non si fida e vuole capire che cosa accade realmente nel grafico dovrebbe guardare la colonna “correlazione”.
Purtroppo, per quanto appassionato, non ho una grande cultura in campo statistico. Mi sono parse però abbastanza curiose le impressioni che ho avuto su qualche semplice esperimento iniziale. Magari i più esperti si faranno qualche risata, tuttavia è venuto fuori che qualcosa che sembra abbastanza intuitivo, come l’autocorrelazione, in realtà lo è molto meno di quel che si possa pensare.
Per prima cosa ho pensato di costruire un bel correlogramma in Excel. Il difficile è stato più che altro far sì che si potesse esaminare anche solo una parte dei dati senza cambiare le formule. Per fare questo sono diventato scemo con le istruzioni “indiretto” e “indirizzo”, che non conoscevo, anche se io dovrei essere uno che sa programmare! Spero che le formule siano giuste!
Per chi non lo sapesse, lo scopo del correlogramma è la ricerca della memoria nella serie storica attraverso l’autocorrelazione. In pratica vengono rilevate delle correlazioni fra la serie partendo dal punto k e la stessa serie partendo dal punto k+1 (lag 1), poi dal punto k+2 ecc. Il grafico mostra il risultato di tutte queste correlazioni, partendo da 1 (correlazione fra k e lo stesso k) e continuando con gli altri lag che saranno(di solito) sempre inferiori a 1 come risultato. Se il lag è vicino allo zero non c’è memoria, se è significativamente superiore (ci sono delle regole precise) allora c’è memoria.
Qui la prima cosa che mi ha incuriosito è che nel mio manualetto di statistica sapevo che per trovare una correlazione bisogna fare la regressione o interpolazione o dir che si voglia, che comporta una serie di calcoli complicati, però, anche sulla guida di Excel, c’è una semplice formula della covarianza divisa per il prodotto delle deviazioni standard. Beh, ho fatto la prova (con un altro foglio excel) e viene lo stesso. Potenza della matematica! Anzi è meglio perché come la sapevo io il coefficiente viene senza segno, in questo modo invece ha il segno e dice se è una correlazione positiva o negativa.
La prima cosa che mi è venuta in mente è stata quella di mettere nel correlogramma delle serie dei prezzi a 5 minuti, e ho visto una forte memoria, ma poi ho visto che lo stesso veniva anche con serie casuali sul tipo delle chanches semplici alla roulette. A quanto ho capito ciò avviene perché, se la serie di roulette fosse un white noise, da un colpo al successivo l’equity dovrebbe essere tipo +10, -5, +2, invece alle chanches semplici può essere solo –1 o +1. Quindi, incredibile a dirsi, anche questa è una forma di memoria, ma a noi non interessa, perché non si vince niente per prevedere che al prossimo colpo uscirà o rosso o nero! D’altronde, se noi mettiamo su un grafico la serie e la stessa serie al lag1, si vede che i dati, se sono abbastanza, si dispongono attorno a una bella retta con poca dispersione, e questo appunto vuol dire correlazione lineare. Ecco perché per l’analisi delle serie finanziarie si prendono i rendimenti e non i prezzi! Grande scoperta!
Allora ho provato a prendere le differenze dei prezzi o la differenza percentuale o la differenza del logaritmo dei prezzi, cambia poco, mi pare. E qui ho trovato che memoria se ne trova poca, ma non solo, anche in un asset costruito artificialmente che sale più o meno sempre è difficile trovare qualcosa! A essere sincero mi aspettavo molto di più.
Nella serie allegata (il close del fib a 5 minuti del 12 c.m.), mi aspettavo di trovare una forte memoria, magari il fib fosse così tutti i giorni, ma non si vede niente. Inquadrando i dati fino alle 11.45 si nota invece un lag significativo, il 10, e niente nella colonna AC, mah, forse i dati sono troppo pochi, sperando di non aver sbagliato qualcosa. In compenso si nota addirittura una certa antipersistenza ai lag 2 e 3!
Ciò mi ha molto sorpreso: se non si trova memoria nemmeno in una serie che pare prevedibile figuriamoci sulle altre. Mi viene in mente che anziché i semplici rendimenti si potrebbe mettere qualcosa di più complicato nel correlogramma, ma a questo punto, se si deve procedere empiricamente, tanto vale usare l’AT.
Boh, non ne so abbastanza per giudicare, mi sembra che, in ogni caso, sapere qualcosa di econometria dia una buona forma mentis su come guardare un grafico, anche se non si arriva a creare dei modelli econometrici veri e propri. Per quanto ne so sui rendimenti si trova poco, forse qualcosa di più sui dati macroeconomici, oppure sulla volatilità.
Stavolta al posto di un libro di AT penso che prenderò l’Hamilton: “Time series analysis”, tanto il prezzo è lo stesso . Oppure “Econometria delle serie storiche”, che dovrebbe essere lo stesso libro tradotto.
-------------------------------------------------------
Per quanto riguarda il correlogramma:
La serie completa si mette nel foglio “dati”, i dati da analizzare devono essere nella colonna g, a partire da g4.
Nel foglio “AC” “inizio” e “fine” indicano le righe dei dati dalle quali si vuole iniziare e finire. Nelle colonna G vengono “riprodotti” i dati del foglio “dati”.
“Confidenza” indica il livello di significatività dell’autocorrelazione (AC). Per il grado di significatività ho messo il 95%: se i dati nelle colonne J o K diventano verdi allora su quel lag c’è memoria al 95%.
La colonna AC rappresenta l’autocorrelazione per ogni lag.
A fianco della colonna AC ho messo quella della “correlazione”. Se ho ben capito, la correlazione “vera” è la colonna “correlazione”, mentre l’altra (che è quella che viene invece usata di solito)sarebbe la stima, ipotizzando che la serie dei dati sia solo un campione di una popolazione più grande. Quindi se uno non si fida e vuole capire che cosa accade realmente nel grafico dovrebbe guardare la colonna “correlazione”.
Allegati
Ultima modifica: