Data generating process

  • Trading Day 19 aprile Torino - Corso Gratuito sull'investimento

    Migliora la tua strategia di trading con le preziose intuizioni dei nostri esperti su oro, materie prime, analisi tecnica, criptovalute e molto altro ancora. Iscriviti subito per partecipare gratuitamente allo Swissquote Trading Day.

    Per continuare a leggere visita questo LINK

vercetti

Presto sul BUND
Registrato
30/11/03
Messaggi
1.890
Punti reazioni
112
Salve a tutti,

ho un dubbio teorico che spero possiate risolvermi.

Ipotizziamo che esista un Data generating process del tipo Y=X1*B1+X2*B2+E, dove E è un errore normale media 0 e varianza costante (ipotizziamo anche che tutte le altre ipotesi alla base degli OLS siano valide).

Se utilizzo un modello del tipo Y=X1*B1+U (quindi con omissione di X2) avrò una certa stima di B1.
Ora, se X1 e X2 non sono correlati B1 sarà non distorto, altrimenti sarà distorto e inconsistente. I passaggi matematici del perchè questo accada mi sono assolutamente chiari, la logica dietro tutto ciò un po' meno:
io mi aspetto che se la correlazione tra X1 e X2 è positiva, il valore che assumerà B1 sarà maggiore di quello del DGP; viceversa, B1 sarà minore del valore del DGP se la corr è negativa (tutto ciò è confermato da alcuni esperimenti fatti su eviews).
Ho provato a spiegare il tutto in questo modo: se X2 non è incluso nel modello rientra sicuramente nell'errore U senza che io me ne accorga. Questo comporta che per valori elevati di X1 anche l'errore (non osservabile) avrà valori elevati e quindi l'R2 sarà molto basso (anche questo confermato dagli esperimenti). Ma perchè B1 stimato aumenta? Dipende dal fatto che un B1 elevato fa sì che X1 provi a spiegare anche tutta la parte di Y non spiegata da X2 inclusa in U?

Perdonate la banalità del quesito ma a lezione ci hanno solo detto che lo stimatore è distorto, senza approfondire minimamente cosa accade nella realtà.

Grazie a tutti.
 
Salve a tutti,

ho un dubbio teorico che spero possiate risolvermi.

Ipotizziamo che esista un Data generating process del tipo Y=X1*B1+X2*B2+E, dove E è un errore normale media 0 e varianza costante (ipotizziamo anche che tutte le altre ipotesi alla base degli OLS siano valide).

Se utilizzo un modello del tipo Y=X1*B1+U (quindi con omissione di X2) avrò una certa stima di B1.
Ora, se X1 e X2 non sono correlati B1 sarà non distorto, altrimenti sarà distorto e inconsistente. I passaggi matematici del perchè questo accada mi sono assolutamente chiari, la logica dietro tutto ciò un po' meno:
io mi aspetto che se la correlazione tra X1 e X2 è positiva, il valore che assumerà B1 sarà maggiore di quello del DGP; viceversa, B1 sarà minore del valore del DGP se la corr è negativa (tutto ciò è confermato da alcuni esperimenti fatti su eviews).
Ho provato a spiegare il tutto in questo modo: se X2 non è incluso nel modello rientra sicuramente nell'errore U senza che io me ne accorga. Questo comporta che per valori elevati di X1 anche l'errore (non osservabile) avrà valori elevati e quindi l'R2 sarà molto basso (anche questo confermato dagli esperimenti). Ma perchè B1 stimato aumenta? Dipende dal fatto che un B1 elevato fa sì che X1 provi a spiegare anche tutta la parte di Y non spiegata da X2 inclusa in U?

Perdonate la banalità del quesito ma a lezione ci hanno solo detto che lo stimatore è distorto, senza approfondire minimamente cosa accade nella realtà.

Grazie a tutti.



Sono ignorante in materia ma se presupponi un errore a varianza costante e media nulla presupponi variabili deterministiche e non stocastiche.

Poichè cosi non è avrai anche correlazione tra gli errori e la conseguente distorsione degli OLS che diverranno inconsistenti rendendo impossibile al DGP di essere spiegato da una funzione di probabilità congiunta.

Saluti e perdono..neanche io so cosa dico:)

Sig.E
 
Sono ignorante in materia ma se presupponi un errore a varianza costante e media nulla presupponi variabili deterministiche e non stocastiche.

Poichè cosi non è avrai anche correlazione tra gli errori e la conseguente distorsione degli OLS che diverranno inconsistenti rendendo impossibile al DGP di essere spiegato da una funzione di probabilità congiunta.

Saluti e perdono..neanche io so cosa dico:)

Sig.E

innanzitutto grazie per la risposta.
sì, l'ipotesi aggiuntiva (implicita nel modello proposto) è che i regressori siano non stocastici... credo che la tua spiegazione sia riferita al caso di regressori stocastici, argomento che ancora non abbiamo trattato...
il mio dubbio è relativo proprio al caso di regressori deterministici: le stime si allontanano dal valore del DGP in funzione della correlazione... come si può spiegare questo? il ragionamento fatto nel primo post è sensato?

un saluto
 
Indietro