Problema di statistica

vykae

Nuovo Utente
Registrato
2/5/06
Messaggi
13
Punti reazioni
1
Avrei bisogno di qualche consiglio da parte di qualcuno che mastica di statistica.
Stò facendo vari test su serie storiche finanziarie e mi sono stoppato su un concetto direi piuttosto elementare raffrontato con i problemi di verifica di ipotesi su medie campionarie che ho già affrontato e superato con successo.
Il problema è questo, abbiamo una certa popolazione che si sa distribuirsi normalmente.

Non conosco media e varianza della popolazione ma mi aiuto estraendo un campione di numerosità (mettiamo) 5.
La media campionaria è pari (sempre mettiamo...) ad 1 e la deviazione standard (campionaria quindi si divide per n-1) è pari a 2.
Supponiamo ora di estrarre dalla popolazione un solo elemento.
Che probabilità c'è che si ottenga un valore pari o maggiore di 5?
Il mio problema è l'indisponibilità della varianza della popolazione, se fosse nota e pari a 3 ad esempio infatti non farei altro che applicare la seguente formula:
(Valore obiettivo-Media)/deviazione standard della popolazione, ovvero (5-1)/3 e sulle tavole delle z troverei che c'è un 2,3% di possibilità che nel nostro caso esca un elemento di valore 5 o superiore.
Purtroppo la varianza della popolazione non è nota in questo esempio però abbiamo un campione che sicuramente ci può essere di aiuto...il problema è come?
Secondo problema
e se fosse nota la media della popolazione?come dovrei comportarmi nello stesso problema?
Sicuramente è una buccia di banana ma non riesco ad entrare mentalmente nel problema, sicuramente qui c'è qualcuno che può aiutarmi...
 
Ultima modifica:
UP per kermit, piedi a terra o per altri esperti di statistica
 
Salve,
dai un occhiata ai test di ipotesi su media con varianza ignota e su varianza con media ignota. Dovresti trovare un approccio che puoi riutilizzare nel tuo caso.

Se riesco vedo di postarti in giornata come fare.

M.L.
 
M.Likelihood ha scritto:
Salve,
dai un occhiata ai test di ipotesi su media con varianza ignota e su varianza con media ignota. Dovresti trovare un approccio che puoi riutilizzare nel tuo caso.

Se riesco vedo di postarti in giornata come fare.

M.L.
ciao, bel nick complimenti!
E' esattamente quello che ho provato a fare, riadattare i test di verifica ipotesi sulla media campionaria ponendo n=1 cioè considerando un campione di una sola unità statistica.
Ciò si può fare però solamente nel caso di varianza della popolazione nota, in quanto la variabile standardizzata z per il test di verifica ipotesi non dipende dalla numerosità del campione (ovvero c'è una radice quadrata di n al denominatore ma per n=1 diventa ovviamente ininfluente).
Purtroppo nel caso di varianza della popolazione non nota si usa per il test di verifica di ipotesi la t di student che invece dipende dalla numerosità del campione ed i gradi di libertà si azzererebbero essendo questi ultimi n-1.
Ciò mi fa pensare che l'approccio al mio problema debba essere affrontato differentemente in quanto non devo fare dei test sui parametri statistici di una popolazione tramite un campione...ma piuttosto verificare che un solo valore possa considerarsi ad un certo livello di significatività riveniente da una data popolazione con varianza incognita di cui abbiamo però un campione.
Se riesci ad arrivare alla soluzione tramite qualche modifica ai test canonici sulla verifica di ipotesi su medie campionarie comunque posta che sono tutt'orecchi...tutt'occhi...vabhè ci siamo capiti! OK!

Vykae
 
Ultima modifica:
vykae ha scritto:
UP per kermit, piedi a terra o per altri esperti di statistica


Non sono un esperto di Statistica, anzi non ho sostenuto neppure 1 esame di tale disciplina ( non c’ era nel mio corso di laurea ) di cui conosco, oltre naturalmente a quanto spiega brillantemente Trilussa . . . :D , solo quanto serve x la progettazione di sistemi di trading
pertanto sebbene spiacente non posso aiutarti nella soluzione di rompicapo teorici di scarsa utilità pratica come sembra essere quello da te proposto, se ho ben capito il quesito . . . :confused:
Tra l’ altro contrariamente alla tua ipotesi di distribuzione normale ( “abbiamo una certa popolazione che si sa distribuirsi normalmente” ) l’ evidenza empirica ci suggerisce un comportamento non gaussiano della distribuzione dei rendimenti finanziari . . . :rolleyes:
Nel caso invece il tuo quesito fosse attinente alla previsione finanziaria cerca di formularlo in maniera + comprensibile ai non introdotti al linguaggio degli statistici . . . ;)
 
vykae ha scritto:
Avrei bisogno di qualche consiglio da parte di qualcuno che mastica di statistica.
Stò facendo vari test su serie storiche finanziarie e mi sono stoppato su un concetto direi piuttosto elementare raffrontato con i problemi di verifica di ipotesi su medie campionarie che ho già affrontato e superato con successo.
Il problema è questo, abbiamo una certa popolazione che si sa distribuirsi normalmente.

Non conosco media e varianza della popolazione ma mi aiuto estraendo un campione di numerosità (mettiamo) 5.
La media campionaria è pari (sempre mettiamo...) ad 1 e la deviazione standard (campionaria quindi si divide per n-1) è pari a 2.
Supponiamo ora di estrarre dalla popolazione un solo elemento.
Che probabilità c'è che si ottenga un valore pari o maggiore di 5?
Il mio problema è l'indisponibilità della varianza della popolazione, se fosse nota e pari a 3 ad esempio infatti non farei altro che applicare la seguente formula:
(Valore obiettivo-Media)/deviazione standard della popolazione, ovvero (5-1)/3 e sulle tavole delle z troverei che c'è un 2,3% di possibilità che nel nostro caso esca un elemento di valore 5 o superiore.
Purtroppo la varianza della popolazione non è nota in questo esempio però abbiamo un campione che sicuramente ci può essere di aiuto...il problema è come?
Secondo problema
e se fosse nota la media della popolazione?come dovrei comportarmi nello stesso problema?
Sicuramente è una buccia di banana ma non riesco ad entrare mentalmente nel problema, sicuramente qui c'è qualcuno che può aiutarmi...

Come dice anche Kermitt nel caso di serie finanziarie ipotizzare una distribuzione normale è una ipotesi base molto forte.
Cmq, poniamo che la distribuzione sia normale : puoi usare il bootstrapping di cui si parlava alcuni giorni fa. Tramite il ricampionamento ottieni la varianza della tua media, da lì applichi la formula che hai scritto prima. Per ricampionare con excel ecco un link molto chiaro : http://people.revoledu.com/kardi/tutorial/Bootstrap/examples.htm
 
kermitt ha scritto:
Non sono un esperto di Statistica, anzi non ho sostenuto neppure 1 esame di tale disciplina ( non c’ era nel mio corso di laurea ) di cui conosco, oltre naturalmente a quanto spiega brillantemente Trilussa . . .

eh, ma si sbagliava, la statistica ti dice che i due tizi hanno mangiato un pollo a testa con deviazione standard di un pollo, ed è tutto a posto. :p
 
kermitt ha scritto:
Non sono un esperto di Statistica...Tra l’ altro contrariamente alla tua ipotesi di distribuzione normale ( “abbiamo una certa popolazione che si sa distribuirsi normalmente” ) l’ evidenza empirica ci suggerisce un comportamento non gaussiano della distribuzione dei rendimenti finanziari . . . :rolleyes:
Nel caso invece il tuo quesito fosse attinente alla previsione finanziaria cerca di formularlo in maniera + comprensibile ai non introdotti al linguaggio degli statistici . . . ;)
Ciao Kermit, in realtà l'approssimazione alla normale della distribuzione dei rendimenti finanziari è ancora considerata negli ambienti accademici "di basso tiraggio" completamente plausibile...mi accontento quindi per ora di tale assunzione.
Esempio pratico spicciolissimo solo per farti capire la pratica della questione da me sollevata...una volta digerita mentalmente la teoria saprò riutilizzarla nei giusti ambiti.
Ho un campione di 5 rendimenti finanziari diciamo giornalieri (media campionaria=+0,5 e deviazione standard campionaria=2), orbene sotto la teoria del random walk la media della popolazione da cui riviene tal campione è 0 (se fosse completamente vero questo forum non avrebbe ragione di esistere ma semplifichiamo ed andiamo avanti...) e la varianza incognita.
Quale è la probabilità che possa verificarsi un rendimento giornaliero pari o maggiore a +4?
Forse così il discorso appare più chiaro.
Grazie a chi mi potrà delucidare

Vykae
 
Ultima modifica:
Pinco Pallino ha scritto:
Come dice anche Kermitt nel caso di serie finanziarie ipotizzare una distribuzione normale è una ipotesi base molto forte.
Cmq, poniamo che la distribuzione sia normale : puoi usare il bootstrapping di cui si parlava alcuni giorni fa. Tramite il ricampionamento ottieni la varianza della tua media, da lì applichi la formula che hai scritto prima. Per ricampionare con excel ecco un link molto chiaro : http://people.revoledu.com/kardi/tutorial/Bootstrap/examples.htm
Ottimo articolo, grazio Pinco, me lo studierò con molta calma, credo tra l'altro che possa risultarmi molto utile, però ho ancora il dubbio statistico di cui sopra e vorrei risolverlo prima di "cambiare carovana"...
grazie tante comunque!

Vykae
 
vykae ha scritto:
Ciao Kermit,


Forse così il discorso appare più chiaro.


no, continuo a non capire dove si vuole arrivare, che utilità può avere x la previsione esaminare 5 rendimenti, quale inferenza si può fare . . . :confused:
forse se ci dici a cosa dovrebbe servire in pratica si può provare a dare una risposta . . . ;)
 
nat64 ha scritto:
Circa l'altro problema ,ossia la possibilita' di fare un'inferenza su un bassissimo campione di v.c. ,di cui e' ignoto un momento fondamentale come la varianza ,non vedo come sia possibile rispondere al quesito che proponi che e' poi il nocciolo fondamentale di qualsiasi analisi probabilistica sui mercati non essendo possibile caratterizzare la distribuzione associata alla v.c. data la scarsezza di dati.
Oltretutto anche se si riuscisse a dimostrarne la normalita', magari su frame molto ampi (mensili o annuali) ,non e' detto che tale permanga in futuro essendo sconosciuto/i il/i generatori coinvolti.
Il massimo che riesco a dirti e' che ti stai muovendo in condizioni di estrema incertezza.
la varianza del campione è ovviamente nota, quella della popolazione non lo è.
Rispondere al quesito è possibile in quanto per popolazioni con varianza e media ignota si può con un campione andare a costruire un intervallo di confidenza per "mi" (media di popolazione).
Ossia se il quesito fosse stato quello che segue avrei saputo rispondere in quanto strumenti statistici standard sono stati costruiti e sono il volano di qualunque studio accademico che riguardi la statistica.
Per esempio:
Media e varianza di popolazione ignote e campione di numerosità bassa, mettiamo 10, con media e deviazione standard campionarie ovviamente note e pari rispettivamente a 68,7 e 8,67.Alfa = 0,05 e test bidirezionale per constatare se l'ipotesi nulla di una media di popolazione pari a 72 sia plausibile col campione estratto contro l'ipotesi alternativa che sia diverso.
Questi dati ci bastano e strabastano tramite la t di student per determinare che il campione è plausibilmente stato estratto da una popolazione normale con media appunto 72.
Calcoli t=(68,7-72)/(8,67/radice quadrata di 10)=-1,2 che in valore assoluto è < di 2,262 (valore teorico soglia della t di student per cpnfermare l'ipotesi nulla).
Se questo si può fare (e si può fare) allora non vedo come il mio piu' semplice quesito con addirittura un parametro noto in piu' (la media della popolazione pari a 0) non possa essere degno di soluzione.
Purtroppo non riesco ad entrare mentalmente nel problema.
Tutte le altre critiche sulla tipologia distributiva dei rendimenti finanziari poco importano di fronte al mio quesito che poggia su assunzioni (magari errate o approssimate) ben precise...quindi prima di mettere altra carne al fuoco vorrei risolvere il mio dubbio.
Credo che questa risposta valga anche per kermit che obiettava sulla poca numerosità del mio campione esemplificativo pretendendo esempi concreti da risolvere magari con altri strumenti interessantissimi ma che per ora non conosco (vedi bootstrap).
Forse il mio dubbio è troppo teorico e arido di precise interpretazioni statistico-finanziarie...ma credo che P.A.T. possa dare una mano visto che leggendo i suoi post si evince oltre che una alta preparazione statistica anche una "ingegneristica" propensione alla teoria prima che alla pratica.
Grazie lo stesso davvero.

Vykae
 
Ultima modifica:
nat64 ha scritto:
Scusa se insisto ma credo che stai facendo un po' di confusione .Una media campionaria e' tanto piu' incerta quanto piu' piccolo e' il campione disponibile .Si puo' avere solo un'idea dell'intervallo entro cui il valore atteso puo' trovarsi e tale intervallo e' tanto piu' largo quanto piu' e' bassa la numerosita' campionaria e il livello di probab. alfa con cui viene costruito tale interv. (detto di confidenza ) che puo' essere costruito con la distibuz. t a n-1 gdl. che e' adatta a piccoli campioni.
All'aumentare della numerosita' tale intervallo si restringera' in accordo al teorema di convergenza stocastica (o legge dei grandi numeri)e la media campionaria tendera' al valore atteso.
Quindi come vedi l'incertezza ti accompagnera' in maniera molto piu' antipatica quanto piu' scarsi saranno i dati disponibili sia per quanto riguarda la media che la varianza.

Prima di costruire tale intervallo pero' il bravo provetto statistico deve assicurarsi di avere a che fare con una distribuzione normale.
Ma il test t non e' il piu' ortodosso per stabilire la normalita' campionaria e' piu' valido il chi ^2 , se si hanno a disposizione molti dati ,se se ne hanno pochi sono piu' potenti Kolmogorov -Smirnov oppure Shapiro Wilk.

Un'altra cosa su cui mi pare che vai troppo leggero e' il dare per scontato la conoscenza della media pari a zero .
Ho detto prima che nel caso del modello che meglio ricalca l'andamento delle serie finanziarie cio' non e' a priori vero ,il valore atteso del processo potrebbe essere diverso da zero ,sia in positivo che in negativo , e sai qual'e' la cosa buffa ? Che nessuno e' in realta' in grado di dirlo con sufficiente attendibilita'.


:bye:
Concordo e probabilmente mi è sfuggito un passaggio dei miei post dove asserirei differentemente a quanto hai scritto.
Il test K-S con correzione Lilliefors, il chi-quadro, lo S-W, l'Andersen-Darling e chi piu' ne ha piu' ne metta sono tutti test che si propongono di verificare la normalità popolativa e non campionaria...e sono utilizzati solo se non ci sono assunzioni di base che invece riporto nel mio esempio...ti dirò di piu', li ho già applicati nella serie finanziaria oggetto del mio studio e tutti i test hanno decretato la possibilità (livello di significatività 95%) di approssimare alla Gaussiana.
Parlando poi di rendimenti giornalieri la media popolativa non può di certo differire molto dallo 0 in quanto si porrebbe una opportunità troppo grassa per non essere sfruttata dal mercato.
Purtroppo Nat le contestazioni in questo thread al mio dubbio si sono poggiate almeno fino ad ora solo sulle mie assunzioni di base o sulla collocazione interpretativa nell'ambito della finanza speculativa, lasciando poco spazio delucidativo alla sua vera linfa vitale.
Spero di non essere stato scortese con te nel chiamare in causa P.A.T. o chicchessia che possa invece aiutarmi nella sua generalizzazione teorica.
Grazie

Vykae
 
Parlando poi di rendimenti giornalieri la media popolativa non può di certo differire molto dallo 0 in quanto si porrebbe una opportunità troppo grassa per non essere sfruttata dal mercato.

nn ho capito cosa stai cercando di dimostrare :confused:

che col trading è/non è possibile ottenere extrarendimenti? (leggasi guadagnare?)

dura la vedo

nei mercati si guadagna e si perde

chi guadagna?

chi ha un vantaggio sulle notizie
chi trova inefficienze, arbitraggi
chi ha il coltello dalla parte del manico (market maker)
chi usa buoni metodi di trading
chi gestisce bene il risk/money management
chi ha fortuna
ecc....

pensi che tutto ciò te lo dica la statistica?
nn credo

se invece nn ho capito cosa stai facendo, fai finta che nn abbia parlato ;)
 
Proverò a porre il quesito in questi temini, la sostanza non cambia per capire come funziona il test.

Non conosco media e varianza della popolazione ma mi aiuto estraendo un campione di numerosità (mettiamo) 5.
La media campionaria è pari (sempre mettiamo...) ad 1 e la deviazione standard (campionaria quindi si divide per n-1) è pari a 2.
Supponiamo ora di estrarre dalla popolazione un solo elemento.
Come si costruisce la verifica di ipotesi che un singolo valore estratto successivamente dalla popolazione e pari a 5 sia compatibile ad un certo livello di significatività (mettiamo alfa=0,05) con la nostra popolazione?

Vykae
 
vykae ha scritto:
Proverò a porre il quesito in questi temini, la sostanza non cambia per capire come funziona il test.

Non conosco media e varianza della popolazione ma mi aiuto estraendo un campione di numerosità (mettiamo) 5.
La media campionaria è pari (sempre mettiamo...) ad 1 e la deviazione standard (campionaria quindi si divide per n-1) è pari a 2.
Supponiamo ora di estrarre dalla popolazione un solo elemento.
Come si costruisce la verifica di ipotesi che un singolo valore estratto successivamente dalla popolazione e pari a 5 sia compatibile ad un certo livello di significatività (mettiamo alfa=0,05) con la nostra popolazione?

Vykae

credo di aver capito dove vuoi arrivare, prendi questo: (dal cap. 6.2 in avanti) http://www.dsa.unipr.it/soliani/capu6.pdf

sono tecniche di statistica NON PARAMETRICA (cioè non è necessario l'assunto di normalità).

ti regalo il codice in vb.net (magari riesci a riciclarlo) per il confronto tra 2 medie, ovvero il test per verificare se due medie sono (stocasticamente) uguali

Public Function f_MedieStocasticamenteUguali(ByVal arrGroup1 As Object, ByVal arrGroup2 As Object, ByVal DatiAppaiati As Boolean) As Boolean
'verifica se le medie dei dati contenuti in arrGroup1 e arrGroup2 possono
'essere considerate stocasticamente uguali
'DatiAppaiati è una variabile booleana he quando è True, la funzione
'calcola come dati appaiati, altrimenti no.
'nel caso si debba calcolare la staz. in media considerando dati appaiati
'la numerosità degli array deve essere uguale

Dim i As Long
Dim X As Long 'numero di coppie di dati appaiati
Dim n As Double 'numero di dati, in generale
Dim n1 As Long 'numerosità gruppo1
Dim n2 As Long 'numerosità gruppo2
Dim MediaGroup1 As Double
Dim MediaGroup2 As Double
Dim DiffMedia As Double 'media delle differenze di tutte le coppie di dati appaiati
Dim DevStdMedia As Double
Dim diffV As Double 'differenza =(media-valore)
Dim devGroup1 As Double 'devianza gruppo 1 =somma delle differenze
Dim devGroup2 As Double 'devianza gruppo 2 "
Dim Gdl_Group1 As Double 'gradi di libertà gruppo1
Dim Gdl_Group2 As Double 'gradi di libertà gruppo2
Dim Gdl As Double 'gdl complessivi
Dim diff_j As Double ' differenza tra valore j esimo del gruppo 1 e valore j esimo del gruppo 2
Dim t_st As Double 'indice t da confrontare con le tabelle "t di Student"
Dim strSQL As String
Dim t_Student99 As Double
Dim t_Student975 As Double
Dim t_Student95 As Double

i = 0
X = UBound(arrGroup1) + 1
n = UBound(arrGroup1) + 1
n1 = UBound(arrGroup1) + 1
n2 = UBound(arrGroup2) + 1
Gdl = n1 + n2 - 2

MediaGroup1 = f_MMSn(arrGroup1, n, 0)
MediaGroup2 = f_MMSn(arrGroup2, n, 0)

diffV = 0
For i = 0 To n - 1
diffV = (MediaGroup1 - arrGroup1(i))
devGroup1 = devGroup1 + diffV
Next i
devGroup1 = Math.Abs(devGroup1)

diffV = 0
For i = 0 To n - 1
diffV = (MediaGroup2 - arrGroup2(i))
devGroup2 = devGroup2 + diffV
Next i
devGroup2 = Math.Abs(devGroup2)

Gdl_Group1 = n1 - 1
Gdl_Group2 = n2 - 1
DevStdMedia = ((devGroup1 + devGroup2) * (Gdl_Group1 + Gdl_Group2)) ^ (1 / 2)

If DatiAppaiati = True Then
ReDim arrDiffInfraGroup(X)
For i = 0 To n - 1
diff_j = arrGroup1(i) - arrGroup2(i)
arrDiffInfraGroup(i) = diff_j
Next
ReDim Preserve arrDiffInfraGroup(i - 1)
DiffMedia = f_MMSn(arrDiffInfraGroup, X, 0)
t_st = (DiffMedia / DevStdMedia) * n ^ (1 / 2)
Else
t_st = (Math.Abs(MediaGroup1 - MediaGroup2) / DevStdMedia) * (n1 * n2 / n1 + n2) ^ (1 / 2)
End If

If Gdl <= 33 Then
strSQL = ("SELECT B_tStudent.n, B_tStudent.P_99, B_tStudent.P_975, B_tStudent.P_95 FROM B_tStudent WHERE B_tStudent.n= " & (Gdl))
rsStudent.Open(strSQL, objConn.ConnectionString, ADODB.CursorTypeEnum.adOpenStatic, _
ADODB.LockTypeEnum.adLockOptimistic)
rsStudent.MoveFirst()
While Not rsStudent.Fields("n").Value = Gdl
rsStudent.MoveNext()
End While
t_Student99 = rsStudent.Fields("P_99").Value
t_Student975 = rsStudent.Fields("P_975").Value
t_Student95 = rsStudent.Fields("P_95").Value
rsStudent.Close()
ElseIf Gdl > 33 And Gdl <= 40 Then
t_Student99 = 2.42
t_Student975 = 2.02
t_Student95 = 1.68
ElseIf Gdl > 40 And Gdl <= 60 Then
t_Student99 = 2.39
t_Student975 = 2
t_Student95 = 1.67
ElseIf Gdl > 60 And Gdl <= 120 Then
t_Student99 = 2.36
t_Student975 = 1.98
t_Student95 = 1.66
ElseIf Gdl > 120 Then
t_Student99 = 2.33
t_Student975 = 1.96
t_Student95 = 1.66
End If

If t_st > t_Student99 Or _
t_st > t_Student975 Or _
t_st > t_Student95 Then
f_MedieStocasticamenteUguali = False
Else
f_MedieStocasticamenteUguali = True
End If

End Function


se la funzione restituisce FALSE vuole dire che
i due gruppi non appartengono alla stessa distribuzione
è quindi vera H1 -> rifiuto l'ipotesi nulla Ho di omogeneità cioè le medie sono stocasticamente diverse .

se la funzione restituisce TRUE vuole dire che
i due gruppi appartengono alla stessa distribuzione
è vera Ho -> rifiuto l'ipotesi alternativa H1 e concludo che le differenze osservate tra le due medie sono casuali cioè le medie sono stocasticamente uguali nella misura indicata dal livello di confidenza assunto.


Ripeto: sono tecniche NON PARAMETRICHE da usarsi quando non si hanno abbastanza dati. Cioè è più corretto usare questa tipologia di statistica in luogo di quella inferenziale quando di quest'ultima non sussistono i necessari requisiti, che usare a tutti i costi quella inferenziale. Ciò (naturalmente) non vuole dire che si avranno dati affidabili in qualsiasi caso, vuole dire solo che si usa una metodologia compatibile con il contesto dei dati effettivamente disponibili.

PS ti consiglio anche l'ANOVA (a una o più vie) per analoghi ragionamenti ma sulla varianza. Una metodologia un pò più sofisticata di quella sopra richiamata.

chiedo scusa anticipatamete se nei prox giorni non potrò rispondere xchè sono via.
 
Ultima modifica:
Ti ringrazio Scalpo, il tuo è l'intervento sicuramente piu' vicino al problema che ho sollevato!
Stavo cominciando a pensare che la domanda non fosse stata posta chiaramente, oppure che fosse la lingua a non essere condivisa...
grazie per il codice vb.net ma purtroppo la questione rimane intatta, avevo già provato questo approccio ma il confronto fra due medie campionarie non può essere applicato al mio caso in quanto uno dei due campioni dovrebbe avere numerosità 1 (l'estrazione singola) e la formula per il calcolo di t (che non riporto per brevità) contiene al denominatore la media delle dev.std. pesate per i gradi di libertà....l'estrazione unica però non ha dev.std e porla = a 0 non è corretto visto che ci sarebbe uno 0 al denominatore che rende impossibile ed invalida l'intero procedimento.
Per di piu' sono riuscito a parlare con P.A.T. che mi ha indirizzato per la soluzione del mio quesito verso Darling, Andersen e Lilliefors che io conoscevo solo per i loro contributi alla verifica di ipotesi Gaussiana di una popolazione tramite un campione...per il resto fra un pò proverò su Wilmott.

Grazie per il tuo post Scalpo

Vykae
 
Ciao Vykae,
scusa per il ritardo nella risposta ma come ti dicevo in MP sono abbastanza indaffarato in questi ultimi tempi.
Innanzitutto ne approfitto per salutare tutti i grandi di questo forum, era un pò che non tornavo, in particolare il Genio, aikman, mistral, andrea volterra, benoit, agrix, stargain, twin peaks, mitile allegro e tutti gli altri...e perchè no, anche Fan-Bozzi! :rolleyes:

Stai tranquillo Vykae la tua domanda è chiarissima come la risposta (spero!) che ti fornirò, devi capire che questo non è un forum di statistica ed è normale che la maggior parte dei nick che lo frequentano si interessino solamente ai concetti scientifici che ritengano interessanti ai fini dello studio finanziario-speculativo.
Sono sicuro che maggior fortuna avresti avuto ponendo un esempio pratico piuttosto che teorico, per di piu’ c’erano molti forum piu’ adatti Hostati da alcune Università dove credo tu saresti stato meno “off-topic”.
Comunque veniamo al punto e riprendiamo il tuo esempio.

Non conosco media e varianza della popolazione ma mi aiuto estraendo un campione di numerosità (mettiamo) 5.
La media campionaria è pari (sempre mettiamo...) ad 1 e la deviazione standard (campionaria quindi si divide per n-1) è pari a 2.
Supponiamo ora di estrarre dalla popolazione un solo elemento.
Che probabilità c'è che si ottenga un valore pari o maggiore di 5?

La risposta si ha calcolando il

test t=[(Valore obiettivo-media campionaria)*radice quadrata(numerosità del campione/numerosità del campione+1)]/deviazione standard campionaria=[(5-1)*(5/6)]/2=1,8257
che si distribuisce al solito con n-1 gradi di libertà ed a cui corrisponde, considerando il test unidirezionale (una coda), una Probabilità pari al 7,14%.
Ovvero ci possiamo aspettare che 7,14 volte su 100 (i seguaci amanti del Prof. Trilussa si chiederanno come interpretare quel 14 centesimale…ma questo è un altro paio di maniche… :censored: ) le osservazioni singole assumeranno valore >= 5.

L’intervallo di confidenza ed il relativo test di ipotesi si costruiscono ovviamente sulla base della formuletta di cui sopra, non c'è bisogno di tediare ulteriormente il forum.

Al livello di significatività alfa=0,05 (l’esempio successivo che hai fatto) cui corrisponde una soglia t unidirezionale di 2,132 siamo portati quindi a non scartare l’ipotesi nulla secondo la quale il valore 5 sarebbe compatibile con la popolazione di origine del campione.

Saluti

Albano

P.s. lascia stare Wilmott, non serve... OK!
 
Ultima modifica:
alborsa ha scritto:
Innanzitutto ne approfitto per salutare tutti i grandi di questo forum, era un pò che non tornavo, in particolare il Genio, aikman, mistral, andrea volterra, benoit, agrix, stargain, twin peaks, mitile allegro e tutti gli altri...e perchè no, anche Fan-Bozzi! :rolleyes:

ciao Albano, un piacere rivederti, anche io non "sfogliavo" il fol da un bel pò. come sempre non meni il can per l'aia...
 
andrea volterra ha scritto:
ciao Albano, un piacere rivederti, anche io non "sfogliavo" il fol da un bel pò. come sempre non meni il can per l'aia...
Bhè, cosa aggiungere, non ho parole, il mio quesito è stato risolto!
Chiarissimo (a posteriori...) l'approccio ma avevo bisogno di un input che mi ci facesse arrivare.
Ad Albano vorrei dire che avevo provato anche su forum di statistica (UNIPadova ad esempio) ma nessuno era riuscito a rispondere, sembra che l'argomento specifico non sia molto trattato negli ambienti accademici.

L'importanza in un ambito finanziario di un test come questo è a mio parere invece rilevantissima...basti pensare che con questo test possiamo individuare valori anomali di rendimenti finanziari (e non...) evitando di calcolare la varianza su un campione troppo lungo e distante dal tempo t (oggi) con il conseguente rischio di "distorsione".
Grazie ancora ad Alborsa e complimenti per il suo bagaglio statistico!

A presto

Vykae
 
Ultima modifica:
Premetto che non ho per nulla capito perche' non hai salutato Andrea Volterra con l'altro nick.
Vabbe',


vykae ha scritto:
... vorrei dire che avevo provato anche su forum di statistica (UNIPadova ad esempio) ma nessuno era riuscito a rispondere, sembra che l'argomento specifico non sia molto trattato negli ambienti accademici.

Ex post, l'utilizzo della t per risolvere quesiti di obiettiva difficoltà come quello testè prospettato si poneva necessario, sebbene su questioni cosi' oggettivamente rilevanti sia comprensibile la giustificata ritrosia degli studiosi di statistica dell'Universita' di Padova a prendere qualsiasi posizione sulll'argomento.

vykae ha scritto:
L'importanza in un ambito finanziario di un test come questo è a mio parere invece rilevantissima...basti pensare che con questo test possiamo individuare valori anomali di rendimenti finanziari (e non...) evitando di calcolare la varianza su un campione troppo lungo e distante dal tempo t (oggi) con il conseguente rischio di "distorsione".

Indubbiamente...
Prima di questa scoperta con soli 5 elementi campionari non era possibile trarre alcuna valida inferenza, a meno di non accontentarsi di margini di errore giganteschi, mentre oggi abbiamo scoperto questa nuova possibilita', che dischiuderà sicuramente importanti orizzonti di ricerca.

Il fatto che la scelta di campionamento che si vuole osservare abbia degli effetti "modellizzatori" sulla popolazione era uno dei piu' grandi misteri dell'analisi delle serie storiche. Grazie alla nuova importante scoperta, la scelta del campionamento si puo' appunto effettuare in modo che gli effetti del campionamento riguardino eventi del passato.In termini classici, questo sembra significare che il passato viene influenzato dal presente.

Come ben sanno gli esperti di trading quantistico,

http://www.finanzaonline.com/forum/showpost.php?p=6279056&postcount=7

significa soltanto che il passato non esiste, se non nelle misurazioni del presente.

Come disse Niels Bohr, "la realtà è solo una teoria"

Cordialmente vi auguro in bocca al lupo a voi tutti trader quantistici, per la rilevanza e l'importanza della vostra scoperta. :)

A buon rendere
PAT
 
Indietro