Example: stock market

DAL CAMPIONE ALLA POPOLAZIONE: LA STIMA …

DAL CAMPIONE alla popolazione : LASTIMA DEI PARAMETRIA ndrea OnofriDipartimento di Scienze Agrarie ed AmbientaliUniversit`a degli Studi di PerugiaVersione on-line: onofri/ STIMA puntuale dei parametri12 La precisione della STIMA e l errore standard33 Intervalli di confidenza di una media44 Intervalli di confidenza e regressione61 STIMA puntuale dei parametriIn genere, le unit`a sperimentali sottoposte ad un esperimento (o i risultatiottenuti da un qualunque procedimento di misura) sono solo un campionedi quelle possibili, anche se il ricercatore `e interessato a trarre conclusionigeneriche, valide per l intera popolazione da cui il CAMPIONE `e stato estratto( STIMA dei parametri della popolazione ).E intuitivo pensare che, data una popolazione se da questa immagini-amo di estrarre a caso un CAMPIONE dinindividui, `e probabile che la mediadel CAMPIONE sia pari alla media della popolazione da cui questo `e stato es-tratto. Infatti gli individui intorno alla media nella popolazione di partenzasono i pi`u frequenti e quindi sono quelli che hanno la massima probabilit`a diessere inclusi nel CAMPIONE .

DAL CAMPIONE ALLA POPOLAZIONE: LA STIMA DEI PARAMETRI Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universit a degli Studi di Perugia

Tags:

  Companies, Alla, Dal campione alla popolazione, Popolazione, La stima, Stima, La stima dei

Information

Domain:

Source:

Link to this page:

Please notify us if you found a problem with this document:

Other abuse

Transcription of DAL CAMPIONE ALLA POPOLAZIONE: LA STIMA …

1 DAL CAMPIONE alla popolazione : LASTIMA DEI PARAMETRIA ndrea OnofriDipartimento di Scienze Agrarie ed AmbientaliUniversit`a degli Studi di PerugiaVersione on-line: onofri/ STIMA puntuale dei parametri12 La precisione della STIMA e l errore standard33 Intervalli di confidenza di una media44 Intervalli di confidenza e regressione61 STIMA puntuale dei parametriIn genere, le unit`a sperimentali sottoposte ad un esperimento (o i risultatiottenuti da un qualunque procedimento di misura) sono solo un campionedi quelle possibili, anche se il ricercatore `e interessato a trarre conclusionigeneriche, valide per l intera popolazione da cui il CAMPIONE `e stato estratto( STIMA dei parametri della popolazione ).E intuitivo pensare che, data una popolazione se da questa immagini-amo di estrarre a caso un CAMPIONE dinindividui, `e probabile che la mediadel CAMPIONE sia pari alla media della popolazione da cui questo `e stato es-tratto. Infatti gli individui intorno alla media nella popolazione di partenzasono i pi`u frequenti e quindi sono quelli che hanno la massima probabilit`a diessere inclusi nel CAMPIONE .

2 E ovvio che questo `e vero se il CAMPIONE `e rap-presentativo (cio`e se `e estratto a caso e sufficientemente numeroso). Questaosservazione intuitiva ci consente di affermare che dato un CAMPIONE estrat-to casualmente da una popolazione normalmente distribuita,la media e ladeviazione standard del CAMPIONE sono una STIMA non distorta della media edella deviazione standard della popolazione di origine. Per la dimostrazionedi questo assunto rimandiamo a pubblicazioni pi`u specifiche, ma ricordiamoche solo la deviazione standard campionaria (cio`e quella ottenuta come:11 STIMA PUNTUALE DEI PARAMETRI2s= SSn 1dove SS `e la devianza del CAMPIONE ) `e una STIMA corretta della deviazionestandard della popolazione . Bisogna comunque notare che i reali valori deiparametri (media e deviazione standard) della popolazione di origine riman-gono comunque ignoti, ma si pu`o affermare che con la massima probabilit`aquesti sono uguali a quelli del CAMPIONE `u in generale, dato un CAMPIONE , le statistiche descrittive calcolateper questo CAMPIONE (media, varianza, deviazione standard, parametri diregressione, correlazione ) possono essere estrapolate alla popolazioneche ha generato il CAMPIONE stesso, senza che questo possa essere in qualchemodo oggetto di critica.

3 In fin dei conti `e la migliore STIMA che tipo di STIMA si definiscestima puntuale, perch e ad ogni valore ignotodi un certo parametro della popolazione (ad es. la media) associamo unacerta STIMA puntiforme, cio`e costituita da un singolo 1Da un terreno agrario `e stato estratto casualmente un campionedi 5 buste da 20 grammi ciascuna di terreno. Il terreno pre-sente in ogni busta viene analizzato per conoscere il contenutoin fosforo assimilabile. I dato ottenuti sono 9, 10, 14, 16 e 13ppm, rispettivamente per le cinque buste. Qual `e il contenutodi fosforo nel terreno e qual `e la sua deviazione standard (vari-abilit`a naturale del contenuto di fosforo nel terreno, errore dicampionamento e di misura)?Questo problema pu`o essere risolto pensando che il CAMPIONE danoi estratto (cinque buste) sia rappresentativo dell intera popo-lazione e, di conseguenza, le statistiche descrittive del campi-one possono essere assunte come stime puntuali delle statistichedescrittive della media delle cinque misure nel CAMPIONE `e pari a ppm,mentre la deviazione standard `e pari ppm.

4 Ne consegue cheil coefficiente di variabilit`a `e pari al Come abbiamo vistoquesti risultati possono essere estrapolati all intera popolazionedi tutte le misure possibili. Possiamo quindi concludere che ilcampione `e estratto da un terreno il cui contenuto medio di fos-foro `e pari a ppm con una deviazione standard pari a reali valori di contenuto medio ed errore rimangono ignoti: lenostre conclusioni sono raggiunti solamente su base probabilisti-ca; si tratta delle conclusione pi`u probabili, ma non LA PRECISIONE DELLA STIMA E L ERRORE STANDARD3 Quanto detto vale anche per la proporzione (la proporzione del campionep `e una STIMA non distorta di ), mentre nel caso della varianza lo stimatorenon distorto `e la varianza campionaria (cio`e quelle ottenuta dividendo ladevianza pern 1).La STIMA puntuale `e molto comoda, ma anche molto imprecisa: possibileche la popolazione intera abbia proprio la stessa media o la stessa deviazionestandard del CAMPIONE che noi abbiamo estratto?

5 Per esprimere questa incertezza `e quindi necessario associare alla stimapuntuale un intervallo, passando quindi alla cosiddetta STIMA per La precisione della STIMA e l errore standardNel paragrafo precedente abbiamo affermato che la media incognita dellapopolazione ( ) `e stimata dalla media del CAMPIONE . Tuttavia, il calcolodi probabilit`a illustrato nel capitolo precedente ci ha insegnato che, datauna popolazione normale con media e deviazione standard ;, se estra-iamo infiniti campioni dinelementi, le medie campionarie sono distribuitenormalmente con media e deviazione standard pari alla quantit`a: x= ndettaerrore standard di una media. Quest ultima pu`o essere guardatocome la variabilit`a della media campionaria, cio`e una misura dell incertezzalegata alla STIMA della media. In altre parole, l errore standard `e una misuradell errore di questo senso, l errore standard `e concettualmente molto diverso dal-la deviazione standard della popolazione da cui il CAMPIONE `e estratto, chene rappresenta la variabilit`a naturale ineliminabile.

6 Infatti, se dalla popo-lazione di partenza avessimo estratto un CAMPIONE di infinite misure (n = ) avremmo ottenuto una STIMA perfetta di (errore standard pari a 0),nonostante la variabilit`a naturale . In altre parole, la STIMA della mediapu`o essere perfetta anche se la misura `e viziata da un errore (per esempioperch e l apparecchio non `e perfettamente funzionante).E bene sottolineare ancora come l errore standard (e quindi la preci-sione della STIMA di ) dipende sia dalla variabilit`a della misura, sia dalnumero di repliche che effettuiamo; pi`u precisamente, l errore standard au-menta all aumentare della deviazione standard e diminuisce all aumentaredel numero delle ripetizioni, annullandosi quando questo tende ad 2In un vigneto, si vuole conoscere la produzione d uva per avendo tempo e risorse sufficienti per misurare tutte le pi-3 INTERVALLI DI CONFIDENZA DI UNA MEDIA4ante del vigneto, si scelgono dieci piante a caso e si misura laloro produzione, che risulta pari rispettivamente , , , , , , , , , STIMA pi`u probabile della produzione per pianta del vigneto`e data dalla media delle misure effettuate, pari a variabilit`a della misura (che include, tra l altro, la variabilit`aindividuale delle viti, la variabilit`a della fertilit`a del terreno e l er-rore di misura dell operatore)

7 Pu`o essere stimata dalla deviazionestandard del CAMPIONE , pari a errore di STIMA della media possiamo prendere l errorestandard, che in R pu`o essere calcolato con le consuete formulex <- c( , , , , , , , , , )mean(x)[1] <-sqrt(var(x))/sqrt(length(x))se[1] Intervalli di confidenza di una mediaNel capitolo precedente abbiamo gi`a illustrato come il 95% delle medie cam-pionarie sono comprese nell intervallo volte l errore standard. Diconseguenza, se affermiamo che: = X Xabbiamo una probabilit`a del 95% di essere nel giusto ed una probabilit`ad errore del 5%.Questo ragionamento, tuttavia, presuppone di conoscere la quantit`a della popolazione . Pi`u frequentemente, viene stimato a partire das, cio`edalla deviazione standard del CAMPIONE . In questa situazione, abbiamo vistoche le medie campionarie sono distribuite tra t , , `e il grado di confidenzaricercato (ad esempio il 95%, equivalente al 5% di probabilit`a di errore del5%) e `e il numero di gradi di libert`a della deviazione standard del CAMPIONE (n-1).

8 Gli intervalli di confidenza della media, pertanto, possono esserecostruiti in questo modo: = X t , s XE bene ribadire che se vogliamo usare R per il calcolo delle bande diconfidenza, dobbiamo fare attenzione al valore , infatti se vogliamo la ban-da di inferenza del 95%, dobbiamo indicare un valore = (1 - )/2(distribuzione ad una coda).3 INTERVALLI DI CONFIDENZA DI UNA MEDIA5In sostanza, dato un certo livello di probabilit`a d errore (ad esempio il5%), possiamo costruire un intervallo che molto probabilmente contiene ilvero ed ignoto valore della media della popolazione da cui il CAMPIONE `estato estratto. Pi`u esattamente, questa affermazione `e tanto probabile dalasciare solo il margine d errore studio 1 Riprendendo i dati dell Esercizio 9 abbiamo gi`a osservato come,sulla base del CAMPIONE esaminato, possiamo concludere che ilvalore pi`u probabile della produzione media per pianta nel vi-gneto `e pari a kg. Questa STIMA ci lascia un po insoddisfatti:come `e possibile che la produzione per pianta di un intero vi-gneto sia proprio uguale a quella delle dieci piante misurate?

9 Seci calcoliamo allora l intervallo di confidenza della media per unlivello di probabilit`a = otteniamo: = = ci permette di affermare che la produzione media per pi-anta del vigneto (quella vera, che rimane ignota) `e compresa e Se il CAMPIONE era effettivamente rappresentati-vo, possiamo avere fiducia che facendo questa affermazione nonabbiamo pi`u del 5% di probabilit`a d volessimo essere ancora pi`u tranquilli, potremmo calcolarel intervallo di confidenza della media per un livello di probabilit`a = ), ottenendo: = = questo caso possiamo affermare che la produzione media perpianta del vigneto `e compresa tra e , con una proba-bilit`a d errore dell 1%. Come si vede, per diminuire la probabilit`ad errore abbiamo dovuto allargare l intervallo di R, per il calcolo dei limiti di confidenza conviene ricorrere allafunzione (), come nell esempio seguente:> (x, )One Sample t-testdata: x4 INTERVALLI DI CONFIDENZA E REGRESSIONE6t = , df = 9, p-value = hypothesis: true mean is not equal to 095 percent confidence estimates:mean of > (x, )One Sample t-testdata: xt = , df = 9, p-value = hypothesis: true mean is not equal to 099 percent confidence estimates:mean of L errore standard e gli intervalli di confidenzanell analisi di regressioneCome avrete intuito, il calcolo dell errore standard e degli intervalli di confi-denza ci consente di aggiungere alle nostre stime una banda d incertezza.

10 Inquesto modo possiamo comunque stare al riparo da errori macroscopici, an-che se rimane il fatto che non potremo mai conoscere con assoluta precisioneuna certa caratteristica della nostra stesso problema va affrontato nel caso dell analisi di si ricorder`a, eseguire una analisi di regressione in una popolazionedi dati bivariata, consiste nel determinare due parametri: l intercetta ( 0) ela pendenza ( 1) in modo da caratterizzare la retta che esprime la relazionefunzionale tra le due in questo caso se non abbiamo a disposizione l intera popolazionepossiamo eseguire l analisi di regressione su un CAMPIONE rappresentativoche sia stato estratto da questa. In questo modo otterremo dei valori diintercetta (b0)) e pendenza (b1) che sono delle stime dei valori reali dell interapopolazione. Anche queste stime, come nel caso della media, dovranno esserecorredate dei relativi intervalli di calcolo degli intervalli di confidenza nell analisi di regressione `e un po pi`u complicato e verr`a demandato ad R.


Related search queries