Example: tourism industry

Testarea ipotezelor statistice - Facultatea de Fizica

Testarea ipotezelor statistice Formularea de ipoteze statistice este una din cele mai importante aspecte ale cercetarii stiintifice. O ipoteza noua trebuie verificata! Pentru verificarea unor ipoteze statistice se folosesc diferite teste statistice . Testarea statistica se face prin enuntarea a doua ipoteze si apoi acceptarea (sau respingerea) ipotezei nulului: Ipoteza nulului (H0): reprezinta modelul pe care experimentatorul ar dori sa il inlocuiasca (rezultatele sunt datorate intamplarii). Ipoteza alternativ (H1): este noul model (de obicei o negatie a ipozei nulului). Ipoteza nulului nu trebuie probata ci negata! Prin respingerea ipotezei nulului, cercetatorul afirma ca rezultatele observate nu sunt datorate intamplarii: rezultatul obtinut este semnificativ din punct de vedere statistic. Daca ipoteza nulului nu este respinsa, cercetatorul afirma ca diferentele observate sunt datorate intamplarii si rezultatul este nesemnificativ din punct de vedere statistic.

Condiţii de aplicare: 1. Este necesar să cunoaştem varianta populaţiei. Dacă nu se cunoaşte, se aplică testul t-Student (pentru compararea mediei unui eşantion cu media unei populaţii). 2. Testul este corect aplicat dacă populaţia este normal distribuită. Dacă populaţia nu este normal distribuită testul dă doar o valoare ...

Tags:

  Per caldaie, Aplicare

Information

Domain:

Source:

Link to this page:

Please notify us if you found a problem with this document:

Other abuse

Transcription of Testarea ipotezelor statistice - Facultatea de Fizica

1 Testarea ipotezelor statistice Formularea de ipoteze statistice este una din cele mai importante aspecte ale cercetarii stiintifice. O ipoteza noua trebuie verificata! Pentru verificarea unor ipoteze statistice se folosesc diferite teste statistice . Testarea statistica se face prin enuntarea a doua ipoteze si apoi acceptarea (sau respingerea) ipotezei nulului: Ipoteza nulului (H0): reprezinta modelul pe care experimentatorul ar dori sa il inlocuiasca (rezultatele sunt datorate intamplarii). Ipoteza alternativ (H1): este noul model (de obicei o negatie a ipozei nulului). Ipoteza nulului nu trebuie probata ci negata! Prin respingerea ipotezei nulului, cercetatorul afirma ca rezultatele observate nu sunt datorate intamplarii: rezultatul obtinut este semnificativ din punct de vedere statistic. Daca ipoteza nulului nu este respinsa, cercetatorul afirma ca diferentele observate sunt datorate intamplarii si rezultatul este nesemnificativ din punct de vedere statistic.

2 Exemplu: Testarea afirmatiei Baietii i fetele au inaltimi diferite se face prin verificarea urmatoarelor ipoteze: Ipoteza nulului (H0): Nu exist diferen ntre inaltimea baietilor si a fetelor. Ipoteza alternativ (H1): Exist o diferen ntre inaltimea baietilor si a fetelor Pasii unui test statistic: 1. Formularea problemei in termenii ipotezelor statistice (H0, H1). 2. Alegerea statisticii adaptata problemei (z sau t). 3. Alegerea nivelului de semnificatie ( = 1 - P) si apoi calcularea pragului de separare (valoarea critica: zcrit; tcrit) dintre valorile acceptabile si cele considerate inacceptabile (de obicei probabilitatea P se alege intre 99% si 95%). 4. Calcularea valorii statisticii (zcalc; tcalc) folosind datele esantionului. 5. Compararea valorii calculate cu valoarea critica (data de nivelul de semnifica ie) pentru a decide dac ipoteza nulului se respinge sau se accepta. Clasificari Teste statistice : Teste parametrice repartitia datelor este cunoscuta (testul F, testul F, etc).

3 Teste neparametrice: nu se cunoaste repartitia datelor (testul semnelor, testul Mann-Withney, etc). Teste statistice parametrice: (fie un parametru : medie,, deviatie standard, etc). Bilaterale H0: 1 = 2 H1: 1 2. Unilaterale a: H0: 1 = 2 H1: 1 > 2. b: H0: 1 = 2 H1: 1 < 2. In functie de modul de enuntare a ipotezei alternative, se alege una din urmatoarele regiuni critice (daca parametrul calculat se afla in regiunea critica, atunci ipoteza nulului se respinge): 1. Regiune critica bilaterala - valoarea parametrului statistic al testului (zcalc; tcalc) este mai mica sau egala cu valoarea extrema din stanga regiunii critice sau mai mare sau egala cu valoarea extrema din dreapta regiunii critice (Ex: H1: x 0). zcalc zcrit zcalc - zcrit 2. Regiune critica unilaterala la dreapta - valoarea parametrului statistic al testului (zcalc; tcalc) este mai mare sau egala cu valoarea din dreapta a intervalului critic. (Ex: H1: x > 0). zcalc zcrit 3.

4 Regiune critica unilaterala la stanga - valoarea parametrului statistic al testului (zcalc; tcalc) este mai mica sau egala cu valoarea din stanga a intervalului critic. (Ex: H1: x < 0). zcalc zcrit Practic: se verifica una din ipotezele: H0: x = 0, s = 0. H1: x 0, s 0. unde x si s reprezinta media si deviatia standard a esantionului, 0 si 0 reprezinta media si deviatia standard a populatiei Nivelul de semnificatie reprezinta probabilitatea de a respinge ipoteza nulului (H0) cand ea de fapt este adevarata De obicei se alege un nivel de semnifica ie ntre 1% ( = 0,01) i 5%. ( = 0,05). = (1-P). P - reprezinta nivelul de siguranta Dac parametrul statistic calculat (zcalc; tcalc) se afl n regiunea critic . atunci se respinge ipoteza nulului H0, deci se respinge ipoteza nulului H0. Respingerea ipotezei nulului implica un risc de eroare , fiind riscul de gradul I. Dac parametrul statistic este in afara regiunii critice ipoteza nulului H0.

5 Este acceptata. Acceptarea ipotezei nulului implica un risc de eroare (notat cu b), numit risc de gradul II. Erori de tipul I i II. H0: x1 x2 Ipoteza nulului H1: x1 x2 adevarata falsa Ipoteza acceptata Decizie corecta (prob = 1- ) Eroare tip II (prob = b). nulului respinsa Eroare tip I (prob = ) Decizie corecta (prob = (1-b). Rezultatul ob inut n poate fi afectat de erori. Ex: aleg nd un nivel de probabilitate de 95%, exist 5% posibilitate de a lua o decizie incorect , atunci c nd valid m sau nu ipoteza testat . Probabilitatea test rii ipotezei 90% 95% 99%. Probabilitatea apari iei erorii de tip I ( ) 0,10 0,05 0,01. Probabilitatea apari iei erorii de tip II (b) mica 0,20 mare Puterea (testului): 1-b 1-b ~ pentru = Testul Z. - pentru compararea mediei unui e antion cu media unei popula ii Scopul testului: compararea mediei unei variabile cantitative continue pe un e antion reprezentativ extras dintr-o popula ie cu o medie cunoscut.)

6 Se presupune c cele dou popula ii au aceia i varianta | x | | x | x - eroarea Parametrul testului: zcalc . x s standard a mediei n Condi ii de aplicare : 1. Este necesar s cunoa tem varianta popula iei. Dac nu se cunoa te, se aplic testul t-Student (pentru compararea mediei unui e antion cu media unei popula ii). 2. Testul este corect aplicat dac popula ia este normal distribuit . Dac . popula ia nu este normal distribuit testul d doar o valoare orientativ . 3. Talia e antionului trebuie sa fie mare ( 30). Testul z pentru compararea mediei unui e antion cu media unei popula ii |x |. z calc . s Ex: Media taliei nou-nascu iilor la termen este = 50 cm. n Calculele efectuate pe un esantion de prematuri ne dau urmatoarele valori: S = 3 cm, n = 50, x = 45 cm. Se testeaza ( cu p = 95%) daca talia prematurilor difera de talia nascutilor la termen. zcrit z . 1 . 2. Etapele testului: H0 : x . 1. Formularea ipotezelor : H1 : x . 2. Nivelul de semnificatie: = 0,05; zcrt = 1,96.

7 3. Parametrul testului: Zcalc = 11,78. 4. Regiunea critica: (- ; -1,96]U[1,96; + ). 5. Decizia: se poate respinge ipoteza nulului pentru ca parametrul testului apartine regiunii critice. Testul este semnificativ din punct de vedere statistic: talia prematurilor difera de talia nascutilor la termen. Alta varianta de aplicare a testului z: 1. Dorim sa comparam (cu o probabilitate de 95% ) nivelul mediu al colesterolului femeilor din mediul rural cu cel al femeilor din mediul urban (media: 0 = 190 mg/dL, deviatia standard: 0 = 40 mg/dL). S-a determinat nivelul colesterolului la 100 femei din mediu rural si s-a obtinut o valoare medie de 181,52 mg/dL. Datele problemei: x = 181,52 mg/dL 0= 190 mg/dL 0 = 40 , s = 40. Ipoteza nulului: x = 0= 190, Ipoteza alternativa: x 0= 190. Intervalul de incredere de 95% pentru media aritmetica este: s s zcrit ( x (z ) , x (z ) ) z 1 .. 1 n 1 n 2. 2 2. Daca acest interval de incredere contine valoarea 0, se respinge ipoteza alternative (se accepta ipoteza nulului).

8 = 0,05 deci zcrit = 1,96 190 (150,16; 212,88). Se accepta ipoteza nulului: NU exista nici o diferenta intre nivelul mediu al colesterolului femeilor din mediul rural si cel al femeilor din mediul urban. 2. Se presupune ca media masei nou-nascutilor la termen este de 3,5 kg. Pe un esantion reprezentativ de 50 nou-nascuti prematur s-a calculat o medie a masei de 2,8 kg cu o deviatie standard egala cu 0,3. Se poate afirma (cu o probabilitate de 95%) ca prematurii se nasc cu o masa mai mica decat nou-nascutii la termen? (Diferenta dintre cele 2 medii este semnificativa din punct de vedere statistic?). Datele problemei: = 3,5, x = 2,8 , s = 0,3. Ipoteza nulului: Nu exista o diferenta semnificativa intre talia prematurilor si talia nou-nascutilor la termen. Ipoteza nulului: x = 0, Ipoteza alternativa: x 0. Pentru un nivel de semnificatie = 0,05 (P = 95%), intervalul de incredere pentru medie este: s s (x z ,x z ). 1 n 1 n 2 2. Daca acest interval de incredere nu contine valoarea 0, se accepta ipoteza alternativa.

9 = 0,05 z = 1,96. 3,5 (2,716; 2,883) se accepta ipoteza alternativa Testul Z. - pentru compararea mediilor a dou e antioane (cu variante inegale). Pragul de semnifica ie considerat este = 0,05. Regiunea critic pentru testul bilateral: (- ; -1,96 ] [1,96; ). Parametrul testului: x1 = media primului e antionului;. n1 = volumul primului e antion;. s21 = varian a primului e antion;. x 2 = media celui de-al doilea e antion;. n2 = volumul celui de-al doilea e antion;. s22 = varian a celui de-al doilea e antion. Testul Z pentru compararea mediilor a dou e antioane (variante inegale). Ex. Se tie c nivelul seric al magneziului urmeaz legea normal cu o varian a de 1 mg/100 ml la persoanele din Rom nia i respectiv cu o varian a de 2,3 mg/100 ml la persoanele din Moldova. Nivelul mediu al magneziului seric, ob inut pe un e antion de 42 persoane cu v rste cuprinse ntre 25 i 35 de ani din Rom nia este de 2 mg/100 ml. S-au efectuat teste serologice la un e antion de 48 persoane cu v rste cuprinse ntre 25 i 35 de ani, din Moldova i media magneziului seric a fost de 2,5.

10 Mg/100 ml. Exist diferen ntre nivelul seric al magneziului la persoanele din Moldova fa de persoanele din Rom nia? Datele problemei: n1 = 42; n2 = 48. m1 = 2; m2 = 2,5. s12 = 1; s22 = 2,3. n1 = 42; n2 = 48 m1 = 2; m2 = 2,5 s12 = 1; s22 = 2,3. Ipoteza nulului: Diferen a mediilor magneziului seric la cele dou . e antioane nu este semnificativ diferit de zero. Ipoteza alternativ (test bilateral): Diferen a mediilor magneziului seric la cele dou e antioane este semnificativ diferit de zero. Pragul de semnifica ie: = 0,05. Deci zcrit = 1,96. Regiunea critic (test bilateral): (- ; -1,96 ] [1,96; ). Concluzie (test bilateral): Se accept ipoteza nulului, deoarece parametrul statistic calculat al testului nu apar ine regiunii critice: diferen a mediilor magneziului seric pentru cele dou e antioane nu este semnificativ diferita de zero (nu este semnificativa din punct de vedere statistic). Test bilateral (non-directional): Nu se evalueaza direc ia diferen ei dintre cele dou medii Un test cu un nivel de semnifica ie.


Related search queries