Example: tourism industry

Introduction à l’approche bootstrap - guillemet.org

Introduction l'approche bootstrap Ir ne Buvat U494 INSERM. 25 septembre 2000. Introduction l'approche bootstrap - Ir ne Buvat - 21/9/00 - 1. Plan du cours Qu'est-ce que le bootstrap ? bootstrap pour l'estimation d'erreurs standard bootstrap de donn es structur es bootstrap pour l'estimation de biais bootstrap et jackknife bootstrap pour la construction d'intervalles de confiance bootstrap et tests d'hypoth ses Bilan R f rence Introduction l'approche bootstrap - Ir ne Buvat - 21/9/00 - 2. Qu'est-ce que le bootstrap ? Technique permettant d'effectuer de l'inf rence statistique Technique r cente (1979) car reposant sur l'usage de calculateurs puissants Technique reposant sur la simulation de donn es partir d'un nombre limit d'observations Technique destin e faciliter l'inf rence dans les situations complexes o les m thodes analytiques ne suffisent pas to pull oneself up by one's bootstrap = se tirer d'un mauvais pas Introduction l'approche bootstrap - Ir ne Buvat - 21/9/00 - 3.

Introduction à l’approche bootstrap - Irène Buvat - 21/9/00 - 9 Exemples d’estimation d’erreurs standard groupe 1 (placébo) n1 = 9 mesures 52, 10, 40, 104, 50,

Information

Domain:

Source:

Link to this page:

Please notify us if you found a problem with this document:

Other abuse

Transcription of Introduction à l’approche bootstrap - guillemet.org

1 Introduction l'approche bootstrap Ir ne Buvat U494 INSERM. 25 septembre 2000. Introduction l'approche bootstrap - Ir ne Buvat - 21/9/00 - 1. Plan du cours Qu'est-ce que le bootstrap ? bootstrap pour l'estimation d'erreurs standard bootstrap de donn es structur es bootstrap pour l'estimation de biais bootstrap et jackknife bootstrap pour la construction d'intervalles de confiance bootstrap et tests d'hypoth ses Bilan R f rence Introduction l'approche bootstrap - Ir ne Buvat - 21/9/00 - 2. Qu'est-ce que le bootstrap ? Technique permettant d'effectuer de l'inf rence statistique Technique r cente (1979) car reposant sur l'usage de calculateurs puissants Technique reposant sur la simulation de donn es partir d'un nombre limit d'observations Technique destin e faciliter l'inf rence dans les situations complexes o les m thodes analytiques ne suffisent pas to pull oneself up by one's bootstrap = se tirer d'un mauvais pas Introduction l'approche bootstrap - Ir ne Buvat - 21/9/00 - 3.

2 Probl matique : exemple d'inf rence statistique La diff rence entre deux valeurs moyenne est-elle statistiquement significative ? dur e de survie groupe 1 (plac bo) groupe 2 (traitement). n1 = 9 mesures n2 = 7 mesures 52, 10, 40, 104, 50, 94, 38, 23, 197, 27, 146, 31, 46 99, 16, 141. moyenne m1 = moyenne m2 = erreur standard erreur standard se1 = var1/n1 = se2 = var2/n2 = diff rence des moyennes = erreur standard associ e la diff rence se = se12 + se22 = + = m1 - m2. = se non significatif pas besoin de bootstrap ! Introduction l'approche bootstrap - Ir ne Buvat - 21/9/00 - 4. Probl matique : int r t du bootstrap La diff rence entre deux valeurs m dianes est-elle statistiquement significative ? dur e de survie groupe 1 (plac bo) groupe 2 (traitement). n1 = 9 mesures n2 = 7 mesures 52, 10, 40, 104, 50, 94, 38, 23, 197, 27, 146, 31, 46 99, 16, 141.

3 M diane m1 = 46 moyenne m2 = 94. erreur standard ? erreur standard ? diff rence des moyennes = 48. erreur standard associ e la diff rence ? diff rence significative ? pas de formule analytique simple pour estimer la fiabilit . des grandeurs autres que les valeurs moyennes int r t du bootstrap Introduction l'approche bootstrap - Ir ne Buvat - 21/9/00 - 5. bootstrap pour l'estimation d'une erreur standard 1 chantillon observ et 1 statistique d'int r t x = (x1 , x2 , .. , xN ) s(x) : moyenne, m diane,.. B chantillons bootstrap r plications bootstrap de s calcul de la statistique d'int r t x*1 = (x1* , x2* , .. , xN*) s(x*1). x*b = (x1* , x2* , .. , xN*) s(x*b).. x*B = (x1* , x2* , .. , xN*) s(x*B). estim e bootstrap de l'erreur standard = cart-type des r plications bootstrap S [s(x*b )- s*]2. b B-1. avec s* = S s(x*b)/B.

4 B Introduction l'approche bootstrap - Ir ne Buvat - 21/9/00 - 6. Calcul d'un chantillon bootstrap 1 chantillon observ de N valeurs x = (50 , 53 , 58 , 80 , 75 , 69 , 77 , 44 , 63 , 73). 1 chantillon bootstrap : 1 tirage al atoire de N valeurs parmi l' chantillon original, avec remise x*1 = (69 , 53 , 80 , 69 , 73 , 53 , 44 , 58 , 75 , 53). 1 chantillon bootstrap : autant de valeurs que dans l' chantillon original valeurs issues de l' chantillon original, mais avec des fr quences potentiellement diff rentes Introduction l'approche bootstrap - Ir ne Buvat - 21/9/00 - 7. Exemple : erreur standard de la moyenne dur e de survie groupe 1 (placebo). n1 = 9 mesures x = (52, 10, 40, 104, 50, 27, 146, 31, 46). statistique d'int r t : moyenne m1 = r plications B chantillons bootstrap bootstrap de calcul de la la moyenne x*1=(50, 10, 40, 50, 46, 10,146, 40, 50) moyenne x*b =(10, 52, 104, 40, 104, 46, 50, 146, 27).

5 X*B =(146, 31, 31, 10, 27, 40, 104, 46, 50) estim e bootstrap de l'erreur standard = cart-type des r plications bootstrap de la moyenne S [m1(x*b )- m1*]2. SE (m1) = b = B-1. avec m1* = S m1(x*b)/B = b Introduction l'approche bootstrap - Ir ne Buvat - 21/9/00 - 8. Exemples d'estimation d'erreurs standard dur e de survie groupe 1 (plac bo) groupe 2 (traitement). n1 = 9 mesures n2 = 7 mesures 52, 10, 40, 104, 50, 94, 38, 23, 197, 27, 146, 31, 46 99, 16, 141. moyenne m1 = moyenne m2 = m diane m1 = 46 m diane m2 = 94. erreur standard sur m1 : erreur standard sur m1 : classique : se1 = classique : se2 = bootstrap : se1* = bootstrap : se2* = erreur standard sur m1 : erreur standard sur m2 : classique : ? classique : ? bootstrap : se1* = bootstrap : se2* = erreur standard sur n'importe quelle statistique classique : ? bootstrap : TOUJOURS UNE SOLUTION.

6 Au prix d'un peu de calcul .. Introduction l'approche bootstrap - Ir ne Buvat - 21/9/00 - 9. Erreur standard d'un coefficient de corr lation (1). performances des tests de contr le de connaissance test national note moyenne pr c dent la scolarisation dans l'ann e qui suit 576 635 558 578 666 580 555 661 651 605 653 575 545 572 594 3. 500 600 700. r= fiabilit de cette valeur ? bootstrap Introduction l'approche bootstrap - Ir ne Buvat - 21/9/00 - 10. Erreur standard d'un coefficient de corr lation (2). chantillon observ . x=( ). 576 635 558 578 666 580 555 661 651 605 653 575 545 572 594. statistique d'int r t : corr lation r= r plications B chantillons bootstrap bootstrap de la calcul de la corr lation r corr lation r x*1 = ( 661 558 666 651 .. 594.. ) x*b = ( 651 575 605 575 .. 575.. ) .. x*B = ( 572 572 545 653 .. 575.)

7 S [r(x*b )- r*]2. SE (r) = b = B-1. avec r* = S r(x*b)/B = b Introduction l'approche bootstrap - Ir ne Buvat - 21/9/00 - 11. Erreurs standard en ACP (1). l ve notes par mati re math phys litt angl mus 1 17 14 18 14 12. 2 09 13 15 16 18.. i xi1 xi2 xij xi5.. N 19 15 09 12 06. Matrice 5x5 de covariance empirique G : Gjk = 1 Si [xij - moyi(xij)] [xik - moyi(xik)] j,k= N. Calcul des valeurs propres et vecteurs propres de G : l1, l2, l3, l4, l5 et v1 , v2 , v3 , v4 , v5. fiabilit du pourcentage d'inertie l1 / Sk lk ? fiabilit des vk ? bootstrap Introduction l'approche bootstrap - Ir ne Buvat - 21/9/00 - 12. Erreurs standard en ACP (2). chantillon observ . l ve notes par mati re math phys litt angl mus 1 17 14 18 14 12. 2 09 13 15 16 18. statistiques d'int r t : .. X= . %age d'inertie PI = l1/Sklk i xi1 xi2 xij xi5. B chantillons.

8 Vecteurs propres vk bootstrap . N 19 15 09 12 06. calcul de G*b , l ve notes par mati re math phys litt angl mus 1 08 11 19 17 15. valeurs propres r plications bootstrap 2 09 13 15 16 18.. et vecteurs X*1 =.. i xi1 xi2 xij xi5. propres de G.. l1*1 /Sklk*1.. v1*1,v2*1,v3*1,v4*1,v5*1. N 17 14 18 14 12.. l ve notes par mati re math phys litt angl mus 1 09 13 15 16 18. 2.. l1*B /Sklk*B. X*B = i xi1 xi2 xij xi5. v1*B,v2*B,v3*B,v4*B ,v5*B.. N 08 11 19 17 15. SE (PI) =. S [PI(X*b )- PI*]2 avec PI* = S PI(x*b)/B. b b B-1. SE (vk) =. S [vk(X*b )- vk*]2 avec vk*=S vk(X*b)/B. b b B-1 Introduction l'approche bootstrap - Ir ne Buvat - 21/9/00 - 13. Erreur standard dans l'ajustement de courbes (1). Diminution du taux de cholest rol (y) en fonction du pourcentage de la dose prescrite effectivement absorb e (x). xi(%) 0 2 7 8 16 33 43.

9 100. yi Mod le yi = b0 + b1 xi + b2 xi2. Ajustement des moindres carr s (^. b0 , ^b1 , b ^2 ). Diminution pr dite par le mod le ^y = ^b + ^b x + ^b x 2. i 0 1 i 2 i fiabilit des valeurs pr dites, , erreur standard autour d'une valeur pr dite pour le mod le consid r ? , erreur standard autour de y60% ? bootstrap Introduction l'approche bootstrap - Ir ne Buvat - 21/9/00 - 14. Erreur standard dans l'ajustement de courbes (2). 1 re approche chantillon observ . xi(%) 0 2 7 8 16 33 43 .. 100. yi statistiques d'int r t : valeurs pr dites ^yi B chantillons bootstrap r plications calcul de bootstrap de ^yi (^ ^1,b b0,b ^ 2). x*1 0 54 43 2 .. 16 yi*1. y*1 .. x*b 33 95 7 43 .. 72. y .. *b yi*b .. x*B 100 72 43 28 .. 7 yi*B. y *B .. S [yi*b- yi*]2. ^i) =. SE (y b B-1. avec yi* = S yi*b /B. b Introduction l'approche bootstrap - Ir ne Buvat - 21/9/00 - 15.

10 Erreur standard dans l'ajustement de courbes (3). 2 me approche chantillon observ . xi(%) 0 2 7 8 16 33 43 .. 100. yi ajustement du mod le : statistiques d'int r t : yi = b0+b1xi+b2xi2 valeurs pr dites ^yi ^0, ^b1, ^b2. b 1 chantillon de r sidus : ^ei = yi-b^0+b^1xi+b ^ 2xi2. ^ei = .. B chantillons bootstrap de r sidus mod le : ^0+b^1xi+b^2xi2+ei*b yi*b=b ei*1 .. yi*1. ei*b .. yi*b ei*B .. yi*B. B r plications bootstrap de ^. yi erreur standard de y^i Introduction l'approche bootstrap - Ir ne Buvat - 21/9/00 - 16. Ajustement de courbes : r sum . 2 possibilit s : bootstrap des paires (xi, yi). pas de mod le n cessaire suppose que les paires sont des r alisations al atoires de la population bootstrap des r sidus sensible au mod le Si mod le incertain, adopter plut t le bootstrap des paires Introduction l'approche bootstrap - Ir ne Buvat - 21/9/00 - 17.


Related search queries