Example: bankruptcy

3. Tests statistiques et graphes - biostat.fr

PlanTests statistiquesGraphesGraphes avanc sINTRODUCTION AU LOGICIEL R3. Tests statistiques et graphesAnne Dubois, Julie Bertrand, Emmanuelle UMR738E. Comets (UMR738)Introduction R - Novembre 20091 / 65 PlanTests statistiquesGraphesGraphes avanc sPlanTests statistiquesMoyenne et varianceAnalyse de varianceVariables discr tesTests de distributionGraphesGraphes simplesEl ments des graphesLes diff rents types de graphesSauvegardeGraphes avanc sLibrairies graphiques avanc esggplot2E. Comets (UMR738)Introduction R - Novembre 20092 / 65 PlanTests statistiquesGraphesGraphes avanc sRemise en jambe : un exercice1 Simulez deux vecteursvec1etvec2contenant 20 r alisationsd une loi normale de moyennes respectivement 70 et 25, et devariances 10 et

Plan Tests statistiques Graphes Graphes avancés INTRODUCTION AU LOGICIEL R 3. Tests statistiques et graphes Anne Dubois, Julie Bertrand, Emmanuelle Comets

Tags:

  Biostat

Information

Domain:

Source:

Link to this page:

Please notify us if you found a problem with this document:

Other abuse

Transcription of 3. Tests statistiques et graphes - biostat.fr

1 PlanTests statistiquesGraphesGraphes avanc sINTRODUCTION AU LOGICIEL R3. Tests statistiques et graphesAnne Dubois, Julie Bertrand, Emmanuelle UMR738E. Comets (UMR738)Introduction R - Novembre 20091 / 65 PlanTests statistiquesGraphesGraphes avanc sPlanTests statistiquesMoyenne et varianceAnalyse de varianceVariables discr tesTests de distributionGraphesGraphes simplesEl ments des graphesLes diff rents types de graphesSauvegardeGraphes avanc sLibrairies graphiques avanc esggplot2E. Comets (UMR738)Introduction R - Novembre 20092 / 65 PlanTests statistiquesGraphesGraphes avanc sRemise en jambe : un exercice1 Simulez deux vecteursvec1etvec2contenant 20 r alisationsd une loi normale de moyennes respectivement 70 et 25, et devariances 10 et 42 Simulez un deuxi me vecteurvec3contenant 20 r alisationsd une loi uniforme sur l intervalle [0.]

2 5]transformezvec3pour qu il contienne des valeurs enti res3Cr ez un dataframe contenant les 3 vecteurs dans 3 colonnes,etnommez-les "poids", "age" et "douleur" respectivement4 Calculez les moyennes et les variances des deux variablescontinuesE. Comets (UMR738)Introduction R - Novembre 20093 / 65 PlanTests statistiquesGraphesGraphes avanc sMoyenne et varianceAnalyse de varianceVariables discr tesTests de distributionPlanTests statistiquesMoyenne et varianceAnalyse de varianceVariables discr tesTests de distributionGraphesGraphes simplesEl ments des graphesLes diff rents types de graphesSauvegardeGraphes avanc sLibrairies graphiques avanc esggplot2E.

3 Comets (UMR738)Introduction R - Novembre 20094 / 65 PlanTests statistiquesGraphesGraphes avanc sMoyenne et varianceAnalyse de varianceVariables discr tesTests de distributionTest de la moyenneLes Tests usuels pour une moyenne ou une comparaison de moyennesont : le test t pour des variables normales (x) (x,y) le test de Wilcoxon, non-param trique, pour des petits chantillons ou des variables non normales (x) (x,y)Pour un test appari on utilise l option"paired=T"> x <- rnorm(50,0,1)> y <- rnorm(50, , )> w <- x + rnorm(50,0, )> (x,y)Pour ces deux Tests on peut sp cifier l hypoth se alternative enutilisant l argumentmu=.

4 E. Comets (UMR738)Introduction R - Novembre 20095 / 65 PlanTests statistiquesGraphesGraphes avanc sMoyenne et varianceAnalyse de varianceVariables discr tesTests de distributionApplication du test tComparaison de moyennes entre 2 groupes :> (x,y)Welch Two Sample t-testt = , df = , p-value = hypothesis: true difference in means != 095 percent confidence de moyennes sur donn es appari es :> (x,w,paired=T)Paired t-testt = , df = 49, p-value = percent confidence est possible d obtenir un intervalle de confiance sur l estimation de lamoyenne en sp , et l optionalternative(" ","less", "greater") permet de sp cifier l hypoth se Comets (UMR738)

5 Introduction R - Novembre 20096 / 65 PlanTests statistiquesGraphesGraphes avanc sMoyenne et varianceAnalyse de varianceVariables discr tesTests de distributionTest de WilcoxonPour une seule variable ou deux variables appari es, un test des signes de Wilcoxon (sur x ou sur (x-y)).Pour deux variables non appari es, le test correspond au test deMann-Whitney aussi appel test des rangs de optionexact=Test utilis e pour demander un calcul exact de Comets (UMR738)Introduction R - Novembre 20097 / 65 PlanTests statistiquesGraphesGraphes avanc sMoyenne et varianceAnalyse de varianceVariables discr tesTests de distributionUtilisation avec un dataframeOn utilise la baseenergycontenue dans la librairieISwR.

6 > library(ISwR)> attach(energy)On teste une diff rence de d pense nerg tique entre ob sesetnon-ob ses :> (expend~stature)qui revient tester :> (expend[stature=="lean"],expend[stature= ="obese"])Cela correspond en SAS :proc ttest data=energy;class stature;var expend;run;E. Comets (UMR738)Introduction R - Novembre 20098 / 65 PlanTests statistiquesGraphesGraphes avanc sMoyenne et varianceAnalyse de varianceVariables discr tesTests de distributionExercice1En reprenant la base que vous avez cr e en d but de cours,testez l galit des moyennes entre les sujets ayant un grade dedouleur inf rieur ou sup rieur utilisant le test de Wilcoxon, comparez les moyennes dansles2 chantillons pour les cas suivantsA=c(0,1,2), B=c(100,150,5000)A=c(0,1,2)

7 , B=c(100,150,5000,6000)A=c(0,1,2,3,4), B=c(100,150,5000,6000)Qu en concluez-vous?3 Faites la m me chose qu en 2 en utilisant un test Comets (UMR738)Introduction R - Novembre 20099 / 65 PlanTests statistiquesGraphesGraphes avanc sMoyenne et varianceAnalyse de varianceVariables discr tesTests de distributionComparaison des variances (1)Par d faut, on suppose que la variance entre les 2 groupes estdiff rente (ce qui n est pas le cas en SAS). Il est pr f rabled effectuerun test d homog n it des variances :> (expend~stature)F test to compare two variancesF = , num df = 12, denom df = 8, p-value = hypothesis: true ratio of variances is not equal to 1On ne rejette pas l hypoth se d galit des variances :> (expend~stature, )E.

8 Comets (UMR738)Introduction R - Novembre 200910 / 65 PlanTests statistiquesGraphesGraphes avanc sMoyenne et varianceAnalyse de varianceVariables discr tesTests de distributionComparaison des variances (2)Le test de Fisher portestricto sensusur des variables autres Tests d homog n it des variances sont disponibles sous particulier le test de Bartlett est plus robuste en cas d carts lanormalit > (expend~stature)Bartlett test of homogeneity of variancesdata: expend by statureBartlett s K-squared = , df = 1, p-value = existe galement des Tests non-param triques (Fligner-Killeen,Ansari-Bradley et Mood) d homog n it de la Comets (UMR738)Introduction R - Novembre 200911 / 65 PlanTests statistiquesGraphesGraphes avanc sMoyenne et varianceAnalyse de varianceVariables discr tesTests de distributionR cup ration des r sultatsOn peut stocker le r sultat du test dans un objet.

9 Test <- (x,y)> names(test)[1] "statistic" "parameter" " " " " "estimate"[6] " " "alternative" "method" " "On peut aussi utiliserattributes(test).Si on souhaite conserver la statistique de test, l IC 95% et la p-value :> res <- c(test$statistic,test$ ,test$ )> names(res) <- c("stat"," "," "," ")> resstat Comets (UMR738)Introduction R - Novembre 200912 / 65 PlanTests statistiquesGraphesGraphes avanc sMoyenne et varianceAnalyse de varianceVariables discr tesTests de distributionCorr lationsLa syntaxe pour calculer la corr lation et la tester est :> (x,y,method="methode")o methode peut tre.

10 Pearson (par d faut) Spearman (non param trique) Kendall (non param trique)> (x,y,method="spearman")Spearman s rank correlation = 15460, p-value = hypothesis: true rho is not equal to 0sample estimates: d faut retire les valeurs Comets (UMR738)Introduction R - Novembre 200913 / 65 PlanTests statistiquesGraphesGraphes avanc sMoyenne et varianceAnalyse de varianceVariables discr tesTests de distributionAnalyse de variance (1)Pour comparer simultan ment les moyennes de plusieurs variables,on pratique une utilise le jeu de donn On souhaite tester unediff rente en folates selon le type de ventilation (N2O+O2pendant 24h,N2O+O2pendant l op ration, seulement O2pendant 24h).