Example: confidence

Statistique Descriptive Multidimensionnelle (pour …

Publicationsdel'InstitutdeMath ematiquesdeToulouseStatistiqueDescriptiv e Multidimensionnelle (pourlesnuls)(version demai2010)AlainBacciniInstitutde Math ematiquesde Toulouse|UMRCNRS5219 Universit e PaulSabatier|31062{ eres1 Multidimensionnelle .. ' .. esentation.. esultatspr eliminaires.. esultatsg en eraux.. esultatssurlesvariables.. esultatssurlesindividus.. esentationg en eraledela m ethode.. esultats..132 g en eraldel' .. ees.. eme.. ethode.. ees.. ' eesdel'exemple1 avec le logicielSAS.. etationdesr esultats..243 tableaudeBurt.. eesconsid er ees.. e nitiondutableaudeBurt.. del' .. eme.. ethode.. ees.. ' ees.. etation..3234 TABLEDESMATI ERESA vant-proposCedocumentestconsacr e auxtroism ethodeslespluscourantesdela statitiquedescriptivemultidimensionnelle : l'Analyseen ComposantesPrincipales(chapitre 1),l'AnalyseFactorielle desCorrespondances (chapitre 2) et l'AnalysedesCorrespondances Multiples(chapitre 3).Il a et e con cupourdespersonnessouhaitantavoirquelque sconnaissances surces m ethodessansavoirla moindre culture scienti que(d'o u ).}

Publications de l’Institut de Math ema tiques de Toulouse Statistique Descriptive Multidimensionnelle (pour les nuls) (version de mai 2010) Alain Baccini

Tags:

  Descriptive, Statistique, Statistique descriptive

Information

Domain:

Source:

Link to this page:

Please notify us if you found a problem with this document:

Other abuse

Transcription of Statistique Descriptive Multidimensionnelle (pour …

1 Publicationsdel'InstitutdeMath ematiquesdeToulouseStatistiqueDescriptiv e Multidimensionnelle (pourlesnuls)(version demai2010)AlainBacciniInstitutde Math ematiquesde Toulouse|UMRCNRS5219 Universit e PaulSabatier|31062{ eres1 Multidimensionnelle .. ' .. esentation.. esultatspr eliminaires.. esultatsg en eraux.. esultatssurlesvariables.. esultatssurlesindividus.. esentationg en eraledela m ethode.. esultats..132 g en eraldel' .. ees.. eme.. ethode.. ees.. ' eesdel'exemple1 avec le logicielSAS.. etationdesr esultats..243 tableaudeBurt.. eesconsid er ees.. e nitiondutableaudeBurt.. del' .. eme.. ethode.. ees.. ' ees.. etation..3234 TABLEDESMATI ERESA vant-proposCedocumentestconsacr e auxtroism ethodeslespluscourantesdela statitiquedescriptivemultidimensionnelle : l'Analyseen ComposantesPrincipales(chapitre 1),l'AnalyseFactorielle desCorrespondances (chapitre 2) et l'AnalysedesCorrespondances Multiples(chapitre 3).Il a et e con cupourdespersonnessouhaitantavoirquelque sconnaissances surces m ethodessansavoirla moindre culture scienti que(d'o u ).}

2 Les connaissances expos eesicisontdonc,n ecessairement,super ciellesmais,nousl'esp erons,su santespourcomprendre lesgrandeslignesde ces statistiquemultidimensionnelle (etprincipalementl'AnalysedesCorresponda nces Multiples)estaujourd'huicourammentutilis ee pouranalyserdesr esultatsd'enqu^etes,y comprispar desper-sonnesn'ayantpas de formationmath erementdestin e et faitsuiteaudocumentintitul e \StatistiqueDescriptive El ementaire",dis-poniblesurle m^emesiteet d esign e sousl'appellation\coursSDE"par la 'autre part,unautre courssurla statistiquemultidimensionnelle,pluscompl etet destin e ades etudiantsdes li eres universitaires de math ematiquesappliqu ees,est egalementdisponiblesurce sitesousle titre \ExplorationStatistique".Chapitre1 AnalyseenComposantesPrincipalesCechapitr e estconsacr e a l'AnalyseenComposantesPrincipales( ),m ethode fon-damentaleen ethode permetde traitersimul-tan ementunnombre quelconquede variables, ,nousdonneronstoutd'abord quelquesindicationssurce quesontlesm ethodesde la statistiquedescriptivemultidimensionnell e.

3 Ensuite,nouspr esenteronsen d etailunexempletr es simple(unexempled' ecole,arti ciel),pourbiencomprendre , a quoi ca sert,commentonl'interpr n,dansundernierparagraphe,nousdonneronsq uelquesindicationsg en eralessurcettem multidimensionnelleOnd esigneparstatistiquedescriptive multidimensionnellel'ensembledesm ethodesde lasta-tistiquedescriptive(ouexploratoire )permettant detraitersimultan ement unnombrequel-conquedevariables(il s'agitd'allerau-del a del' etuded'uneseuleoudedeuxvariables).Cesm ethodessont purement descriptives,c'est- a-direqu'ellesnesupposent, a priori,aucunmod elesous-jacent, detype probabiliste.(Ainsi,lorsqu'onconsid ereunensembledevariablesquantita-tives surlesquellesonsouhaiter , il n'estpasn ecessairedesupposerquecesvariablessont distribu eesselondesloisnormales.)Danschaquem ethode quenousallonsd evelopper,lesvariablesconsid er eesseront de m^emena-ture: toutesquantitatives(Analyseen ComposantesPrincipales)outoutesqualitati ves(Ana-lysesdesCorrespondances).

4 Lesm ethodeslesplusclassiquesdela statistiquedescriptive multidimensionnellesont lesm a rechercherdesfacteurs(cettenotionserapr ecis ee ult erieu-rement) ennombrerestreint et r esumant le mieuxpossiblelesdonn eesconsid er a desrepr esentationsgraphiquesdesdonn ees(desindividuscommedesva-riables)parra pport a cesfacteurs,repr esent es esentationsgraphiquessont dutypenuagedepoints(oudiagrammede dispersion).Nousallonsd evelopper 3 m ethodes,chacunecorrespondant a unchapitre: l'Analyseen Compo-santesPrincipales( ), dansce chapitre1, l'AnalyseFactorielledesCorrespondances( ),dansle chapitre2 et l'AnalysedesCorrespondancesMultiples( ),dansle ^ot e l'AnalyseFactorielleDiscriminante et l'AnalyseCanonique(m ethodesfactoriellesplusparticuli eres),ainsiquelesm ethodesnonfactorielles(principalement la classi ca-tion).Lalogiquedestroischapitresconsa cr es a la statistiquedescriptive multidimensionnelleestla suivante : l'objectif,pourles etudiants,estdema^ triser,aumoinspartiellement, l'AnalysedesCorrespondancesMultiples,m ethodesouvent utilis ee danslesd epouillements d'enqu^etes,lorsqu'onsouhaiteallerau-del a dessimplestris a plat(analysesunidimensionnelles)outriscr ois es(analysesbidimensionnelles).

5 Oncommencedoncparintroduirel' , m ethode centrale,indispensablepourbiencomprendre le fonctionnement de ' ,casparticulierde l' 'onne consid en eraliseen n a l' ' 'on etudiesimultan ementunnombre importantde variablesquantitatives(neserait-ceque4 !), commenten faire un graphiqueglobal ? La di cult e vientde ce queles individus etudi es nesontplusrepr esent es dansun plan,espace de dimension2, maisdansun espace de dimensionplusimportante(par exemple4).L'objectifde l'AnalyseenComposantesPrincipalesestde revenir aunespace de dimensionr eduite(par exemple2) en d eformantle moinspossiblela r ealit e. Il s'agitdoncd'obtenirle r esum e le pluspertinentpossibledesdonn 'estla matrice desvariances-covariances(oucelle descorr elations)quivapermettre der ealiserce r esum e pertinent,parce qu'onanalyseessentiellementla dispersiondesdonn eesconsid e-r , on va extraire, par un proc ed e math ematiqueappropri e, les facteursquel'onrecherche,en petitnombre. Ils vontpermettre de r ealiserlesgraphiquesd esir es danscet espace depetitedimension(lenombre de facteursretenus),en d eformantle moinspossiblela con gurationglobaledesindividustelle qu'elle estd e niepar l'ensembledesvariablesinitiales(ainsirem plac eespar lesfacteurs).

6 C'estl'interpr etationde ces graphiquesquipermettra de comprendre la structure desdonn eesanalys etationsera guid ee par un certainnombre d'indicateursnum eriques,appel esaides a l'interpr etation,quisontl a pouraiderl'utilisateur a faire l'interpr etationla plusjusteetla planth eorique,l'AnalyseenComposantesPrincipale sestunem ethoderelativementcomplexe,dansla mesureo u ellefaitappel a desnotionsmath ematiquesnon el ementaires: cellesde matrices,d' el ements , il n'estpasn ecessairede conna^ trecesnotionspourcomprendrele m ecanismed' et doncpourl'utilisercorrectement. Pourfaciliterlat^ache dulecteur,nousavonschoiside pr esenterl' a traverssond eroulement surunexemple ctif,tr es simple,et quiparlera a toutle monde: lesnotesobtenuespardes el eves esentationConsid eronslesnotes(de0 a 20)obtenuespar9 el eves dans4 disciplines(math ematiques,physique,fran cais,anglais) analysers epar ement chacunede ces4 variables,soiten faisant ungraphique,soiten calculant desr esum es num eriques.

7 Noussavons egalement qu'onpeutregarderlesliai-sonsentre2 variables(parexemplemath ematiqueset fran cais),soitenfaisant ungraphiquedutype nuagedepoints,soitencalculant leurcoe cient decorr elationlin eaire, voireenr ealisant lar egressionde l'unesurl'autre(pourtoutcela,se reporteraucoursSDE).Mais,comment faireune etudesimultan ee des4 variables,neserait-cequ'enr ealisant ungra-phique? Ladi cult e vient dece quelesindividus(les el eves)nesont plusrepr esent es ' ,espacededimension2, maisdansunespacededimension4 (chaque el eve etant caract eris eparles4 notesqu'ila obtenues).L'objectifde l'Analyseen ComposantesPrincipalesestde revenir a unespacede dimensionr eduite(parexemple,ici,2) en d eformant le moinspossiblela r ealit e. Ils'agitdoncd'obtenirle r esum e le pluspertinent desdonn analogie,on peutpenserau photographequicherche le meilleuranglede vuepourtranscrireendimension2 (leplandesa photo)unesc enesitu ee endimension3 (notreespaceambiant).Lam ethodemath ematiqueva se chargerdetrouver l'\anglede vue"optimal,se substituant ainsiaucoupd' esentonsci-dessousquelquesr esultatsdel' r ealis ee,avec le logicielSAS,surcesdonn permettredese rendrecomptedespossibilit es dela m 'ons'estlimit e a 2 d ecimalesdanslesr esultats,bienqueleslogicielsenfournissen t, eng en eral,beaucoupplus(maisellessont rarement utiles).

8 Esultatspr eliminairesLelogicielfournittoutd'abordl a moyenne(mean), l' ecart-type (standard deviation), le mini-mumet le s'agitdonc,pourl'instant, d' etudesunivari el grandehomog en eit e des4 variablesconsid er ees: m^emeordrede grandeurpourlesmoyennes,les ecarts-types,lesminimaet estlamatricedescorr elations. Elledonnelescoe cients decorr elationlin eairedesvariablesprisesdeux a 'estunesuccessiond'analysesbivari ees, constituantunpremierpasversl'analysemult ivari corr elationslin eairessont positives (cequisigni equetouteslesvariablesvarient, en moyenne,dansle m^emesens),certaines etant tr es fortes( ),d'autresmoyennes( ),d'autresen nplut^ot faibles( ). esultatsg en erauxContinuonsl'examendessortiesdecette analyseparl' etudedelamatricedesvariances-covariances , matricede m^emenaturequecelledescorr elations,bienquemoins\parlante"(nousverr onsn eanmoinsplusloincomment elleestutilis ee concr etement).Ladiagonaledecettema-tricefourn itlesvariancesdes4 variablesconsid er ees(onnoteraqu'auniveaudescalculs,il estpluscommodedemanipulerla variancequel' ecart-type ; pourcetteraison,dansdenombreusesm ethodesstatistiques,commel' , onutilisela variancepourprendreen comptela dispersiond'unevariablequantitative).

9 Matricedes ( el ements math ematiquesdont la signi cationpeut^etrelaiss ee dec^ot epourl'instant) donn eesci-dessoussont cellesde la ; variancesexpliqu etationChaquelignedutableauci-dessuscorr espond a unevariablevirtuelle(voil a lesfacteurs!) dontla (valeurpropre)fournitla variance(enfait,chaquevaleurproprerepr esente lavariancedufacteurcorrespondant). , oupourcentagede variance, , oupourcentagecumul e, repr esente le cumul lesvariancesdes4 variablesinitiales(diagonaledela matricedesvariances-covariances): 11:39 + 8:94 + 12:06 + 7:91= 40:30:Ladispersiontotaledesindividuscons id er es,endimension4, estainsi egale a valeurspropresobtenues: 28:23 + 12:03 + 0:03+0:01 = 40:30:Lenuagede points en dimension4 esttoujoursle m^emeet sa dispersionglobalen'apaschang e. C'estla r epartitionde cettedispersion,selonlesnouvellesvariabl esquesont lesfacteurs,ou composantesprincipales,quise trouve modi ee : les2 premiersfacteursrestituent a euxseulsla quasi-totalit edela dispersiondunuage,ce quipermetden egligerles2 cons equent, lesgraphiquesendimension2 pr esent es ci-dessousr esument presqueparfai-tement la con gurationr eelledesdonn eesquise trouvent endimension4 : l'objectif(r esum epertinent desdonn eesen petitedimension) esultatssurlesvariablesLer esultatfondamentalconcernant lesvariablesestle tableaudescorr elationsvariables-facteurs.

10 Il s'agitdescoe cients de corr elationlin eaireentrelesvariablesinitialeset cescorr elationsquivont permettrededonnerunsensauxfacteurs(deles interpr eter).Corr elationsvariables-facteursFACTEURS--> erescolonnesde ce tableaupermettent, toutd'abord,de r ealiserlegraphiquedesvariablesdonn e parla ,cesdeuxcolonnespermettent egalement dedonnerunesigni cationauxfacteurs(doncauxaxesdesgraphiqu es). ' 2- 1 . 0- 0 . 50 . 00 . 51 . 0A x e 1- 1 . 0 - 0 . 5 0 . 0 0 . 5 1 . {Repr esentationdesvariablesOnnoteraquelesdeux derni erescolonnesne seront pasutilis eespuisqu'onne retient quedeuxdimensionspourinterpr eterl' etationAinsi,onvoitquele premierfacteurestcorrel e positivement, et assezfortement, avec chacunedes4 variablesinitiales: plusun el eve obtient debonnesnotesdanschacunedes4 disciplines,plusil a unscore elev e surl'axe1 ; r eciproquement, plussesnotessont mauvaises,plussonscoreestn egatif; l'axe1 repr esente donc,enquelquessortes,le r esultatglobal(dansl'ensembledes4discipli nesconsid er ees)des el quiconcernel'axe2, il oppose,d'unepart,le fran caiset l'anglais(corr elationspositives),d'autrepart,lesmath ematiqueset la physique(corr elationsn egatives).}


Related search queries