Example: tourism industry

La représentativité d’un échantillon et son test par le ...

Tutorials in Quantitative Methods for Psychology 2012, Vol. 8(3), p. 173-181. 173 La repr sentativit d un chantillon et son test par le Khi-deux Testing the representativeness of a sample Louis Laurencelle Universit du Qu bec Trois-Rivi res The value and credibility of a survey or opinion pool depend to a large extent on the observed sample s representativeness, which in turn depends on sample size. When dealing with an heterogenous population, however, sample size may be insufficient to counterbalance possible biases due to differences in constituent subpopulations. If population s composition is known, the sample s representativeness can be verified by a Chi-square test: the test is illustrated and a special formula is proposed and validated for the case of finite populations. La valeur d une statistique issue d un sondage, telle qu une moyenne ou une proportion, d pend la fois de la repr sentativit de l chantillon d l ments sur lequel elle est bas e et de sa m thode de calcul.

Tutorials in Quantitative Methods for Psychology 2012, Vol. 8(3), p. 173-181. 173 La représentativité d’un échantillon et son test par le Khi-deux

Information

Domain:

Source:

Link to this page:

Please notify us if you found a problem with this document:

Other abuse

Transcription of La représentativité d’un échantillon et son test par le ...

1 Tutorials in Quantitative Methods for Psychology 2012, Vol. 8(3), p. 173-181. 173 La repr sentativit d un chantillon et son test par le Khi-deux Testing the representativeness of a sample Louis Laurencelle Universit du Qu bec Trois-Rivi res The value and credibility of a survey or opinion pool depend to a large extent on the observed sample s representativeness, which in turn depends on sample size. When dealing with an heterogenous population, however, sample size may be insufficient to counterbalance possible biases due to differences in constituent subpopulations. If population s composition is known, the sample s representativeness can be verified by a Chi-square test: the test is illustrated and a special formula is proposed and validated for the case of finite populations. La valeur d une statistique issue d un sondage, telle qu une moyenne ou une proportion, d pend la fois de la repr sentativit de l chantillon d l ments sur lequel elle est bas e et de sa m thode de calcul.

2 Dans les cas o l enqu te porte sur une population h t rog ne et de composition connue, la repr sentativit de l chantillon lui-m me peut tre v rifi e par un test statistique, le test Khi-deux d ajustement. Nous examinons la r alisation de ce test pour les cas de population infinie ou finie et nous proposons une approximation originale pour ce dernier cas. Article first published in Lettres Satistiques, 2005, vol. 12, p. 131-146. Peut-on l gitimement appliquer la population enti re les r sultats et conclusions obtenus partir d un seul groupe d l ments, d un chantillon? C est une question fondamentale que doit aborder la m thodologie des enqu tes et sondages, la r ponse cette question formant la trame des th ories de l chantillonnage. Au c ur de ces th ories, trois concepts : la repr sentativit , le biais et la pr cision.

3 Imaginons une population quelconque, constitu e d un ensemble de N l ments pouvant chacun tre mesur et not Xi, population dont la moyenne, ou esp rance, est d finie par / N, la taille N pouvant tre infinie : cette quantit peut d noter une grandeur (p. ex. le poids corporel, le revenu annuel, etc.), une r ponse (p. ex. 1 = Oui , 0 = Non ), un attribut (p. ex. sexe, cat gorie d emploi, intention de vote).1 Tirons un chantillon de n l ments de 1 La donn e d'attribut peut tre simple (p. ex. le sexe : 1 = cette population, soit { X1, X2, .., Xn }, o n < N, et calculons = / n partir de ce sous-ensemble. Alors, le biais d chantillonnage B est d fini par : B = E[] X , et la pr cision 2, par : 2 = E[2] (E[])2.)

4 La pr cision, exprim e ici par la variance d erreur de l estimateur , d pend bien s r du plan d chantillonnage, mais son principal facteur est la taille d chantillon n : nous n y reviendrons pas. Le biais, quant lui, d pend Homme , 0 = Femme ) ou multiple (p. ex. la cat gorie d'emploi : Sans emploi , Col blanc , Col bleu , Entrepreneur ind pendant , etc.), tout comme les quantit s Xi et X peuvent tre scalaires ou vectorielles. Notre propos vaut galement pour les deux types de quantit s. Cependant, pour rester simple, nous nous en tiendrons aux scalaires dans la suite du texte. 174 essentiellement du plan d chantillonnage, -d.

5 De la m thode employ e pour mettre sur pied l chantillon. Pour que le biais soit nul, -d. pour que la quantit obtenue par l chantillon soit l gitimement applicable la population, la m thode de mise sur pied de l chantillon doit en garantir la repr sentativit . Le concept de repr sentativit n est pas explicitement mentionn dans plusieurs grands trait s de statistique sur l chantillonnage (Cochran 1963 ; Kish 1965 ; Rossi, Wright et Anderson 1983 ; Thompson 1997) : on se contente plut t de parler d un chantillon ou d un chantillonnage sans biais, confondant ainsi la m thode de s lection des l ments et leur valeur mesur e. Certains auteurs, comme Yates (1981) et S. K. Thompson (1992), identifient " chantillon repr sentatif" " chantillon de repr sentants", les l ments tant choisis et sp cifiquement d sign s, voire mandat s, pour "repr senter" la population.

6 Le concept fran ais d chantillon repr sentatif n a pas cette acception restrictive. Logiquement affili l chantillon au hasard simple (Robert 1988) , pour lequel chaque l ment de la population a une chance gale d tre tir , l chantillon repr sentatif en est un dans lequel les diff rentes sous-populations ou strates de la population-m re ont des chances proportionnelles de se retrouver. La population serait-elle homog ne, -d. form e d l ments tous interchangeables, de menues variations pr s? Dans ce cas, - une utopie dans le monde humain mais un cas possible quand on s int resse des populations du r gne v g tal ou du r gne animal ou des produits manufactur s, par exemple -, n importe quel lot d l ments peut tre dit repr sentatif (puisque tous les lots sont quivalents) et sans biais.

7 Pour une population h t rog ne, d autre part, le probl me se pose avec acuit , et les concepts de biais et de repr sentativit y m ritent alors une discussion nuanc e. Repr sentativit versus biais Si population h t rog ne il y a, c est que la mesure Xi change syst matiquement en fonction de certaines caract ristiques de ses l ments. Si la possibilit nous tait donn e de mesurer d avance toute la population ou une bonne fraction de celle-ci, nous pourrions tablir quelles caract ristiques sont pertinentes en ce qu elles influencent la valeur de la mesure X, ainsi que dresser un plan d chantillonnage afin de les contr ler. Ce plan d chantillonnage d couperait la population selon diff rents niveaux des caract ristiques identifi es et permettrait de reconstituer petite chelle, de taille n, la composition globale de la population, de taille N.

8 Un tel mode d chantillonnage serait, selon nous, la fois repr sentatif et sans biais. H las, de par la nature des choses, nous ne pouvons que rarement mesurer toute une population, et nous ne sommes jamais m me d tablir avec confiance les caract ristiques d mographiques pertinentes pour notre objet d tude. Par contre, nous constatons assez facilement si et jusqu quel point notre mesure X varie d un l ment l autre, -d. si la population vis e peut tre r put e homog ne ou h t rog ne. Si h t rog ne, l chantillonnage au hasard simple, la m thode id ale en principe, devient en effet seulement id ale en ce qu elle se heurte de grandes difficult s d op rationnalisation. Il reste donc l chantillonnage stratifi , une m thode qui consiste d couper la population en sous-populations artificielles, ou strates, selon des crit res ou caract ristiques externes dict s par un plan d chantillonnage : on pense par exemple au sexe, au niveau socio- conomique, au statut civique, etc.

9 Les crit res, ou variables de stratification, appliqu s pour un chantillonnage stratifi ne sont pas obtenus d ordinaire par une tude faite sur l objet d enqu te mais, plut t, le chercheur suppose et argumente qu il existe un lien de corr lation, quel qu il soit, entre la mesure X et ces dits crit res. Pour autant qu un tel lien existe, l chantillonnage stratifi va g n ralement produire des estimateurs plus pr cis que l chantillonnage au hasard simple, tailles d chantillon gales (Cochran 1963 ; Kish, 1965 ; Laurencelle, 2001 ; Thompson 1997 ; Voyer, Valois et R millard 2000). De plus, en structurant la population-m re en il ts ou sous-ensembles bien d finis d l ments, ce type d chantillonnage r duit les risques de d rapage lectif qu encourt l chantillonnage cens au hasard simple et il contribue ainsi mieux contr ler le biais.

10 L chantillon stratifi proportionnel, qui reproduit dans ses l ments la composition connue de la population en fonction des variables de stratification convenues, peut tre dit repr sentatif de la population. Le proc d de stratification, m me si les crit res utilis s sont sans relation aucune avec l objet d tude (la mesure X), ne produit pas de biais ; au contraire, en r gissant la s lection des l ments et en divisant, pour ainsi dire, le risque global en un agglom rat de risques plus cern s, l amplitude d un biais possible s en trouve amoindrie. Enfin, nonobstant la question centrale du biais et celle du lien entre les variables de stratification et l objet d tude, il est souvent important que la population, la population humaine, soit et se sente repr sent e dans une enqu te qui la concerne, et que cette repr sentativit lui soit justifiable en termes de crit res et de correspondances proportionnelles.


Related search queries