Example: confidence

COURS DE STATISTIQUES - iml.univ-mrs.fr

COURS DE STATISTIQUES (24h). Introduction STATISTIQUES descriptives (4 h). Rappels de Probabilit s (4 h). Echantillonnage (4 h). Estimation ponctuelle (6 h). Introduction aux tests (6 h). Qu'est-ce que la statistique ? Les STATISTIQUES (descriptives) sont n es de l'activit de recueil des donn es r pondant aux besoins d'organisation et de gouvernement des grands empires (arm e, imp ts, organisation des richesses). Ex: premiers recensements connus vers 3000 ans avant notre re en Sum rie. Les STATISTIQUES sont aujourd'hui utilis es dans tous les secteurs d'activit : - Industrie : fiabilit , contr le qualit , . - Economie et finance: sondages, enqu te d'opinion, assurance, marketing - Sant , environnement.

Qu’est-ce que la statistique? ¾Les statistiques (descriptives) sont nées de l’activité de recueil des données répondant aux besoins d’organisation et de gouvernement des

Tags:

  Statistique

Information

Domain:

Source:

Link to this page:

Please notify us if you found a problem with this document:

Other abuse

Transcription of COURS DE STATISTIQUES - iml.univ-mrs.fr

1 COURS DE STATISTIQUES (24h). Introduction STATISTIQUES descriptives (4 h). Rappels de Probabilit s (4 h). Echantillonnage (4 h). Estimation ponctuelle (6 h). Introduction aux tests (6 h). Qu'est-ce que la statistique ? Les STATISTIQUES (descriptives) sont n es de l'activit de recueil des donn es r pondant aux besoins d'organisation et de gouvernement des grands empires (arm e, imp ts, organisation des richesses). Ex: premiers recensements connus vers 3000 ans avant notre re en Sum rie. Les STATISTIQUES sont aujourd'hui utilis es dans tous les secteurs d'activit : - Industrie : fiabilit , contr le qualit , . - Economie et finance: sondages, enqu te d'opinion, assurance, marketing - Sant , environnement.

2 - Partout o l'on dispose de donn es ont connu un grand essor avec l'arrivage des ordinateurs performants Qu'est-ce que la statistique ? Vient du latin status = tat . Le terme statisticum appara t . la fin du XVII si cle. statistique = ensemble de m thodes permettant de d crire et d'analyser des observations (ou donn es). Ces observations consistent g n ralement en la mesure d'une ou plusieurs caract ristiques communes sur un ensemble de personnes ou d'objets quivalents. Remarque : une statistique = grandeur calcul e partir des observations recueillies (ex : moyenne d' ge des l ves d'une m me classe, balance commerciale de la France, ). Quelques d finitions de base L'ensemble de personnes ou d'objets quivalents tudi s'appelle la population.

3 Chaque objet d'une population s'appelle un individus ou unit . statistique . Les caract ristique que l'on mesure s'appellent des variables. Les mesures s'appellent des observations. La s rie d'observations recueillies s'appelle s rie statistique . Elle est g n ralement retranscrite dans un tableau de donn es. Rq : La statistique traite des propri t s des population plus que des individus particuliers de ces populations. Quelques d finitions de base Exemple 1 : On s'int resse aux d bits annuels du Nil entre 1871 et 1970. Variable tudi e=d bit annuel ;. population= 100 ann es de 1871 1970. Un individu= 1900 par exemple. S rie statistique (unidimensionnelle): [1] 1120 1160 963 1210 1160 1160 813 1230 1370 1140 995.

4 935 1110 994 1020 960 1180 799 958 1140 1100 1210 1150. [24] 1250 1260 1220 1030 1100 774 840 874 694 940 833. 701 916 692 1020 1050 969 831 726 456 824 702 1120. [47] 1100 832 764 821 768 845 864 862 698 845 744. 796 1040 759 781 865 845 944 984 897 822 1010 771. [70] 676 649 846 812 742 801 1040 860 874 848 890. 744 749 838 1050 918 986 797 923 975 815 1020 906. [93] 901 1170 912 746 919 718 714 740. Quelques d finitions de base Exemple 2 : On s'int resse la f condit en relation avec certains indicateurs socio- conomiques dans 47 provinces francophones suisses vers 1888. La s rie statistique (multidimensionnelles) est donn e dans le tableau de donn es suivant : population 1 individus Fertility Agriculture Education Catholic Courtelary 12 Delemont 9 1 variable Franches-Mnt 5 Moutier 7 Neuveville 15 Porrentruy 7.

5 1 observation Fertility=indice de f condit . Agriculture= % de males agriculteurs Education= % d'individus ayant tudi apr s le primaire Catholic=% de catholiques mortalit infantile Quelques d finitions de base Recensement= Etude de tous les individus d'une population. Difficile en pratique lorsque les populations sont grandes pour des questions de co t et de temps.. Sondage= recueil d'une partie de la population. La partie des individus tudi s s'appelle l' chantillon. Le recueil d'un chantillon partir de la population initiale se fait par des techniques STATISTIQUES , appel es m thodes d' chantillonnage. Quelques d finitions de base Il existe diff rent types de variables 9 Variables quantitatives : caract ristiques num riques (taille, age, ).

6 S'expriment par des nombres r els sur lesquels les op rations arithm tiques de base (somme, moyenne, ) ont un sens. Peuvent tre discr tes (nombre fini ou d nombrable de valeurs : age,..) ou continues (toutes les valeurs r elles sont susceptibles d' tre prises : taille, ). 9 Variables qualitatives : caract ristiques non num riques dans le sens o les op rations de base n'ont pas de sens. Peuvent tre nominales (sexe,..) ou ordinales lorsque l'ensemble des cat gories est muni d'un ordre total (tr s r sistant, assez r sistant, peu r sistant,..). Les diff rents niveaux d'une variable qualitative s'appellent des modalit s (ou cat gories). Quelques d finitions de base INFO. Une variable quantitative peut tre mise sous forme qualitative ordinale en constituant des classes d'appartenance.

7 Exemple : On consid re la population des salari s de France, le salaire mensuel S est une variable quantitative. On peut construire la variable SS qualitative ordinale quatre modalit s (S<6000 : modalit 1 ;. 6000<S<10000 : modalit 2 ; 10000<S<20000 : modalit 3 ;. S>20000 : modalit 4). La cr ation des amplitudes des classes est un probl me d licat, qui n cessite un arbitrage entre information et simplification. Les diff rentes probl matiques de la statistique La statistique descriptive (ou exploratoire). 9 Objectifs : r sumer, synth tiser l'information contenue dans une s rie statistique , mettre en vidence ses propri t s. sugg rer des hypoth ses relatives la population dont est issu l' chantillon.

8 9 Outils utilis s : Tableaux (table des fr quences,..). Graphiques (box-plots, histogrammes,..). indicateurs (moyenne, corr lation,..). 9 M thodes : statistique descriptive classiques (uni et bidimensionnelles). M thodes d'ADD. Les diff rentes probl matiques de la statistique Exemple 1 : Graphiques : S e r ie s N il e 1400. 1400. 1200. 1200. 1000. 1000. ACF. Nile 800. 800. 600. 600. 1880 1900 1920 1940 1960 0 5 10 15 20. T im e Lag Indicateurs : Min. 1st Qu. Median Mean 3rd Qu. Max. Les diff rentes probl matiques de la statistique INFO. La statistique descriptive s'est enrichie ces derni res ann es de nombreuses techniques de visualisation de donn es multidimensionnelles, connues sous le nom d'analyse des donn es, puis de data mining.

9 Parmi ces m thodes on trouve : 9 les m thodes de classification (partitionnement, CAH), visant . r duire la taille de l' chantillon en classant les individus dans des groupes de caract ristiques homog nes. 9 les m thodes d'analyse factorielle (ACP, AFCM, ) qui cherchent . r duire le nombre de caract ristiques d'une population en les r sumant par un petit nombre de composantes synth tiques. Les diff rentes probl matiques de la statistique Inf rence. Op ration par laquelle La statistique inf rentielle (ou d cisionnelle) on passe d'une v rit une autre v rit , jug e telle en fonction de son lien avec la premi re. (Petit Larousse). 9 Sp cificit : La s rie de donn es est consid r comme un chantillon d'une population suppose un mod le probabiliste sur la population.

10 N cessite des m thodes d' chantillonnage. 9 Objectifs : tendre (inf rer) les propri t s constat es sur l' chantillon la population. Valider ou infirmer des hypoth ses sur la population nonc es a priori ou formul es apr s une phase exploratoire. 9 M thodes : Estimation : approcher des param tres de la population partir de l' chantillon. Tests : valider ou d'infirmer des hypoth ses mises sur ces param tres. Mod lisation et de pr vision : recherche d'une relation entre une variable et plusieurs autres, valable pour l'ensemble de la population. Les diff rentes probl matiques de la statistique Ex 2 : Mod lisation par RLM : F A E + + I. Residuals: Min 1Q Median 3Q Max estimations Coefficients: tests Estimate Std.


Related search queries