Transcription of Introduction au logiciel STATA - Paris School of Economics
1 Introduction au logiciel STATAA ntoineBozio 28 janvier 2005 Table des mati`eres1 Les premiers Les diff erentes fen etres .. Comment lire des donn ees .. La commandeuse.. La commandeinsheet.. La commandeinfile.. Le logiciel Stat Transfert .. Le probl`eme de m emoire insuffisante .. Comment sauvegarder donn ees et travail .. Le do file .. Sauver les donn ees .. Chercher de l aide .. Dans les manuels .. Dans STATA .. Sur Internet .. D ecrire les donn ees .. Regarder les donn ees brutes .. La commandelist.. La commandedescribe.. La commandesummarize.. La commandetabulate.
2 Les commandescorrelateetcovariance..72 Travailler sur les donn R eorganiser les donn ees .. La commanderename.. Les commandesrecodeetreplace.. Les commandeskeepetdrop.. Les commandessortetby.. Comprendre les formats wide et long .. Combiner diff erentes bases de donn ees :appendetmerge.. La dangereuse commandecollapse.. Cr eer de nouvelles variables .. Les commandesgenerate,egenetreplace.. Comment cr eer des variables avec retard .. Passer de variables textes `a des variables num eriques .. Combiner ou r eduire des variables ..13 AntoineBozio, Ecole Normale Sup erieure - EHESS - Campus Paris Jourdan, 48 boulevard Jourdan, 75014 Paris , R ealiser des graphiques.
3 Les estimations MCO .. La commanderegress.. Les poids .. Comment cr eer des variables muettes .. Pr ediction .. Extraire les r esultats .. Les tests d hypoth`eses .. Les autres types d estimation .. Estimation lin eaire contrainte .. Estimation par variable instrumentale .. Les autres estimations ..153 La Comment programmer .. Macros .. R ealiser une boucle .. La commandeforouforeachetforvalues.. La commandewhileet comment cr eer un incr ement .. Programmer en ramification (branching) .. R ealiser des simulations Monte Carlo ..182Ce polycopi e vise `a aider les etudiants `a se lancer `a l assaut de l econom etrie appliqu ee ense familiarisant avec le logiciel le plus complet et le plus facile d acc`es, c est-`a-dire ya bien s ur d autres logiciels econom etriques (SAS est l un des plus r epandus au sein des grossesinstitutions qui utilisent l outil econom etrique ; E-views est simple mais parfois aussi limit e ; lesautres sont inconnus de l auteur de cette note) mais STATA est le plus r epandu dans les universit esam ericaines et de fa con croissante en Europe.
4 Il ne s agit nullement de viser `a l exhaustivit e dela pr esentation de ce logiciel (il existe des manuels de r ef erence en cinq tomes pour cela) maissimplement d aider `a la pratique rapide de l econom etrie appliqu l auteur accueille volontiers les commentaires, conseils et corrections que les lecteursvoudront bien lui Les premiers Les diff erentes fen etresA la figure 1, on a reproduit un ecran type de STATA . Quatre fen etres sont rep erables L ecran de StataFen etre r esultatEn haut `a droite sur fond noir, la fen etre d ecrit les r esultats des commandes,des r etre de commandeEn bas `a droite, la fen etre commande permet de taper ici des com-mandes qui peuvent etre ex ecut ees par la touche Entr ee.
5 On n utilise cette fen etre quepour essayer de fa con interactive des commandes mais pas pour r ediger un auteur reconna t que son parti pris reste subjectif et tout en pr ecisant qu il n a aucune relation financi`ere avecla soci et e distributrice de STATA , souligne trois avantages majeurs : STATA est simple car il est possible d apprendredes commandes de fa con interactive ; avec l augmentation de la m emoire vive des ordinateurs, l avantage originelde SAS de pouvoir g erer d enormes bases de donn ees dispara t puisque STATA peut aussi le faire maintenant ; enfinStata est rapide puisqu il utilise les donn ees directement en m etre de variablesEn bas `a gauche la fen etre de variables liste les variables avec les labels de celles-ci quand elles existent.
6 Il suffit de cliquer sur l une d elles pour qu elle soit saisiepar la fen etre etre de commandes pass eesEn haut `a gauche la fen etre des commandes pass ees r ecapituleles commandes d ej`a utilis ees et il suffit de cliquer sur l une d elle pour la rappeler dans lafen etre barre d outil de STATA permet facilement de g erer les actions de base. De gauche `a droite :ouvrir un fichier de donn ee STATA , sauvegarder un fichier de donn ee ( equivalent `a la commandesave), imprimer les r esultats tels qu ils apparaissent dans la fen etre de r esultats, commencer unlog qui est une proc edure qui stocke dans un fichier.
7 Log les commandes suivis des r esultats, unbouton pour faire appara tre la fen etre r esultat lorsqu elle n est pas pr esente, un bouton avec uneenveloppe qui permet de cr eer un do file (on revient l`a-dessus plus bas), deux editeurs des tableauxde donn ees et finalement un bouton pour stopper la commande en cours (si elle est longue et quevous vous etes aper cu d une erreur dans votre programme par exemple). La barre d outil de Comment lire des donn La commandeuseSi vous disposez des donn ees sous format STATA (qui finissent ) alors la commande usevous permet simplement de lire les donn ees.
8 Il y a deux fa cons de proc eder, selon que l on souhaitetravailler dans un dossier seul ou juste faire appel au fichier de donn ees :.use "C :\Econometrie\TDmaitrise\ "ou bien. cd "C :\Econometrie\TDmaitrise". use ee2002Il faut parfois rajouter l optionclear2afin d effacer le fichier de donn ees d ej`a utilis e par le use ee2002, La commandeinsheetSi vos donn ees sont sous la forme d un fichier CSV (comma separated values, ou finissant ) alors il faut utiliser la insheet using "C :\Econometrie\TDmaitrise\ "Les seules consignes `a respecter avec cette commande sont la pr eparation du fichier de donn eesen indiquant sur la premi`ere ligne le nom des variables qui sont dispos ees en colonne.
9 Il ne fautpas laisser de noms de variables sous format num erique et de pr ef erence transformer les dates (envariables) avec un underscore : 2004 en2004. V erifier qu il n y a pas de virgule dans les donn eespour ne pas troubler la reconnaissance des options sont situ ees apr`es les commandes et apr`es une La commandeinfileSi vous avez des donn ees sous format ASCII, format , alors il suffit d utiliserla commandeinfileavec un inconv enient : il faut pr eciser `a la main le nom des infile age edu salaire using "C :\Econometrie\TDmaitrise\ " Le logiciel Stat TransfertEnfin si vous avez acc`es au logiciel Stat Transfert, vous pouvez facilement convertir n importequel format de donn ees (SAS, Excel, SPSS, ASCI, Gauss, ) en format de STATA et inver-sement.
10 Il faut pourtant toujours v erifier que le transfert n a pas alt er e les donn ees et a bien prisen compte toutes les Le probl`eme de m emoire insuffisanteSi vous n avez pas assez de m emoire vive disponible pour STATA (le message d erreur est :noroom for more observations) alors il faut utiliser la commandeset memory XXmpour pr eciserle nombre de m egabytes3que vous souhaitez allouer `a Comment sauvegarder donn ees et Le do fileLa bonne fa con de travailler sous STATA est d utiliser un fichier .do (un do file) comme fichierde travail. On ecrit ainsi un programme que l on peut sauvegarder et r eutiliser la fois utilisation de la fen etre commande est plus pour tester rapidement des variantes ou pour s exercerau d ebut avec les commandes.