Example: bachelor of science

Il linguaggio R concetti introduttivi ed esempi II edizione

Il linguaggioR: concetti introduttivi ed esempiII edizione settembre 2005 Vito M. R. e -R: concetti introduttivi ed esempiiIndiceNote preliminari alla I edizione ..iiNote Preliminari alla II edizione ..iiiIntroduzione11 Nozioni di Le funzioni inR.. Organizzazione del lavoro ..82 Vettori, Matrici, Array e Vettori .. Matrici .. Array .. Liste ..173 Il Importazione di dati .. Valori mancanti .. Codifica di variabili ..244 Sintesi di una Qualche statistica descrittiva .. Le funzionitapply(),apply(),lapply(),sapply ().. Alcune rappresentazioni grafiche ..385 Introduzione all analisi dei Analisi delle componenti principali (ACP) .. I modelli di dipendenza .. Cenni ai Modelli Lineari Generalizzati .. Cenni teorici .. Aspetti pratici .. Ancora sui GLM: il ciclo while ..596 Le simulazioni inR: il ciclo for62 Indice e -R: concetti introduttivi ed esempiiiNote preliminari alla I edizioneUna prima bozza di questo materiale risale alle esercitazioni che ho avuto mododi fare con gli studenti del corso di Statistica Sociale (Laboratorio) del dell Universit`a di Palermo nel 2000, quando frequentavo il tutto `e stato riordinato e sistemato con lo scopo di diffondereR, soprattuttotra gli studenti di Statistica e gli statistici in generale; esso pu`o essere distri-buito gratuitamente, purc

di R. Piuttosto che deflnire R come un software statistico, esso deve esse-re deflnito come un ambiente, ovvero un insieme di macro, librerie, oggetti che possono essere utilizzati per la gestione, l’analisi dei dati e la produzione di graflci; il termine R o ambiente verranno utilizzati indifierentemente. Per

Tags:

  Gestione

Information

Domain:

Source:

Link to this page:

Please notify us if you found a problem with this document:

Other abuse

Transcription of Il linguaggio R concetti introduttivi ed esempi II edizione

1 Il linguaggioR: concetti introduttivi ed esempiII edizione settembre 2005 Vito M. R. e -R: concetti introduttivi ed esempiiIndiceNote preliminari alla I edizione ..iiNote Preliminari alla II edizione ..iiiIntroduzione11 Nozioni di Le funzioni inR.. Organizzazione del lavoro ..82 Vettori, Matrici, Array e Vettori .. Matrici .. Array .. Liste ..173 Il Importazione di dati .. Valori mancanti .. Codifica di variabili ..244 Sintesi di una Qualche statistica descrittiva .. Le funzionitapply(),apply(),lapply(),sapply ().. Alcune rappresentazioni grafiche ..385 Introduzione all analisi dei Analisi delle componenti principali (ACP) .. I modelli di dipendenza .. Cenni ai Modelli Lineari Generalizzati .. Cenni teorici .. Aspetti pratici .. Ancora sui GLM: il ciclo while ..596 Le simulazioni inR: il ciclo for62 Indice e -R: concetti introduttivi ed esempiiiNote preliminari alla I edizioneUna prima bozza di questo materiale risale alle esercitazioni che ho avuto mododi fare con gli studenti del corso di Statistica Sociale (Laboratorio) del dell Universit`a di Palermo nel 2000, quando frequentavo il tutto `e stato riordinato e sistemato con lo scopo di diffondereR, soprattuttotra gli studenti di Statistica e gli statistici in generale; esso pu`o essere distri-buito gratuitamente, purch e nella sua integrit`a: vedi la nota sotto.

2 Comunquechiunque intenda stampare su carta queste dispense e voglia contraccambiare questo lavoro, pu`o farlo semplicemente stampandolo su carta riciclata. La cartabianca che normalmente si usa viene ottenuta abbattendo alberi ed utilizzandocloro per sbiancarla. Se non hai a disposizione carta riciclata, questa `e unabuona occasione per iniziare: utilizzando e promuovendo la sua diffusione tragli amici/colleghi contribuisci a preservare le foreste della Terra. Le generazionifuture , giugno 2002La creazione e distribuzione di copie fedeli di questo manuale `e concessa apatto che la nota di copyright e questo permesso stesso vengano distribuiti conogni copia. Copie modificate di questo manuale possono essere copiate e di-stribuite alle stesse condizioni delle copie fedeli, a patto che il lavoro risultantevenga distribuito con la medesima 2002 Vito e -R: concetti introduttivi ed esempiiiiNote preliminari alla II edizioneI tre anni che sono trascorsi dalla pubblicazione della prima versione di que-ste dispense hanno visto la diffusione di numerosi altri documenti contribuiti,appunti ed eccellenti libri, sia in lingua inglese che italiana, tutti finalizzati al-l utilizzo e alla comprensione diR.

3 Tuttavia l aspettorealmenteintroduttivopare essere stato leggermente tralasciato: per chi si accinge (i cos` -dettibegin-ners) ad imparareR, un riferimento di base facilmente accessibile e reperibilepu`o risultare abbastanza utile; nel fornire nozioni e concetti introduttivi , l in-tento `e che tali dispense possano rappresentare un possibile (e valido) punto dipartenza per la lettura di altri questa idea la prima versione (che pure pare avere avuto una discretadiffusione in Italia) `e stata completamente riscritta per cercare di rendere icontenuti pi`u chiari. Pur mantenendo il carattere introduttivo, qualche nuovoelemento, come i cicliwhileefor, `e stato dovuto ringraziamento va al gruppo di sviluppatori diRche rendo-no possibile tutto questo e a tutti gli utenti dellaRmailing listche con do-mande/risposte e suggerimenti contribuiscono ad accrescere la conoscenza una nota di carattere ambientale: nonostante l evidenza empirica (ar-retramento di ghiacciai, aumento delle temperature) i nostri governi sono an-cora molto lontani dal mostrare un reale interesse e volont`a al mantenimentodel nostro ambiente: l unica cosa che si pu`o fare `e aumentare il peso delle asso-ciazioni ambientaliste ed assumere atteggiamenti eco-compatibili (come uso dicarta riciclata o parsimonioso utilizzo di risorse).

4 Palermo, settembre 2005La creazione e distribuzione di copie fedeli di questo manuale `e concessa apatto che la nota di copyright e questo permesso stesso vengano distribuiti conogni copia. Copie modificate di questo manuale possono essere copiate e di-stribuite alle stesse condizioni delle copie fedeli, a patto che il lavoro risultantevenga distribuito con la medesima 2005 Vito Muggeo e Giancarlo e -R: concetti introduttivi ed esempi1 IntroduzioneQueste dispense hanno lo scopo di illustrare i fondamenti logici ed applicatividiR. Piuttosto che definireRcome un software statistico, esso deve esse-re definito come un ambiente, ovvero un insieme di macro, librerie, oggettiche possono essere utilizzati per la gestione , l analisi dei dati e la produzionedi grafici; il termineRo ambiente verranno utilizzati indifferentemente. Perquesto motivo quando ci si appresta a lavorare la classica domanda `E possi-bile , deve essere sostituita da Quanto `e difficile R`e basato sul linguaggioSa cui `e strettamente legato un altro ambiente commerciale probabilmente pi`u conosciuto, , a differenza diS-Plus, `eunGNU-Sofware, ovvero disponibile gratuitamente sotto i vincoli della GPL(General Public Licence).

5 Nel loro utilizzo base, al quale queste dispense sonorivolte, tali duedialettisono molto simili per cui ci`o che `e di seguito riportatoperRpotrebbe essere utilizzato anche perS-Plus, sebbene le differenze tra i duelinguaggi non siano evidenziate.`E bene ribadire che, proprio perch e si tratta di ambiente, per un determi-nato problema possono esistere (ed in generale esistono) diverse soluzioni, tutteugualmente valide. Conseguentemente i metodi ed i risultati che di seguito so-no riportati, essendo il frutto dell esperienza degli autori, potrebbero essereimplementati in modi differenti, tutti ugualmente validi: la flessibilit`a diR`e lasua principale lavoro `e organizzato sommariamente in due parti. I primi 3 paragrafi evi-denziano i principali elementi che `e necessario conoscere per capire come `e fattoRe come `e stato pensato al fine di iniziare a familiarizzare con l ambiente edacquisire un certo livello di comprensione di ci`o che si sta facendo.

6 La secondaparte `e pi`u a carattere operativo, nel senso che vengono illustrati i procedi-menti utilizzati per impostare un analisi statistica dei dati: indici descrittivi emodellazione. In questo contesto il lettore dovrebbe aver gi`a chiari i concetti di matrice dei dati , tipo di variabili , distribuzioni e modello di regressione .Come il titolo evidenzia, lo scopo del presente lavoro `e semplicemente forni-re nozioni introduttive al linguaggio : dopo una completa lettura, possibilmenteaccompagnata da un parallelo utilizzo diR, il lettore dovrebbe riuscire (al-meno si spera) ad aver chiaro come lavorare conR, e dovrebbe aver acquisitole basi sufficienti per leggere con maggiore semplicit`a i (numerosi) documen-ti relativi ad una discussione pi`u approfondita diR: vedi sullaRhome-page, Si tenga presente, che poich e la trattazione `emantenuta ad un livello base e cerca di raccogliere gli aspetti essenziali opera-tivi diR, alcuni precisazioni tecniche sono state volutamente omesse ed alcunitermini potrebbero risultare non adeguatamente impiegati ad un lettore esper-to che, comunque, potrebbe non trarre alcun vantaggio dalla lettura di e -R.

7 concetti introduttivi ed esempi21 Nozioni di SintassiUna volta cheR`e stato lanciato, tutte le istruzioni sono eseguibili dalla lineadi comando dell ambiente, tipicamente ma non necessariamente, caratterizzatadal prompt>: la linea di comando viene eseguita semplicemente premendo iltastoInviodella tastiera. In ci`o che segue i comandi digitati e i risultatidell operazione vengono riportati inquesto suo utilizzo pi`u semplice,Rpu`o essere utilizzato come calcolatrice:> 3+5* [1] il comando non `e terminato risulta un prompt+; a questo punto `esufficiente continuare a scrivere sulla riga successiva> 2^3 -+ 3[1] 5[1]indica il numero della linea in cui compare il risultato dell operazione. Adesempio eseguendo dalla stessa riga due operazioni distinte, intervallate con;si ha> 3+5*( )+5-(2/6*4); 3+2[1] [1] 5in quanto le due operazioni sono che fare eseguire le operazioni e lasciare che i risultati venganostampati sullo schermo, pu`o essere utile salvarli per poi visualizzarli, modificarlied utilizzarli successivamente.

8 Ci`o che `e richiesto per salvare un qualcosa chepossa essere utilizzato in seguito, in qualsiasi modo, `e costruire unoggetto. Iltermine oggetto, d ora in avanti, verr`a impiegato per indicare qualsiasi cosa inR: espressioni, numeri, formule, insomma TUTTO. Per costruire un oggettoviene utilizzato il comando<-o=(od anche->). Le seguenti linee potrannorendere le idee pi`u chiare:> x<-2+(3-4*5)/2 #costruisci un oggetto> x #..visualizzalo[1] > x-2 #..utilizzalo[1] > x=5 #..sovrascrivilo> > #crea un altro oggetto> #..fai una qualsiasi operazione con gli oggetti[1] e -R: concetti introduttivi ed esempi3Il carattere#`e il simbolo di commento e tutto ci`o che ad esso segue vieneignorato dall ambiente. Nell esempio precedente si `e creato prima un oggettox(assegnandogli il risultato dell espressione2+(3-4*5)/2) che `e stato succes-sivamente sovrascritto (assegnandogli5), poi un altro infine `estata eseguita un operazione.

9 Si noti il segno=che `e del tutto equivalente a<-,mentre il punto.`e un normale carattere inR(non ha nulla a che vedere conle estensioni dei file nel sistema operativo Windows).A differenza quindi dei pi`u comuni software, i risultati di tutte le operazionieseguite possono essere salvati in un oggetto e utilizzate in seguito, semplice-mente assegnando qualcosa ad un nome qualsiasi : questo `e un grande VAN-TAGGIO diR, in quanto diversi oggetti, creati in momenti diversi, sarannosempre disponibili e prontamente richiamabili e utilizzabili. Comunque `e benetenere presente che, nel momento in cui si decide di creare un oggetto, even-tuali oggetti pre-esistenti che possiedono lo stesso nome saranno sovrascritti equindi cancellati: `e necessario quindi fare molta attenzione a non creare oggetticon nomi gi`a usati dall ambiente, perch e sia l utente cheRstesso potrebberoconfondersi!Con la pratica l utente imparer`a a conoscere i nomi che dovrebbero essereevitati, ma fino a quel momento per maggiore sicurezza si potrebbe interrogareRprima dell assegnazione.

10 Per esempio> AError: Object "A" not foundcos` A`e un nome da poter essere usato.`E forse opportuno osservare che> x<-2> XError: Object "X" not foundcio`e l ambiente `ecase-sensitive, ovvero fa distinzione fra lettere minuscole emaiuscole, cos` xeXsono oggetti inRuna lista di parole riservate che non possono essere utilizzatedall utente a proprio piacimento, ma solo per le finalit`a per le quali sono statecostruite; queste sono:FALSE, TRUE, Inf, NA, NaN, NULL, break, else, for, function, if,in, next, repeat, whilePi`u avanti sar`a discusso l utilizzo di alcune di queste parole, per il momento siosservi cosa succede se l utente cerca di utilizzarle per creare dei propri oggetti:> TRUE<-2 Error in TRUE <- 2 : invalid (do_set) left-hand side to assignment> TRUe<-2> TRUe[1] e -R: concetti introduttivi ed esempi4 TRUEnon pu`o essere utilizzata come nome da assegnare ad un oggetto ma perquanto detto sopra, l utilizzo di qualsiasi altro nome diverso (anche soltantoper una sola lettera) `e seguenti linee illustrano l utilizzo dei 6 operatori:==(uguale);>=/<=(maggiore/minore uguale);>/<(maggiore/minore);!


Related search queries