Example: air traffic controller

FONDAMENTI DI STATISTICA APPLICATA …

FONDAMENTI DI STATISTICA APPLICATA ALL'ANALISI E ALLA GESTIONE DELL'AMBIENTE (edizione settembre 2001) Lamberto SolianiEmail: Fax 0521/905402 PresentazioneCon intensit crescente negli ultimi anni, collegata alla diffusione dell'informatica e all'emergenza deiproblemi ambientali, i tecnici, i ricercatori e i responsabili della gestione ambientale chiedono gli strumentiper una conoscenza operativa delle metodologie statistiche. I corsi di laurea in Biologia, Scienze Naturali eGeologia, quelli di Chimica e di Ingegneria del territorio, dai quali provengono molti degli attuali operatoridell'ambiente, sovente forniscono una preparazione teorica che si dimostra insufficiente, per affrontare iproblemi della professione. Anche agli studenti dei corsi di diploma, di laurea, dei master e dei dottoratifinalizzati alla ricerca ecologica ed ambientale, appare utile una spiegazione semplice dei concettifondamentali e dei metodi pi importanti. Per essi hanno un'importanza relativa le dimostrazionimatematiche sofisticate, mentre necessaria un'illustrazione chiara e semplice dei test pi diffusi, soventespiegati in modo troppo sommario e poco comprensibile nei manuali relativi.

1.2. Il disegno sperimentale ed il campionamento 1.3. Tipi di dati e scale di misurazione 1.3.1 La scala nominale o classificatoria 1.3.2 La scala ordinale o per ranghi

Information

Domain:

Source:

Link to this page:

Please notify us if you found a problem with this document:

Other abuse

Transcription of FONDAMENTI DI STATISTICA APPLICATA …

1 FONDAMENTI DI STATISTICA APPLICATA ALL'ANALISI E ALLA GESTIONE DELL'AMBIENTE (edizione settembre 2001) Lamberto SolianiEmail: Fax 0521/905402 PresentazioneCon intensit crescente negli ultimi anni, collegata alla diffusione dell'informatica e all'emergenza deiproblemi ambientali, i tecnici, i ricercatori e i responsabili della gestione ambientale chiedono gli strumentiper una conoscenza operativa delle metodologie statistiche. I corsi di laurea in Biologia, Scienze Naturali eGeologia, quelli di Chimica e di Ingegneria del territorio, dai quali provengono molti degli attuali operatoridell'ambiente, sovente forniscono una preparazione teorica che si dimostra insufficiente, per affrontare iproblemi della professione. Anche agli studenti dei corsi di diploma, di laurea, dei master e dei dottoratifinalizzati alla ricerca ecologica ed ambientale, appare utile una spiegazione semplice dei concettifondamentali e dei metodi pi importanti. Per essi hanno un'importanza relativa le dimostrazionimatematiche sofisticate, mentre necessaria un'illustrazione chiara e semplice dei test pi diffusi, soventespiegati in modo troppo sommario e poco comprensibile nei manuali relativi.

2 L'autore ha cercato di rispondere a questa domanda cos diversificata, con una presentazione elementare macompleta dei concetti e dei metodi dell'inferenza STATISTICA , con numerose applicazioni. Nei casi pi semplici,sono stati esposti i calcoli manuali; in quelli pi complessi, sono stati forniti gli elementi essenziali, percomprendere i risultati dei programmi informatici pi utilizzati nella ricerca internazionale. La riforma degli ordinamenti didattici, in atto nelle Universit italiane, esige programmi strutturati inmoduli, per una preparazione culturale pi completa da fornire nei corsi di laurea, per un approcciorapidamente operativo nei diplomi. Il manuale, che fornisce argomenti ed esempi per oltre 100 ore dilezione, pu essere scisso con facilit in parti indipendenti, autonome ed ugualmente di semplicecomprensione: i concetti pi importanti sono ripetuti in molti esempi, in modo volutamente ridondante, conestrema attenzione alle applicazioni.

3 Ideato e scritto per la formazione e l'aggiornamento degli operatori dell'ambiente, questo manuale vuoleessere utile sia per la preparazione di base sia per l'approfondimento su molti temi di STATISTICA univarita ebivariata, parametrica e non parametrica di uso corrente. Lamberto Soliani Professore ordinario di " FONDAMENTI di analisi dei sistemi ecologici" e docente di " STATISTICA APPLICATA " (Dipartimento di Scienze Ambientali, Universit di Parma) Viale delle Scienze 43100 ParmaI N D I C E1. ELEMENTI DI STATISTICA DESCRITTIVA PER DISTRIBUZIONI UNIVARIATE La STATISTICA nella ricerca Il disegno sperimentale ed il Tipi di dati e scale di La scala nominale o La scala ordinale o per La scala ad La scala di Classificazione in Rappresentazioni grafiche di distribuzioni Le misure di tendenza Le misure di tendenza centrale o La La Misure di dispersione o variabilit Intervallo di La differenza Lo scarto medio assoluto dalla Lo scarto medio assoluto dalla La La La deviazione L'errore Il coefficiente di La varianza in dati raggruppati: correzione di Indici di forma: simmetria e Metodi per calcolare un generico quantile da una serie di Rappresentazione semi-grafica delle distribuzioni: Box-and-Wisker, diagrammi Esercizi sulle misure di tendenza centrale, dispersione, simmetria e curtosi2.

4 DISTRIBUZIONI E LEGGI DI PROBABILITA' Elementi di calcolo combinatorio Permutazioni Disposizioni Combinazioni Risposte alle domande del paragrafo Definizioni di probabilit : matematica, frequentista, Alcune distribuzioni Distribuzione Distribuzione Distribuzione Distribuzione geometrica e distribuzione di Distribuzione Distribuzione binomiale Distribuzione uniforme o Alcune distribuzioni Distribuzione normale o di Distribuzioni asintoticamente normali, con approssimazioni e Dalla disuguaglianza di Tchebycheff all'uso della distribuzione Approssimazioni e correzioni per la continuit Distribuzione Distribuzione esponenziale Le curve di La distribuzione Distribuzioni campionarie derivate dalla normale ed utili per l'inferenza: di Pearson, t di Student eF di La distribuzione La distribuzione t di La distribuzione F di Fisher 3. CONFRONTI TRA TASSI E PROPORZIONI Confronti tra distribuzioni osservate e distribuzioni te Condizioni di validit del e correzione di Il metodo di Kolmogorov-Smirnov per un Il confronto tra due distribuzioni osservate, per test di indipendenza: le tabelle dicontingenza 2 x 2 (fourfold tables) Confronti tra frequenze relative con la distribuzione normale e sua correzione per la continuit Confronto tra test per tabelle 2 x 2 e test z, senza e con le varie correzioni per la continuit Confronto di una proporzione osservata con una attesa:il test z per grandi campioni; la distribuzione binomiale per piccoli Tabelle di contingenza 2 x 2 in piccoli campioni: il metodo esatto di Le tabelle 2 x N con la formula generale e quella di Brandt-Snedecor.

5 Le tabelle M x Il log-likelihood ratio o metodo Confronto tra una distribuzione osservata ed una attesa con la correzione di Tabelle 2 x 2, con la correzione di Williams e quella di Tabelle M x N con la correzione di Il confronto tra due distribuzioni osservate: il metodo di Kolmogorov-Smirnov per 2 Il chi quadro con il metodo di Cochran e di Esercizi svolti per dati in tabelle di contingenza 4. VERIFICA DELLE IPOTESI Risultati significativi e Procedura di verifica delle ipotesi: vero o falso? utile o dannoso? Potenza di un Numero di dati necessari in rapporto alla potenza, alla significativit del test e alla direzionalit dell'ipotesi. Il criterio di Cohen per la scelta di a e Dimensioni (n) del campione, nel caso di Le quattro propriet che deve avere uno stimatore: correttezza, efficienza, consistenza, Intervallo fiduciale di una Valutazione del rischio aggiuntivo (f) e intervallo fiduciale di una Intervallo di confidenza di una varianza 5.

6 INFERENZA SU UNA O DUE MEDIE CON IL TEST t DI STUDENT La distribuzione t di Confronto tra una media osservata e una media attesa; calcolo dei limiti di confidenza di una media,con Confronto tra una osservazione e la media di un Il confronto tra le medie di due Il test t per 2 campioni dipendenti o per dati appaiati ed intervallo fiduciale della media Il test t per 2 campioni indipendenti o per dati non Test F, test di Levene e test di Bartlett per ipotesi bilaterali e unilaterali sull'uguaglianza di Significativit e intervallo fiduciale di una Potenza a priori e a posteriori del test t, con un campione e con due campioni dipendenti Dimensione del campione e precisione nella stima sia di una media, sia della differenza tra Il bilanciamento di due campioni indipendenti: vantaggi e Potenza a priori e a posteriori del test F per l'omoschedasticit Correzione per campionamento in una popolazione finita e il concetto di Test per la differenza tra due coefficienti di variazione con distribuzione z oppure distribuzione t diStudent 6.

7 METODI NON PARAMETRICI PER UN CAMPIONE Caratteristiche dei test non Il test delle successioni per un Il test dei segni per un Intervallo di confidenza di una probabilit o frequenza relativa, secondo il metodo di Clopper Intervalli di confidenza non parametrici e intervalli di Il test dei segni per ranghi di Caratteristiche distintive dei test sulla bont di adattamento rispetto a quelli su un Il test di Lilliefors e il test di Cram r e Von Mises 7. METODI NON PARAMETRICI PER DUE CAMPIONI Test per 2 campioni dipendenti o per dati Il test di Il test dei Il test dei segni per ranghi: test T di Test di casualizzazione per 2 campioni Test per 2 campioni Il test della mediana o test di Il test di Wilcoxon-Mann-Whitney della somma dei Il test u di Mann-Whitney o dell'ordine robusto dei Cenni del test S di Kendall e rapporti con T ed U; potenza-efficienza dei tre Test di casualizzazione per 2 campioni Il test delle successioni per due campioni o test di Test di Siegel-Tukey per l'uguaglianza della varianza: cenni del test di Freund-Ansari-Bradley edel test di Il test dei ranghi equivalenti di Moses per le differenze nella dispersione o variabilit 8.

8 Analisi della varianza (ANOVA I) a UN criterio di classificazione E CONFRONTI TRA PIU' MEDIE Analisi della varianza ad un criterio di classificazione o a campionamento Confronto tra analisi della varianza con due trattamenti e test t di Student per 2 Test per l'omogeneit della varianza tra pi campioni: test di Hartley, Cochran, Bartlett, I confronti tra pi Confronti a priori o pianificati od Test per confronti multipli o a posteriori: Bonferroni, snk di Neuman-Keuls, lsd di Fisher, step-up diWelsch, hsd di Tukey, Scheff , Dunnett, Stima della dimensione N di k gruppi campionari per l'ANOVA 9. ANALISI DELLA VARIANZA A PIU' CRITERI DI CLASSIFICAZIONE Analisi della varianza a due criteri di classificazione o a blocchi randomizzati, con una solaosservazione per Confronto tra analisi della varianza a due criteri e test t di Student per 2 campioni Analisi della varianza a tre o pi Quadrati latini e Dati mancanti o anomali in disegni a pi Efficienza relativa di due disegni Potenza a priori e a posteriori nell'ANOVA, con grafici di Pearson e Appendice al capitolo: lettura di tabulati dell'analisi della varianza effettuata con un pacchettostatistico 10.

9 ANALISI FATTORIALE, DISEGNI COMPLESSI: TRASFORMAZIONI DEI DATI Analisi fattoriale ed Interazione tra due fattori a pi Rappresentazione grafica per l'interpretazione dell'interazione a due Analisi della varianza a due fattori con repliche Il test T di Tukey per il confronto tra le medie in disegni a due fattori con Esperimenti fattoriali 2 x 2 e 23 con i confronti Esperimenti fattoriali con P fattori a k Quadrati latini con Analisi gerarchica (Nested ANOVA) Assunzioni di validit e trasformazioni dei La scelta della trasformazione idonea: il metodo di Lettura di due tabulati di programmi informatici 11. TEST NON PARAMETRICI PER PIU' CAMPIONI Test non parametrici analoghi all'analisi della Estensione del test della Cenni sul test di Analisi della varianza per ranghi ad un criterio di classificazione: il test di Confronti multipli nell'analisi della varianza per ranghi, con k campioni Test per l'eterogeneit della varianza con k Il test Q di Estensione del test di McNemar a una tabella quadrata N x N: il test di Analisi della varianza per ranghi, a 2 criteri di classificazione: test di Friedman con una e con I confronti multipli tra medie di ranghi nell'analisi della varianza non parametrica, a due criteri diclassificazione 12.

10 REGRESSIONE LINEARE SEMPLICE Regressione o correlazione? Descrizione di distribuzioni Modelli di La regressione lineare Valore predittivo della Significativit dei parametri b e a della retta di Potenza a priori e a posteriori nella regressione Intervallo di confidenza dei parametri b e a . Limiti di confidenza per i valori medi di i Limiti di confidenza per singoli valori di i Errori delle variabili e limiti di Il coefficiente di determinazione: R2 e R2 adj (aggiustato) La predizione Confronto tra due o pi rette di Confronti multipli tra pi coefficienti Analisi della relazione dose-effetto nel caso di Y ripetute: test per la linearit e calcolo della retta Condizioni di validit della regressione, analisi dei residui e trasformazioni 13. CORRELAZIONE E COVARIANZA La Condizioni di validit e significativit di r con r = 0 e con r diverso da Significativit della retta con R2 ? Intervallo di confidenza di Potenza a priori e a posteriori per la significativit di Differenza tra due coefficienti di correlazione in campioni indipendenti e calcolo del Potenza a priori e a posteriori del test per la significativit della differenza tra due coefficienti Test per la differenza tra pi coefficienti di correlazione; coefficiente di correlazione comune rw esua significativit Cenni sui confronti multipli tra pi La correlazione parziale o netta di primo ordine e di ordine superiore; la correlazione Analisi della covarianza (ancova) Lettura di tre tabulati di programmi informatici 14.


Related search queries