Example: dental hygienist

APLICACIONES DE LA CHI-CUADRADO - …

Gesti n Aeron utica: Estad stica Te rica Facultad Ciencias Econ micas y Empresariales Departamento de Econom a Aplicada Profesor: Santiago de la Fuente Fern ndez APLICACIONES DE LA CHI-CUADRADO : TABLAS DE CONTINGENCIA. HOMOGENEIDAD. DEPENDENCIA E INDEPENDENCIA. Gesti n Aeron utica: Estad stica Te rica Facultad Ciencias Econ micas y Empresariales Departamento de Econom a Aplicada Profesor: Santiago de la Fuente Fern ndez PRINCIPALES APLICACIONES DE LA CHI CUADRADO. Al analizar en una poblaci n un car cter cualitativo o cuantitativo el estudio resulta muy tedioso por el gran n mero de elementos del que consta la poblaci n. Generalmente, se examina una muestra tomada de la poblaci n, lo que lleva a tener una serie de datos, y ver hasta qu punto la muestra se pude considerar perteneciente a una distribuci n te rica conocida. Siempre existir n desviaciones entre la distribuci n emp rica u observada y la distribuci n te rica. Se plantea la cuesti n de saber si estas desviaciones son debidas al azar o al haber tomado una distribuci n te rica inadecuada.

3 Bajo la hipótesis nula, cada frecuencia observada ij n (i ,1 ,k; j 1, , m) de la tabla de contingencia (k m) hay una frecuencia esperada x ij

Information

Domain:

Source:

Link to this page:

Please notify us if you found a problem with this document:

Other abuse

Transcription of APLICACIONES DE LA CHI-CUADRADO - …

1 Gesti n Aeron utica: Estad stica Te rica Facultad Ciencias Econ micas y Empresariales Departamento de Econom a Aplicada Profesor: Santiago de la Fuente Fern ndez APLICACIONES DE LA CHI-CUADRADO : TABLAS DE CONTINGENCIA. HOMOGENEIDAD. DEPENDENCIA E INDEPENDENCIA. Gesti n Aeron utica: Estad stica Te rica Facultad Ciencias Econ micas y Empresariales Departamento de Econom a Aplicada Profesor: Santiago de la Fuente Fern ndez PRINCIPALES APLICACIONES DE LA CHI CUADRADO. Al analizar en una poblaci n un car cter cualitativo o cuantitativo el estudio resulta muy tedioso por el gran n mero de elementos del que consta la poblaci n. Generalmente, se examina una muestra tomada de la poblaci n, lo que lleva a tener una serie de datos, y ver hasta qu punto la muestra se pude considerar perteneciente a una distribuci n te rica conocida. Siempre existir n desviaciones entre la distribuci n emp rica u observada y la distribuci n te rica. Se plantea la cuesti n de saber si estas desviaciones son debidas al azar o al haber tomado una distribuci n te rica inadecuada.

2 CONTRASTE DE BONDAD DEL AJUSTE. El objetivo del contraste de bondad del ajuste es saber si una muestra procede de una poblaci n te rica con determinada distribuci n de probabilidad. Sea una poblaci n, donde se analiza un car cter X con (x 1, x 2 , , x k ) modalidades excluyentes, denotando por n i es el n mero de elementos que presenta la modalidad k xi (frecuencia observada de xi ), n n i 1. i Por otra parte, sea e i n . p i la frecuencia esperada o te rica de cada modalidad x i Se origina la TABLA DE CONTINGENCIA: X x1 x2 xi xk Frecuencia observada n1 n2 ni nk Frecuencia esperada (e1 ) (e2 ) (ei ) (ek ). La distribuci n te rica representa a Se plantea la hip tesis nula H0 : . la distribuci n emp rica u observada Para un nivel de significaci n (o riesgo) : estad stico estad stico observado observado estad stico te rico estad stico te rico k (n i ei )2 k (n i ei )2 . Se acepta H0 : . i 1. ei 2 , (k 1) Se rechaza H0 : i 1. ei 2 , (k 1).

3 1. k (n i e i )2 k n2i El estad stico . i 1. ei e i 1 i n ( til en el c lculo). OBSERVACIONES DE LA APLICACI N. a) El test de la 2 se puede aplicar en situaciones donde se desea decidir si una serie de datos (observaciones) se ajusta o no a una funci n te rica previamente determinada (Binomial, Poisson, Normal, etc.). b) Es necesario que las frecuencias esperadas de las distintas modalidades no sea inferior a cinco. Si alguna modalidad tiene una frecuencia esperada menor que cinco se agrupan dos o m s modalidades contiguas en una sola hasta conseguir que la frecuencia esperada sea mayor que cinco. c) Los grados de libertad de la 2 dependen del n mero de par metros que se necesitan hallar para obtener las frecuencias esperadas. En este sentido, si se requieren hallar p par metros, los grados de libertad son (k p) si las modalidades son independientes y (k p 1) cuando las modalidades son excluyentes. TABLAS CONTIGENCIA: CONTRASTE DE DEPENDENCIA O INDEPENDENCIA.

4 Cuando se desea comparar dos caracteres (X, Y) en una misma poblaci n que admiten las modalidades: X (x 1, x 2 , , x i, , x k ) Y (y1 , y2, , yj, , ym ) , se toma una muestra de tama o n, representando por n ij el n mero de elementos de la poblaci n que presentan la modalidad x i de X e yj de Y. m X. Y. y1 y2 yj ym n j 1. i . x1 n 11 n 12 n 1j n1m n1 . x2 n 21 n 22 n 2j n 2m n2 .. xi n i1 n i2 n ij n im ni .. xk n k1 n k2 n kj n km nk . k n i 1. j n 1 n 2 n j n m n No existe diferencia entre las Se plantea la hip tesis nula H0 : . distribuciones emp ricas de X e Y. 2. Bajo la hip tesis nula, cada frecuencia observada n ij (i 1, , k ; j 1, , m) de la tabla de contingencia (k x m) hay una frecuencia esperada ( e ij ) que se obtiene mediante la expresi n: ni x n j n i n j e ij p ij . n , donde p ij x n n n Agrupando frecuencias observadas y esperadas en la tabla de contingencia (k x m) : m X. Y. y1 y2 yj ym n j 1. i . n 11 n 12 n 1j n1m x1 n1.

5 ( e11 ) ( e12 ) ( e1j ) ( e1 m ). n 21 n 22 n 2j n 2m x2 n2 . ( e21 ) ( e22 ) ( e2j ) ( e2m ).. n i1 n i2 n ij n im xi ni . ( ei1 ) ( ei2 ) ( eij ) ( eim ).. n k1 n k2 n kj n km xk nk . ( ek1 ) ( ek2 ) ( ekj ) ( ek m ). k n i 1. j n 1 n 2 n j n m n Las condiciones necesarias para aplicar el test de la CHI-CUADRADO exige que al menos el 80% de los valores esperados de las celdas sean mayores que 5. Cuando esto no ocurre hay que agrupar modalidades contiguas en una sola hasta lograr que la nueva frecuencia sea mayor que cinco. En una tabla de contingencia de 2 x 2 ser necesario que todas las celdas verifiquen esta condici n, si bien en la pr ctica suele permitirse que una de ellas tenga frecuencias esperadas ligeramente por debajo de 5. k m (n ij eij )2. El estad stico de contraste observado: . i 1 j 1. eij 2(k 1) . (m 1) que sigue aproximadamente una CHI-CUADRADO con (k 1) x (m 1) grados de libertad. 3. Para un nivel de significaci n se puede contrastar la diferencia significativa entre las dos distribuciones emp ricas o la independencia de las distribuciones emp ricas.

6 CONTRASTE DE HOMOGENEIDAD. estad stico observado estad stico te rico k m (n ij e ij )2 . Se acepta Ho si : . i 1 j 1. e ij 2. , (k 1) . (m 1). estad stico observado estad stico te rico k m (n ij e ij )2 . Se rechaza Ho si : i 1 j 1. e ij 2. , (k 1) . (m 1). CONTRASTE DE INDEPENDENCIA. Hip tesis nula H0 : Las distribuciones emp ricas X e Y son independientes estad stico observado estad stico te rico k m (n ij e ij )2 . Se acepta Ho si : . i 1 j 1. e ij 2. , (k 1) . (m 1). estad stico observado estad stico te rico k m (n ij e ij )2 . Se rechaza Ho si : i 1 j 1. e ij 2. , (k 1) . (m 1). TABLAS CONTIGENCIA 2 x 2 y 2 x 3. Para las tablas de contingencia 2x2 y 2x3 se obtienen f rmulas sencillas de la 2. utilizando nicamente las frecuencias observadas Y. y1 y2. X. x1 n 11 n 12 n1 2. n (n 11 . n 22 n 12 . n 21 )2.. 1. n 1 . n 2 . n 1 . n 2. x2 n 21 n 22 n2 . n 1 n 2 n Se acepta H0 : 12 2 ,1 Se rechaza H0 : 12 2 ,1. 4. Y. y1 y2 y3. X. x1 n 11 n 12 n 13 n1.

7 X2 n 21 n 22 n 23 n2 . n 1 n 2 n 3 n n n211 n212 n213 n n221 n222 n223 . 2. n 2. n 1 n 1 n 2 n 3 n 2 n 1 n 2 n 3 . Se acepta H0 : 22 2 ,2 Se rechaza H0 : 22 2 ,2. Coeficiente de CONTINGENCIA. Es una medida del grado de relaci n o dependencia entre dos caracteres en la tabla de contingencia, se define: 2. C 0 C 1. 2 n Mayor valor de C indica un grado de dependencia mayor entre X e Y. FACTOR de correcci n de YATES. Advi rtase que como la muestra n 40 se hace aconsejable el uso de la CHI-CUADRADO con el factor de correcci n de continuidad de Yates: nij eij nij 0,5. Factor correcci n . nij eij nij 0,5. Para una tabla de contingencia de 2 x 2 la correcci n de Yates: 2. n . n n11 .n22 n12 .n21 . 2 n 12 la correcci n no es v lida cuando n11 .n22 n12 .n21 . n1 .n2 .n 1 .n 2 2. En general, la correcci n de Yates se hace cuando el n mero de grados de libertad es 1. 5. Test G de la raz n de verosimilitud El test de contraste de independencias por la raz n de verosimilitudes (test G) es una prueba de hip tesis de la CHI-CUADRADO que presenta mejores resultados que el de Pearson.

8 Se distribuye asint ticamente con una variable aleatoria 2 con (k 1).(m 1). grados de libertad. k m nij . Se define el estad stico G 2 nij ln . eij . i 1 j 1 . k m nij . Se acepta la hip tesis nula H0 si G 2 nij ln 2 , (k 1) .(m 1). eij . i 1 j 1 . Test de McNemar El test de McNemar se utiliza para decidir si se puede aceptar o no que determinado tratamiento induce un cambio en la respuesta de los elementos sometidos al mismo, y es aplicable a los dise os del tipo antes-despu s en los que cada elemento act a como su propio control. Consisten en n observaciones de una variable aleatoria bidimensional (X, Y). La escala de medici n para X e Y es nominal con dos categor as, tales como positivo o negativo, hembra o macho, presencia o ausencia, que se pueden denominar 0 y 1. Y. X Total . a b a b c d c d Total a c b d n Los casos que muestran cambios entre la primera y segunda respuesta aparecen en las celdillas b y c . Un individuo es clasificado en la celdilla b si cambia de a , en la celdilla a cuando la respuesta es antes y despu s, en la celdilla d cuando la respuesta es antes y despu s.

9 Hip tesis nula H0 : El tratamiento no induce cambios significativos en las respuestas En el test de McNemar para la significaci n de cambios solamente interesa conocer las celdas b y c que presentan cambios. Puesto que b + c es el n mero de individuos que cambiaron, bajo el supuesto de la hip tesis nula, se espera que (b + c) / 2 casos cambien en una direcci n y (b + c) / 2 casos cambien en otra direcci n. 6. Estad stico de contraste si b + c < 20 : 2 McNemar b se acepta H0 si 2 McNemar b 2 /2,1. Estad stico de contraste si b + c 20 : (b c)2 (b c)2. 2. 2. se acepta H0 si 2. 2. 2 /2,1. McNemar b c 1 McNemar 1. b c La aproximaci n muestral a la distribuci n CHI-CUADRADO es m s precisa si se realiza la correcci n de continuidad de Yates (ya que se utiliza una distribuci n continua para aproximar una distribuci n discreta). El estad stico corregido: b c 1 b c 1 . 2 2. 2. 2. se acepta H0 si 2. 2. 2 /2,1. McNemar 1. b c McNemar 1. b c Coeficientes en distribuciones dicot micas Los coeficientes m s utilizados en variables dicot micas son los de correlaci n phi y Q de Yule.

10 Estos coeficientes tienen algunas propiedades comunes de inter s: a) Est n normalizados, las magnitudes no dependen del tama o de la tabla. b) Son muy sensibles a la distribuci n emp rica observada, traduciendo concentraciones de casos en algunas celdas en magnitudes. c) Tienen un recorrido te rico entre [-1, 1] indicando situaciones de asociaci n perfecta y de independencia estad stica. Los coeficientes y Q de Yule se diferencian en la sensibilidad rinconal: a) El coeficiente alcanza su m ximo valor s lo cuando una de las dos diagonales se ha vaciado. b) El coeficiente Q es muy sensible a la existencia de una celda que en t rminos relativos se est vaciando. Su valor m ximo se alcanza cuando en una celda no hay ning n caso, esto es lo que se conoce como sensibilidad rinconal. Y. X Total y1 y2. x1 a b (a + b). x2 c d (c + d). Total (a + c) (b + d) (n). 7. a d bc Coeficiente Phi: 0 1. (a b)(c d)(a c)(b d). a d bc Coeficiente Q de Yule: Q 0 Q 1.


Related search queries