Example: biology

FIABILIDAD Y VALIDEZ

Os psic logos utilizan diversos procedimientos es-tandarizados para obtener muestras de la con-ducta de las personas. Estos recursos,gen ricamente denominados tests, incluyen un procedi-miento de puntuaci n que permite obtener medidas quepueden ser usadas con distintos prop sitos: estimar el ni-vel de la personas en un constructo (ansiedad, calidadde vida, visualizaci n ), evaluar la competen-cia tras un periodo de aprendizaje, clasificar a los pa-cientes en categor as diagn sticas o seleccionar a losaspirantes m s aptos para un puesto de trabajo. La legi-timidad y eficiencia de estas pr cticas depende de sufiabilidad y este cap tulo se describen, de forma conceptual, es-tas dos caracter sticas psicom tricas y los procedimientosm s frecuentes para evaluarlas. De entrada, hay queprevenir al lector de dos frecuentes malentendidos. Elprimero consiste en considerar que la FIABILIDAD y la vali-dez son caracter sticas de los tests.

FIABILIDAD Y VALIDEZ uno de los problemas de las medición psicológica y educa-tiva. El nivel de atención y de motivación de una persona puede …

Information

Domain:

Source:

Link to this page:

Please notify us if you found a problem with this document:

Other abuse

Transcription of FIABILIDAD Y VALIDEZ

1 Os psic logos utilizan diversos procedimientos es-tandarizados para obtener muestras de la con-ducta de las personas. Estos recursos,gen ricamente denominados tests, incluyen un procedi-miento de puntuaci n que permite obtener medidas quepueden ser usadas con distintos prop sitos: estimar el ni-vel de la personas en un constructo (ansiedad, calidadde vida, visualizaci n ), evaluar la competen-cia tras un periodo de aprendizaje, clasificar a los pa-cientes en categor as diagn sticas o seleccionar a losaspirantes m s aptos para un puesto de trabajo. La legi-timidad y eficiencia de estas pr cticas depende de sufiabilidad y este cap tulo se describen, de forma conceptual, es-tas dos caracter sticas psicom tricas y los procedimientosm s frecuentes para evaluarlas. De entrada, hay queprevenir al lector de dos frecuentes malentendidos. Elprimero consiste en considerar que la FIABILIDAD y la vali-dez son caracter sticas de los tests.

2 Por el contrario, co-rresponden a propiedades de las interpretaciones,inferencias o usos espec ficos de las medidas que esostests proporcionan. El segundo se refiere a la considera-ci n de que la FIABILIDAD y la VALIDEZ se poseen o no, enlugar de entenderlas como una cuesti n de grado (AE-RA, APA y NCME, 1999).FIABILIDADLa FIABILIDAD se concibe como la consistencia o estabilidadde las medidas cuando el proceso de medici n se ejemplo, si las lecturas del peso de una cesta de man-zanas var an mucho en sucesivas mediciones efectuadasen las mismas condiciones, se considerar que las medidasson inestables, inconsistentes y poco fiables. La carencia deprecisi n podr a tener consecuencias indeseables en el cos-te de ese producto en una ocasi n determinada. De estaconcepci n se sigue que de la variabilidad de las puntua-ciones obtenidas en repeticiones de la medici n puede ob-tenerse un indicador de la FIABILIDAD , consistencia oprecisi n de las medidas.

3 Si la variabilidad de las medidasdel objeto es grande, se considerar que los valores sonimprecisos y, en consecuencia, poco fiables. De manerasemejante, si una persona contestase a un test repetida-mente en las mismas condiciones, de la variabilidad de laspuntuaciones podr a obtenerse un indicador de su gradode FIABILIDAD . La imposibilidad de lograr que las medidasse lleven a cabo exactamenteen las mismas condiciones esFIABILIDAD Y VALIDEZRELIABILITY ANDVALIDITYG erardo Prieto y Ana R. DelgadoUniversidad de SalamancaEn este cap tulo se describen conceptualmente las propiedades psicom tricas de FIABILIDAD y VALIDEZ y los procedimientos para eva-luarlas. El apartado dedicado a la FIABILIDAD o precisi n de las puntuaciones de las pruebas describe los distintos modelos, procedi-mientos emp ricos e ndices estad sticos para cuantificarla. En cuanto a la VALIDEZ , la propiedad psicom trica m s importante y la queha experimentado mayores transformaciones a lo largo de la historia de la Psicometr a, se resumen las principales concepciones y losdebates en torno a la previene al lector de dos frecuentes malentendidos: en primer lugar, considerar que la FIABILIDAD y la VALIDEZ son caracter sticasde los tests cuando corresponden a propiedades de las interpretaciones, inferencias o usos espec ficos de las medidas que esos testsproporcionan.

4 En segundo lugar, tratar la FIABILIDAD y la VALIDEZ como propiedades que se poseen o no en lugar de entenderlas co-mo una cuesti n de ras clav e: FIABILIDAD , Psicometr a, Tests, psychometric properties of reliability and validity and the procedures used to assess them are conceptually described in this part devoted to the reliability, or test score accuracy, is focused in the models, procedures and statistical indicators most usuallyemployed. As to validity, the most important psychometric property, and the one whose conception has changed the most, wesummarize its history in testing contexts. The reader is prevented that reliability and validity are not, as usually thought, properties of the testing instruments but of the particularinferences made from the scores. Another common error is considering reliability and validity, not as questions of degree, but asabsolute words:Reliability, Psychometrics, Testing, : Gerardo Prieto.

5 Facultad de Psicolog a. Uni-versidad de Salamanca. Avda. De la Merced 109-131, 37005 Sa-lamanca. Espa a. Email: n Monogr fica67 Papeles del Psic logo, 2010. Vol. 31(1), pp. 67-74 Y VALIDEZuno de los problemas de las medici n psicol gica y educa-tiva. El nivel de atenci n y de motivaci n de una personapuede variar al contestar repetidamente a la misma prue-ba, la dificultad de dos tests pretendidamente iguales cons-truidos para medir el mismo constructo puede ser desigual,las muestras de examinadores que califican un examen deselectividad pueden diferir en el grado de severidad, tanto, el esfuerzo de los evaluadores ha de centrarse enestandarizar el procedimiento de medici n para minimizarla influencia de aquellas variables extra as que puedenproducir inconsistencias no deseadas. La estandarizaci ndel procedimiento implica obtener las medidas en todas lasocasiones en condiciones muy semejantes: con el mismotiempo de ejecuci n, las mismas instrucciones, similaresejemplos de pr ctica, tareas de contenido y dificultad equi-valentes, similares criterios de calificaci n de los evaluado-res de ex menes, estudio de la FIABILIDAD parte de la idea de que lapuntuaci n observada en una prueba es un valor con-creto de una variable aleatoria consistente en todas lasposibles puntuaciones que podr an haber sido obteni-das por una persona en repeticiones del proceso demedida en condiciones semejantes (Haertel, 2006).

6 Obviamente, no es posible repetir la medici n un n -mero muy grande de veces a los mismos tanto, la distribuci n de las puntuaciones es hipot -tica y sus propiedades deben ser estimadas indirecta-mente. La media de esa distribuci n, que reflejar a elnivel de una persona en el atributo de inter s, es deno-minada puntuaci n verdaderaen la Teor a Cl sica delos Tests (TCT). La TCT es un conjunto articulado deprocedimientos psicom tricos desarrollados fundamen-talmente en la primera mitad del siglo pasado, que seha utilizado extensivamente para la construcci n, an -lisis y aplicaci n de los tests psicol gicos y la TCT surgi en el contexto de la medici n delas aptitudes humanas, sus propuestas se extienden aotras reas. Se asume que la puntuaci n verdadera deuna persona no cambia entre ocasiones, por lo que lavariabilidad de las puntuaciones observadas se debe ala influencia de un error de medidaaleatorio, no siste-m tico (producido por causas desconocidas e incontro-lables en esa situaci n).

7 La cantidad de error en cadacaso ser a la diferencia entre una puntuaci n observa-da y la puntuaci n verdadera. La desviaci n t pica delos errores, denominadaerror t pico de medida(ETM),indica la precisi n de las puntuaciones de una perso-na, es decir, su variabilidad en torno a la puntuaci nverdadera. El ETM refleja el error que puede esperarseen una puntuaci n observada. Por ejemplo, si el errort pico de medida del peso de un objeto fuese de dosgramos, se puede aventurar que el peso observado di-ferir del peso verdadero en m s de dos gramos solola tercera parte de las veces. Aunque la TCT permiteestimar el ETM para personas situadas en distintos ran-gos de la variable (denominados errores t picos de me-dida condicionales), suele emplearse un nico valoraplicable de forma general a todas las puntuaciones delas personas de una poblaci n.

8 Obviamente, la valora-ci n del ETM depende de la magnitud de los objetosque se est n midiendo: dos gramos es un error despre-ciable si se pesan objetos muy pesados como sacos decereales, pero es un error notable si se pesan objetosm s livianos como los diamantes. Es decir, el valor delETM est en las mismas unidades que los objetos medi-dos y carece de un l mite superior estandarizado quefacilite su valoraci n. Por ello, se ha propuesto un ndi-ce estandarizado de consistencia o precisi n denomi-nado coeficiente de fiabilidadque puede oscilar entre0 y 1. De la TCT se deriva que este coeficiente es el co-ciente entre la varianza de las puntuaciones verdade-ras y la varianza de las puntuaciones observadas enuna poblaci n de personas. En consecuencia, indica laproporci n de la variabilidad de las puntuaciones ob-servadas que nopuede atribuirse al error de medida;por ejemplo, si el coeficiente de FIABILIDAD es de 0,80,se considera que el 20% de la variabilidad observadaes estimar emp ricamente los estad sticos de fiabili-dad (ETM y coeficiente de FIABILIDAD ) se emplean diver-sos dise os de recogida de datos que reflejan distintasrepeticiones del proceso de medida.

9 Los m s conocidosse denominan test-retest (aplicaci n de un test a unamuestra de personas en dos ocasiones entre las que elatributo se mantiene estable), formas paralelas(aplica-ci n a una muestra de personas en la misma ocasi n oen distintas ocasiones de dos versiones del test equiva-lentes en contenido, dificultad, etc), consistencia entre laspartes de una prueba(divisi n del test en dos subconjun-tos equivalentes de tems o estimaci n a partir de las co-varianzas entre los tems de la prueba) y consistencia delas puntuaciones de distintos calificadores (evaluaci nde una muestra de conducta por calificadores indepen-dientes). La estimaci n del coeficiente de FIABILIDAD apartir de estos dise os suele basarse en la correlaci nentre las puntuaciones observadas obtenidas en las dis-tintas formas de replicaci n. Existe una extensa biblio-graf a para obtener una informaci n detallada de estosprocedimientos y de los conceptos y desarrollos de laTCT.

10 Excelentes exposiciones pueden encontrarse en este68 Secci n Monogr ficaGERARDO PRIETO Y ANA R. DELGADO volumen (Mu iz, 2010) y en los textos de Gulliksen(1950), Mart nez-Arias, Hern ndez-Lloreda y Hern n-dez-Lloreda (2006) y Mu iz (1998).Adem s de la TCT, se emplean otros enfoques paracuantificar la FIABILIDAD de las puntuaciones de los tests:la Teor a de la Generalizabilidad (TG) y la Teor a deRespuesta al tem (TRI).La TCT permite cuantificar solamente dos componen-tes de la varianza de las puntuaciones observadas: lavarianza verdadera y la varianza de error. La TG, con-cebida como una extensi n de la TCT, trata de especifi-car la contribuci n a la varianza observada de unn mero mayor de facetas: la variabilidad entre las per-sonas, las ocasiones en que se mide, las diferentes for-mas del instrumento, los diferentes calificadores y lasinteracciones entre los componentes.


Related search queries