jueves, 29 de julio de 2010

Generación de índices

Muy frecuentemente se aplican encuestas que contienen varias preguntas que pretenden indagar sobre un tema del que no es posible preguntar directamente por tratarse de un concepto abstracto o complejo que no todos los cuestionados interpretan necesariamente de la misma forma, o porque ni ellos mismos conocen la respuesta.

La generación de índices es una estrategia utilizada desde hace varios decenios. Lo que pretende un índice es reflejar en una variable numérica un valor que determine la intensidad del concepto indagado. Si se tiene un extenso número de variables iniciales, podrían generarse varios índices, pero siempre será un número mucho menor al conjunto de variables iniciales, y deberá poderse interpretar la dimensión que refleja cada índice. Por ejemplo, a partir de cuestiones como los materiales y número de cuartos de la vivienda, el número de individuos, edades y composición familiar del hogar y la posesión de algunos electrodomésticos o servicios considerados básicos, se puede calcular un número que determine el índice de condiciones de vida, el cual tiene sentido en referencia a un parámetro definido de manera arbitraria.

Hay dos estrategias tradicionales: el análisis de correspondencias múltiples (MCA por sus siglas en inglés) y Análisis de Componentes Principales (PCA por sus siglas en inglés). Ésta última sólo debe ser utilizada si las variables analizadas son de carácter continuo, es decir, no corresponden a escalas categóricas tales como 1.- Muy importante, 2.- importante, 3.- poco importante, 4.- nada importante, no corresponden tampoco a variables nominales, es decir, que no pueden ser sometidas a un ordenamiento, tales como 1.– hombre, 2.- mujer y de manera general, no son de carácter discreto, es decir, no presenta interrupciones o discontinuidades en los valores que pueda tomar.

Hoy en día se están utilizando cada vez más frecuentemente dos estrategias nuevas: la generación de índices a partir de la Teoría de Respuesta al Ítem (IRT por sus siglas en inglés) y el Análisis de Componentes Principales basado en correlaciones policóricas (PCApolychoric) como fue propuesto por Kolenikov y Ángeles en 2004, la cual sí permite utilizar variables nominales, categóricas y discretas en general.

He utilizado esta última técnica en la generación de índices de clima escolar con resultados muy positivos en cuanto a la coherencia de los resultados.

Referencias:

Kolenikov, S. y Angeles, G. The Use of Discrete Data in PCA: Theory, Simulations, and Applications to Socioeconomic Indices. Carolina Population Center. Paper. Octubre 20 de 2004.

No hay comentarios:

Publicar un comentario

Estás invitado a realizar comentarios