martes, 12 de octubre de 2010

Costo de la inversión en Sistemas de Información en el sector educativo colombiano en el periodo 2003 a 2008

La Revolución Educativa llevó a cabo cuantiosas inversiones relacionadas con la contratación de plataformas tecnológicas, desarrollo de sistemas de información para el mejoramiento de la gestión del sector y para la toma de decisiones.

A continuación muestro un acercamiento al costo de esa inversión, si bien tener un dato preciso es difícil por cuanto cada proyecto involucra una cuantiosa cantidad de actividades y sólo el responsable de cada subcomponente es quien podría informar qué porcentaje del costo de cada actividad está directamente relacionado con tecnologías de información y comunicaciones. No obstante las magnitudes mostradas (casi 70,000 millones de pesos - U$38 millones) deben ser del orden real.

millones de pesos
PolíticaProyectos200320042005200620072008
Calidad en educación básica y mediaNuevas tecnologías$3,356$1,877$1,851$1,328$255$-
Calidad en la educación superiorObservatorio Laboral para la Educación$-$-$547$62$1,461$-
Sistema de Calidad de formación para el trabajo y el desarrollo humano$-$-$-$-$80$60
Cobertura en educación superiorAdecuar y flexibilizar la oferta educativa en educación superior$-$-$-$-$1,135$-
Fomentar la permanencia estudiantil$-$-$-$-$516$200
Eficiencia en el sectorFortalecimiento de la gestión de las secretarias de educación$-$-$-$-$1,008$1,509
Fortalecimiento de la Gestión del servicio en el MEN$-$-$-$-$3,344$1,803
Fortalecimiento SNIES$-$-$1,818$100$3,569$-
Modernización de las secretarias de educación departamentales, distritales y municipales$-$-$-$-$7,758$8,666
Modernización MEN$432$395$629$1,146$375$-
Modernización SED certificadas$27$795$1,674$5,336$815$-
Seguimiento y monitoreo del subsector de educación superior$-$-$-$-$1,046$1,218
SINEB$355$110$-$45$55$-
Pertinencia de la educación superiorInnovación educativa con el uso de Nuevas Tecnologías$-$-$-$-$-$10,599
Promoción y seguimiento de la pertinencia$-$-$-$-$592$2,132
Total$4,170$3,177$6,519$7,867$22,009$26,187

jueves, 29 de julio de 2010

Generación de índices

Muy frecuentemente se aplican encuestas que contienen varias preguntas que pretenden indagar sobre un tema del que no es posible preguntar directamente por tratarse de un concepto abstracto o complejo que no todos los cuestionados interpretan necesariamente de la misma forma, o porque ni ellos mismos conocen la respuesta.

La generación de índices es una estrategia utilizada desde hace varios decenios. Lo que pretende un índice es reflejar en una variable numérica un valor que determine la intensidad del concepto indagado. Si se tiene un extenso número de variables iniciales, podrían generarse varios índices, pero siempre será un número mucho menor al conjunto de variables iniciales, y deberá poderse interpretar la dimensión que refleja cada índice. Por ejemplo, a partir de cuestiones como los materiales y número de cuartos de la vivienda, el número de individuos, edades y composición familiar del hogar y la posesión de algunos electrodomésticos o servicios considerados básicos, se puede calcular un número que determine el índice de condiciones de vida, el cual tiene sentido en referencia a un parámetro definido de manera arbitraria.

Hay dos estrategias tradicionales: el análisis de correspondencias múltiples (MCA por sus siglas en inglés) y Análisis de Componentes Principales (PCA por sus siglas en inglés). Ésta última sólo debe ser utilizada si las variables analizadas son de carácter continuo, es decir, no corresponden a escalas categóricas tales como 1.- Muy importante, 2.- importante, 3.- poco importante, 4.- nada importante, no corresponden tampoco a variables nominales, es decir, que no pueden ser sometidas a un ordenamiento, tales como 1.– hombre, 2.- mujer y de manera general, no son de carácter discreto, es decir, no presenta interrupciones o discontinuidades en los valores que pueda tomar.

Hoy en día se están utilizando cada vez más frecuentemente dos estrategias nuevas: la generación de índices a partir de la Teoría de Respuesta al Ítem (IRT por sus siglas en inglés) y el Análisis de Componentes Principales basado en correlaciones policóricas (PCApolychoric) como fue propuesto por Kolenikov y Ángeles en 2004, la cual sí permite utilizar variables nominales, categóricas y discretas en general.

He utilizado esta última técnica en la generación de índices de clima escolar con resultados muy positivos en cuanto a la coherencia de los resultados.

Referencias:

Kolenikov, S. y Angeles, G. The Use of Discrete Data in PCA: Theory, Simulations, and Applications to Socioeconomic Indices. Carolina Population Center. Paper. Octubre 20 de 2004.

Evaluación de impacto

En el contexto de datos, información y conocimiento, iré mencionando algunas disciplinas relacionadas con la transformación de información en conocimiento. He aquí una introducción a la evaluación de impacto de programas sociales:

El interés sobre la evaluación de impacto se ha incrementado a medida qué el monto de los recursos del Estado se incrementan en programas de bienestar social. Recientemente en Colombia salió a la luz la publicación del resultado de la evaluación de impacto del programa Familias en Acción, al cual se le ha dado mucha publicidad en los medios académicos por haber sido contratado por el Estado, el amplio abanico de temas evaluados y la rigurosidad con que fue tratado por parte de las reconocidas empresas y entes investigadores que participaron en el mismo. Así mismo, se ha incrementado el monto invertido por la sociedad civil en temas de responsabilidad social, llevando a que la evaluación de impacto también sea contratada por parte de organizaciones no gubernamentales.

La evaluación de impacto de programas sociales tiene como objetivo determinar los beneficios obtenidos por los participantes en conexión a los objetivos del proyecto respecto a lo que hubiera ocurrido si no hubieran participado en el programa: el denominado hecho contrafactual. Debido a que no es posible tener a un individuo dentro del programa y fuera de él simultáneamente con el objeto de comparar los efectos, se debe buscar población similar con la cual realizar dicha comparación. No obstante esta posibilidad puede traer distorsiones que escondan los beneficios realmente obtenidos.

Un grupo de distorsiones o sesgos comunes son las que pueden presentarse en el conjunto de características observadas en las dos poblaciones, la tratada y la de control, las cuales pueden no ser necesariamente pareables, o ser pareables, pero con diferencias no evidentes. Por ejemplo pueden tener el mismo valor medio, pero no tener una función de distribución semejante.

Pero también pueden presentarse otras distorsiones no evidentes causadas por la existencia de correlaciones entre las características acordadas para la selección de los beneficiarios del programa social y los resultados buscados por el mismo.

No hay garantía de que estas dos fuentes de distorsión no trabajen en direcciones opuestas y en intensidad semejante de tal modo que anulen en conjunto el impacto que se pretende medir.

Por ello, en los últimos dos decenios se ha avanzado en el desarrollo de técnicas que disminuyan dichas distorsiones, las cuales van desde el diseño del método de selección de la población objetivo del programa y la de comparación, pasando por la selección de las variables que se deben preguntar a ambas poblaciones para realizar la evaluación, hasta el diseño de métodos econométricos específicos para el análisis cuantitativo.

La participación activa del evaluador de impacto desde la etapa de planeación del programa social permite darle robustez a los resultados.

Basado en RAVALLION, Martin. The Mistery of Vanishing Benefits: An introduction to Impact Evaluation. The World Bank Economic Review, Vol 15, No. I, 115 - 140.

martes, 11 de mayo de 2010

Detección de duplicados en los nombres

Un problema usual tanto en el sector público como en el privado es la duplicación de registros por causa de errores en la información. Si hay un error en el documento de identidad fácilmente se abre un nuevo registro. En algunos casos sólo se cuenta con los nombres y apellidos como llave de identificación. Los nombres propios de las personas se escriben de diversas maneras y se transcriben de acuerdo a una aproximación a la fonología interpretada por el digitador, aún en casos en que está copiando el nombre. Con los apellidos es más usual que se presenten errores tipográficos por simple duplicación, omisión, transposición, o sustitución de un pequeño número de caracteres.

Es conveniente guardar en campos separados primer nombre, demás nombres, primer apellido y segundo apellido. Para su depuración se debe proceder primero a una corrección de las posibles duplicaciones, omisiones, transposiciones o sustituciones de un pequeño número de caracteres.

Una alternativa para ello es generar una consulta que muestre todos aquellos nombres o apellidos únicos. Por inspección visual se identifican los errores tipográficos más comunes, los cuales se van almacenando en una tabla para nombres y otra para apellidos, cada una con dos campos, el primero contendrá el nombre o apellido mal tipografiado y el segundo la forma correcta. Se podrá utilizar luego en sucesivas ocasiones para ejecutar una rutina automatizada de corrección de todos aquellos nombres o apellidos que tienen tal problema.

La segunda verificación previa es identificar si hay mala ubicación de nombres y apellidos en los campos correspondientes. Los casos comunes son cinco: colocación de sólo primer nombre y primer apellido de manera consecutiva, quedando el primer apellido en el campo del segundo nombre; colocación de los nombres en los campos de apellidos y viceversa; colocación de todo el nombre en un solo campo; colocación del primer y segundo nombre en el campo del primer nombre con el objeto de darle cabida a un tercer nombre en el campo del segundo nombre, en vez de colocar segundo y tercer nombre en el campo de segundo nombre; mala separación de los nombres, por ejemplo: maría del pilar separado en “maría del” y “pilar”.

Y la tercera verificación previa es la adecuada separación de los nombres. Por ejemplo: “delaossa” debería estar escrito como “de la ossa”. La rutina de depuración haría una verificación por separado del sufijo “de la” y del apellido “ossa”.

Una vez se ha realizado tal tipo de depuración es necesario crear otros cuatro campos en dónde se almacenará la transcripción fonética:





  • Eliminar toda la acentuación gráfica (tildes) de las vocales.





  • Eliminar todo carácter ajeno a las letras: ".", "-", "’", " "





  • Sustituir las grafías con igual sonido: "g" por "j", "c" y "z" por "s", "b" por "v", "ll" por "y", "w" por "u", "k" por "q", "m" por "n", o realizar sustituciones directas: "ñ" por "n", "y" por "i".





  • Eliminar la muda “h”.





  • Eliminar las dobles consonantes: "gg" por "g", "ss" por "s", "ll" por "y", "rr" por "r", "dd" por "d", "tt" por "t", "nn" por "n", "pp" por "p".





  • Corregir grafías que vienen de lenguas ajenas al español: "tz" por "x", "tx" por "x", "ph" por "f", "x" por "j", "jh" por "y"





  • Corregir las tres últimas letras de grafías que vienen de lenguas ajenas al español: "tte" por /"t", "sse" por "s", "lle" por /"l", "ck" por "c".




  • Se debe estar atento al orden en que se debe realizar dicho proceso, por ejemplo, se realiza la eliminación de dobles consonantes antes de la conversión de grafías.

    La comparación de nombres y apellidos se realiza respecto a estos campos fonéticos.

    Debido a la influencia de los medios de comunicación, los nombres propios de origen extranjero tienen grafías demasiado variadas: Bregite, Briget, Brigeth, Briggette, Briggite, Briggith, Briggitte, Briggyth, Brigide, Brigit, Brigite, Brigith, Brigithe, Brigitte, Brigyth, Brijida, Brygithe. Por ello para los nombres propios recomiendo realizar una codificación Soundex sobre el nombre fonético.

    Soundex es un algoritmo fonético para indexar nombres por su sonido. Su origen es el inglés, por tanto se debe verificar si es necesario realizar ajustes para su uso en el idioma español, no obstante, si se aplica sobre el nombre fonético, dichos ajustes ya fueron realizados.

    El esquema del Soundex es crear un código de cuatro caracteres. El primero se corresponde con el primer carácter del nombre. Sobre las siguientes letras se desechan las vocales y respecto a las tres primeras consonantes se realiza una trasformación numérica: “B”, “F”, “P” y “V” valen 1, “C”, “G”, “J”, “K”, “Q”, “S”, “X”, “Z” valen 2, “D” y “T” valen 3, la “L” vale 4, la “M” y la “N” valen 5 y la “R” vale 6.

    De este modo, todas las grafías mostradas del nombre Brigit se transforman en V623.

    En bases de datos grandes es posible encontrar muchos homónimos por tanto esta estrategia siempre se debe combinar con la coincidencia de la fecha de nacimiento u otra información disponible.

    Por experiencia, sólo utilizando la estrategia de nombres y sin contar con información que permita verificar de mejor manera la correcta digitación de los nombres, la tasa de éxito es de alrededor del 50%.

    lunes, 12 de abril de 2010

    Directorio de establecimientos. (III)

    El directorio de establecimientos proporciona el universo de establecimientos del sector educativo. Esta entrada es la tercera. La primera se encuentra aquí.

    foto establecimiento educativo de Quetame, Cundinamarca, ColombiaEn el año 2009 de nuevo me encontré con un nuevo directorio. Lo estaba construyendo el Instituto Colombiano para la Evaluación de la Educación, con el compromiso de entregar el resultado al Ministerio de Educación. El problema que estaban resolviendo era la complejidad proveniente de la existencia de varias identificaciones y de que no se poseía un mapa completo de relación entre dichas identificaciones. He aquí las razones de la desorganización:


  • Reorganización: Hacia el año 2002 el Ministerio de Educación inició un proceso de reorganización del sector en la cual las escuelas, es decir, aquellas que sólo ofrecían los grados de preescolar y/o primaria, se unieron administrativamente a establecimientos educativos cercanos que ofrecieran hasta grado once. Esto implicó la necesidad de manejar, además de la identificación de la sede y su jornada, la identificación de la sede principal.

  • Cambio del Identificador tradicional: El DANE ha sido quien tradicionalmente ha asignado un identificador único a las sedes educativas. Inicialmente constaba de 11 dígitos, pero a partir del año 2001 reasignaron identificaciones con una estructura de 12 dígitos. Ambos códigos identificaban a la sede y por tanto eran independientes de la jornada que tuviera la institución.

  • Segundo identificador: Hacia el año 2002 el DANE inició la asignación de un código de institución, correspondiente al código de la sede principal. El código de las demás sedes suele mantenerse como el código que tenía antes de adherirse administrativamente a la sede principal.

  • Proceso de asignación del identificador: Cuando se crea una nueva institución se le asigna un código DANE la primera vez que reporta la información estadística al DANE. En la década del noventa esta asignación se hacía al final del proceso estadístico, ocasionando que se tardara en conocer dicha asignación casi dos años. A partir del momento en que se empezó a manejar el concepto de los directorios de establecimientos por parte de las entidades territoriales, éstas le asignaban un código provisional al establecimiento (tal vez a ejemplo de lo que inicié en el año 2000). No había un mapa que proporcionara historia del enlace entre el código provisional, que podía aparecer en bases de datos diferentes a la del DANE y el código definitivo. Si una institución nueva no presentaba información estadística, de todos modos le proveían un código provisional. Los códigos definitivos empiezan por un número entre uno y cuatro, los provisionales por un número entre 5 y 9.

  • Tercera identificación: El ICFES, desde sus inicios, asignaba una identificación única a las jornadas educativas que presentaban alumnos de grado 11 para los Exámenes de Estado. Esta asignación se realizaba de manera independiente al DANE y el MEN. La identificación, aún hoy, es única a nivel de institución – jornada. La información de las sedes sólo la recolectan para efectos de organizar la logística de aplicación de las pruebas.

  • Cuarta identificación: Con la realización de las pruebas SABER a estudiantes de quinto y noveno grado se abrió una nueva fuente de asignación de códigos a las instituciones por parte del ICFES. Asignaba una identificación a cada institución – jornada de manera independiente a la que realizaba para los Exámenes de Estado. De hecho, la identificación dada en el año 2002 difiere de la del 2005. La primera asignó un número de cinco dígitos a cada institución. En el año 2005 asignó un consecutivo generado a partir de un directorio maestro proporcionado por el sistema de información del Ministerio de Educación.

  • Quinta identificación: El Ministerio de Educación asignó un número interno a cada establecimiento – sede –jornada con el objeto de permitir hacer seguimiento histórico a la variación del código DANE en el tiempo.


  • El ICFES es una entidad muy autónoma y sólo hasta inicios de la segunda década, y con base en la organización de los sistemas de información del sector educativo, inició el esfuerzo de construir una base que relacionase los códigos asignados por el propio ICFES con los códigos del DANE que es el que usan el resto de entidades asociadas al sector.

    La conclusión de la historia contada es que un tema tan sencillo es muy complejo y que en la implementación de los sistemas de información damos por sentado el elemento social de los sistemas sin prestar la suficiente atención al mismo.

    lunes, 8 de febrero de 2010

    Hospitalidad

    A continuación hago un resumen del quinto concepto que Claudio Ciborra expone en su libro "Los laberintos de la información: desafiando la sabiduría de los sistemas"

    Xenia.

    La hospitalidad es una tradición milenaria de múltiples culturas. Es un atajo para mezclar pueblos o integrar extranjeros a nuestra cultura. La noción de hospitalidad ofrece la oportunidad de explorar nuevas maneras de diseñar, desarrollar e implementar sistemas en las organizaciones.

    En esta práctica se hospeda en la propia casa a una persona extraña. Se le provee de toda la información necesaria para que conozca las costumbres y horarios de la casa y se sienta cómodo. Se le provee de una habitación con una cama confortable y de alimentación. Pero simultáneamente a toda esta amabilidad se toman medidas de precaución. No se sabe si este extranjero aprovechará el silencio y quietud de la noche para acercarse a nuestro lecho y robarnos pertenencias. En caso de cualquier desavenencia, tenemos el derecho de solicitarle que abandone nuestro hogar inmediatamente.

    La misma actitud debemos tomar al invitar a nuestra cultura organizacional una innovación. No se debe pensar en términos de planeación, procedimientos, técnicas de medición que lleven a pensar en la tecnología como en una herramienta domesticada y bajo control. La experiencia nos muestra una serie de patologías que desmienten esta perspectiva: excesivo idealismo, olvido de detalles importantes en medio de las prisas por cumplir con las fechas, adopción de proyectos y métodos sin adaptación a la propia cultura, narcisismo por parte de líderes que impulsan proyectos que se supone son rigurosamente científicos, sesgo tecnocrático que destierra cualquier tipo de creatividad y toque personalizado, eliminación del riesgo y la complejidad inherente a la realidad por medio de simplificaciones de ésta y/o ideológismo por parte de predicadores de métodos y procedimientos que ignoran la cultura organizacional.

    Lo cierto es que los actores involucrados en el proyecto, sus historias, perspectivas y expectativas son las que le dan razón y momentum.

    Debemos de proveer de todas las facilidades para que se logre una interfaz con los sistemas en uso. Se le debe proporcionar toda la información necesaria a los ingenieros de implantación, no solo acerca de las fuentes de datos, sino de nuestros usos y costumbres. Esperamos que esta nueva plataforma nos muestre sus bondades con el objeto de avanzar en nuestra propia cultura, pero también se toman medidas de precaución para el caso en que el sistema altere de manera no tolerable la cultura institucional. El directorio de la empresa no debe casarse en ningún caso con la nueva plataforma de tal manera que sea una opción factible deshacer los pasos y expulsarla de la organización.

    domingo, 17 de enero de 2010

    Sensibilización previa en proyectos OLPC

    Previo al proceso de implementación de un proyecto OLPC existe la necesidad de realizar una campaña de sensibilización:

  • Hace referencia a niños y familiares.

  • Debe ser previa a la entrega de los computadores.

  • Debe contemplar aplicaciones peligrosas, virus y páginas malignas o potencialmente malignas.

  • Esta sensibilización debe contemplar los cuidados al computador. Así mismo es importante vender adecuadamente la capacidad del equipo para resistir un trato infantil, pero sin que se interprete que son irrompibles.

  • Debe concienciar la responsabilidad de los padres en el uso de los equipos para que no sean utilizados por parte de hermanos mayores o los propios padres para el acceso a páginas impropias para menores.