Análisis de las Estimaciones de las Casas Encuestadoras en la Elección Presidencial de 2012 (Parte 3)

Se ha comentado en un post publicado en Colloqui el 2 de mayo del presente año (el cual se puede consultar aquí), que ADNPolítico estuvo recopilando en su sitio de internet, las estimaciones de preferencia bruta y efectiva de las casas encuestadoras para los candidatos a la elección presidencial de 2012 en México (a estas estimaciones se le añadieron las de Indermerc-Harris, las cuales fueron tomadas de los reportes entregados por esa casa encuestadora al IFE).

Figura1.png

Figura 1

Se construyó un gráfico de series de tiempo, en cuyo eje vertical se tienen las estimaciones de preferencia neta reportadas por las casas encuestadoras y, en el eje horizontal, la fecha de terminación del trabajo de campo en el levantamiento de la encuesta. El gráfico se muestra en la Figura 1.

A este gráfico se le añadió también, para cada candidato, una curva de promedios móviles. Cada estimación de la curva de promedios móviles se construyó en cada fecha con las últimas siete estimaciones para un candidato dado (la curva de promedios móviles es la línea más gruesa, y la más delgada es la curva formada por las estimaciones). La curva de promedios móviles nos muestra las tendencias en la preferencia efectiva para cada candidato.

A la derecha de esa figura se muestran, para cada candidato, los resultados del cómputo distrital del IFE.

En estadística se le llama valor atípico [1] (en inglés se le llama outlier) a un valor que es muy distante del resto de los datos o de su patrón de distribución.

Figura2.png

Figura 2

La Figura 2, fue tomada del libro: The Virtual Display of Quantitative Information, de Edward Tufte, Segunda Edición. En esa figura se muestra como el Punto A es un valor atípico (outlier) en el plano bidimensional.

Un valor atípico puede presentarse por errores de medición o estimación, errores de captura, mezcla de estimaciones de dos poblaciones diferentes, presentación de resultados poco probables y, agregaré otra causa: por la manipulación de las estimaciones.

Algunos sinónimos para atípico son: irregular, extraño, raro e infrecuente. Algunos antónimos para atípico son: típico y habitual.

Luego, un valor atípico es un valor que se aparta o es muy diferente del patrón de datos, tiene una conducta singular o rara. Por lo antes establecido, los valores atípicos deben estar en minoría en relación al conjunto restante y mayoritario de los datos.

Lo expresado anteriormente acerca de los valores atípicos –en cuanto a que están en minoría– se cumple cuando las mediciones o estimaciones fueron hechas de manera honesta y, quienes las realizaron, tienen la capacidad técnica adecuada para la obtención de las mismas.

De haber deshonestidad en el cálculo de la mayoría de las estimaciones, se puede presentar el escenario de que los aparentes valores atípicos sean los más cercanos a la realidad, y la mayoría de los valores sean los más alejados de ésta, por haber sido alterados a propósito.

En la Figura 3 –continuación de la Figura 2- se han agregado líneas horizontales de referencia, que pasan por el punto que representa el resultado del cómputo distrital para cada candidato. También se muestran algunos de los aparentes valores atípicos para las estimaciones de Peña Nieto, en las fechas en que ocurrieron éstos.

Se pueden apreciar en esa misma Figura 3 algunas situaciones raras o singulares. Una de ellas es que durante el mes de junio, casi todas las estimaciones para Peña Nieto (salvo la del 27 de mayo de Reforma) fueron mayores al resultado del cómputo distrital del IFE para dicho candidato (sesgos positivos). Incluso la última estimación para Peña Nieto, que corresponde a GEA-ISA, tiene un sesgo a favor de este candidato de 8.69 puntos porcentuales.

La curva de promedios móviles de Peña Nieto, siempre estuvo por encima de la estimación del cómputo distrital para este candidato.

Para López Obrador se tiene la situación contraria. Casi todas las estimaciones, salvo tres, siempre estuvieron por debajo del resultado del cómputo distrital; además, la curva de promedios móviles siempre estuvo por debajo del resultado del cómputo distrital del IFE para este candidato.

Figura3.png

Figura 3

Se puede observar en la Figura 3, como Demotecnia y Reforma tuvieron estimaciones aparentemente atípicas, las cuales se encontraron muy cerca del resultado del cómputo distrital del IFE para Peña Nieto; particularmente las del 27 de marzo (Demotecnia), 13 de mayo (Demotecnia) y 27 de mayo (Reforma).

Demotecnia realizó solamente tres encuestas, y dos de ellas están bastante cercanas al resultado del cómputo distrital para Peña Nieto, lo mismo ocurre con la estimación de Reforma para el 27 de mayo. Lo anterior sugiere que las fluctuaciones mostradas por los otros encuestadores para Peña Nieto eran ficticias.

Figura4.png

Figura 4

En la Figura 4 se ha agregado un rectángulo con líneas punteadas, el cual encierra estimaciones aparentemente atípicas, si se considera el total de las estimaciones. El rectángulo encierra a las estimaciones que están alejadas 2.5 puntos porcentuales o menos del resultado del cómputo distrital para Peña Nieto, que fue 38.21 puntos porcentuales. Las estimaciones aparentemente atípicas de las casas encuestadoras para Peña Nieto fueron las siguientes: 27 marzo, Demotencia 38.9 puntos porcentuales; 13 de mayo, Demotecnia 39; 16 de mayo, Covarrubias 40; 27 de mayo, Reforma 38; 24 de junio, Demotecnia 40.2.

La paradoja de paradojas es que, las estimaciones y el resultado oficial del cómputo distrital del IFE para Peña Nieto, los cuales están encerradas en el rectángulo de líneas punteadas son todos valores atípicos en relación a la mayoría de las estimaciones. Entonces resulta ser que, en particular, el valor oficial del resultado del cómputo distrital de Peña Nieto resulta ser también un valor atípico, ¡cuándo este valor es el que están estimando las mediciones de las casas encuestadoras!

De las cinco estimaciones más cercanas a Peña Nieto, en el lapso de enero a junio de 2012, tres fueron de Demotecnia de María de las Heras (véase la Figura 4), por lo que, como antes se ha comentado, se puede suponer que las estimaciones de Peña Nieto no tuvieron tanta fluctuación, como lo quisieron hacer creer la mayoría de las casas encuestadoras, entre ellas, principalmente, Gea-Isa de Ricardo de la Peña y Jesús Reyes Heroles.

En un programa de televisión donde se discutían las estimaciones de las encuestas, el conductor preguntaba por qué las estimaciones de Reforma, correspondientes al día 27 de mayo de 2012, eran tan diferentes a las de los otros encuestadores, a lo que Roy Campos, de Consulta Mitofsky, respondía que las estimaciones de la mayoría de los encuestadores eran consistentes, por lo cual Reforma debía explicar el porqué de la diferencia o inconsistencia. Se daba por hecho, mañosamente, que si las estimaciones de la mayoría de los encuestadores eran consistentes entonces eran acertadas. En realidad si las estimaciones de la mayoría de los encuestadores son consistentes puede ser que: (1) estén midiendo bien en forma consistente (2) estén midiendo consistentemente mal (3) que estén manipulando de manera consiste sus estimaciones.

Si se comparan las últimas estimaciones de las casas encuestadoras con el resultado del cómputo distrital del IFE, sugiere que la mayoría de los encuestadores estuvieron manipulando consistentemente sus estimaciones.

Esto es, si camina como pato, tiene pico de pato y cola de pato, ¿Qué cree usted que sea?

Un especial agradecimiento a Daniel González Sepúlveda por la revisión de este escrito, así como por sus correcciones y aportaciones al mismo.

[1] Según la Real Academia Española de la Lengua atípico o atípica significa: 1. adj. Que por sus caracteres se aparta de los modelos representativos o de los tipos conocidos.