Primer Análisis de las Elecciones en México 2012

 

En la medida que los datos de la elección se hacen accesibles a los interesados, los estudios empiezan a aparecer. Este es un breve resumen informativo de estos primeros esfuerzos.

Correlación de Pearson

Los datos acumulados de los partidos fueron estudiados cada hora hasta un máximo de seis horas (con 55 actualizaciones del PREP). Usando la función PEARSON de Excel y seleccionando columnas de PAN y PRI, PRI y PRD, y PAN y PRD se calculó la función de correlación Pearson dando en todos los casos un resultado de 1.000. Este resultado se mantuvo estable desde la actualización 14 hasta la 55 que fue la última en ser revisada. La tabla 1 presenta resultados típicos:

Tabla 1.



Significado


La correlación de Pearson mide la existencia de relaciones entre variables. Cuando dos variables son independientes (por ejemplo, el precio de las tortillas y la edad del que las compra) la r de Pearson tiene un valor cercano al cero, cuando hay relación entre variables (como el precio de las tortilla y el del maíz) se tendrá r ~ 1.0. El caso de r = 1.000 es prácticamente improbable en muestreos de números que aparecen de manera natural en mediciones, y muestra de ello es que se han diseñado pruebas (por ejemplo, reemplazo transpuesto, prueba t, etc.) para medir la efectividad de la r de Pearson para casos de valores altos, pero nunca exactos para r = 1.000, donde los métodos no funcionan.

Limitantes

La correlación de Pearson crece para valores acumulados, como en el caso del PREP, sin embargo este crecimiento no implica que se llegue al caso de r = 1.000 de manera automática. En el caso de la elección presidencial mexicana del 2006 el r = 1.000 se mantuvo por casi 36 horas pero al final su valor se reduce al orden de 0.97. Asimismo, como lo ejemplifica la figura 1, que calcula los coeficientes de Pearson para 9 datos del PREP (izquierda) y para 8 datos obtenidos de la misma tabla del PREP pero con ruido aleatorio que mantiene las mismas cantidades iniciales y finales; es claro que el efecto del ruido es el de destruir la correlación perfecta.



Figura 1. Pearson obtenido con datos del PREP (izquierda) y con datos al azar de la misma tabla (derecha).

Este ejercicio es parecido al de Javier Aparicio quien crea una tabla y demuestra que el r de Pearson crece a valores cercanos al perfecto. Y la sugerencia en ese caso es de seguir intentándolo cientos o miles de veces hasta que el valor llegue a, digamos, 0.999 y se mantenga con tablas desde 15 a 55 datos.

Implicaciones políticas

La importancia de este estudio es el de servir como un indicador de que más análisis es necesario. No es posible probar fraude con tan sólo este estudio. Investigaciones por venir deberán usar Pearson con ventana movible (para minimizar el efecto de la acumulación de datos), así como otros tipos de correlaciones.

Comportamiento espejo

Otro estudio reportado en http://www.blogdeizquierda.com/2012/07/reportan-grafica-espejo-entre-jvm-y.html muestra un comportamiento simétrico entre los porcentajes obtenidos por el PRD y PAN. Tal comportamiento se muestra en la figura siguiente:



Aunque el reporte indica que una gráfica espejo es estadísticamente imposible en una elección pues los votos forzosamente arrojan números aleatorios sin relación de uno con otro, se sabe que al ser presentados en porcentajes, los números tienen a mostrar un efecto de compensación. Aún así el hecho de que esa compensación aparezca principalmente entre dos partidos debe ser tomada como una indicación de que más estudios son necesarios.

Cabe recordar que en 2006 también se dio una gráfica espejo entre los resultados de Andrés Manuel López Obrador y Felipe Calderón, lo cual fue tachado por expertos como atípico en el mejor de los casos.

Ordenamiento del PREP

Luis Mochán hace una comparación entre los resultados de cada partido de acuerdo al tiempo de registro (tiempo PREP) y los compara con los mismos resultados de acuerdo al tiempo de captura (tiempo Distrito).  La figura siguiente muestra los resultados de acuerdo a ambos tiempos (izquierda: registro, y derecha: captura).



Observaciones interesantes son que:

  1. Las gráficas son distintas y no hay razón para que lo sean
  2. La de la izquierda (que corresponde a datos del PREP) no muestra el cruce en el que AMLO sobrepasa a EPN durante algunas miles de casillas, y
  3. Asimismo, aunque un poco aminorado, se percibe u comportamiento simétrico entre algunas subidas y bajadas del AMLO y JVM.

Inconsistencias aritméticas

En otro análisis, Mochán presenta datos de casillas con inconsistencias numéricas. Los datos faltantes son:

  • PRI_PVEM en 2612 regs.
  • PRD_PT_MC 2902
  • PRD_PT 4955
  • PRD_MC 7286
  • PT_MC 888
  • NO_REGS 14553
  • NULOS 1563

De 45,229 actas, a AMLO le quitaron alguna contribución en 3377, y le quitaron todas sus contribuciones en 13.  Asimismo faltan datos del PAN en 238 regs., PRI 366, PRD 559, PVEM 2721, PT 2,584, MC 3065, PANAL 898.

Y hasta aquí este reporte, gracias a los participantes y por favor sigan enviando material y críticas que todo es bien recibido.