Desigualdad y Crecimiento en el cono sur

Nota: Las gráficas de este artículo se pueden explorar interactivamente y para muchos otros países en este link. El código fuente y los datos están disponibles aqui

Este artículo tiene dos partes, una de comentario sobre las gráficas, y otra de discusión técnica sobre la visualización.

Comentarios:
Hace poco mostré una gráfica sobre la evolución de la economía de Argentina y la desigualdad social. Esta gráfica reproducía una equivalente de Alberto Cairo para Brasil, donde se podía ver que a partir de los gobiernos de Lula (en principio mas de izquierdas) el país crecía y la desigualdad bajaba. La misma tendencia se ve en el gráfico de Argentina a partir de los gobiernos de Kirchner y Fernandez, y quizás desde el interino de Duhalde. Desde el principio de este ejercicio me llamó la atención que ambas tendencias comienzan las dos en 2002, y quería observar la misma gráfica para los países de la zona:

Desigualdad y crecimiento en el cono sur

En esta gráfica he quitado importancia (al sacar contraste de color) a los períodos presidenciales para centrarnos en las tendencias de las curvas. Como cada país tiene un tamaño muy diferente, ponerlos todos en el mismo gráfico no ayuda a ver la tendencia. Probamos entonces una gráfica separada para cada país (Ahora si con mucho color :) :

Pequeños multiples

Creo que se aprecia relativamente bien que si, todos los países del cono sur latinoamericano han mejorado económica y socialmente a partir de 2002. Sin entrar en discusiones de las causas de la tendencia (que requeriría un estudio estadístico riguroso y con una buena base teórica), hay muchos detalles interesantes a comentar:

  • Chile es el único país que ha mantenido una tendencia clara y constante durante todo el período observado, aunque su coeficiente de Gini resulta mas alto que el de Uruguay o Argentina (sin embargo la comparación entre Ginis de diferentes países puede ser muy engañosa, lo mejor es comparar cuando la metodología es la misma).
  • Paraguay, Argentina, y Brasil han sufrido los vaivenes mas importantes a fines de los 90.
  • Bolivia y Paraguay son notablemente mas chicos que los otros países, pero si van a esta página interactiva pueden verificar que toda latinoamérica es muy pequeña y mas desigual que la mayoría de los países desarrollados.

Siento que estas gráficas no son todavía la mejor manera de resaltar la tendencia. Para esto, pensé en una segunda en la cual pintar con un color la dirección del cambio entre un año y el siguiente. Las cuatro direcciones posibles están dadas por si crece o baja tanto el Gini como el PBI. La idea de esta nueva gráfica es que si un grupo de países cambian en la misma dirección se ve como un bloque de color sólido. Este es el resultado:

Grafico de direccion

Estoy conforme con esta nueva gráfica, la tendencia conjunta después de 2002 es bien evidente como una mancha naranja, excepto por la crisis financiera del 2009. Me queda la duda de si no se podría ver o representar al mismo tiempo la magnitud del cambio (no solo la dirección). En algunos casos podría ser importante (por ejemplo Chile tiene algunos años malos entre el 98 y el 2000, pero no tienen nada que ver con las crisis de Argentina del 2001. En esta gráfica se ven iguales, lo cual es malo. Mala gráfica, mala.
Para una tercera y última parte, exploraremos opciones visuales para incluír esta información asi como los períodos presidenciales. No hay promesas de fechas (este post lo prometí en un par de semanas y tardé casi tres meses…)

Como antes, la fuente de datos es el Banco Mundial (esta tabla y esta tabla), y los períodos presidenciales están sacados de aquí.

Discusión técnica:

Tener muchos países juntos hace muy complejo distinguir los períodos presidenciales por color–que es en mi opinión lo que distingue la gráfica original de Alberto Cairo de un simple scatter plot conectado (tal vez lo podemos llamar un Cairo chart?) En este caso bajé la cacofonía de colores a proposito para distinguir solo la dirección de las curvas, pero tal vez podría haber distinguido el período pre-post 2002? Tampoco estaría mal ver si se puede pintar usando una única variable (gobierno de derecha o de izquierda), pero habría que catalogar todos los gobiernos de la base de datos que recolecté (para ayudar ir este repositorio).

La ubicación de las etiquetas en el interactivo es una pesadilla. Literalmente, he soñado con ella. Las gráficas de este post han sido fuertemente estilizadas con Illustrator, pero automáticamente no es nada fácil ubicar etiquetas sin que pisen algo interesante abajo o entre ellas.
Para ayudar, podría hacer que se resaltaran los períodos presidenciales cuando se les pasa por encima, no solo que aparezca la etiqueta.

Las escalas son toda una discusión aparte. Dejé algunas opciones en el interactivo, con los valores por defecto como a mi me gusta ver el gráfico. Pero es cierto que ayuda ver las curvas todas juntas, o al menos todas en la misma escala. Pero a mi lo que me gusta es ver el detalle de cada país, y si se usa una escala única es casi imposible.

La única escala que dejo de lado (porque no me queda sitio en la página para mas opciones) es una isométrica donde el eje x cambie porcentualmete lo mismo que el eje y. Lo mas parecido a esto es la combinación de ver las curvas en un gráfico único, y tomar un año de referencia para ver porcentajes. De pura casualidad, el eje x varía casi un 75%, y el eje y un 60%. Casi.

La lista de presidentes que saqué de internet no es lo que uno cree para algunos países como Alemania, donde el presidente es la cabeza del estado y el canciller o primer ministro es la cabeza del gobierno (el que tiene el verdadero poder, digamos). Me haría falta ayuda para agregar esta información, una vez puesta debería funcionar el gráfico solo (si es que los datos del Banco Mundial están disponibles)

Por último, la gráfica de direcciones: He probado pequeñas líneas bajo los cuadrados para marcar los presidentes, un gradiente de color para marcar intensidad del cambio, y pequeñas flechitas para marcar dirección (en vez de un bloque sólido). Ninguna me satisface mucho, pero me parece que vale la pena seguir probando. ¿Ideas?

Desigualdad y crecimiento económico en Argentina

Antes que nada: No soy pro-Kirchner ni pro-Macri, y honestamente si hoy tuviera que votar en Argentina no se a quién votaría. Esto no es un comentario político real, a mi lo que me gusta es la visualización de datos.

Hace poco leí en profundidad el libro de Alberto Cairo El Arte Funcional, y me atrajo una infográfica muy buena acerca de la evolución de la economía y la desigualdad en Brasil, y me dió curiosidad saber como serían esa gráfica para Argentina. Después de conseguir los números del Banco Mundial (solo conseguí datos a partir de 1986, y solo hasta 2013), reproduje la gráfica en un estilo muy similar pero utilizando los datos para Argentina.

Link al gráfico original

El mío:

desigualdadArgentinav3

La interpretación de la gráfica es que puntos mas arriba representan una distribución mas desigual de los ingresos, mientras que mas a la derecha significa una producción total de riqueza mayor. En palabras de Alberto Cairo, vemos que “un crecimiento del PBI no siempre está acompañado de una reducción de la desigualdad”.

Un par de comentarios técnicos:

Como la gráfica original, para medir la desigualdad uso el coeficiente de Gini. No es una medida perfecta pero es un indicador muy utilizado. Para medir el crecimiento económico decidí usar el producto bruto interno per capita, introduciendo un cambio con respecto a la gráfica original (que usa el producto bruto interno total). Me parece que es un poco mas correcto usar esta gráfica ya que el tamaño de la población cambió bastante en las tres décadas abarcadas por los datos.

Respeté el diseño original de separar los datos en intervalos por presidencias, una decisión de diseño brillante. Sin embargo, creo que como la medición de cada año es para el pasado, y los cambios de presidencia están marcados aproximadamente dentro de ese año, se introduce un poco de ruido y el punto medido no coincide en realidad con la separación de colores perfectamente (a ver si se me ocurre un criterio automático para solucionar esto).

A riesgo de arruinar el increíble trabajo de diseño de Alberto Cairo y sus colaboradores, me tomé la libertad de agregar pequeños recordatorios de eventos económicos importantes de cada año (además de cambiar fonts, colores, anchos de líneas, y otras cosas que hacen que mi gráfica sea claramente peor, por supuesto :).

Comentarios sobre el contenido:

Como en la gráfica original, se puede ver una clara marca o tendencia general muy diferenciada por cada presidente Argentino (incluyendo Menem primera o segunda presidencia).

Mas importante, a partir de 2003, coincidiendo con la entrada de los Kirchner en el poder –y así como en Brasil con la entrada de Lula–, el país crece económicamente y baja la desigualdad de manera sistemática y sin precedentes (excepto por un retroceso coincidiendo con la crisis financiera global). No existen mediciones del índice de Gini a escala del país antes del 86 (o no las encuentro), pero las calculadas para Buenos Aires dan que no se veían niveles de desigualdad tan bajos desde 1984, y eso es un punto bajo especial que solo tenía pareja en 1974 (datos de Gapminder).

Nuevas preguntas que surgen:

La evolución en Brasil es muy similar a la de Argentina. Esto hace que me pregunte cuanto es el efecto de los presidentes en particular (que seguro hay alguno) y del comportamiento económico global y de la región. Para responder esta pregunta me bajé los datos de los países vecinos de Argentina, y voy a crear (tal vez dentro de una o dos semanas) una infográfica mas completa comparando todos los países (que me va a llevar mas esfuerzo porque no es fácil poner en la misma gráfica a Brasil y a Bolivia, por ejemplo). Próximamente por este blog…

Edición posterior:
Repito para responder antes que sigan preguntando: Todos los datos salen del Banco Mundial, de esta tabla esta tabla y de esta otra, excepto por los años 88, 89, y 90 del Gini que están sacados de la estimación de Gapminder.org, que cita al Banco Mundial como su fuente pero probablemente lo sacaron de otro lado. De paso comento que con Gapminder ya se puede hacer la comparación de países de la región, pero no hay información de los períodos presidenciales.

Segunda Edición: actualización con nuevos datos del PBI alternativo

ESTA SECCIÓN HA QUEDADO ALGO INCOHERENTE, VER EDICIÓN POSTERIOR MAS ABAJO

Por un lado me encanta la increíble recepción que ha tenido este artículo, pero por el otro me han llenado ya demasiado la cabeza con el tema de la confiabilidad de los datos del INDEC (y por ende, de los de mi fuente que es el Banco Mundial). Esta desgracia institucional me ha hecho sacar horas de donde no las tengo buscando como incorporar en la gráfica algo de este tema. Aqui está, pero antes, unas (cuantas) palabras.

No estoy contento del todo con el resultado por dos motivos, y ninguno tiene que ver con lo que dicen los datos: (1) Me molesta que la nueva presentación gira la discusión hacia el problema del INDEC y la mentira institucional. La gráfica original de Cairo tiene como tema principal la correlación entre el crecimiento económico y la distribución de la riqueza. Invita a pensar en la personalidad que cada presidencia dió a estas variables, a la comparación entre épocas y a ponerse ansioso y querer saber que le pasa a otros países. Técnicamente hablando, lo que ocurre ahora es que al mostrar dos conjuntos de datos para una misma secuencia, nuestro cerebro automáticamente entra en modo comparación/busqueda de similitud y diferencia, y el tema original se reemplaza por este. Para mitigar este problema resolví usar otro código de color (gris) para esta línea alternativa, intentando mantener la primera historia en una primera capa, y la segunda que aparece cuando hemos ya pasado por la primera. Es un intento de narrativa por capas, o como se llame, pero no se si me salió bien.
(2) Como visualizador de datos, lo mejor del mundo es tener una fuente confiable, regular, o por lo menos completa, de manera que puedo focalizar en construir el mensaje visual, en como se va a leer, en crear estructura gráfica y luego diseñarla, que son las cosas que me apasionan. Cuando los datos vienen “sucios”, como decimos, hay que hacer un buen trabajo de normalización, inspección, etc, lo que llamamos “limpieza”, repasando 17 veces para que no se escape ningún maltrato del dato o error estadístico. En este caso estoy combinando dos fuentes de datos que incluso puede que no sean completamente compatibles, y el resultado es que estoy poniendo juntos en la misma gráfica cosas que no estoy seguro si deberían estarlo (porque no soy un experto). Al final, que si esto fuera un periódico o una publicación con una editorial fuerte, nunca publicaría esta nueva versión, porque técnicamente agrega mas problemas de los que soluciona. Pero como esto es un blog sobre visualización experimental, y aquí la audiencia ha demostrado un altísimo nivel de poder ver las historias y los detalles de la primera versión, voy a dejar la original que me gusta porque tiene menos cosas, y poner aquí la nueva para que sigan discutiendo (la metodología la explico mas abajo):

(aqui estaba la imagen con los datos de ARKLEMS, ver mas abajo)

Con respecto a la fiabilidad de los datos anteriores y de los nuevos. Como comentó uno de los lectores, el mismo Banco Mundial (que usa datos del INDEC) reconoció que era una fuente de datos no confiable a partir del 2007, en especial para los datos de PBI. Sin embargo, a partir del 2014 volvieron a incluír las estadísticas, mencionando que el FMI todavía tiene a Argentina retada por no producir buenos datos, y que en ese contexto “el Banco Mundial también usa fuentes de datos y estimados alternativos para la supervisión de los desarrollos macroeconómicos en Argentina” (traducción mía de la errata de Abril de 2014). No me queda claro de este mensaje si el Banco Mundial solo mira esos datos alternativos, o si los incorpora en sus publicaciones y por lo tanto los datos originales que utilicé ya están corregidos.

Supongamos que no. Me sugirieron usar el indicador de ARKLEMS, creado y mantenido por un grupo de profesores de la UBA. La verdad es que no conozco cuales pueden ser mejores o peores, o si hay mas, asi que vamos a ir con este que tiene un nombre llamativo y fácil de recordar :). Cómo pegarlos? Son fuentes muy dispares en su metodolgía y la salida final, asi que hay procesarlo un poco (lo que mencionaba arriba). Después de darle varias vueltas para ver como juntarlo, decidí que lo mejor (en términos de balancear facilidad de implementación y comprensión con correctitud) fue utilizar el último punto que se considera válido del Banco Mundial (2007) como el punto de empate entre las curvas, y calcular la evolución de ese punto en adelante usando los crecimientos porcentuales año a año reportados en ARKLEMS. O sea, la curva gris que está en el nuevo gráfico se va calculando año a año a partir del año anterior y del cambio registrado en ARKLEMS. Es decir a partir de 2007 no se utilizan más los datos del INDEC.

¿Que cambia? Bueno, como era de esperar, hay menos crecimiento. La crisis del 2008 pegó mas fuerte de lo se veía antes, el crecimiento entre 2009 y 2011 fue grande pero no tanto, y a partir de 2011 se estanca el crecimiento. De cualquier manera la curva sigue mostrando un crecimiento, mas moderado, y más importante, la caída de la desigualdad, ya que este indicador es independiente y nunca dejó de ser aceptado por el Banco Mundial. Un poco sin sorpresas, la tendencia general permanece similar, por lo que la historia contada en la primer versión era básicamente correcta. Es mas, uno de los comentarios estimaba que el PBI final iba a caer cerca de los 9000, muy buen ojo!

Bueno, esa es mi interpretación. Opinen lo que quieran, pero como siempre manteniendo el respeto por favor, que venimos bastante bien.

Por útlimo, vuelvo a repetir que lo que me gusta es la visuaización de datos, y aunque no esté conforme es cierto que esta nueva gráfica me trajo un par de desafíos interesantes en ese sentido. Espero que si un poco falla y nos hace dejar de hablar de que pasó con la economía Argentina, al menos nos lleve a buenas discusiones sobre como recuperar la confiabilidad del INDEC, que sería muy bueno.

Aprovecho para agradecer todos los comentarios, pero por favor por unos días no pidan mas cambios :)

Un saludo

TERCERA EDICION: O sobre como cagarla, y luego reconocerlo. 

El gráfico que presenté originalmente tenía un error mío, interpreté “USD a valores actuales” como USD ajustados por inflación a valores de hoy. Ahora la gráfica es correcta (la que está arriba), con valores USD constantes a 2005. La anterior está mas abajo luego de la discusión de mi error.

A ver, tengo que pedir mil perdones por cometer un error básico. Esta vez los dioses de la estadística me sonrieron y la gráfica no cambia sustancialmente (también porque la tendencia es mas fuerte que la correción), pero es importante reconocer que la cagué y arreglarla. Por si no se nota, me siento mal al respecto.

Mi error, que astutamente reconocieron algunos lectores en sus comentarios, fué interpretar la descripción de los datos “USD a valores actuales” como USD ajustados por inflación a valores actuales. Los valores ajustados siempre se dan en referencia a algún año en concreto, pensé que buenos estos tipos me los dan a valores 2015. Pues no.

La nueva tabla de PBI que estoy usando es esta.

La gráfica correcta está arriba de todo, aquí abajo la primera que hice (solo le he cambiado la leyenda para que no circule mas la original con el error), para comparación.

desigualdadArgentinav2_CORRECT

Dos cosas: 1) Es notable que a pesar de cambiar los números, el comportamiento general de cada una de las presidencias que se veía en la otra curva se mantiene, y 2) Estoy asombrado con como coinciden los porcentajes de crecimiento año a año de la medición independiente de ARKLEMS con los datos del Banco Mundial. ¿Será que están realmente ajustando los datos del INDEC con indicadores alternativos? Para recordar, en esta curva tomo el valor 2007 del Banco Mundial como bueno, y le aplico el crecimiento año a año medido con el ARKLEMS per capita (porque ARKLEMS está en pesos y no quiero ponerme a usar tasas de cambio varias). La otra opción es que el INDEC está publicando bien los números y solo lo ha quedado la mala fama, que sería un primer paso para recuperarla. O por supuesto puede que la metodología de ajuste de ARKLEMS a esta escala no sirva, por ahora no me doy cuenta de como. Si alguien quiere ayudar en eso, bienvenido.