miércoles, 24 de diciembre de 2014

¿A mayores tasas de impuesto más recaudación?

Hace pocos días en una comida llegó a mí la siguiente hipótesis, en la que creo, pero que no había intentado probar: no por subir la tasa se recaudan más impuestos. Tiene lógica, la teoría nos dice que la magnitud del aumento de la recaudación disminuye entre más subas las tasas. Si me cobran muchos impuestos no vale la pena trabajar tanto… (en la teoría no se habla mucho de la evasión pero también es una consecuencia). Entonces al graficar tasa e impuestos recolectados esperaríamos ver una “desaceleración” en la recaudación:

El primer paso para probar esta hipótesis es conseguir los datos, la razón principal por la que no había hecho esto antes (no hay series confiables… cada pocos años deciden hacer una nueva serie, cada dependencia del gobierno tiene una serie de fuentes diferentes, etc). Le creeremos a los Diputados, al CEPAL, a la UNAM y al INEGI. Tenemos la recaudación de 1980 a 2012 del ISR tanto en pesos constantes como reales.


Como podemos ver, la recaudación ha aumentado a través de los años; sin sorpresas, la población también crece. Para limpiar ese ruido nuestro siguiente paso es dividir la recaudación por persona (como no hay datos decidí usar un crecimiento lineal para los primeros 10 años). También vemos una tendencia alcista:

Por último lo más interesante; a probar la hipótesis. Usamos la serie de arriba (recaudación por persona) dentro de una regresión como variable dependiente y la tasa impositiva (usaremos la máxima ya que es la única que encontré) como variable independiente. El resultado sin duda no era el que esperábamos:

Vemos una clara tendencia negativa: a mayor tasa del ISR, menor recaudación por persona. Ya que estamos en esto, de una vez echarle un ojo a los datos. Si se aburren, mejor salten al próximo análisis.

Primero la significancia:

-La F de la regresión es de 29.17… significativa.
-El valor t del intercepto es 13.94… significativa.
-El valor t de la variable dependiente -5.4… significativa. 

Sobra poner el valor p a esos niveles ¿Error tipo I? Quien sabe, no creo que exista una diferencia entre la población y la muestra; pero sin duda probar que no la hay sería muy complicado por la naturaleza de los datos. 

Seguimos con el coeficiente de la variable independiente: -4.33, con estas cifras quiere decir que por cada 10% que suban los impuestos la recaudación baja en .43 miles de pesos por persona.

Luego la R cuadrada: 0.49; en otras palabras, el cambio en la tasa explica la mitad del cambio en la recaudación.

Por último podemos ver los residuales graficados para confirmar que tienen media 0 y no hay tendencia.

Sin tener un buen programa estadístico JB a mano es de 0.15, discutible si difiere a 0, además podemos ver esa relación linear en la gráfica relativamente bien… Puede que haya heteroscedasticidad pero haciendo la regresión para BP no podemos rechazar la hipótesis nula con una F de 1.25 y significancia de 0.27 con estas 32 observaciones.


Si se saltaron, aquí está el próximo análisis:

Ahora vamos a usar a la población económicamente activa en lugar de la población total. Al usar esto tenemos un mejor estimado de la población que está en condiciones de trabajar y en la posibilidad de pagar impuestos. Para obtener la serie aplicamos la misma fórmula de antes: dividir el ingreso total del ISR entre la PEA y obtenemos ingresos del ISR por persona económicamente activa.

De entrada saltan que no hay tendencia clara. Cualquier aventurero se podría animar a decir que no hay relación entre la recaudación y la tasa de impuestos; nosotros no, vamos a ver más allá. Seguiremos los mismos pasos de arriba:

Encontramos la misma tendencia negativa: a mayor tasa del ISR, menor recaudación por persona económicamente activa.

De nuevo, podemos ver un poco más a detalle los datos, si no les late se pueden ir a las conclusiones.

Significancia:

- F de 5.13, valor p de 0.03, ya no en 0 como en el caso anterior... significativa.
- t del intercepto en 12.95… significativa.
- t de la variable dependiente -2.26 con un valor p de 0.03… significativa. 

Seguimos con el coeficiente de la variable independiente: -4.00 (aun negativo pero menos pronunciado que en el caso anterior), con estas cifras quiere decir que por cada 10% que suban el ISR la recaudación baja en .40 miles de pesos por persona. 

Luego la R cuadrada: 0.16; en otras palabras, el cambio en la tasa en realidad explica poco del cambio en la recaudación por persona (el 16%). Por eso la gráfica donde vimos el ingreso por PEA parecía no tener mucha relación con la tasa del ISR. 

Por último podemos ver los residuales graficados para confirmar que tienen media 0 y no hay tendencia.

Aun sin tener un buen programa estadístico JB a mano es de 0.39, no pasa la prueba de normalidad en los errores (probablemente sea por esos pocos alejados de la media). No es el fin del mundo, a lo mucho el coeficiente de la variable independiente es 0 y probamos que no hay relación entre tasa y recaudación. Por si tenían la duda, transforme la serie a una logarítmica y el resultado fue el mismo, culpo a las fuentes por no tener datos suficientes. Primeras diferencias no fue significativo, para eso nos podemos quedar con la no transformada e inferir lo mismo. No se ve heteroscedasticidad, confirmando con BP no podemos rechazar la hipótesis nula con una F de 0.45 y significancia de 0.50 con estas 28 observaciones.

Conclusión:

 1. A mayor tasa del ISR la recaudación por persona disminuye.

 2. A mayor tasa del ISR lo único que es seguro es que la recaudación por persona económicamente activa no sube.

       a. Además, si se quiere asumir que hay una correlación, la correlación va a ser negativa.    

A final de cuentas confirmamos la hipótesis: no por subir la tasa se recaudan más impuestos.


Seguro existen métodos estadísticos más robustos pero no los manejo.

martes, 16 de diciembre de 2014

¿Quién me hizo caso?

¿Quién recuerda la serie “Aprendiendo a invertir”? Si recuerdan la parte 1 (de abril de 2013), la parte 2 (de julio de 2013) y la parte 3 (de septiembre de 2013), Gigante se veía a una valuación atractiva.

Si la compraron desde la parte 1 o parte 2, en el peor de los casos, les habrá tocado a $25.00 la acción. Si se esperaron a la parte 3, y también en el peor de los casos, habrán comprado a $26.90 aproximadamente. El precio de cierre de ayer, 15 de diciembre de 2014, fue de $40.60… nada mal.


 *Datos de Yahoo y tiempo para jugar con la gráfica.
 
Comprar desde
Rendimiento
Parte 1 y 2
60.00%
Parte 3
48.70%

¿Había volumen para comprar? Es cierto que muchos días no opera la acción pero en resumen: en abril el volumen fue por casi $8.5 millones, en julio solo $181 mil y en septiembre $77.6 millones. Si había volumen, solo se necesitaba paciencia.

Quien me hizo caso me debe una comida.


miércoles, 3 de diciembre de 2014

Petróleo y Tipo de Cambio

El petróleo ha caído por: 
 
1. Incremento en la oferta: en Estados Unidos la producción de petróleo aumentó por los nuevos métodos de extracción no convencionales  (los sacan de las piedras de esquisto). Esto ha inundado el mercado con mucho petróleo. 
 
2. Disminución en la demanda: hay debilidad económica en China (incluso el Banco Central bajó su estimación recientemente para el crecimiento de 2015) y Europa (solo con China tenemos para mover al mercado).  
 
Clásico ejemplo de economía 101; a mayor oferta y menor demanda cae el precio del bien. 
 
Precio del Brent, de Bloomberg.
 
El dólar se ha apreciado por: 
 
Con el precio del petróleo en caída las naciones que lo venden se ven afectadas; en especial los países cuyo presupuesto depende del petróleo. Con mencionar que el PIB depende del consumo, gasto del gobierno, y exportaciones netas. Si baja el gasto del gobierno, con todas las demás variables constantes, baja el PIB. Curiosamente muchas de las naciones en vías de desarrollo dependen del petróleo para el gasto del gobierno. La conclusión es clara: es probable que crezcan menos. Esto causa una fuga de capitales hacia activos refugio, por lo general en Estados Unidos. 
 
Tomando en cuenta la leyenda, de arriba para abajo, monedas de México, Brasil, Chile, Colombia (base 100).

Para empeorar las cosas, el precio del petróleo se podría corregir si disminuye la oferta. De hecho hay un organismo que regula la producción de petróleo de sus miembros (la OPEP). Desgraciadamente, si los miembros bajan su producción, los que están fuera de la organización ganarían más mercado. El miembro más importante dentro de la OPEP, Arabia Saudita, está en contra de reducir la producción para no perder su participación en el mercado, así que los países que quieren disminuir la producción para que suban los precios traen las de perder.  
 
 
Impactos en México:
 
  1. Incremento en precios, inflación importada. 
    • El precio de la gasolina es fijo así que el argumento de menores precios del petróleo es igual a    menores costos que se traduzcan en menores precios no aplican en México (solo en pocas empresotas que ni siquiera ajustarán los rpecios). 
  2. Presupuesto apretado. Se cubrió, ok (aunque no se los detalles), pero siempre son mejores los precios altos. 
  3. Salida de flujos. El efecto del flight to quality le afecta a México (¿tasas más altas? Puede ser, pero con los eventos políticos, reformas chafas, correlación con las tasas en EUA y demás no va a impactar). 

viernes, 19 de septiembre de 2014

Crisis del ébola





Gracias a unos minutos libres y algo de curiosidad le decidí poner números a la crisis del ébola. Con las finanzas poco tiene que ver, pero el análisis de datos se puede aplicar el entendimiento de otras series de tiempo que tengan algún impacto con el mundo económico-financiero; examinar interpretaciones y a lidiar con los problemas de los resultados.

De acuerdo a lo que dice Wikipedia de la CDC, el 24 de marzo comenzó esta crisis con 86 casos y 59 muertes. Unos 173 días después (13 de septiembre), se habían registrado 4,985 casos y 2,461 muertes.

La cosa se dio así:

Casos
Cambio en Casos
Muertes
Cambio en Muertes
13-sep-14
4,985
1,278
2,461
613
31-ago-14
3,707
638
1,848
296
26-ago-14
3,069
454
1,552
125
20-ago-14
2,615
142
1,427
77
18-ago-14
2,473
233
1,350
121
16-ago-14
2,240
113
1,229
84
13-ago-14
2,127
152
1,145
76
11-ago-14
1,975
127
1,069
56
09-ago-14
1,848
69
1,013
52
06-ago-14
1,779
68
961
29
04-ago-14
1,711
108
932
45
01-ago-14
1,603
163
887
61
30-jul-14
1,440
117
826
97
27-jul-14
1,323
122
729
57
23-jul-14
1,201
108
672
12
20-jul-14
1,093
45
660
28
17-jul-14
1,048
84
632
29
12-jul-14
964
76
603
64
08-jul-14
888
44
539
21
06-jul-14
844
65
518
37
02-jul-14
779
20
481
14
30-jun-14
759
160
467
114
22-jun-14
599
71
353
31
17-jun-14
528
22
322
52
10-jun-14
506
32
270
18
08-jun-14
474
36
252
21
05-jun-14
438
84
231
23
30-may-14
354
45
208
8
27-may-14
309
39
200
17
21-may-14
270
25
183
17
10-may-14
245
2
166
2
03-may-14
243
10
164
9
30-abr-14
233
13
155
10
21-abr-14
220
5
145
7
17-abr-14
215
6
138
7
16-abr-14
209
40
131
21
10-abr-14
169
6
110
8
07-abr-14
163
28
102
14
02-abr-14
135
5
88
6
01-abr-14
130
16
82
12
31-mar-14
114
11
70
4
27-mar-14
103
17
66
6
25-mar-14
86
0
60
1
24-mar-14
86

59


Saltan dos cosas:

1) Es una listota

2) Entre las dos últimas mediciones el cambio en casos se duplicó. Ojo: el cambio, no el número de casos.

          a. De esto podemos adivinar que tendrá un crecimiento exponencial.

Si lo graficamos nos damos cuenta que si:


Dependiendo del paquete estadístico que usemos, podremos tratar de calcular la ecuación. En mi caso es un Excel, jugar con la gráfica y el análisis de tendencias.

Llegamos a las siguientes ecuaciones para el número de casos y muertes con respecto a días transcurridos desde que esto estalló (si, a más x mayor la R pero después de 2 es prácticamente indiferente y es mucho más cómodo trabajar con pocas):

Casos = 0.0024x^3 – 0.3675x^2 + 19.733x – 28.41; R^2 = 0.9937


*Las bolas negras son las de la ecuación.

Y a esta otra para el número de muertes:

Muertes = 0.001x^3 – 0.1412x^2 + 8.0534x – 19.899; R^2 = 0.9954


*Las bolas negras son las de la ecuación.

Lo primero que podemos hacer, y lo más obvio, es echar unas predicciones (recuerden que vamos en el día 174 desde que empezó esto):


Días
Casos
Muertes
180
5,613
2,687
240
16,717
7,604
360
71,422
31,236
720
719,463
305,828

Ok, ¡malas noticias! Pero también hay otra cosa que podemos hacer, examinar la evolución de la proporción de muertes a casos registrados y sacar una tendencia:

% = -0.0009x + 0.6689



De aquí podemos echar otra predicción: en teoría, después de 720 días ya no va a haber casos fatales de ébola, independientemente del número de casos. Esto quiere decir que cada vez hay un menor número de víctimas por número de casos ¡buenas noticias!

¿Cómo conciliamos las ecuaciones? Si le hacemos caso al primer par de ecuaciones, la epidemia seguirá hasta terminar con todos y la tasa de mortalidad nunca bajará del 41.67% (matamos la paradoja con una distribución de probabilidades que seguro existe); si le hacemos caso a la tercera, la epidemia solo durará 720 días. La respuesta es muy simple, y ya la dijo Bhor: "Hacer predicciones es muy difícil, especialmente cuando se trata del futuro". Como nunca vamos a poder ver el futuro no hace falta tratar de conciliar las ecuaciones.

Se pueden saltar este párrafo: Por ejemplo, con las primeras 2 ecuaciones. Estas salen de la serie de 43 datos, pero al jugar con el número de datos y quitar los más recientes, las curvas se van aplanando más y más. Esto quiere decir que las primeras dos ecuaciones han variado a través del tiempo y por esto las podemos descartar para echar un pronóstico… no nos sirve un modelo que cambie cada vez y que no pueda predecir (en teoría podemos añadir el cambio en las ecuaciones a una nueva ecuación, y en caso de ser necesario los cambios de los cambios a otra nueva ecuación… o encontrar un límite, pero me da flojera lo primero y no sé cómo hacer lo segundo). En la tercera ecuación pasa lo mismo; si usamos menos datos la tendencia se aplana y prácticamente desaparece.

¿Entonces perdimos el tiempo con las ecuaciones? Tampoco. Podemos interpretar relativamente bien lo que pasó y podría pasar:

El ébola brotó pero lento (como de a 8 contagiados por día) hasta julio. La mortalidad era alta, 63% en promedio. No impactaba tanto, en bloomberg encontré 3 páginas de varias. Luego FUA!, el virus se comenzó a propagar mucho más rápido (…ooooo… ¿había más gente para contarlos?...), de a 74 por día. Se convirtió en noticia, en bloomberg encontré 30 páginas de noticias para los últimos 2 meses. Las campañas tuvieron impacto, la mortalidad bajó a 54% en promedio. NOTA: son muertes y casos acumulados por lo que es probable que ahorita la mortalidad real sea mucho más baja. ¿Qué podrá pasará? Juntando las 3 ecuaciones y la historia: los contagios continuarán pero controlados (puede que 74 por día sea el límite) gracias a las campañas para contener la enfermedad. Es muy probable que, también gracias a las campañas, la tasa de mortalidad baje considerablemente. Así que los 550,000 contagiados que espera la CDC suenan complicados. En otras palabras, si de morir se trata, de ébola no será.

¿Pero en realidad es tan malo este brote (está claro que no está cool, pero comparada con otras)? En 1918 la gripe española mató entre 50 a 100 millones de personas en solo un año; la peste negra mató a 34 millones, la gripe asiática mató a 4 millones. Y por mencionar, la famosa AH1N! mató a 18,000 supuestamente y en México han muerto más de 63 mil personas en accidentes de tráfico en los últimos 10 años...


Update:

Desde que publiqué esto las muertes parecen estabilizarse: de las 11 observaciones recientes las muertes diarias, el promedio de muertes bajó a 65 y solo en 3 se rompió el límite de 74.