Revista académica de economía
con
el Número Internacional Normalizado de
Publicaciones Seriadas ISSN
1696-8352
Manuel
Barrón Ayllón
Investigador de ophèlimos,
Comunidad Económica en Red
www.ophelimos.org
mbarron@ophelimos.org
Resumen
El objetivo del presente documento es estimar la brecha salarial entre
empleados limeños y provincianos en Lima Metropolitana, con datos de la Encuesta
Nacional de Hogares de 2003-2004. La metodología utilizada es conocida como
Propensity Score Matching (PSM). Bajo condiciones satisfechas en el presente
trabajo, PSM supera a otras metodologías de medición de brechas salariales. La
diferencia estimada no es significativa, en promedio resulta en unos S/.0.50 y
S/.0.60 por hora, lo que se estima que equivale entre S/.85 y S/.113 mensuales.
Estas cifras no tienen efecto sobre la distribución de ingresos laborales de los
empleados de Lima Metropolitana. Por lo tanto, hay indicios de que la
discriminación no juega un papel muy importante en el grupo analizado.
Abstract
This paper aims to estimate the wage gap among white collar workers in
Metropolitan Lima between the ones born in Lima and the ones born in the other
provinces of Peru. The data was obtained from the National Household Survey of
2003-2004. Under conditions met in this paper, PSM proves to be better than
other wage gap estimation methodologies. The estimated difference is non-significant,
between S/.0.50 and S/.0.60 per hour, resulting in a gap of between S/.85 and
S/.113 per month. This gap does not have a gravitating impact on labor income
inequality between white collar workers in Metropolitan Lima. Therefore, the
evidence suggests that discrimination does not play a crucial role in the group
under analysis.
NOTAS DEL EDITOR: El texto que se ofrece en esta página web carece de fórmulas, notas, gráficos y tablas. Su objetivo es facilitar que sea encontrado al utilizar buscadores en Internet y que el investigador pueda revisar el texto antes de bajarse el artículo completo que está aquí en formato PDF.
El artículo es parte de la Serie de Investigaciones Cortas, que publica ophèlimos, Comunidad Económica en Red www.ophelimos.org
Para citar el artículo puede utilizar el siguiente formato:
Barrón Ayllón, M. "Cuánto cuesta ser provinciano a un empleado de Lima Metropolitana: Una aproximación mediante Propensity Score Matching" en Observatorio de la Economía Latinoamericana nº 47, agosto 2005, accesible a texto completo en www.eumed.net/cursecon/ecolat/
1. Introducción
El objetivo del presente documento es estimar el diferencial de ingresos por hora entre provincianos y limeños que laboran como empleados en Lima Metropolitana3, con datos de la Encuesta Nacional de Hogares de 2003-2004. La representatividad de la encuesta permite hacer inferencia a nivel de Lima Metropolitana, lo que, como se verá más adelante, permite resolver uno de los potenciales problemas de la metodología utilizada.
En la siguiente sección se presenta el marco teórico y una revisión de la literatura sobre brecha salarial en el Perú. En la tercera se presenta los detalles de la muestra. En la cuarta sección se resume la metodología de Propensity Score Matching (PSM). En la quinta se presenta y discute los resultados. La sexta sección concluye el documento.
2. Marco teórico
Desde hace algunos años se viene desarrollando una corriente en historia económica que investiga la relación entre la desigualdad actual y el pasado colonial. Las hipótesis convergen en que la llegada de los españoles a América significó un desastre no sólo político sino también económico para los pueblos aborígenes. Estos argumentos han sido trabajados por Grier (1999), Engerman & Sokoloff (2002), Figueroa (2003) y Mahoney (2003), entre otros. La idea común es que la dinámica de la desigualdad contiene una fuerza de inercia, es decir, la desigualdad actual depende de la pasada. Esto se ha llegado a conocer como dependencia de la senda (“path dependence”).
La línea principal de razonamiento se centra en la serie de shocks sufridos por las poblaciones aborígenes a causa de la invasión española. Además de ser degradados socialmente, los indígenas sufrieron una serie de shocks económicos. En primer lugar, atravesaron un gran shock demográfico por las enfermedades transmitidas por los españoles, para las que no tenían anticuerpos.
En segundo lugar, la mano de obra fue reasignada de acuerdo a los intereses de los conquistadores: se trasladó masivamente de la agricultura a la minería. Paralelamente, los españoles despojaron a los indígenas de las mejores tierras, dejándoles las tierras menos productivas, o sin tierra en absoluto. Así, habiendo sufrido una serie de shocks drásticos en los principales medios de producción (mano de obra y tierra) que generaron graves desequilibrios y por ende serias ineficiencias productivas, los indígenas fueron rápidamente aglutinados en el bloque de los más pobres del virreinato. Además, su sistema económico fue reemplazado abruptamente por el español, y la reciprocidad y redistribución fueron reemplazadas por una feroz recolección de tributosprácticamente sin ninguna retribución del Estado4.
Por otro lado, los indígenas estaban excluidos del sistema de educación formal, teniendo como tope excepcional la alfabetización.
De esta manera los españoles bloquearon su acceso al capital humano, imposibilitando su ingreso al sector moderno de la economía y confinándolos a los sectores extractivos, política perfectamente compatible con los objetivos de los colonizadores.
Llegada la independencia se estableció ser alfabeto como condición para ejercer el derecho a voto y para poder postular a cargos políticos. De esta manera la mayoría de los indígenas no sólo estaban impedidos de elegir a los gobernantes, sino que los líderes políticos indígenas estaban impedidos de postular a cargos públicos. Se esgrimió diversas razones para esto, como que los indígenas no tenían capacidad de organización, o que de tener derecho a voto serían fácilmente manipulables. Sin embargo, no se tomaba en cuenta que los medios de organización de los aborígenes habían existido desde antes de la llegada de los españoles, y que éstos les habían permitido gobernar un imperio que llegó a cubrir varios países de América del Sur, sin necesidad alguna de ser alfabetos. Recién en la Constitución de 1979 se elimina este requerimiento. Si bien esto no es condición suficiente, el voto universal es una condición necesaria para eliminar la desigualdad y el estigma que produce ser indígena (Ames ed. 1978).
Desde fines del siglo XIX ha habido una reducción constante en la tasa de analfabetismo, y por lo tanto una mayor proporción de voto indígena, pero ésta ha sido significativamente menor en las zonas indígenas que en el resto del país. Sin embargo, con datos de los censos nacionales, Figueroa & Barrón (2005:11 y Cuadro 3C) muestran que el progreso en el proceso de alfabetización ha estado sesgado en contra de los departamentos “más indígenas” del país.
Según la Teoría Sigma (Figueroa 2003), la causa principal de la desigualdad es la exclusión, no la discriminación, lo que está en línea con el razonamiento anterior, pues las poblaciones aborígenes han sido sistemáticamente excluidas del acceso a capital humano. Sin embargo los procesos de degradación social al que fueron sometidos los pueblos aborígenes podrían haber tenido como resultado cierto grado de discriminación contra sus miembros. En general, la desigualdad observada (además de ser resultado natural del sistema capitalista) puede ser resultado de discriminación, de exclusión, o de una combinación de ambas. La discriminación es el trato diferente a individuos de distintos grupos con características similares. La exclusión, en cambio, es la desigualdad en el acceso a recursos por parte de los individuos de un grupo. Así, por ejemplo, hay discriminación si un hombre y una mujer con el mismo nivel de capital humano realizan la misma tarea y reciben salarios distintos. En cambio, hay exclusión cuando uno de los grupos (típicamente las mujeres) está excluido del acceso a la educación, por lo que no puede acceder al mismo tipo de ocupaciones que los hombres y por lo tanto recibe un ingreso menor. Nótese que en los dos casos el resultado es desigualdad entre los grupos, pero las causas son diferentes. Estudios recientes han mostrado por metodologías diferentes que no hay evidencia de discriminación en el acceso a puestos de trabajo como empleado en el Perú. Por un lado, Figueroa & Barrón (2005) muestran que, una vez controlando por años de educación (entre otras variables), el origen étnico de un individuo se vuelve irrelevante para determinar la probabilidad de conseguir un trabajo como empleado. Sin embargo, el origen étnico es en sí mismo relevante para determinar los años de estudio que ese individuo acumulará. Siguiendo el razonamiento del párrafo precedente, esto no es un problema de discriminación, pues individuos con el mismo número de años de educación tienen la misma probabilidad de ser empleados, sin importar el grupo étnico al que pertenecen. Es, más bien, un problema de exclusión, pues los años de educación de los individuos dependen del grupo étnico al que pertenecen.
Moreno et al. (2004) llegan a conclusiones similares. Ellos realizaron un interesante experimento para analizar la relevancia del origen étnico en el acceso a tres ocupaciones: vendedores, secretarias y asistentes administrativos y de contabilidad. Los datos fueron obtenidos de PROEMPLEO, un programa de intermediación laboral del Ministerio de Trabajo y Promoción del Empleo.
Basados en una serie de características físicas, los postulantes fueron calificados en escalas de etnicidad, de acuerdo a la metodología propuesta por Ñopo et al. (2004). Básicamente, a la persona se le asigna una puntuación de 0 a 10 de acuerdo a qué tantas características tiene sobre cada uno de los cuatro principales grupos raciales del Perú: blancos, indígenas, africanos y asiáticos. Los resultados revelan que, una vez controlando por una serie de variables relevantes, las características étnicas no influyen en la probabilidad de que una persona sea contratada. Si bien la muestra utilizada no es representativa de Lima o el Perú5, los resultados son importantes porque se trata de un experimento cuidadosamente diseñado, que utiliza datos de alta calidad. A pesar de que parece no haber discriminación en el acceso a puestos de trabajo, estudios previos dan evidencia de discriminación en los ingresos laborales. Por ejemplo, Ñopo et al. (2004), utilizando una extensión para la descomposición de Blinder y Oaxaca (Blinder 1973, Oaxaca 1973) encuentran una diferencia de 12% a favor de los blancos asalariados (en comparación con los indígenas asalariados), mientras que es estadísticamente nula en los trabajadores independientes.
Además de la metodología de estimación, hay dos diferencias entre el presente documento y Ñopo et al. (2004). En primer lugar, mientras que sus resultados son representativos del Perú urbano, aquí la representatividad es más reducida: el objeto de estudio son los empleados de Lima Metropolitana. El fin de esta restricción es medir la diferencia en ingresos (si la hay) entre trabajadores con un nivel educativo relativamente alto para los estándares peruanos. La segunda diferencia consiste en la variable respecto a la cual se mide la brecha salarial. La variable utilizada por Ñopo et al. (2004) tiene la ventaja de ser continua, lo que permite medir la discriminación de acuerdo a “qué tan indígena” es la persona. La desventaja de esta variable es ser una medición subjetiva de los encuestadores, por lo que el índice racial del entrevistado puede variar dependiendo del encuestador. En este trabajo la variable cuyo efecto se analiza es dicotómica (sólo distingue provincianos y limeños) y objetiva: sea quien sea el encuestador, el lugar de nacimiento de la persona encuestada será el mismo.
3. La Muestra
Las observaciones fueron tomadas de la Encuesta Nacional de Hogares tomada entre mayo de 2003 y abril de 2004 (www.inei.gob.pe). La muestra seleccionada para el presente estudio consiste en individuos residentes en Lima Metropolitana que se encontraban trabajando como empleados, ya sea en el sector público o privado.
El Cuadro 1 presenta algunos rasgos generales del mercado laboral peruano y limeño, para la población de 25 años a más.
Diferenciando limeños y provincianos, es posible notar que los limeños se concentran en el rubro “empleado”, mientras que los provincianos lo hacen en el rubro “independiente”. La razón parece clara: casi 90% de los limeños tiene educación secundaria completa o más, mientras que para los provincianos esta cifra está cerca al 45% a nivel nacional y 60% en Lima Metropolitana. Al parecer, los limeños acumulan un mayor stock de capital humano y por ello consiguen mejores puestos.
Se restringió la muestra a los empleados residentes en Lima Metropolitana por dos razones. En primer lugar, para evitar la necesidad de corregir los salarios por el nivel de precios de cada región. El nivel de precios es distinto en diferentes lugares del país, y la inclusión del nivel de precios estimado podría ser una fuente adicional de ruido en el modelo. En segundo lugar, porque la metodología econométrica utilizada requiere que los individuos participen del mismo mercado laboral. Residir en Lima Metropolitana, junto al hecho de laborar como empleado, tiene como objetivo tratar de garantizar que los individuos pertenezcan al mismo mercado laboral. Esto no resta relevancia a los resultados presentados más adelante, pues los resultados de la encuesta son representativos a nivel de Lima Metropolitana.
CUADRO 1. PERÚ: CATEGORÍA LABORAL Y NIVEL EDUCATIVO, 2003-2004
El Cuadro 2 muestra que a pesar de tener similar número promedio de años de educación, los limeños son más jóvenes. Esto podría deberse, entre otras razones, a que a un provinciano le cuesta más tiempo emitir las señales necesarias para conseguir un puesto de empleado. Además, un mayor porcentaje de limeños ha estudiado en una institución privada, lo que está fuertemente asociado a una mejor educación. Finalmente, en el grupo de limeños, la mitad son mujeres, mientras que en los provincianos, sólo algo más del 40%.
CUADRO 2. CARACTERÍSTICAS PROMEDIO DE LOS EMPLEADOS DE LIMA METROPOLITANA
La variable utilizada para medir la discriminación es el ingreso por hora, con seis especificaciones de ingreso: ingreso bruto, neto y “social”, tanto monetario como total (monetario más pago en especie). Lo que aquí se llama ingreso “social” es el ingreso neto más los descuentos de ley (aportes a las administradoras de fondos de pensiones y la compensación por tiempo de servicios). Esta medida es relevante porque toma en cuenta aportes que regresarán al trabajador en algún momento del tiempo8. Como se verá más adelante, la medida de ingreso que se utilice no tiene efectos importantes en la interpretación de los resultados.
CUADRO 3. INGRESO POR HORA Y MENSUAL DE EMPLEADOS DE LIMA METROPOLITANA (S/.)
El Cuadro 3 muestra el ingreso laboral por hora y mensual de los empleados de Lima Metropolitana. En este cuadro se puede apreciar la diferencia en los promedios muestrales, que varía de S/.0.34 a S/.0.56 por hora a favor de los limeños. Sin embargo, estas diferencias no toman en cuenta las diferencias en otras características, como años de educación, edad, experiencia, etc. En el Cuadro 4 se presenta los resultados de una serie de regresiones por mínimos cuadrados ordinarios (MCO) que sí las toma en cuenta. “Provinciano” y “Estatal” son dummies que identifican a los individuos nacidos fuera de Lima y a los que estudiaron en una institución estatal, respectivamente. “Anosed” son los años de educación formal del individuo. “Edad” y “Género” son obvias. De acuerdo a estos modelos, un empleado dejaría de ganar entre S/. 0.92 y S/. 1.09 por haber nacido fuera de Lima. Sin embargo, en ningún caso la diferencia es estadísticamente significativa.
CUADRO 4. ESTIMACIONES DEL SALARIO POR HORA (MCO)
4. La Metodología
Diversas metodologías econométricas han sido aplicadas para medir la brecha salarial entre diferentes grupos sociales.
La metodología propuesta casi simultáneamente por Blinder y Oaxaca (Blinder 1973, Oaxaca 1973) fue una de las pioneras en el estudio de las brechas salariales. Dicha metodología permite cuantificar las contribuciones de diferencias grupales en características observables (como educación, estado civil, o experiencia) a brechas de género o raciales. Muchos trabajos siguieron sus pasos, con diversas modificaciones y adaptaciones.
El método tradicional de Blinder y Oaxaca extrapola los estimadores lineales de las ecuaciones de ingresos fuera del grupo de los individuos para cuyas características se estimó. Por ejemplo, en el caso de brecha de género es fácil encontrar hombres de 40 años solteros, sin hijos y en puestos altos, mientras que es raro encontrar mujeres con dichas características. Ñopo (2004) presenta evidencia de que esta extrapolación tiende a sobreestimar el componente de la brecha atribuible a diferencias en las recompensas de las características individuales (e.g., años de estudios o experiencia profesional)11. En el presente documento se utiliza otra metodología, llamada Propensity Score Matching (PSM) que fue originalmente diseñada para evaluar el impacto de programas sociales.
Para estimar el impacto de un programa social, lo ideal sería que la población beneficiada hubiera sido seleccionada aleatoriamente. Esto haría posible un estudio experimental. Sin embargo, los programas sociales rara vez son aplicados de esta manera. PSM es una metodología inicialmente desarrollada por Rosenbaum & Rubin (1983) para medir el impacto de programas de capacitación laboral sobre los ingresos de los participantes en situaciones donde éstos no eran seleccionados aleatoriamente.
Esta metodología toma en cuenta las diferencias entre los individuos que participaron del programa y los que no. En la jerga de PSM, los individuos que participaron del programa se conocen como “tratados”, y los que no lo recibieron son llamados “controles”.
En este caso, los tratados son los provincianos, mientras que los controles son los limeños. En este caso, el “tratamiento” es haber nacido fuera de Lima Metropolitana.
La metodología puede resumirse de la siguiente manera. En primer lugar se estima la probabilidad de que un individuo reciba el tratamiento. La probabilidad predicha es el puntaje o score del individuo. En segundo lugar se separa la muestra en dos submuestras: la de tratados (los que recibieron el tratamiento) y la de controles (los que no recibieron el tratamiento), y se ordena ambas submuestras de forma descendente. A continuación para cada tratado se busca un control con similar puntaje12, y se forma parejas (tomar en cuenta que un mismo control puede ser emparejado con más de un tratado).
El siguiente paso es calcular la diferencia de ingresos en cada pareja, para luego calcular la diferencia promedio en toda la muestra. Esto es conocido como el efecto promedio del tratamiento en los tratados (EPTT). El error estándar de la diferencia entre cada pareja permite realizar una prueba “t” de significancia, para contrastar la hipótesis nula de EPTT nulo. Si se rechaza la hipótesis, se puede asegurar que el EPTT es estadísticamente diferente de cero, en caso contrario no se puede afirmar que el EPTT sea distinto de cero.
Para las estimaciones presentadas en la sección 5 se utilizó la siguiente fórmula para ponderar las observaciones:
Donde G(•) es una función kernel gaussiana, y n á es un parámetro de ancho de banda. En este caso, se utilizó 06 . 0 n = á . I0 es el grupo de limeños, Pj es el puntaje del individuo j (del grupo de provincianos) y Pi es el puntaje del individuo i (del grupo de limeños). Para calcular el error estándar de cada EPTT se utilizó simulaciones de Montecarlo con 50 repeticiones. PSM tiene, como toda metodología econométrica, defensores y detractores. Por un lado, Rosenbaum & Rubin (1983) le atribuyen un rol central en el estudio de relaciones de causalidad. Dehejia & Wahba (1998) resaltan que PSM permite estimar exitosamente el impacto de programas laborales y que además simplifica enormemente la tarea de controlar por diferencias en variables previas al programa. Dehejia & Wahba (2002) resaltan las buenas propiedades de PSM aun cuando hay pocos “controles”14 con qué comparar las unidades que recibieron tratamiento.
Por otro lado, Heckman, Ichimura & Todd (2003) desarrollan un método de emparejamiento basado en distribuciones de kernel y demuestran que PSM no implica necesariamente una reducción en la varianza de los estimadores. Además, Drake (1993) examina los efectos de errores en la especificación sobre los modelos de PSM. Ella encuentra que el sesgo producido por la omisión de una variable relevante puede ser bastante grande y significativo. Finalmente, Shadish et al. (2002) señalan que se requiere muestras grandes, con suficiente traslape entre grupos y que además puede haber cierto sesgo debido a que PSM sólo controla por variables observables.
Sin embargo, se ha llegado a un consenso que PSM es una metodología adecuada siempre y cuando se cumpla con las siguientes condiciones (Smith & Todd 2001: 112):
1. Que la población tratada y los controles pertenezcan a la misma muestra (o por lo menos al mismo tipo de encuesta), de modo que las variables sean medidas del mismo modo.
2. Que ambos grupos participen del mismo mercado laboral
3. Que las bases de datos contengan un número suficiente de variables para modelar la decisión de participar en el programa
El primer punto es cubierto desde el inicio, pues todas las observaciones pertenecen a la Enaho 2003-2004, lo que garantiza homogeneidad en la medición de las variables entre los dos grupos. El segundo punto es cubierto por el hecho de que los individuos analizados son empleados en Lima Metropolitana, lo que se aproxima a un único mercado laboral.
En relación al tercer punto, Bratti & Mancini (2003) ilustran claramente que PSM introduce un sesgo importante cuando la decisión de participar en el programa no está bien modelada. Este punto también está cubierto en el presente estudio, pues en este documento no se está analizando un programa en el que los individuos deciden o no participar, sino al lugar donde nacieron, que es totalmente exógeno a ellos. Ello elimina el problema de endogeneidad en la ecuación estimada. Habiendo satisfecho las tres condiciones, se puede concluir que PSM es una metodología adecuada para los objetivos del presente documento.
5. Resultados
Regresiones como las del Cuadro 4 podrían incurrir en lo que Ñopo (2004) llama “diferencias en los soportes””, pues, como se discutió anteriormente extrapolan los coeficientes hallados a partes de la muestra donde los individuos tienen distintas características. Por ello es necesario reducir la muestra a la “región de traslape” o “de soporte común”, es decir, a aquellas observaciones que pueden compararse en ambas muestras. Debido a que se utiliza un número grande de variables, se genera un problema, pues mientras más variables sean tomadas en cuenta, más difícil será encontrar controles adecuados para cada individuo tratado. Sin embargo, el puntaje de cada individuo (en este caso, la probabilidad de que sea provinciano) resume sus características en una variable unidimensional. Esto permite hacer comparaciones tomando en cuenta un número potencialmente grande de variables sin perder parejas. En este caso, la región de traslape estaría dada por la intersección en el rango de puntajes de provincianos y limeños. En el caso del modelo irrestricto, el puntaje de los provincianos va de 0.068 a 0.848 y el de los limeños va de 0.086 a 0.914. Por lo tanto, la región de traslape estaría en el intervalo [0.086,0.848].
De cualquier forma, mediante este procedimiento se pierde observaciones (las que tengan puntajes que estén fuera de la intersección), por lo que la solución no es del todo satisfactoria. Hay otro modo de resolver este problema con PSM. En primer lugar, se agrupa a los individuos en bloques de acuerdo al puntaje de cada individuo. A continuación se estima la mediana del puntaje para controles y para tratados en cada bloque. Finalmente se evalúa si las medianas de controles y tratados son estadísticamente diferentes en cada bloque. Si en todos los bloques se rechazara la hipótesis de que las medianas son diferentes, se puede utilizar toda la muestra para medir el EPTT. Si la hipótesis no se rechazara en algún bloque, la estimación tendría que restringirse a la región de soporte común. La ventaja de este método es que el número de bloque es arbitrario, por lo que casi siempre puede hallarse una división que resulte en un conjunto de bloques balanceados. En este caso, los bloques están balanceados en todas las especificaciones del modelo, ergo el EPTT puede ser medido utilizando toda la muestra. A modo de ilustración también se midió el EPTT para la región de soporte común. Como se puede observar en el Cuadro 5, la diferencia es prácticamente nula.
Las variables utilizadas para estimar el puntaje de cada individuo fueron el nivel educativo de la madre, tener agua potable en el hogar, trabajar en una empresa formal, la edad los años de educación del individuo, haber estudiado en una institución estatal, y el género del individuo. El nivel educativo de la madre es una proxy del stock inicial de capital humano del individuo; el acceso a agua potable y los años de educación dan indicios del capital humano actual del individuo; haber estudiado en una institución estatal es una aproximación a la calidad de la educación; la edad da una idea gruesa de la experiencia potencial del individuo; y el género fue incluido para limpiar diferencias entre hombres y mujeres.
Siempre es tentador incluir más variables, pero es necesario tener en cuenta que de incluir variables irrelevantes es posible que dos individuos que deberían ser comparados no lo sean por presentar diferencias en la variable irrelevante. Por ello se estimó el modelo detallado arriba que, aunque parsimonioso, incluye variables que dan gran cantidad de información tanto sobre la probabilidad de ser provinciano como de los determinantes del ingreso laboral.
Para comprobar la robustez de los resultados se estimó el EPTT eliminando una de las explicativas por vez, con lo que se obtuvo un total de 8 modelos por cada especificación de ingreso (el irrestricto más 7 modelos restringidos). La única diferencia notable ocurre al eliminar la edad. En este caso el EPTT se vuelve positivo para todas las especificaciones de ingreso, pero sigue siendo no significativo. En general la diferencia es menor a S/.0.30 de acuerdo a la especificación que se utilice. Por otro lado, la media y la mediana están muy cerca al modelo irrestricto, con S/0.02 y S/.0.03 de diferencia en promedio. A partir de este análisis se puede concluir que los resultados presentados son robustos a diversas especificaciones.
El EPTT, según el modelo irrestricto, está entre S/.0.49 y S/.0.65 por hora en contra de los provincianos. MCO sobreestima la brecha, mientras que la diferencia “cruda” (Cuadro 3) la subestima. Según la brecha obtenida por PSM, para un empleado que labora 40 horas semanales esto significa entre S/.85 y S/.113 mensuales. Sin embargo, estas diferencias no son estadísticamente significativas. En conclusión, parecería no haber discriminación contra los provincianos entre los empleados de Lima Metropolitana.
Como ejercicio, utilizaremos los estimados puntuales para estimar qué parte de la desigualdad en ingresos laborales podría deberse a la discriminación contra los provincianos. Para ello se estimó el coeficiente de Gini para cada una de las variables de ingreso. A continuación se imputó el salario mensual que recibiría un empleado provinciano “sin discriminación racial” (tomando en cuenta las horas semanales que trabaja) y se volvió a calcular el coeficiente de Gini. Esta metodología tiene un supuesto implícito importante: ante el incremento en los salarios debido a la eliminación de la discriminación, el número de horas trabajadas de los provincianos no varía. Esto ocurriría si la demanda o la oferta laboral fueran inelásticas ante cambios en el salario, lo que parece ocurrir en el mercado laboral peruano15. Si el número de horas trabajadas por los provincianos se incrementara, la reducción del Gini sería de mayor magnitud. En cambio, si este número se redujera, no se podría saber si el cambio en el Gini sería mayor o menor al estimado en el Cuadro 6.
CUADRO 5. EPTT SOBRE EL INGRESO POR HORA (PSM)
Es importante resaltar que parte del EPTT se debe a todos los factores no tomados en cuenta por el modelo. Sin embargo, en el modelo se ha considerado variables que permiten aproximar la cantidad y calidad de capital humano, así como limpiar el efecto de la discriminación de género, lo que se espera que capte la mayor parte de las diferencias en salario.
En el Cuadro 6 se presenta el coeficiente de Gini observado, el imputado considerando el modelo irrestricto y el que sería resultado de los modelos restringidos. Como se puede apreciar, los resultados son bastante consistentes: el Gini observado es de alrededor de 0.49, y según el modelo irrestricto, de eliminarse la discriminación este indicador se reduciría en menos de 5%, lo que significa que, dadas las características de la muestra, el Gini se mantendría estadísticamente constante. Esto puede deberse a la pequeña brecha estimada así como al pequeño número de provincianos que laboran como empleados. Al parecer, como lo predice la Teoría Sigma (Figueroa 2003), el problema central es la exclusión, no la discriminación. Esto es consistente con los resultados presentados en Figueroa & Barrón (2005), donde se muestra que distintos grupos étnicos tienen un acceso diferenciado a la educación, con los nacidos en Lima Metropolitana en el escalón más alto y los nacidos en la Sierra Sur en el más bajo.
CUADRO 6. COEFICIENTE DE GINI ESTIMADO E IMPUTADO SIN EPTT
6. Conclusiones
En este documento se ha estimado la brecha de ingresos entre limeños y provincianos para los empleados de Lima Metropolitana, utilizando diversas especificaciones de ingreso laboral de la ocupación principal: total y monetario, y para cada uno de ellos bruto, neto y “social”, definido como el ingreso neto más los descuentos de ley. Después de demostrar el cumplimiento de las condiciones para su uso, se utilizó la metodología de Propensity Score Matching (PSM), que permite comparar individuos similares y medir la diferencia sin incurrir en extrapolaciones, o extrapolar una vez que ciertas condiciones están garantizadas. Una segunda ventaja de PSM es ser un método no paramétrico, y por ello requiere el cumplimiento de menos supuestos estadísticos. A pesar de que la estimación por MCO llevaría a concluir que ser provinciano tiene un efecto negativo y significativo sobre los ingresos, por PSM se encuentra que el efecto es pequeño y estadísticamente no significativo. Controlando por una serie de variables, especialmente por características de la región de nacimiento del individuo, se encontró una diferencia entre de S/.0.49 y S/.0.60 en el salario por hora entre limeños y provincianos, lo que revertiría en una diferencia de alrededor de entre S/.85 y S/.113 mensuales para un trabajador que labora 40 horas semanales. Se estimó además que de eliminarse este efecto, el coeficiente de Gini prácticamente no se reduciría.
No se ha encontrado indicios de discriminación salarial entre los individuos que laboran como empleados en Lima Metropolitana, pero estos resultados no implican la inexistencia discriminación salarial en el Perú. La existencia de discriminación salarial en otras ocupaciones (obreros, trabajadores del hogar), o en otras regiones geográficas (a nivel nacional, Perú urbano, Perú rural, o a nivel departamental, por ejemplo) no se puede determinar con los resultados aquí presentados. En particular, los resultados de este documento no contradicen los de Ñopo et al. (2004), que encuentran una brecha de 12% entre los trabajadores dependientes en las zonas urbanas a nivel nacional.
Es cierto que por disponibilidad de datos hay factores que no han sido tomados en cuenta, como la capacidad de negociación de los individuos o diferencias en su productividad debidas a factores distintos a las variables incluidas. Tomando en cuenta estas características probablemente la brecha se reduciría aun más. Ese es precisamente el problema de todos los estudios sobre discriminación: que se basan en el resto, en lo no explicado. Un modelo mal especificado daría como resultado un alto grado de discriminación aun en una sociedad donde ésta no exista.
Al parecer, a un empleado de Lima Metropolitana no le cuesta nada ser provinciano. Sin embargo, la estructura de categoría laboral es distinta entre limeños y provincianos. Una vez que alcanzan un puesto como empleado la diferencia con los limeños es casi irrelevante, pero es necesario tener en cuenta que cuatro de cada cinco provincianos quedan fuera de esta categoría en Lima Metropolitana, y 8 de cada 9 en todo el Perú. Ello da indicios de que el principal problema se encontraría en la exclusión. Para medir la parte de la desigualdad de ingresos en Lima Metropolitana debida a la exclusión, habría que calcular la brecha salarial en cada sector productivo de la economía o en cada categoría laboral. Aquí se ha hecho el ejercicio sólo para los empleados. El paso siguiente sería atribuir a los provincianos el mismo acceso a la educación que los limeños. A partir de esto se obtendría unos cuadros equivalentes al Cuadro 1, pero las columnas de provincianos y limeños mostrarían estructuras similares. El paso final consistiría en estimar el coeficiente de Gini antes y después de este ejercicio. Un ejercicio similar podría estimar la diferencia a nivel nacional.
REFERENCIAS
Ames, Rolando (ed.) 1978 Situación y derechos políticos del analfabeto en el Perú. Lima: PUCP.
Banco Interamericano de Desarrollo (BID) 2004 Se buscan buenos empleos: Informe de progreso económico y social.
Becker, Sascha y Andrea Ichino 2002 “Estimation of Average Treatment Effects Based on Propensity Scores” The Stata Journal 2(4): 358-377
Blinder, Alan 1973 “Wage Discrimination: Reduced Form and Structural Variables” Journal of Human Resources 8: 436-455.
Bratti, Maximiliano y Luca Mancini 2003 “Differences in Early Occupational Earnings of UK Male Graduates by Degree Subject: Evidence from the 1980-1993 USR” Quaderni di Ricerca n.189, Dipartimento di Economia, Università degli Studi di Ancona.
Dehejia, Rajeev y Sadek Wahba 1998 “Causal Effects in Non-Experimental Studies: Re-Evaluating the Evaluation of Training Programs” NBER Working Paper 6586
- 2002 “Propensity Score-Matching Methods for Nonexperimental Causal Studies” The Review of Economics and Statistics 84(1): 151-161
Drake, Christiana 1993 “Effects of Misspecification of the Propensity Score on Estimators of Treatment Effect” Biometrics 49(4):1231-1236 Engerman, Stanley y Kenneth Sokoloff
- 2002 “Inequality Before and Under the Law: Paths of Long-Run Development in the Americas” Paper delivered for presentation at the Annual Bank Conference on Development Economics held at Oslo, June 24-26.
Estela, Manuel 2001 Ocho apuntes para el crecimiento con bienestar. Lima: Fondo Editorial del Banco Central de Reserva del Perú.
Fairlie, Robert 2003 “An Extension of the Blinder-Oaxaca Decomposition Technique to Logit and Probit Models” Yale University Economic Growth Center Discussion Paper No. 873.
Figueroa, Adolfo 2003 La sociedad Sigma: Una teoría del desarrollo económico. Lima y México: Fondo Editorial PUCP y Fondo de Cultura Económica.
Figueroa, Adolfo, y Manuel Barrón 2005 “Ethnicity, Inequality and Social Disorder in Peru” CRISE Working Paper 8. Disponible en www.crise.ox.ac.uk (en proceso de publicación)
Grier, Robin 1999 “Colonial legacies and economic growth” Public Choice 98(3-4):317-335.
Heckman, James, Hidehiko Ichimura and Petra Todd 1998 “Matching as an Econometric Evaluation Estimator” The Review of Economic Studies 65(2): 261-294
Jenkins, Stephen 1994 “Earnings Discrimination Measurement: A Distributional Approach” Journal of Econometrics 61: 81-102. Cuánto cuesta ser provinciano a un empleado de Lima Metropolitana: Una aproximación mediante Propensity Score Matching 13
Mahoney, James 2003 “Long-Run Development and the Legacy of Colonialism in Spanish America” The American Journal of Sociology 109(1): 50-106.
Moreno, Martín, Hugo Ñopo, Jaima Saavedra y Máximo Torero 2004 “Gender and Racial Discrimination in Hiring: A Pseudo Audit Study for Three Selected Occupations in Metropolitan Lima” IZA Discussion Paper Series 979.
Ñopo, Hugo 2004 “Matching as a Tool to Decompose Wage Gaps” IZA Discussion Paper Series 981.
Ñopo, Hugo, Jaime Saavedra y Máximo Torero 2004 “Ethnicity and Earnings in Urban Peru” IZA Discussion Paper Series 980.
Oaxaca, Ronald 1973 “Male-Female Wage Differentials in Urban Labor Markets” International Economic Review 14(October): 693-709.
Rosembaun, Paul y Donald Rubin 1983 “The Central Role of the Propensity Score in Observational Studies for Causal Effects” Biometrika 70(1): 41-55
Saavedra, Jose Carlos 2005 “Incremento de la remuneración mínima vital en Lima Metropolitana en un contexto de crecimiento económico: Efectos sobre el empleo y los ingresos” Serie de Investigaciones Cortas ophèlimos 1(2). Disponible en www.ophelimos.org
Shadish, William, Thomas Cook y Donald Campbell 2002 Experimental and Quasi-Experimental Designs for Generalized Causal Inferences. Boston: Houghton-Mifflin. Smith, Jeffrey, y Petra Todd
- 2001 “Reconciling Conflicting evidence on the Performance of Propensity-Score Matching Methods” American Economic Review 91(2): 112-118.
Torero, Máximo y Jaime Saavedra 2005 “Labor Market Reforms and their Impact over Formal Labor Demand and Job Market Turnover: The Case of Peru” en Law and Employment: Lessons from Latin America and the Caribbean. James Heckman & Carmen Pagés, eds. En prensa. Wooldridge, Jeffrey
- 2001 Econometric Analysis of Cross Section and Panel Data. London:
The MIT Press.