APROXIMACIÓN A LA MEDICIÓN DE LA CALIDAD DE VIDA SOCIAL E INDIVIDUAL EN LA EUROPA COMUNITARIA
Mª Noelia Somarriba Arechavala
Esta página muestra parte del texto pero sin formato.
Puede bajarse la tesis completa en PDF comprimido ZIP
(448 páginas, 2.91 Mb) pulsando aquí
Definición
Este método se basa en que el indicador DP2 verifica la condición de participación, es decir que los indicadores simples se pueden agrupar en conjuntos informacionalmente independientes, por lo que el indicador sintético de distancia podría particionarse en tantos indicadores parciales como grupos independientes existan, siendo aquel igual a la suma de éstos.
Esta propiedad tiene una aplicación interesante para el caso en que los componentes puedan ser agrupados en grupos homogéneos de forma que dichos grupos sean independientes entre si. En este caso sería suficiente con la aplicación estricta de la condición de participación, calculando la DP2 para cada grupo y, posteriormente, calculando la suma total.
Tal y como plantea Pena (1970) en ese caso el cálculo de la DP2 vendría dado por:
Donde (1) y (2) se refieren a los subconjuntos X1 y X2 y el número de etapas es igual al número de subconjuntos ortogonales obtenidos a partir de X.
Si la ortogonalidad no fuese perfecta se podría proceder a calcular la DP2 por bloques aplicando al segundo bloque un factor corrector del efecto lineal del primero, al tercero uno corrector de los dos primeros y así sucesivamente. Se nos plantea por tanto la necesidad de aplicar un coeficiente corrector que garantice que el indicador sólo aproveche la información útil eliminando el exceso de información. Para ello se propone el coeficiente de alejamiento, Dhrymes (1970) lo define de la siguiente manera:
en donde , , , son, respectivamente, las matrices de varianzas y covarianzas de los componentes (1), (2) y de las covarianzas entre los bloques (1) y (2) y en donde es el coeficiente de alejamiento entre el bloque 1 y el 2.
Este coeficiente tiene su campo de variación entre [0,1], es decir, toma los valores extremos cuando hay ortogonalidad entre los dos bloques o cuando están conectados por una relación lineal exacta.
En palabras de Dhrymes mide la variabilidad residual relativa que permanece después de que la influencia del bloque explicativo ha sido removida. Como se ve es un estadístico análogo al (1-R2) de la regresión lineal de una sola ecuación.
Otra ventaja es que el coeficiente es simétrico y, por tanto, es igual el coeficiente de alejamiento entre el bloque 1 y el bloque 2 que entre el bloque 2 y el bloque 1.
De esta forma para el caso de dos bloques la formula de la DP2 sería:
A continuación nos planteamos una revisión de las principales hipótesis, propiedades y condiciones que previamente se habían estudiado para el cálculo de la DP2 y si son válidas en el cálculo de la DP2 por etapas.
Partiremos de la DP2 modificada [Rivera (2004)], recordemos que éste autor implementaba una modificación de la DP2 con el objeto de garantizar la existencia de una única solución conforme, que a su vez era la que maximizaba la Cantidad de Información de Ivanonvic- Pena.
La DP2 por etapas quedaría definida de la siguiente forma:
Siendo, p el número de bloques o componentes,
es una permutación de índices tal que
sea un vector ordenado de mayor a menor, y la Cantidad de Información Global de Ivanovic-Pena, medida definida por Zarzosa (1992, 1996):
y donde
es una permutación de índices tal que
sea un vector ordenado de mayor a menor, y la Cantidad de Información Global de Ivanovic-Pena del conjunto de componentes ordenado sea máxima y vendrá dada por
Si una componente es constante, los resultados de la DP2 son los mismos para todos los países y, en ese caso, su coeficiente de discriminación sería igual a cero.
En el caso de que dos componentes ofreciesen la misma información, el factor de alejamiento se encargaría de eliminar la información redundante.
Si todas las componentes están mutuamente incorrelacionadas, la información global es la suma de los poderes discriminantes de todas las componentes ya que el factor de alejamiento sería igual a uno.
Y si entre todas las componentes existe una relación lineal exacta, la información contenida en cualquiera de ellas es suficiente para determinar la información global, puesto que todas ellas aportan la misma información sobre el nivel de bienestar.
Propiedades de la DP2 por etapas:
La DP2e verifica las propiedades de la I a la IX cuyas demostraciones son similares a la de la DP2. Sin embargo la hipótesis de conformidad y neutralidad se analizará de forma separada:
Existencia y Determinación (I): Dada la función matemática que define al indicador sintético DP2e, es claro que éste existe y toma un valor determinado siempre que exista la varianza de todas y cada una de las variables y sea finita y distinta de cero. Además, es necesario que las varianzas de las componentes sean también finitas y distintas de cero. En el caso de que la varianza de una componente tomase el valor cero, significaría que las variables que integran la componente toman los mimos valores o que unos son combinaciones lineales de otros, por lo que la propia medida de distancia DP2 se encargaría de eliminar la información redundante.
Monotonía (II): El indicador sintético DP2e responde positivamente a una modificación positiva de las variables y negativamente a una modificación negativa.
La condición para que se cumpla esta propiedad es que al modificarse únicamente el valor xij en la matriz de datos, no se alteren sustancialmente los valores de , , y x*i., lo cual es razonable si trabajamos con un número de unidades territoriales elevado.
Unicidad (III): Dado un conjunto ordenado de indicadores simples la función matemática que define el indicador sintético DP2 proporciona un único resultado numérico.
Invarianza (IV): el indicador sintético es invariante a cambios de origen y/o escala en las medidas de los componentes. Si se realiza una transformación del tipo donde b es un parámetro positivo y Xi el vector que recoge los valores de la variable i-ésima antes de la transformación, el indicador permanece inalterado debido a que los indicadores parciales no se modifica:
ya que el coeficiente de determinación y el de alejamiento son inalterables a cambios de escala y de origen, y el cociente no se ve alterado ya que tanto como quedan multiplicados por la constante b.
Homogeneidad (V): El indicador sintético DP2e es una función homogénea de grado 1 respecto a los indicadores simples, es decir si a todos los indicadores parciales DPj se les multiplica por una constante el indicador sintético queda multiplicado por esa constante. La DP2 por etapas lo verifica porque lo cumple la DP2
Por tanto el indicador sintético DP2 por etapas es una función homogénea de grado 1 respecto a los indicadores simples, es decir, verifica la propiedad de homogeneidad.
Transitividad (VI): Si (a), (b) y (c) son tres situaciones distintas del objetivo medido por el indicador sintético e DP2e(a), DP2e (b) e DP2e(c) son los valores del indicador sintético correspondientes a esas tres situaciones se verifica que:
Exhustividad (VII): El indicador sintético debe de ser tal que aproveche al máximo y de forma útil la información suministrada por los indicadores simples. Es decir debe de aprovechar la información proporcionada por los indicadores parciales sin duplicar la información.
Para que verifique esta propiedad debe de verificar las siguientes cuatro propiedades:
Independencia:
Respecto de los componentes: Si todos los indicadores por componentes son mutuamente independientes, el indicador sintético de distancia por etapas es la suma de los indicadores de las componentes. Veamos si se cumple:
ya que los coeficientes de alejamiento en ese caso son todos unitarios.
Respecto de las variables: Si todas las variables son mutuamente independientes, el indicador sintético de distancia por etapas es la suma de los indicadores simples ya que:
ya que los coeficientes de determinación implicados en el cálculo de la DP2 son todos nulos y los coeficientes de alejamiento entre los indicadores de alejamiento son unitarios.
En ese caso la DP2e coincide con la Distancia de Frechet, que designaremos con F y que es el máximo valor que puede tomar DP2, en este caso daría igual calcular la DP2 que la DP2 por etapas ya que los valores coinciden.
Dependencia funcional:
Entre componentes: Si entre los componentes existe una relación funcional exacta, de forma que uno de ellos es función de otro u otros, entonces el componente dependiente recoge la información contenida en los independientes y éstos pueden ser eliminados. En el caso límite de que un componente parcial contenga la información que recogen todos los demás, el indicador sintético de distancia debe expresarse solamente en función de aquél.
En el indicador DP2e cuando existe correlación total entre los componentes el coeficiente de alejamiento es igual a 0 y por lo tanto estos factores correctores se anulan, de forma que la DP2e coincide con el la DP2 de una componente cualquiera, ya que en este caso cada componente es una transformación lineal de las demás.
Entre variables: Si entre las variables existe una relación funcional exacta, de forma que uno de ellas es función de otra u otras, entonces la variable dependiente recoge la información contenida en las independientes y éstas pueden ser eliminados. En el caso límite de que una variable contenga la información que recogen todos los demás, el indicador sintético de distancia debe expresarse solamente en función de aquél.
En el indicador DP2e cuando existe correlación total entre las variables los coeficiente de alejamiento son iguales a 0 mientras los coeficientes de determinación son iguales a 1 por lo que la DP2e coincide con la DP2 de esa variable.
Dependencia parcial:
Dependencia Parcial: Si algunos componentes contienen información parcial de otros, el indicador sintético de distancia debe de ser modificado para eliminar la doble información. El indicador DP2 por etapas verifica esta propiedad ya que el factor de alejamiento va eliminando de cada componente la parte de información recogida por los componentes precedentes.
De partición
Si los componentes pueden agruparse en conjuntos de información independientes, el indicador sintético de distancia podría particionarse en tantos como grupos independientes existan, siendo igual aquél a la suma de éstos.
Si los componentes están agrupados en dos subconjuntos ortogonales. Entonces la matriz P de componentes puede particionarse en dos matrices ortogonales . Dado que el coeficiente de alejamiento entre los bloques P1 y P2 sería igual a la unidad, la DP2e sería:
No insistiremos más en esta propiedad, ya que en ésta se fundamenta el procedimiento de cálculo de la DP2 por etapas.
Aditividad (VIII): El indicador sintético DP2 por etapas entre dos países debe de ser tal, que el indicador sintético de cada país verifique los postulados I a VII y además que la diferencia obtenida entre ellos directamente por el indicador de distancia sea igual a la que se obtendría al comparar los indicadores sintéticos de cada país.
Sean y los indicadores sintéticos de las unidades territoriales r y k de forma que
Asimismo sea
En general esta propiedad no se verifica ya que
Para que se verifique esta igualdad la base de referencia debe de ser elegida de forma que sea para todos los componentes el valor máximo o superior a este o el valor mínimo o inferior a este, de forma que las diferencias , tengan el mismo signo.
Zarzosa (1996) demuestra, como ya se ha indicado, que para el caso de la DP2 la relación que existe entre ambos es
Esta autora teniendo en cuenta la condición de desigualdad triangular, que verifica la distancia de un espacio métrico, acota superiormente a la DP2 con lo que obtiene:
Veamos si la DP2e la verifica:
Es decir:
También se verifica que:
De estas dos últimas expresiones obtenemos:
Esta relación nos permite afirmar que el valor del indicador sintético de distancia entre dos países es al menos la diferencia en valor absoluto entre los indicadores sintéticos de distancia de los dos países calculados con respecto a la misma base de referencia.
Recordemos que dentro de las condiciones exigidas a la distancia de un espacio métrico se verificaba la condición de desigualdad triangular, que nos decía que dados tres países definidos en el mismo espacio vectorial, debe de verificarse que la suma de las distancias de dos de ellos al tercero ha de ser mayor o igual que la distancia que la distancia existente entre ambos. Asimismo la distancia DP2 por etapas es una distancia métrica ya que se basa en la familia de indicadores basada en la D1 .
Por lo que se verifica
Invarianza respecto a la base de referencia (IX): La distancia entre dos países r, k es invariante respecto a la base de referencia siempre que está sea la misma para los dos países y para cada variable tome el valor máximo o el valor mínimo o uno inferior a éste de la serie de valores.
Partiendo de Pena se demuestra que si la base de referencia es la misma para las dos unidades y siempre que, para cada variable tome el valor máximo, o uno superior a éste, o el valor mínimo o uno inferior a este de la serie de valores de dicha variable
o bien
entonces el valor de no depende de los valores de referencia ya que,
Ya que en ese caso
los signos de y son iguales, los dos positivos o los dos negativos.
Además los valores y coinciden, cuando para todas las variables se cumple o , situación que significa que, para todas y cada una de las variables una unidad territorial tiene mejor posición (o igual que otra).
Estudio de las propiedades de neutralidad y conformidad
A continuación, analizaremos dos propiedades muy interesantes en el diseño de un indicador sintético de distancia como son las propiedades de conformidad y neutralidad.
La propiedad de conformidad nos establece que el orden de entrada de las variables en el cálculo de la DP2 debe de ser tal que los coeficientes de correlación, en términos absolutos del indicador resultante y las variables que lo componen están ordenados de mayor a menor. Una ordenación que cumple esta condición de conformidad recibe el nombre de solución conforme.
En el cálculo tanto de la DP2 como de la DP2 por etapas se requiere una ordenación previa de los indicadores parciales. Dicha ordenación se consigue mediante un procedimiento iterativo que parte del indicador de Frechet, siendo la primera ordenación la determinada por los coeficientes de correlación en valor absoluto entre los indicadores parciales y el indicador de Frechet. En base a la propiedad de neutralidad o de no arbitrariedad en la importancia atribuida a los indicadores simples debemos de demostrar que esa combinación lineal de indicadores simples no interfiere en el cálculo de la DP2.
Zarzosa (1992) demuestra para el caso de la DP2 se puede partir del indicador de Frechet o de cualquier otra combinación lineal de indicadores parciales ya que la DP2 se estabiliza en un valor determinado, lo cual es independiente de la primera ordenación.
En este epígrafe, analizaremos si la DP2 por etapas verifica estas propiedades y como paso previo reflexionaremos si la DP2 modificada las verifica. Con el objetivo de simplificar el análisis nos situaremos en primer lugar en dos situaciones extremas: incorrelación (I) y correlación total (II), para posteriormente analizar el caso en que los coeficientes de correlación ni son nulos ni toman el valor absoluto (III). En todas las situaciones se trata de ver si es indiferente partir de cualquier combinación lineal de los indicadores parciales, donde:
En Zarzosa (1992) se obtiene que:
donde Ri recoge las correlaciones entre el indicador i-esimo y el resto de variables y el vector tipificado o centrado.
I. Incorrelación lineal:
Consideremos el caso en que todos los indicadores parciales están incorrelacionados, partiendo de Zarzosa (1992), si calculamos el coeficiente de correlación del indicador por el factor corrector obtenemos:
Con lo que el orden de entrada de las variables en el indicador sintético en la primera etapa dependerá exclusivamente de .
A la hora de calcular nuestro indicador sintético modificado obtendremos:
En la segunda fase procederemos a calcular los coeficientes de correlación entre los indicadores simples con el indicador sintético de distancia obtenido que no deja de ser una combinación lineal de los indicadores parciales en la que todos los son iguales a 1.
Con lo que se verifica:
o lo que es lo mismo el orden de entrada es indiferente.
Concluyendo cuando existe incorrelación entre las variables, no depende en absoluto del vector . A lo que se une que no existe solución conforme, todas las distancias posibles coinciden con el vector de Frechet y por tanto con la DP2. Sea cual sea el orden de entrada se obtiene exactamente la misma expresión para el cálculo del indicador sintético, siendo idéntica la Cantidad de Información Global de Ivanovic-Pena para todas ellas, por lo que cualquier caso es óptimo.
Seguidamente, nos vamos a plantear que ocurre en el cálculo de la DP2 por etapas. Vamos a distinguir dentro del caso de incorrelación lineal dos situaciones:
a) Incorrelación entre componentes, en ese caso:
Esta situación nos remitiríamos al caso general de la distancia DP2 modificada si ésta lo verifica las propiedades de neutralidad y conformidad la DP2 por etapas lo verificará por ser en este caso la DP2 por etapas un sumatorio de la DP2 modificada.
b) Incorrelación entre indicadores, en esta situación haremos referencia al supuesto de independencia entre variables en la propiedad de exhaustividad:
En este caso las conclusiones obtenidas en el caso de la DP2 modificada coinciden para el cálculo de la DP2 por etapas.
II. Correlación total:
Veamos si la DP2 modificada verifica las propiedades de neutralidad y conformidad en el caso de que los indicadores presenten correlación total.
En este caso los coeficientes de correlación entre la combinación lineal de indicadores C y el indicador i serán iguales a 1.
Junto a que el vector de factores correctores será de la forma (1, 0,…, 0) es decir, el resultado de la DP2 modificada (1) será:
si calculamos los coeficientes de correlación entre los indicadores y este indicador sintético obtenemos
Con lo que si las variables están totalmente correlacionadas por un lado la solución que facilitaría la distancia DP2 modificada es la de seleccionar, como primera y única variables una cualquiera, pues todas las demás variables van a estar perfectamente correlacionadas con el indicador sintético. Sin embargo la solución no es única pues cada una de las variables constituiría una opción válida que entra en el cálculo del indicador.
En este caso la Cantidad de Información de Ivanovic-Pena coincide con el coeficiente de discriminación de la única variable que entra en el cálculo del indicador sintético. Por tanto al DP2 modificada resulta ser la que contiene únicamente la variable con un mayor coeficiente de discriminación de Ivanovic de esta forma queda unívocamente determinada.
Veamos que ocurre con la DP2 por etapas al igual que en el caso de incorrelación diferenciaremos dos situaciones, correlación total entre indicadores y entre componentes:
a) Correlación total componentes:
En el indicador DP2e cuando existe correlación total entre los componentes el coeficiente de alejamiento es igual a 0 y por lo tanto este factor corrector se anula, de forma que la DP2e coincide con el la DP2 modificada de una componente cualquiera, ya que en este caso cada componente es una transformación lineal de las demás.
b) Correlación total entre indicadores:
Si entre los indicadores existe una correlación total de forma que uno de ellos es función de los otros, entonces el indicador dependiente recoge la información contenida en los independientes y éstos pueden ser eliminados y el indicador sintético de distancia debe expresarse solamente en función de aquél.
En el indicador DP2e cuando existe correlación total entre los indicadores los coeficientes de alejamiento son iguales a 0, mientras los coeficientes de determinación son iguales a 1 por lo que la DP2e coincide con la DP2 de esa variable:
III. Los casos estudiados anteriormente son casos de tipo teórico que difícilmente se cumplirán en la realidad. Con el objetivo de simplificar la notación y facilitar la compresión desarrollaremos el caso de que la DP2 por etapas esté constituida por dos componentes.
Para ello nos proponemos calcular en primer lugar el coeficiente de correlación entre una componente y la .
Teorema:
El coeficiente de correlación entre una componente cualesquiera y la distancia DP2 por etapas es igual a:
siendo
Demostración:
Dado que la es una combinación lineal de sus componentes, de forma que si tenemos tan sólo dos componentes tendremos:
donde
si
donde
donde
y donde
donde
Es fácil comprobar que el caso de calcular el coeficiente de correlación entre y
es:
Dada la propia estructura del coeficiente de correlación se puede comprobar que la ordenación de las componentes en la DP2 por etapas viene producida por la dispersión interna de las propias componentes y por los factores de alejamiento:
Si comparamos los coeficientes de correlación entre ambas componentes con la DP2e , obtenemos:
Recordemos
Como se puede observar prescindimos del valor absoluto, dado que tanto la varianza y el coeficiente de alejamiento por definición son positivos.
A continuación partiendo del resultado anterior nos planteamos analizar para el caso de dos componentes tanto la propiedad de neutralidad como la de conformidad:
Si partimos de un vector de partida cualesquiera para iniciar el procedimiento iterativo, de la forma
Debemos tener presente que nuestro objetivo es analizar la forma en que esta ordenación puede condicionar el resultado del indicador sintético y si se obtiene soluciones estables.
Partiendo de la definición anterior del coeficiente de correlación, el orden de entrada de las componentes en la primera iteración vendrá determinado por .
La condición para que entre en la primera iteración la antes que la será:
Si eso se verifica entonces la DP2 por etapas en la primera iteración vendrá dada por:
En la segunda iteración el orden de entrada de los indicadores vendrá dado por los coeficientes de correlación .
En la segunda iteración entraría primero DP2a si:
En ese caso la .
En la tercera iteración a entra primero que b si:
El orden se mantendría indefinidamente, por lo que el resultado es definitivo, ya que no es posible que
Puesto que este resultado se contradice con el obtenido en la primera iteración.
b) Si en la primera iteración
en la segunda iteración la DP2b entraría en esa iteración en primer lugar, produciéndose un cambio de orden.
En ese caso,
Si
Con lo que el orden de entrada en la tercera iteración es el mismo.
La dirección contraria,
no es posible ya que no es compatible con .
Por lo que podemos ver que el orden de entrada de los indicadores parciales en la medida de distancia por fases dependerá de la dispersión interna y de los factores de alejamiento y no de la ordenación dada en la primera iteración.
Por último, analicemos el caso en que a entra antes que la , la condición para que entre en la primera iteración la antes que la será
Si eso se verifica entonces la DP2 por etapas en la primera iteración vendrá dada por:
En la segunda iteración el orden de entrada de los indicadores vendrá dado por los coeficientes de correlación
a) En esta segunda iteración entraría primero si
En ese caso,
el orden se mantendría indefinidamente, por lo que el resultado es definitivo.
b) En esta segunda iteración entraría primero si:
entonces la segunda iteración sería:
para que la entre primero en la tercera iteración, produciéndose un cambio de orden, debe de cumplirse que:
Con lo que el orden de entrada en la tercera iteración es el mismo.
La dirección contraria
no es posible ya que no es compatible .
Por lo que podemos ver, el orden de entrada de los indicadores parciales en la medida de distancia por etapas dependerá de la dispersión interna y de los factores de alejamiento y no de la ordenación dada en la primera iteración.
Obtención del indicador sintético por etapas. Programa de cálculo
A la hora de estimar tanto la DP2 como la DP2 por etapas, se hace necesario un programa de cálculo específico. En este sentido existen ciertos trabajos previos :
En relación al cálculo de la DP2, citemos el trabajo realizado por Zarzosa y Zarzosa (1994), que diseñaron un programa específico denominado Feliz.for. Se trataba de un programa en Fortran diseñado de acuerdo al esquema de cálculo propuesto por Pena (1977).
En cuanto a la DP2 modificada, Rivera (2004) programa una función en Matlab para realizar su cálculo a la que denomina dp2mod.m
Sin embargo, y dado que nuestro objetivo era implementar la DP2 por etapas en base a la distancia modificada, procedemos a implementar este procedimiento de cálculo en Matlab, sin embargo nos encontramos que cuando calculamos la matriz de permutaciones de los indicadores para considerar todas las posibles ordenaciones entre las p variables almacenadas, la matriz resultante que las contiene, per se encuentra limitada ya que tanto Matlab como otro software estadístico consultado no calcula permutaciones mayores de 10.
Esto ocasiona en nuestro caso de estudio una limitación insalvable ya que no nos parece correcto desde un punto conceptual limitar el número de indicadores de cada una de las componentes de nuestro concepto de calidad de vida a 10.
Ante este obstáculo insalvable procedemos a buscar una solución más sencilla y que desde un punto de vista metodológico sea correcta, como es calcular la DP2 por componentes y con estos nuevos indicadores resultantes calcular una indicador sintético total. Ello facilita enormemente el cálculo y simplifica el proceso. Además nos permite obtener información detallada por componentes.
La lógica de esta forma de proceder es la siguiente si el objetivo a buscar se descompone en varias dimensiones (salud, educación,…) y se dispone de una medida adecuada para cada dominio, el indicador sintético puede obtenerse al aplicar la metodología al conjunto de medidas de cada dominio.
Para el cálculo de la DP2 por etapas se crean en Matlab, una función para el cálculo de la DP2 (dp2.m) que para una entrada de datos X que contiene p variables y n unidades geográficas proporciona el indicador de distancia para los diferentes países con el objetivo de alcanzar un buen nivel de calidad de vida, así mismo devuelve los factores correctos y los coeficientes de correlación de cada variable con la DP2 obtenida en la iteración anterior a alcanzar la convergencia. En base a esta función, en un fichero denominado dp2e se crea un fichero de instrucciones en el que se procede al cálculo de la dp2 por etapas, donde a partir de una matriz de total de datos X y indicando oportunamente las componentes se procede al cálculo de esta medida. (dp2e.m), asimismo nos proporciona para cada componente los factores correctores y los coeficientes de correlación.