Tesis doctorales de Ciencias Sociales


ANÁLISIS DE LAS DIFICULTADES FINANCIERAS DE LAS EMPRESAS EN UNA ECONOMÍA EMERGENTE: LAS BASES DE DATOS Y LAS VARIABLES INDEPENDIENTES EN EL SECTOR HOTELERO DE LA BOLSA MEXICANA DE VALORES

Alberto Ibarra Mares



Esta página muestra parte del texto pero sin formato.
Puede bajarse la tesis completa en PDF comprimido ZIP (575 páginas, 2.82 Mb) pulsando aquí

 

 

 

8.4.3. EXTRACCIÓN DE LOS FACTORES INICIALES Y NECESARIOS QUE REPRESENTEN A LOS DATOS ORIGINALES

Utilizando el análisis factorial de componentes principales a partir de la matriz de correlaciones se obtiene la matriz factorial (“factor matrix”), que es una reproducción de la primera de forma simple. Cada columna de esta nueva matriz representa a un factor y el número de filas corresponde por igual al número de variables independientes. Con este output también obtenemos una tabla de comunalidades (ver tabla 4) y una tabla de la varianza total explicada (ver tabla 5). En el caso del análisis factorial confirmatorio, en ambas tablas se dan diferentes resultados de acuerdo al número de factores seleccionados previamente.

Previo al análisis de las estimaciones de las comunalidades, primero es importante entender que la comunalidad es la proporción de la varianza explicada por los factores comunes. Las comunalidades iniciales dentro del análisis de componentes principales son siempre iguales a uno, por lo que este dato no representa información importante. En cambio, en los estadísticos finales la comunalidad sí tiene una significación importante. Esto se debe a que al final del proceso no queda explicada la varianza total de cada una de las variables debido a que sólo se ha conservado un pequeño conjunto de factores entre todos los posibles, y por lo tanto, la comunalidad de cada variable representará la proporción de varianza explicada por el conjunto de los factores finales resultantes. La comunalidad (h2) de cada variable se estima a partir de la matriz factorial, y esto es igual a la suma de los cuadrados de las saturaciones o ponderaciones factoriales de cada una de las variables, es decir:

La comunalidad puede oscilar entre cero y uno. Cuando obtenemos una comunalidad de cero quiere decir que los factores comunes no tienen ningún poder explicativo de la variabilidad de una variable. En cambio, si la comunalidad es uno, entonces la variable está totalmente explicada por los factores comunes que aparecen en la matriz factorial. Por último, la varianza que no queda explicada por los factores comunes se atribuye al factor único, el cual no aparece en la matriz factorial, y esto se puede expresar de la siguiente forma:

Si se logran obtener los factores o determinados grupos de variables correlacionadas para formar cada uno de los factores iniciales con un fundamento teórico sólido, se supera uno de los principales problemas para llevar a cabo la correcta aplicación del análisis factorial. También es importante mejorar la normalidad, pudiéndose alcanzar esto a través de transformaciones logarítmicas, o bien, reduciendo los valores extremos y mejorando la homocedasticidad de las distribuciones. Este último aspecto es un supuesto relativo principalmente a las relaciones de dependencia entre las variables. Con variables independientes métricas, la homocedasticidad se basa en la dispersión de la varianza de la variable dependiente a lo largo del rango de los valores de la variable independiente. En el caso de nuestro estudio, y por lo que respecta a la tabla de comunalidades, comentamos a continuación los eventos más importantes que observamos.

Entre más factores se establecieron, se incrementó la comunalidad final de cada una de las variables originales. Es decir, si consideramos que la comunalidad es el porcentaje de las variables iniciales explicadas por las nuevas variables (factores), entonces cuando aumentamos el número de estas nuevas variables, también se incrementa la proporción de la varianza explicada. Por otra parte, se observó que al calcular las comunalidades por medio de los valores propios (“eigenvalue”), el cual dio como resultado 6 factores, la varianza explicada varió muy poco con relación a los resultados obtenidos a través del análisis factorial confirmatorio con 7 y 8 factores, a excepción de los ratios R30 y R50 en donde las diferencias fueron bastante notorias como se puede apreciar en el cuadro 8.7.

Lo anterior indica que estos dos ratios se explican muy bien al establecerse entre 7 a 10 factores. En este último caso ambos ratios llegan a explicarse casi en su totalidad. Por otra parte, en el caso de los ratios R51 y R58, se obtiene una varianza explicada idéntica al estimar las comunalidades a través de un factorial exploratorio y un factorial confirmatorio con los 7 factores que establecimos a través de nuestro marco teórico, variando en muy poco la varianza explicada al incrementarse el número de factores como lo podemos observar en el cuadro 8.8.

En cuanto al número de factores que explican en más del 85% a las variables originales, observamos que con 7 factores se obtuvieron mejores resultados en comparación con el “eigenvalue”. Con respecto a los resultados obtenidos con 7 y 8 factores, la diferencia fue mínima pues sólo se incrementaron los porcentajes de la varianza explicada en tres variables dentro del conjunto de 8 factores, según lo muestra el cuadro 8.9.

Por último, las comunalidades que obtuvimos con 3 y 4 factores fueron muy bajas en comparación con el “eigenvalue” y el análisis confirmatorio con 7 y 8 factores, ya que se obtiene respectivamente en el primero y segundo caso: 18 y 13 variables independientes con porcentajes menores al 85% (ver tabla 4). Esto nos vuelve a indicar que el número de factores adecuados para obtener la matriz factorial oscila entre 6 y 8 factores. Sin embargo, para obtener aún más evidencia empírica sobre esta hipótesis es necesario pasar a analizar la tabla de la varianza total explicada y su respectivo gráfico de sedimentación denominado: “scree plot”.

La tabla de la varianza total explicada la podemos dividir para su análisis básicamente en dos partes. En la primera de ellas se encuentran los estadísticos iniciales de los factores seleccionados, en donde primero encontramos la lista de factores o componentes. En seguida se presentan los valores propios (“initial eigenvalues”) en valores absolutos (“total”) y valores relativos con sus respectiva acumulaciones (“% of variance” and “cumulative %”). Posteriormente, y para completar la primera parte de la tabla, se presenta la varianza explicada de todos los factores seleccionados en el análisis confirmatorio o en el análisis exploratorio. Esta parte de la tabla de ninguna forma se ve alterada en las estimaciones por la inclusión o exclusión de factores.

Es importante destacar que en esta tabla los componentes ya no representan a los valores de las variables originales, sino a las variables independientes de acuerdo a su comunalidad final. Por otra parte, considerando la varianza acumulada de los factores seleccionados es posible obtener el grafico de sedimentación “scree plot” para facilitar la interpretación de la varianza explicada por cada factor. Por lógica podemos deducir que dicho gráfico tampoco se ve modificado por el número de factores seleccionados. Además, esta gráfica elimina todas aquellas variables con “eigenvalues” menores a uno.

El “scree plot” representa en el eje de las “x” el número de los factores en orden ascedente, y en el eje de las “y” los valores propios (“eigenvalue”) en orden descedente. Como se puede observar en la tabla 2, el gráfico mostró que con 6 factores se puede explicar el 80.34% de la información total, pues a partir del factor 7 el punto de “quiebra” es casi horizontal, y esto le sugiere al analista que la información restante ya no es tan importante. Sin embargo, si analizamos la tabla 5 de la varianza total explicada, veremos que incluyendo el factor 7 y 8 se incrementa la varianza total explicada a un 84.87% y un 89.15% respectivamente, es decir, se puede obtener hasta un 8.81% de información explicada adicional. A partir de esto podemos decir que el número óptimo de factores se sitúa entre 6, 7 u 8.

La segunda parte de la tabla sobre la varianza total explicada incluye la suma de cuadrados de los pesos rotados (“rotation sums of squared loandings”). En esta parte de la tabla se obtienen diferentes resultados dependiendo del número de factores seleccionados. Esto es debido a que la rotación varía de acuerdo a los factores que se incluyen en el análisis.

Por ejemplo, el porcentaje de varianza explicada acumulada después de la rotación y centrándonos en el componente 3, disminuyó con el “eigenvalue” (54.15%), con 10 factores (52.58%), 8 factores (53.63%), 7 factores (53.97%), 4 factores (55.68%), y únicamente con 3 factores se igualó (58.75%). Ahora bien, si consideramos 4 componentes después de la rotación, obtendremos también disminuciones en cada caso, excepto cuando se llega al mismo número de componentes y de factores. Por ejemplo: con el “eigenvalue” obtuvimos un porcentaje de la varianza total explicada de 64.53%, con 10 factores del 62.27%, 8 factores del 63.69%, 7 factores 64.14% y con 4 factores del 67.52%, que es igual a la varianza total explicada antes de la rotación. Esta misma situación se repite también en el caso de los factores 7, 8 y 10 (ver tabla 5).

Lo anterior indica que al utilizar más factores con respecto al “eigenvalue”, disminuirá la varianza total explicada parcial y acumulada hasta que coincidan el número de componentes y factores, que es el punto donde se iguala la varianza explicada después de la rotación, es decir, no se perderá información acumulada.

Por otra parte hay que considerar que a partir del factor 7 en adelante, el componente tiene un “eigenvalue” menor a uno. Esto nos indica que en caso de seleccionar más de 6 factores, lo debemos hacer siempre y cuando el porcentaje de varianza explicada se incremente significativamente, de lo contrario no estaríamos utilizando eficientemente el factorial.

Una vez analizadas las comunalidades, la varianza total explicada y el “scree plot”, procederemos a analizar la matriz factorial sin rotar. Los resultados que obtuvimos fueron los que a continuación explicamos.

En primer lugar, para llevar a cabo la lectura de esta matriz dividimos en dos partes su análisis. En la primera parte observamos que existe una similitud en los pesos factoriales de todos los análisis confirmatorios (3, 4, 7, 8 y 10 factores) con respecto a los pesos factoriales que se obtienen a través del análisis exploratorio, siempre y cuando los primeros no excedieron en el número de factores que se obtuvieron a través del “eigenvalue”, que en este caso fue de 6 factores. También es importante aclarar que para facilitar la lectura de las matrices factoriales se utilizó una condición de sintaxis en el SPSS para eliminar valores absolutos menores a .40. Dicha restricción se estableció dentro del menú de opciones del análisis factorial denominada: “supress absolute values less than...”.

En la segunda parte del análisis observamos que en el caso de que se presenten más de 6 factores, aparecen más valores en algunas de las variables independientes, los cuales pueden ser más altos o más bajos a los obtenidos por las variables dentro de los factores estimados en el “eigenvalue”. Por ejemplo: en la matriz con 10 factores, que es la más grande, aparecieron 6 nuevos valores que corresponden a las siguientes variables R28 = .479 (factor 10), R50 = .678 (factor 7), R50 = .526 (factor 9), R30 = .570 (factor 7), R30 = .601 (factor 8), R15 = .418 (factor 9). Al seleccionar 7 factores obtuvimos dos nuevos valores en dos ratios que fueron: R50 =.678 y R30 = .570, en ambos casos en el factor 7. Al considerar 8 factores, lógicamente obtuvimos los dos valores anteriores en las mismas variables y factores, pero además se obtuvo un valor adicional en el R30 = .601 dentro del factor 8 (ver área sombreada de la tabla 6).

Por otra parte observamos, según lo muestra la tabla 6 y su anexo A, que previo a establecer el nombre del factor de acuerdo a los ratios que lo integran en cuanto a una mayor correlación, en el factor 1 se agruparon la mayor cantidad de ratios. Aquí predominaron 6 de rentabilidad y 5 de solvencia de un total de 13 ratios. En este caso el ratio de solvencia R57 fue el que obtuvo una mayor correlación con el factor (.802), le precedió el ratio de rentabilidad R9 = .783. A continuación se situaron diversos ratios con altas correlaciones como el R36 = .755 (liquidez), R51 = .751 (solvencia) y el R64 = .722 (endeudamiento). En el caso del factor 2 se agruparon un total de ocho ratios, cuatro de los cuales fueron de rentabilidad, uno de productividad y eficiencia, dos de solvencia y uno de endeudamiento. Aquí el R4= .669 (rentabilidad) fue el que obtuvo mayor correlación con el factor, seguido del R58 = .650 (solvencia), R1 = .638 (rentabilidad) y R70 = .635 (endeudamiento). En el factor 3 predominaron en cuanto a número y correlación más alta los ratios de liquidez (R35 = .865 y R38 = .737).

En el caso del factor 4 no hubo un predominio en la correlación de determinado grupo de ratios, pues ésta fue muy similar entre los ratios que fueron: R51 = .502, R64 = .474 (solvencia), y R38 = .479 (liquidez). Para el factor 5 predominaron en número y correlación los ratios de productividad y eficiencia (R14 = .798, R15 = .403) y uno de liquidez (R28 = .531). Por último, y para dar por finalizada la descripción de los resultados del análisis exploratorio, en el factor 6 predominaron dos ratios: uno de rentabilidad (R12 = .661) y otro de cash flow (R50 = .412).

Con base en los anteriores resultados, se puede deducir que a excepción de los factores 3 y 5 se presentó una combinación difícil de ratios dentro de los factores. Esto a su vez provoca problemas para asignarle al factor una denominación, esto de acuerdo al marco teórico financiero con el que llevamos a cabo la taxonomía para las variables independientes. A partir de esta situación procedimos a incrementar el número de factores a 7, 8 y 10 dentro de la matriz factorial sin rotar, con el fin de obtener más evidencia empírica sobre la correlación entre las variables independientes y los factores. En el primer caso se mejoró la correlación del ratio de cash flow R50 al incrementarse su correlación dentro del factor 7 a .678; además el R30 mostró una correlación superior a .40, que como se recordará es el límite mínimo establecido para los valores. Este ratio obtuvo correlaciones de .570 y .601 dentro del factor 7 y 8 respectivamente. Por último, al utilizar 10 factores se observó que no se obtuvo una mayor correlación con tres ratios que anteriormente ya habían dado significativas correlaciones (R28, R50, R15).

En términos generales, en la matriz sin rotar las nuevas variables dentro del factor se conocen también se conoce como las “nuevas puntuaciones factoriales” o “constructos”. Para Hair (2000: p.770) el constructo es un concepto que el analista puede definir en términos conceptuales, pero que no puede ser directamente medido, ya que sólo representa las bases para formar relaciones causales en la medida en que son las representaciones más “puras” posibles de un concepto. También este mismo autor apunta que los constructos pueden definirse con diversos grados de precisión, que parten desde los conceptos más simples (como las cantidades o magnitudes monetarias) hasta conceptos más complejos y abstractos, como por ejemplo: las emociones, los gustos de los consumidores, entre otros. En conclusión, cualquiera que sea el nivel de especificidad del constructo, éste nunca podrá ser medido directa y perfectamente, aunque sí aproximarse a través de indicadores.

Con base en lo antes descrito y para facilitar al analista la interpretación de dichas puntuaciones factoriales procedimos a rotar la matriz. A continuación explicamos en que consiste este proceso a través de utilizar la evidencia empírica de nuestro trabajo de investigación.


Grupo EUMEDNET de la Universidad de Málaga Mensajes cristianos

Venta, Reparación y Liberación de Teléfonos Móviles
Enciclopedia Virtual
Biblioteca Virtual
Servicios