"Contribuciones a la Economía" es una revista
académica con el
Número Internacional Normalizado
de Publicaciones Seriadas
ISSN 1696-8360
ANÁLISIS CLUSTER EN LA HOTELERÍA
Ángela María González Laucirica (CV)
amgldscr@yahoo.es
Universidad Tecnológica ECOTEC
Resumen.
Este artículo presentado a continuación, aborda el tema del análisis cluster aplicado al sector de la hotelería.
Al inicio se esbozan conceptos relacionados con el tema para que el lector comprenda las generalidades de esta técnica: el análisis cluster, aunque como herramienta de la estadística avanzada, requiere conocimientos básicos por parte del lector.
Lo novedoso de presentar esta técnica aplicada al turismo y la hotelería, es demostrar cómo desarrollarla y luego interpretarla para futura toma de decisiones, utilizando el software estadístico profesional SPSS.
Constituye una especie de tutorial para los lectores que se hallen cursando alguna carrera universitaria o maestría en Turismo y Hotelería.
Palabras clave: análisis cluster, hotel, estadística, SPSS.
Abstract.
This article presented below, addresses the issue of cluster analysis applied to the hospitality sector.
Early outlines concepts related to the topic for the reader to understand the generality of this technique: the cluster analysis, although as advanced statistics tool requires basic knowledge of the reader.
The novelty of presenting this technique applied to tourism and hospitality, is to demonstrate how to develop and then interpret it for future decision-making, using professional statistical software SPSS.
It is a kind of tutorial for readers who are carrying their college career or a master's degree in Tourism and Hospitality.
Keywords: cluster analysis, hotel, Statistics, SPSS.
Para ver el artículo completo en formato pdf comprimido zip pulse aquí
González Laucirica, A.: "Análisis Cluster en la hotelería" ,en Contribuciones a la Economía, noviembre 2013, en www.eumed.net/ce/2013/analisis-cluster.html
Concepto de análisis cluster.
El análisis cluster (llámese también análisis de conglomerados) es una técnica multivariante que utiliza la información de una serie de variables para cada sujeto u objeto y, conforme a estas variables, se mide la similitud entre ellos. Una vez medida la similitud, se agrupan en: grupos homogéneos internamente y diferentes entre sí.
La idea conceptual básica de este tipo de análisis, parte de suponer que en muchas ocasiones, un solo individuo u objeto, constituye una unidad de observación demasiado reducida. Se trata entonces de agrupar a los sujetos originales (u objetos) en grupos, centrando el análisis en esos grupos y no en cada uno de los individuos (u objetos).
Debe aclararse que los resultados logrados para una muestra, sólo sirven para ese diseño (su valor atañe sólo a los objetivos del investigador). Se habla de resultados en cuanto a: la elección de individuos (u objetos), variables relevantes utilizadas, criterio de similitud empleado, nivel de agrupación final elegido, etc. Existen dos tipos de análisis cluster:
Por último, resulta útil destacar que el análisis cluster y el análisis discriminante aunque parecen muy similares, realmente no lo son. El análisis discriminante intenta explicar una estructura, y el análisis cluster pretende determinarla.
Concepto de análisis cluster jerárquico.
El análisis cluster jerárquico, permite aglomerar tanto casos como variables, y elegir entre una gran variedad de métodos de aglomeración y medidas de distancia. En éste se procede de forma jerárquica. Es una técnica aglomerativa que comienza partiendo de los elementos muestrales individualmente considerados, y va creando grupos hasta llegar a la formación de un único grupo o conglomerado, constituido por todos los elementos de la muestra.
Concepto de análisis cluster K-medias.
El análisis cluster K-medias, es un método de agrupación de casos que se basa en las distancias existentes entre ellos en un conjunto de variables. Permite procesar un número ilimitado de casos pero utilizando un único método de aglomeración. Requiere, además, que se proponga previamente el número de conglomerados que se desea obtener.
Para muestras grandes, este método resulta más aconsejable que el jerárquico.
Es importante señalar, que esta técnica de aglomeración no permite agrupar variables a diferencia del jerárquico.
Algunas puntualizaciones de interés acerca del análisis cluster.
En la matriz de coeficientes de distancia euclídea al cuadrado (o cualquier otro tipo de medida de distancia seleccionada), los coeficientes más elevados responden a mayores distancias o mayor diferencia entre los casos analizados. Por el contrario, coeficientes con más bajo valor, corresponden a menores distancias o mayor parecido entre dichos casos.
La lectura del gráfico de carámbanos vertical, se realiza de abajo hacia arriba, de modo que la última fila, corresponde al primer nivel de agrupación de los casos, y la primera fila, al último nivel. Siempre en el último nivel, quedan agrupados todos los casos de la muestra en un solo cluster.
Un cluster puede formarse a partir de dos casos en uno solo, o añadiendo un caso a un multicluster ya existente, o uniendo dos multicluster ya existentes.
En la tabla de aglomeraciones previstas, el valor del coeficiente a cada nivel, ayuda a decidir cuántos clusters pueden constituir la mejor solución para representar los datos.
La lectura del dendograma se realiza de izquierda a derecha donde las líneas verticales representan la unión de dos clusters. La posición de la línea vertical sobre la escala de valores de 0 a 25, indica a qué distancia los clusters se han unido.
Ejemplo 1:
En el polo turístico de Varadero, un grupo de analistas de la Delegación del MINTUR, está realizando un estudio que incluye diez instalaciones hoteleras. Basándose en los datos recopilados de ocho variables que han sido medidas en cada uno de los diez hoteles, el objetivo de los miembros del grupo, consiste en agrupar dichas entidades según su similitud o semejanza. Los datos se muestran a continuación:
Variables:
En la imagen anterior, se observa la tabla “Proximity Matrix” donde se muestran los coeficientes de distancia euclídea al cuadrado, entre los distintos hoteles de la muestra. Por ejemplo, la distancia o diferencia mayor con un coeficiente igual a 44.317, es la existente entre los hoteles Iberostar Río Azul y Meliá Estrella de Mar. Por el contrario, los más próximos o parecidos, son los hoteles Sol Cayo de Oro y Sandals Arenas con un coeficiente igual a 4.745.
En la imagen anterior, se muestra el gráfico de carámbanos o tabla “Vertical Icicle” donde se puede ir determinando los diferentes clusters a cada nivel. Obsérvese que el:
En la imagen anterior, se muestra la tabla “Agglomeration Schedule” donde se observa que, por ejemplo, en el primer nivel se unen para formar un cluster, los hoteles 9 (Sol Cayo de Oro) y 10 (Sandals Arenas). Ambos casos se unen a otros hoteles por primera vez para formar un multicluster, en el nivel siete, cuando se les suma los hoteles Oasis Laguna Azul, Riu Varadero, Tryp Palma Real, Iberostar Río Azul, Iberostar Playa Azul y Sirenis Abanico de Coral.
En esta misma tabla se observa el valor del coeficiente para cada nivel, de modo que mientras menor sea el coeficiente, indicará la existencia de clusters más homogéneos. Cuanto mayor sea el valor del coeficiente, pues más heterogéneos serán éstos.
Supóngase que el grupo de analistas de la Delegación del MINTUR, desea obtener una cantidad de clusters específicos de la muestra de hoteles tomada, en este caso, 3 clusters.
En la imagen anterior, se muestra la tabla “Cluster Membership” donde se observa que el:
Obsérvese en la imagen anterior, que a la base de datos original, el programa ha añadido una nueva columna llamada “clu3_1”. La misma refleja igual contenido que el de la tabla “Cluster Membership” analizada previamente, o sea, a qué cluster pertenece cada hotel dado que han sido seleccionados 3 clusters.
Ahora véase un ejemplo de análisis cluster K-medias.
Ejemplo 2:
El grupo de analistas de la Delegación del MINTUR, ha decidido ahora ampliar la muestra de hoteles a estudiar a treinta y tres. Continuando el análisis de las ocho variables en las entidades hoteleras.
Basándose en los datos recopilados de ocho variables que han sido medidas en cada uno de los treinta y tres hoteles, el objetivo de los miembros del grupo, consiste en agrupar dichas entidades según su similitud o semejanza, pero predeterminando la cantidad de clusters a 4.
En las dos imágenes anteriores, se muestra la tabla “Cluster Membership” donde aparece cada hotel asignado a su cluster. Véase que el:
En la imagen anterior, se muestra la tabla “Number of Cases in each Cluster” donde aparece un resumen final. Obsérvese que en el cluster 1 están aglomerados cinco hoteles, en el cluster 2 doce hoteles, en el cluster 3 catorce hoteles y en el cluster 4 sólo dos hoteles, para completar la muestra de treinta y tres instalaciones hoteleras en la que fueron estudiadas ocho variables.
Se demostró la pertinencia de realizar un análisis cluster aplicado a la hotelería como herramienta de gestión que permite la acertada toma de decisiones por parte de los directivos hoteleros.
Se evidenció la utilidad práctica del empleo del software estadístico profesional SPSS para simplificar el tratamiento de los datos y obtener una información más veraz, explícita y rápida para quienes toman decisones.