David Flores Ruiz
Para determinar la población objetivo, así como el tamaño óptimo de la muestra de alojamientos turísticos a encuestar en el PNSAPA y en el PNSCSV, hemos seguido los siguientes pasos metodológicos:
Cálculo de la población objetivo a partir de la depuración de datos del RAT.
En el cuadro 6.1 se recogen los alojamientos turísticos que, a fecha de 15 de febrero de 2005, se encontraban inscritos en el Registro de Turismo de Andalucía -RAT-, así como los que, tras un proceso de depuración de datos, entraron a formar parte de la población objetivo a encuestar.
Estos datos del RAT nos fueron proporcionados por los servicios centrales de la Consejería de Turismo, Comercio y Deporte de la Junta de Andalucía, de tal forma que, con este registro como base, y mediante un proceso previo de depuración de los mismos mediante contacto telefónico con todos sus propietarios, se determinó los que se encontraban realmente en funcionamiento, los cuales entraron a formar parte de la población objetivo sobre la que calcular la muestra a encuestar, así como sus errores de muestreo. En este sentido, a continuación recogemos las deficiencias encontradas en el RAT durante el proceso de depuración de datos:
- Se encontraban inscritos alojamientos turísticos que no estaban en funcionamiento, de tal forma que sus propietarios no los habían dado de baja.
- Existían alojamientos turísticos duplicados al estar inscritos en más de una tipología de alojamiento -alojamiento hotelero, casa rural campamento y apartamentos-.
- El teléfono y la dirección de algunos alojamientos turísticos no se correspondía con los que tienen actualmente.
Una vez identificados y corregidos todos estos defectos del RAT y, por tanto, determinado el tamaño real de la población objetivo sobre la que abordar el análisis empírico, en el segundo paso determinamos los tamaños de las muestras a encuestar, así como sus errores de muestreo.
Cálculo del tamaño de las muestras a encuestar y errores de muestreo.
Para el cálculo del error y del tamaño de la muestra vamos a aplicar un Muestreo Aleatorio Simple [MAS (n,N)] en el caso de estimación de variables cualitativas -proporción-, dado que una gran parte de las variables con las que se trabaja en el cuestionario son de este tipo. Nuestro objetivo, por tanto, es construir un intervalo del tipo:
p
Donde P es la proporción de la población que queremos estimar, p es la proporción muestral y la precisión que queremos alcanzar. Y bajo el supuesto de MAS (N,n) la precisión debe ser:
para obtener un nivel de confianza de 1- , de donde se obtiene despejado que:
con . Como P es desconocida y, en cualquier caso, P(1-P)<1/4 -suponemos máxima dispersión- y (N-1) será próximo a N en poblaciones grandes -más de 30 unidades-, podemos dar una cota para el tamaño de la muestra del siguiente modo:
, con . Ambos supuestos no suponen una merma en la precisión deseada porque nos conducen a sobreestimar el tamaño de la muestra, por lo que aposteriori, el error de las estimaciones se verá reducido, en mayor medida, en las variables cuantitativas.
Por consiguiente, partiendo de un tamaño poblacional -cuadro 6.1- de N=103 para el PNSAPA y de N=161 para el PNSCSV, así como de un error máximo en las estimaciones poblacionales de 0,05 ( ), y un nivel de confianza del 95% (1- ) , el número de alojamientos turísticos a encuestar en cada uno de estos dos parques naturales, según la fórmula anterior, aparece recogido en los cuadros siguientes, junto con el reparto de la muestra, según el criterio de afijación proporcional, para cada una de las tipologías de alojamientos a encuestar en cada uno de los espacios naturales protegidos.
Una vez calculado el número de alojamientos a encuestar en cada uno de los parques naturales por tipologías, dado que también deseamos hacer estimaciones para cada una de esas tipologías, pasamos a calcular, siguiendo la fórmula anterior del muestreo aleatorio simple, los errores de estimación para las mismas.
Si tenemos en cuenta el reducido número de campamentos y apartamentos turísticos localizados en ambos parques naturales consideramos conveniente no entrar a analizar cada una de estas tipologías de alojamientos por separado, pues, a demás de que su representatividad sobre el total de alojamientos es muy reducida, para aproximarnos a la realidad de cada una de ellas habría que encuestar a su práctica totalidad, lo cual supone un gran esfuerzo en el trabajo de campo que no se ve recompensado con los resultados a los que puede llegarse.
En este sentido, el reducido tamaño de las poblaciones objetivo en ambos parques naturales deja de manifiesto que la ganancia, en términos de ahorro en el trabajo de campo, del muestreo frente al censo no es de la misma magnitud que en poblaciones de mayor dimensión. Además, con el inconveniente añadido de que, tal y como se recoge en los cuadros anteriores, la precisión para el análisis de los alojamientos hoteleros y casas rurales no alcanza el nivel de error deseado del 5%, ni en el PNSAPA -10,05% para sus alojamientos hoteleros y 5,97% para sus casas rurales- ni en el PNSCSV -7,64% para sus alojamientos hoteleros y 8,46% para sus casas rurales-
Todo ello nos llevó a replantearnos los tamaños muestrales en cada uno de estos tipos de alojamientos con el fin de reducir estos errores lo máximo posible, lo cual supuso en la gran mayoría de los casos aproximarnos a lo que sería un recuento exhaustivo que, al tratarse de una inversión privada, iba a ser muy difícil de alcanzar ante la falta de colaboración de algunos establecimientos. Por tanto, ante el tamaño reducido de las poblaciones objetivo, también cabe plantearse la precisión de las estimaciones en términos de cobertura de la población objetivo -censo poblacional- que, como se recoge en los cuadros 6.4 y 6.5, está siempre por encima del 80%, excepto para los alojamientos hoteleros localizados en el PNSCSV que se sitúa en el 77,14%.
Así pues, partiendo del tamaño muestral teórico, calculado anteriormente a partir de la fórmula del muestreo aleatorio simple -n teórico-, y aumentándolo para los alojamientos hoteleros y las casas rurales de ambos parques naturales con objeto de disminuir el error de muestreo, en los cuadros 6.4 y 6.5 aparecen recogido el número de encuestas que finalmente se hicieron -n final-, así como los errores de muestreo y los índices de cobertura para los alojamientos turísticos, en general y las casas rurales y alojamientos hoteleros, en particular.
En definitiva, como se recoge en los dos cuadros anteriores, el número de alojamientos hoteleros que finalmente se encuestaron pasó de 20 a 21 en el PNSAPA y de 49 a 54 en el PNSCSV, lo cual supone un error de muestreo del 8,76% y del 6,30%, respectivamente. Por su parte, el número de casas rurales pasó de 57 a 60 en el PNSAPA y de 39 a 54 en el PNSCSV, siendo los errores de muestreo del 5,20% y del 1,80%, respectivamente. Por lo que podemos comprobar cómo este esfuerzo a la hora de encuestar un mayor número de alojamientos hoteleros y de casas rurales en cada uno de estos parques naturales ha contribuido a disminuir los errores muestrales que cometíamos cuando distribuimos la población a encuestar siguiendo el criterio de afijación proporcional. De tal forma que este sobreesfuerzo nos ha permitido acercarnos al 5% de error en los alojamientos hoteleros del PNSCSV y en las casas rurales del PNSAPA, habiendo bajado del 10% al 8,76% en los alojamientos hoteleros del PNSAPA y situarnos en tan sólo un 1,80% en las casas rurales del PNSCSV.
Por consiguiente, el número total de alojamientos turísticos que finalmente se encuestaron en el PNSAPA fue de 85, y en el PNSCSV de 128, lo cual supone, según el muestreo aleatorio simple para variables cualitativas -proporciones-, en el supuesto de mayor dispersión [P(1-P)=1/4], un error máximo de muestreo del 4,46% y 3,92%, respectivamente, frente al 5% que supusimos en primer lugar para calcular el tamaño teórico de la muestra a encuestar.
Por su parte, en términos de cobertura, la representatividad, tal y como hemos comentado, también está asegurada, pues se ha logrado contar con el 83% de los establecimientos de la sierra onubense y el 80% de la jienense. Y, a su vez, los porcentajes de cobertura para las diferentes tipologías de alojamientos turísticos superan el 80%, excepto para los alojamientos hoteleros del PNSCSV que se queda en un 77,14%, lo cual nos permite acercarnos, prácticamente, al censo de alojamientos turísticos legales que, a febrero de 2005, se localizaban en el PNSAPA y en el PNSCSV.
Explotación de los datos
Una vez obtenidas las encuestas, cuya estructura aparece en el anexo I, el siguiente paso fue introducir toda la información generada por éstas en una base de datos Access, la depuración de esos datos y su posterior tratamiento mediante el paquete estadístico SPSS versión 13.0.
Dado el objetivo principal de esta parte empírica de la investigación -análisis comparativo de los factores con influencia en el desarrollo turístico del PNSAPA y el PNSCSV-, a la hora de analizar las características de los alojamientos turísticos localizados en estos dos espacios naturales protegidos nos limitamos a comprobar, mediante contrastes de hipótesis nula de igualdad de proporciones y medias entre las variables de los alojamientos turísticos localizados en ambos parques naturales, si existen diferencias estadísticamente significativas entre los mismos . Este análisis nos permitirá concluir si existen diferencias significativas en lo que respecta al “efecto empresa” y al “efecto industria” entre los alojamientos turísticos de ambos espacios naturales. De tal forma que a partir de ello contrastamos la importancia que han tenido estos dos grupos de factores en el mayor desarrollo turístico del PNSCSV.
Los contrastes de hipótesis realizados mediante el SPSS son de dos tipos: por un lado, el contraste de medias, utilizando la Prueba T para muestras independientes en el PNSAPA y en el PNSCSV y; por otro, las pruebas bilaterales de proporciones bajo hipótesis de normalidad para el estadístico de contraste. Así pues, mientras que en el primer tipo de contraste partimos de una hipótesis nula de igualdad de media, en el segundo partimos de una hipótesis nula de igualdad de proporciones. De tal forma que a partir de la interpretación de las salidas generadas por el SPSS se aceptarán o rechazarán las diferentes hipótesis nulas .
Estos contrastes de hipótesis se hacen fundamentalmente en este vértice del “diamante”. No obstante, tal y como hemos apuntado anteriormente, a la hora de aproximarnos a las condiciones de la demanda y a la coordinación y colaboración entre los sectores de apoyo y relacionados con la actividad turística, también se recurre a este contraste de hipótesis para determinadas variables del cuestionario.