|
Las fuentes de datos - Preferencias Reveladas
Las Preferencias Reveladas (PR) son datos que reflejan el comportamiento actual de los individuos en sus decisiones de viaje. Estos se obtienen a partir de encuestas que permiten recoger información de las variables que explican la utilidad de las distintas alternativas y de las elecciones realizadas. Hasta la mitad de los años 80 éste fue el tipo de datos más utilizado en la modelización de la demanda de transporte. Sin embargo, presentan una serie de limitaciones en términos de comprensión del comportamiento de viajes (ver Ortúzar y Willumsem, 2001):
Las observaciones de las elecciones actuales pueden no presentar suficiente variabilidad para la construcción de buenos modelos que permitan evaluar proyectos y realizar predicciones.
Las variables más interesantes suelen estar correlacionadas, por ejemplo, el tiempo de viaje y el coste. En este caso, es difícil, separar dicho efecto en la modelización y por lo tanto también en la fase predictiva.
No es posible el estudio de variables latentes[1]. Pueden existir factores que dominen el comportamiento actual, lo que dificulta detectar la importancia relativa de otras variables igualmente importantes como el confort, la seguridad, la puntualidad del servicio, etc.
No permiten estudiar los efectos de nuevas políticas, como por ejemplo la introducción de un nuevo modo de transporte.
No existe información completa sobre las condiciones del mercado, lo que dificulta determinar el conjunto real de elecciones disponibles.
Están sujetas a potencialmente importantes errores de medida, especialmente de nivel de servicio. Esto se intenta resolver realizando el investigador las mediciones para el conjunto de alternativas disponibles.
2.1.2 Preferencias Declaradas
Las Preferencias Declaradas (PD) son datos que tratan de reflejar lo que los individuos harían ante determinadas situaciones hipotéticas construídas por el investigador. Las PD se desarrollaron inicialmente en el ámbito de la investigación de mercado y comenzaron a ser utilizadas en la modelización de transporte a fines de los años 70. A diferencia de los datos de PR, que entregan información sobre los viajes que realiza un individuo habitualmente, los datos de PD informan sobre los viajes que el individuo realizaría si, por ejemplo, se introdujera un nuevo modo de transporte, se mejorase la calidad del servicio, se ofreciese una ruta alternativa más rápida, etc.
La posibilidad de diseñar experimentos de PD permite, en principio, resolver los problemas que presentan las PR (ver Ortúzar y Willumsen, 2001):
ü Se puede ampliar el rango de variación hasta el nivel en el que existe un compromiso entre las distintas alternativas consideradas en el diseño.
ü En la construcción de los escenarios se puede evitar la existencia de correlación entre variables.
ü Permiten incorporar tanto atributos como alternativas no disponibles en el momento del análisis.
ü Se puede aislar el efecto de un determinado atributo así como considerar variables latentes.
ü El conjunto de elección se puede pre-especificar.
ü En el diseño, se pueden evitar los errores de medida.
No obstante, no podemos estar seguros de que el individuo se comporte como dice que haría cuando contesta a una encuesta de PD. Es importante, por tanto, diseñar ejercicios que sean plausibles y realistas para que el entrevistado se implique en el juego correctamente. Los tipos de errores clasificados para este tipo de datos son cuatro (ver por ejemplo Bradley y Kroes, 1990):
Sesgo de afirmación: El entrevistado contesta, consciente o inconscientemente, lo que cree que el entrevistador quiere.
§ Sesgo de racionalización: El entrevistado intenta ser racional en sus respuestas con el objetivo de justificar su comportamiento en el momento de la entrevista.
§ Sesgo de política: El entrevistado contesta con el objetivo de influir en las decisiones de política en función de su creencia de cómo pueden afectar los resultados de la encuesta.
§ Sesgo de no restricción: A la hora de responder no se toma en cuenta todas las restricciones que afectan a su comportamiento, de manera que las respuestas no son reales.
En un ejercicio de PD se pueden distinguir tres elementos principalmente. En primer lugar, tenemos la situación en la que el individuo se encuentra para declarar sus preferencias; ésta puede ser una situación real (un viaje que realice en este momento como ir al trabajo) o hipotética (un viaje que realizaría en el futuro dadas una serie de condiciones), y constituye el contexto de decisión. En segundo lugar, se deben seleccionar las alternativas, normalmente hipotéticas aunque algunas de ellas pueden existir en la actualidad, que se presentan en el ejercicio como función de un conjunto de atributos. En tercer lugar, está la forma en que los individuos pueden declarar sus preferencias (ver Ortúzar y Garrido, 2000); las más frecuentes son: Jerarquización (Ranking), Escalamiento o Elección Generalizada (Rating) y Elección (Choice).
Un punto importante del experimento de PD es la selección de los atributos a considerar en cada alternativa del ejercicio. Una forma de identificar los atributos más relevantes es realizando un grupo de discusión (focus group) con una muestra representativa de individuos. Un grupo de discusión no es más que una reunión de individuos dirigida por un moderador de manera que los participantes hablen sobre el tema considerado y durante el desarrollo de la misma se obtengan tanto los elementos clave en el análisis como una mejor comprensión del problema tratado.
El número de atributos a considerar para cada juego es determinado por el investigador; no obstante, la literatura recomienda que no debe ser muy elevado (no más de cuatro) por cada juego para evitar el efecto fatiga (Carson et al. 1994) o que contesten de manera lexicográfica (Saelensminde, 1999), tema que trataremos más adelante.
Las unidades de medida en que se expresan los atributos pueden ser triviales en algunos casos, como el tiempo o el coste, pero no lo son en otros como el confort, la seguridad, etc. Estos atributos requieren un estudio más detallado en grupos de discusión, unido a la realización encuestas piloto que ayuden a encontrar la métrica más adecuada[2]. La definición de niveles es también decisión del investigador; sólo se recomienda definir mayores niveles de variación para las variables consideradas más importantes en la elección a estudiar (Wittink et al, 1982), pero se debe cuidar que esto no sesgue los resultados del experimento.
El diseño factorial completo determina el número total de opciones dados los atributos y los niveles de variación para cada uno de ellos. Sí a es el número de atributos y n el número de niveles de cada atributo, el número total de opciones es na. Si tenemos un diseño con dos atributos a dos niveles y tres atributos a tres niveles, el número de opciones resultantes es 108 (22x33). En la práctica no es factible presentar a un individuo 108 opciones para que declare sus preferencias. Este número se puede reducir si consideramos un diseño factorial fraccional, que no es otra cosa que un diseño formado por un subconjunto de opciones del diseño factorial completo. La diferencia entre un diseño factorial completo y un diseño factorial fraccionado está en que mientras el primero permite medir todos los efectos principales e interacciones entre las variables, en el segundo se sacrifica la medición de algunas (o todas) las interacciones con el fin de reducir el número de opciones. Los efectos principales se definen como la respuesta de pasar al siguiente nivel de la variable en cuestión manteniendo constante el resto de variables, mientras que las interacciones consideran los efectos debidos a la variación conjunta de más de una variable; por ejemplo, en la elección modal el efecto de la interacción entre el tiempo y el coste. Normalmente, los cambios en la elección están determinados por los efectos principales y según Louviere (1988):
§ El 80% o más de la varianza de los datos lo explican los efectos principales.
§ Las interacciones de dos términos explican más de un 2% o 3% de la varianza.
§ Las interacciones de tres términos explican una proporción muy pequeña de la varianza, del orden del 0.5% al 1% y rara vez sobre el 2% o el 3%.
§ Las interacciones de mayor orden explican una proporción minúscula de la varianza de los datos.
Si sólo se desea analizar los efectos principales, el diseño de 108 opciones anterior se reduciría a 16, y a 27 opciones si se considera interacciones de dos términos (Kocur et al, 1982), que son números más manejables. No obstante, la literatura (Bradley y Daly, 1994) recomienda no presentar más de 10 (entre 8 y 10) situaciones de elección a cada individuo (ver la discusión de Cherchi y Ortúzar, 2002). En casos en que se requiera estudiar interacciones y el número de opciones sea elevado, se puede utilizar el diseño en bloques; para esto se subdivide la muestra y a cada submuestra se le presenta uno de los bloques (Louviere et al, 2000). El tamaño de cada submuestra recomendado (Kocur et al, 1982) es de un mínimo de 30 personas por grupo, aunque en la práctica este tamaño parece bajo (ver también la discusión de Ortúzar y Willumsen, 2001).
Las formas de obtener la respuesta en un experimento de PD son, como comentamos anteriormente, Jerarquización, Escalamiento y Elección:
Jerarquización: Se presentan todas las opciones simultáneamente al individuo y se le pide que las ordene en función de sus preferencias, de más a menos preferida. Al ordenar las opciones, el individuo está jerarquizando los valores de utilidad de forma que la opción más preferida le reportará un mayor nivel de utilidad.
Escalamiento: Se le pide al individuo que exprese su grado de preferencia para una opción utilizando una escala arbitraria que puede ser numérica (de 1 a 5 o de 1 a 10) o semántica; por ejemplo: 1 = siempre elijo A, 2 = probablemente elijo A, 3 = ninguna; 4 = probablemente elijo B, 5 = siempre elijo B.
Elección: El individuo selecciona una de las distintas opciones que se le presentan que pueden ser dos (elección binaria) o más de dos (elección múltiple). Se considera que ésta es la forma más sencilla de responder a una encuesta de PD para un individuo porque es la forma habitual en la que toma decisiones. En estos casos, puede incluirse la alternativa “ninguna de ellas” para no forzar al entrevistado a elegir cuando ninguna le parece conveniente.
Un aspecto importante en este tipo de diseños es la necesidad de hacer creíble las distintas opciones presentadas al individuo. Para ello podemos definir el contexto en el que el experimento se realiza y en ese contexto hacer factibles las opciones de elección. Por ejemplo, para que sea considerado viable que exista un bus que realice un recorrido en un tiempo menor que un vehículo privado, puede ser necesario que existan una serie de condiciones tales como: carriles exclusivos para el bus, preferencia en los semáforos, etc. Este tipo de elementos se pueden considerar en el contexto en el que se presenta el experimento haciendo más realistas las opciones.
[1] Las variables latentes son variables difíciles de medir o que no presentan suficiente variabilidad.
[2] En la siguiente sección se presenta el proceso de generación del diseño experimental, donde la definición de la variable latente considerada requirió de un trabajo minucioso..