"Contribuciones a la Economía" es una revista
académica con el
Número Internacional Normalizado
de Publicaciones Seriadas
ISSN 1696-8360
Jennifer Armas Méndez (CV)
jenniferarmasmendez@gmail.com
Gisela Santana Jiménez (CV)
1. INTRODUCCIÓN
En este trabajo, deseamos abordar la cuestión de cómo se está esbozando en nuestras vidas, la compra de bienes y servicios a un click del ratón del ordenador o del teléfono móvil. Las Tecnologías de la Información y la Comunicación (TIC en adelante) son las culpables de que sea un hecho efectuar actividades de consumo sin que sea preciso nuestra presencia física. Es posible comprar cualquier cosa sin tenerla delante, con cierto grado de fiabilidad, y que nos lo envíen a una dirección determinada. Las TIC nos permiten establecer relaciones telemáticas con empresas, organizaciones y administraciones públicas sin restricción de horarios, de una forma cómoda, segura y rápida. La cuestión es, hasta qué punto los residentes en España son consecuentes con este hecho y si constituye una herramienta de sus pautas de consumo. A raíz de los datos aportados por una encuesta del INE en este ámbito, deseamos estimar de qué depende que una persona compre o no a través de internet, qué tipo de bienes y servicios son adquiridos y en definitiva, cuáles son las características o circunstancias que invitan al consumo virtual. Otra de las cuestiones que deseamos inferir son si las diferencias socioeconómicas entre individuos son determinantes en nuestro fenómeno de estudio, o bien si es posible establecer alguna diferenciación por razón de sexo, es decir, ¿compran más los hombres que las mujeres? ¿El nivel de estudios o la edad son determinantes en el uso de transacciones telemáticas?
Palabras clave: Compras por internet, Modelos Zip.
Para ver el artículo completo en formato pdf comprimido zip pulse aquí
Armas Méndez y Santana Jiménez: "Estimación de compras por internet en los hogares españoles" ,en Contribuciones a la Economía, junio 2012, en http://www.eumed.net/ce/2012/
2. ANTECEDENTES
Las Tecnologías de la Información y la Comunicación contribuyen a aumentar nuestras capacidades, tanto físicas como mentales, y amplían el abanico de posibilidades a disposición de los ciudadanos para su desarrollo social. Conforman el pilar de una “cultura tecnológica” en la que las sociedades más avanzadas se encuentran inmersas.
Para hacerse una idea más o menos clara de lo que son las TIC, no debemos pensar únicamente en un concepto asociado a la informática y otras tecnologías agregadas, sino también a medios de comunicación de cualquier índole. Están sometidas a un ritmo vertiginoso en continuo proceso de cambio, a la par que el progreso científico y en un contexto de globalización económica y cultural. De este modo sobresalen como el soporte que ayuda al alzamiento de nuevos valores y convertir los conocimientos adquiridos en casi prehistóricos. Este fenómeno implica profundos reajustes en nuestras estructuras sociales, culturales y económicas, recayendo en prácticamente todos los aspectos de la vida cotidiana. El efecto de las TIC en las acciones humanas, empresariales e institucionales es tal, que ha supuesto un gran cambio en el modo de comprender la realidad y confeccionar una filosofía de vida, siendo impensable desprendernos de ellas para actuar de un modo óptimo. Acceder al mercado laboral, la educación, la comunicación, la búsqueda y tratamiento de la información, entre otras, son actividades que cuentan con valiosos recursos que, por otra parte, no debemos obviar la exigencia de tener ciertos conocimientos previos para su uso.
Si tuviéramos que elegir, de entre los componentes que integran las TIC, aquel que ocupara el primer puesto en un podio, sin duda ese sería Internet. Internet abre las puertas a un mundo donde es posible realizar casi todo lo que hacemos en el mundo real y además otras funciones contribuyentes a mejorar nuestra calidad de vida.
No obstante, pese a que hoy en día podemos dividirnos en dos mundos, el físico y el ciberespacio, no tener acceso a internet puede producir serias desventajas con relación a los demás. Pensemos por ejemplo en una región no conectada a la red, perdería competitividad en el exterior y carecería de capacidad de adaptación a un nuevo modelo de desarrollo. También podríamos hablar de personas en paro sin conexión con la consiguiente debilidad que ello supone para su acceso al mercado de trabajo. De esto último se deduce que no disponer de internet, o disponer de la red pero no conectarse bien por desconocimiento, por desconfianza hacia la fiabilidad de procedimientos o cualquier otra causa, comportan lo que podemos denominar una brecha digital que asiste al hecho de aumentar las diferencias entre individuos.
“Una vez que toda la información está en la red, una vez que el conocimiento está en la red, el conocimiento codificado, pero no el conocimiento que se necesita para lo que se quiere hacer, de lo que se trata es de saber dónde está la información, cómo buscarla, cómo procesarla, cómo transformarla en conocimiento específico para lo que se quiere hacer. Esa capacidad de aprender, esa capacidad de saber qué hacer con lo que se aprende, esa capacidad es socialmente desigual y está ligada al origen social, al origen familiar, al nivel cultural, al nivel de educación.” (Castells, 2001)
3. HIPÓTESIS DE LA ESTIMACIÓN: OBJETIVOS
Previamente a iniciar el proceso de estimación, hicimos un análisis de qué hipótesis de partida esperábamos refutar con respecto a nuestra intención principal de estimar de qué dependen los productos y servicios que se compran por Internet. Muy a grosso modo, las hipótesis y, por tanto, la intención última de lo que queremos obtener de nuestro estudio, son las siguientes:
En función de estas premisas previas y de lo explicado anteriormente, se hace necesario seleccionar las variables que van a intervenir en el proceso de estimación. En el apartado siguiente se explica cuál ha sido el procedimiento de selección de las variables relevantes y las razones que han motivado la elección del modelo.
4. METODOLOGÍA: DATOS Y CONFECCIÓN DEL MODELO
El punto de partida de nuestro estudio fue la “Encuesta sobre Equipamiento y Uso de Tecnologías de Información y Comunicación en los Hogares” del año 2010 (TIC-H). Esta encuesta se viene elaborando anualmente desde 2002 por el INE y recoge información sobre “los productos de tecnologías de información y comunicación de los hogares españoles de estos productos, de Internet y del comercio electrónico” (ine.es).
La Encuesta TIC-H 2010 se hizo a través de un muestreo trietápico estratificado . El tamaño de la muestra es de 25.000 viviendas y se dirige a las personas a partir de 10 años de edad residentes en la vivienda. De entre toda la información recolectada (equipamiento del hogar en tecnologías de la información y la comunicación y sobre el uso de ordenador, Internet y comercio electrónico) la estimación está centrada en lo referente al consumo de productos y servicios de distintas tipologías vía Internet por parte de los individuos con una edad igual o superior a 16 años recopilando así 19.384 observaciones. Ante la variedad y número de variables disponibles, hemos hecho un filtrado de las mismas (Ver Tabla 1 Anexo) hasta determinar, según lo que nos dicta más el sentido común que la teoría económica, cuáles son las variables más significativas. Así, entendimos que eran muy vinculantes la provincia de origen, sexo, edad, nacionalidad, nivel de educación, situación laboral, ocupación (nos interesa sobre todo si está relacionado con TICs), ingresos mensuales netos del hogar, posesión de aparatos de información y comunicación (televisión en la vivienda y cómo recibe los canales; ordenador en la vivienda y, si dispone de conexión a Internet, a través de qué vía), causas de no disponer de Internet, servicios a los que accede por Internet, productos y servicios comprados por Internet, descargas, problemas más frecuentes en Internet, etc. Cabe aducir que, salvo contadas excepciones, se trata de variables ficticias.
Pese a contar con el fichero de microdatos de la encuesta, en primera instancia tuvimos que modificar las variables para transformarlas en variables binarias (cero-uno). Originalmente, el INE codificó las respuestas afirmativas (en general a la posesión de, la compra de, etc.) con un 1, a las negativas con 6, y las respuestas en blanco y los “no sabe/no contesta” con el valor 9. Para nosotros, sin embargo, era más fácil trabajar con variables “cero-uno” que con 3 categorías . Por tanto, transformamos en Dummies dichas variables.
Por construcción del cuestionario, más de 9.000 missing values no indicaban realmente ausencia de respuestas. En la pregunta nº 31 se les preguntaba a los individuos si alguna vez habían usado internet; aquellos cuyas respuestas fuera NO pasaban directamente a contestar a partir de la pregunta nº 55. Por consiguiente, todas las preguntas intermedias carentes de datos las interpretamos como respuestas de tipo negativo.
Nuestra variable dependiente, el número de compras efectuadas por Internet, cuyos valores van desde 0 hasta 17, es una variable recuento determinada por un modelo Poisson. En una primera fase de construcción del modelo, se creó la variable COMPINT, de naturaleza binaria que toma el valor 1 si el entrevistado ha comprado algo en internet y 0 en caso contrario, de esa forma pudimos averiguar qué porcentaje de la muestra representa las compras virtuales. A continuación se adjunta una tabla donde se observa que el 82,35% de la muestra no realiza compras vía internet frente al 17,65% que sí lo hace. Por consiguiente, el modelo a estimar se denomina Modelo Poisson inflado de ceros (en adelante ZIP), donde la parte “inflada” está determinada por un modelo binario tipo logit.
Para realizar las estimaciones, contrastes y demás cálculos pertinentes, el software utilizado será el Stata/SE 11.1.
Otra de las modificaciones previas que introdujimos fue la compilación de las 17 variedades de “productos y servicios comprados en Internet” en una única variable, nuestra endógena del modelo, en la nueva variable “NCOMPINT” la cual representa el número de tipos de bienes y servicios adquiridos vía internet. Para ello, creamos la variable como la suma de todos los elementos de la encuesta que empezaban por PROD, puesto que éstos representan los tipos de bienes y servicios comprados. Cada dato PROD toma el valor 1 si éste es comprado y cero en otro caso. De este modo la variable respuesta toma el valor 0 si no ha comprado nada, 1 si el individuo ha comprado una única cosa por internet, 2 si ha comprado dos, y así sucesivamente hasta 17. En la siguiente tabla, se observa la clasificación de bienes y servicios.
Cabe aducir que, unido al “inflado de ceros” ya comentado, la variable endógena presenta otra anomalía muestral que es la sobre-dispersión dado que, como vemos en el siguiente cuadro, la varianza es superior a la unidad.
4.1 LA VARIABLE INGRESOS NETOS DEL HOGAR
A tenor de la posible relevancia en el nivel de ingresos sobre el consumo virtual, se hace necesario una mención especial a esta variable y cuál ha sido su tratamiento en la encuesta. Se consideran ingresos netos de cada hogar los siguientes (según la metodología del cuestionario):
“Ingresos mensuales netos: recibidos después de las retenciones a cuenta por impuestos, cotizaciones sociales y otros pagos asimilados. Incluidas todas las fuentes de ingreso (en el caso de existir más de una), considerando (para los ingresos del trabajo por cuenta ajena) la parte proporcional de las pagas extraordinarias y otros ingresos extraordinarios percibidos regularmente.”
“Se deberá contabilizar la suma de los ingresos regulares percibidos por todos los miembros del hogar en la actualidad, aporten ó no estos ingresos en su totalidad ó en parte para sufragar los gastos del hogar.”
En el cómputo del importe de estos ingresos mensuales se tendrá en cuenta:
- para los ingresos de trabajo por cuenta ajena, debe sumarse al importe mensual el prorrateo de los ingresos regulares que no tengan periodicidad mensual (pagas extraordinarias y otros ingresos extraordinarios que se perciban regularmente)
- para los ingresos de trabajo por cuenta propia, debe descontarse del importe de los ingresos mensuales, los gastos deducibles, retenciones ó pagos fraccionados.
CODIFICACIÓN DE LOS INGRESOS POR INTERVALOS
Menos de 1.100 euros..................................................... 1
De 1.100 a 1.800 euros................................................... 2
De 1.800 a 2.700 euros................................................... 3
Más de 2.700 euros......................................................... 4
NS/NR.............................................................................. 5
Tomamos como datos relevantes para esta variable las marcas de clase de cada intervalo con el fin de especificarla como continua. Para el último intervalo de renta, la marca de clase se ha propuesto como 3.500 €. Del total de los encuestados, 4.301 individuos han sido reacios a responder cuáles son los ingresos netos del hogar. Sin embargo, a pesar del sesgo que se produce en la muestra, hemos decidido incorporar la variable al modelo, dada su significación estadística.
4.2 LA VARIABLE NIVEL DE ESTUDIOS
El nivel máximo de estudios adquirido por los entrevistados está ordenado de menor a mayor formación según la siguiente clasificación:
Analfabetos ................................................................................... 1
Educación Primaria....................................................................... 2
Primera etapa de la Educación Secundaria................................... 3
Segunda etapa de la Educación Secundaria................................. 4
Formación Profesional de Grado Superior.................................... 5
Educación Superior Universitaria.................................................. 6
No se puede codificar.................................................................... 9
Unimos las categorías analfabetos y educación primaria en un grupo único y tomamos las observaciones que no se podían codificar como categoría de referencia para evitar que educación superior universitaria fuera omitida por multicolinealidad (problemas surgidos realizando pruebas). De esta forma, cada una de las categorías está codificada como una dummy, la cual toma valor 1 cuando se da el suceso y 0 en otro caso. Finalmente contemplamos en el modelo cinco categorías de formación.
4.3 LA VARIABLE SITUACIÓN LABORAL
Siguiendo el mismo criterio del apartado anterior, recodificamos la situación laboral de los encuestados en variables dummy. La clasificación construida en función del cuestionario es la siguiente:
Trabajando por cuenta ajena.......................................... 1
Trabajando por cuenta propia (se incluye ayuda
familiar)........................................................................... 2
Parado ........................................................................... 3
Estudiante....................................................................... 4
Labores del hogar........................................................... 5
Pensionista...................................................................... 6
Otra situación ................................................................. 7
A tenor de la similitud entre las dos primeras categorías, creamos la variable dicotómica TRABAJA relativa al hecho de estar ocupado (valor 1 si, 0 en otro caso) bajo las siguientes circunstancias:
“Ha de tenerse en cuenta que el informante se considerará trabajando cuando lo haya hecho al menos una hora en la semana de referencia ó cuando, no haciéndolo, tuviera un trabajo del que estuvo ausente temporalmente (vacaciones).”
La categoría “otra situación” ha sido la seleccionada para jugar el papel de referencia mientras que el resto se han convertido en variables binarias tipo cero-uno.
4.4 LA VARIABLE OCUPACIÓN
En esta parte del trabajo nos encontramos con un problema que sesgaba sumamente la muestra haciendo que el modelo perdiera observaciones. La ocupación ha sido codificada a través del cuestionario en dos partes. Primero como OCUPACION1, relativa a individuos con trabajos manuales y no manuales y, OCUPACION2, para trabajadores de las TIC´s, cuyo valor 1 indica pertenecer a este grupo y 0 en caso contrario.
La razón por la cual las observaciones se perdían estriba en que solamente los individuos en situación de trabajar son los que contestan a esta parte, los cuales ascienden a 8.043, de éstos, únicamente el 3,23% son trabajadores TIC. En consecuencia, se consideró necesario (dada la posibilidad de su significación estadística) incluir ambos tipos de ocupación como dummies. La primera DOCUPACION1, que toma el valor 1 en caso de que el trabajo en cuestión sea manual y 0 si es no manual. La segunda DOCUPACION2, con valor 1 si el trabajador es TIC y 0 en caso contrario.
4.5 RECODIFICACIÓN DEL RESTO DE VARIABLES
Examinando el cuestionario nos dimos cuenta de que la variable NIVELEST sólo afectaba a los encuestados de nacionalidad española , por consiguiente, convertimos la variable NACIONALIDAD (categórica hasta el momento) en una dummy que toma el valor 1 para españoles y 0 para cualquier otro caso. No obstante, en posteriores pruebas resultó ser no significativa para el modelo ZIP.
Un hecho curioso fue el descubrir que disponer de televisión en la vivienda carece de significación estadística cuando a priori pensábamos que la publicidad emitida a través de este medio podría suponer un impulso para el consumo vía internet. A consecuencia de esto, consideramos apropiado no incorporar como variables del modelo la recepción de canales de cualquier tipo como por ejemplo antena parabólica o ADSL.
Por otro lado, aunque resulte obvio, cabe destacar que disponer de internet en la vivienda (ver tabla VIV_INTER en Anexo) sí es sumamente significativo aunque no lo es la forma de conexión a internet. De hecho, disponer o no de internet da resultados muy ajustados dentro de la muestra: un 49,16% no dispone de internet en casa mientras que el 50,84% sí (a excepción de 66 missing values). Nos pareció razonable efectuar pruebas sobre si los motivos de no disponer de internet facilitados por los encuestados y seleccionados a priori, eran relevantes para la estimación. Nuestra conclusión resultó ser que solamente la percepción de los individuos sobre si los equipos son caros o no (NOINT4) era significativa, no obstante, incluirla suponía omitir la variable VIV_INTER por colinealidad.
En los microdatos que manejamos, la variable “APINT” engloba la realización de apuestas o loterías por internet. Según el modelo, realizar esta actividad por internet, pese a que es realmente exiguo el porcentaje de individuos que afirman hacerlo (1,30%), consideramos incluirla en el modelo porque este servicio no estaba incorporado como tal dentro de las variables codificadas como “PROD”. Asimismo, esperamos que tenga una relación positiva con nuestra variable endógena.
De todos los problemas que los internautas pueden experimentar en sus transacciones los más importantes a nuestro criterio son: virus con pérdida de información, intimidad, fishing y el uso fraudulento de tarjetas de crédito (PROBINT). Nos pareció importante incluir estas variables en el modelo para determinar de qué forman condicionan el comportamiento de los encuestados con respecto a sus compras online.
Decidimos que el tratamiento más adecuado para la variable EDAD era elevándola al cuadrado con el fin de mejorar la estimación del modelo. Consideramos apropiado proceder de esta manera con EDAD porque resulta poco creíble establecer una relación lineal entre ella y la endógena. En este contexto, el cumplir más años no implica comprar más por internet.
Por último, con el fin de averiguar si existe un “efecto región” en función de la Comunidad Autónoma de residencia, y puesto que en la muestra está especificada solamente la provincia, contrastamos si existían diferencias significativas entre las mismas.
A la luz de los datos, podemos observar que efectivamente existen diferencias significativas entre las provincias. Destacan las provincias de Álava (1), Barcelona (8), Madrid (28) y Soria (42) con medias superiores al 0,80. Descartamos Soria por disponer únicamente de 44 observaciones. Debido a esto, construimos las variables relativas a las Comunidades Autónomas de País Vasco, Cataluña y Madrid.
Una vez recodificadas nuestras variables preseleccionadas, hicimos un nuevo filtrado de las mismas, pero esta vez en busca de aquellas que no aportaran mayor sesgo importante en la muestra en relación a una pérdida considerable de observaciones, puesto que ya habíamos asumido la pérdida de más de 4.000 observaciones por incorporar ING_HOG. Tras este último filtrado, obtuvimos una muestra final de 15.039 observaciones.
5. ANÁLISIS DE LOS RESULTADOS
Los regresores obtenidos en la endógena NCOMPINT del modelo se interpretan igual que en un modelo Poisson convencional, mientras que los relativos a la parte INFLATE no pueden ser tratados como en un modelo logit binomial donde la probabilidad de éxito está determinada por:
Para el caso que nos ocupa, la probabilidad de éxito es que la variable endógena tome el valor 0:
=
Por tanto, si esperamos una relación positiva entre una variable explicativa y la variable respuesta, en la parte ínflate esperamos un coeficiente negativo.
El primer análisis que debemos realizar es el de los signos de los coeficientes. No todos los regresores obtenidos poseían el signo esperado.
Los problemas experimentados en internet por los usuarios, variables incluidas en la parte Poisson, arrojaron signos positivos, indicando entonces, que dichos problemas incrementaban el número esperado de compras de bienes y servicios por internet, manteniéndose el resto de variables constantes. Por esta causa se hizo necesario, a fin de lograr un buen modelo (cuanto menos, coherente), eliminarlas de la estimación final, aunque fueran estadísticamente significativas.
Por su parte, la variable ingresos netos del hogar ha resultado significativa tanto en la parte Poisson como en la parte ínflate. Se espera que si aumentan los ingresos netos del hogar, la probabilidad de comprar más productos o servicios por internet aumente, entonces es de esperar un signo positivo para el regresor. Mientras que si los ingresos aumentan, también se espera que la probabilidad de que NO se realice ninguna compra, sea más pequeña, por lo cual se espera un signo negativo como regresor.
Observemos el coeficiente de la variable ING_HOG para la parte Poisson, éste es:
ING_HOG (0 .0000853): Tal y como hemos apuntado, es positivo y se interpreta como en cuanto aumentaría el número de compras esperadas (NCOMPINT) si aumentaran los ingresos de los individuos. Por ejemplo, aumentar en 300 € los ingresos netos mensuales del hogar, implica aumentar el nº de compras esperado en un 25,77%.
Ahora bien, observemos el coeficiente de la parte “inflada” para la misma variable:
ING_HOG (-0,0002755): Supongamos una observación con las siguientes características:
Mujer, 30 años, desempleada, con ingresos netos mensuales de 800 €, con disponibilidad de internet en la vivienda; tendría una probabilidad de no comprar por internet del 23,34% .
5.1 SIGNIFICATIVIDAD ESTADÍSTICA
Una vez examinado los signos, pasamos a contrastar la significación individual y global de los estimadores. Los estadísticos t nos demuestran algunas variables no significativas.
En la parte Poisson, la variable SEXO no es significativa, sin embargo sí lo es en la parte “ínflate”. Así mismo, no existe efecto Comunidad Autónoma para Cataluña en el número de compras vía internet. No obstante, el contraste significación global nos informa de que los regresores son globalmente significativos.
En la parte ínflate, las variables EDAD, TRABAJA y PENSIONISTA han resultado no significativas. Respecto a la variable TRABAJA, no nos parece razonable que no sea significativa. Suponíamos en un principio que el hecho de trabajar, influía positivamente en la decisión de comprar, debido a que un individuo que trabaja dispone de menos tiempo y oportunidad de realizar compras físicamente y, por tanto, optaría por realizar un consumo virtual. Realizamos el contraste para NCOMPINT si existen diferencias entre trabajar y no trabajar y el resultado es el siguiente:
Ho: No existen diferencias entre trabajar y no trabajar.
Dado el valor del estadístico: 1.477,55 concluimos rechazar la hipótesis nula y existen diferencias entre trabajar y no trabajar.
Después de este resultado, en búsqueda de una explicación, nos percatamos de que las variables DOCUPACION1 Y 2, relativas a los individuos ocupados, resultaron significativas, por tanto eliminamos del modelo la variable TRABAJA. Además estas variables nos arrojan información adicional sobre el tipo de actividad desempañada por lo trabajadores, si éstos son empleados TIC`s o no.
5.2 INTERPRETACIÓN DE LOS COEFICIENTES
En este apartado vamos a definir el significado de cada coeficiente. Al tratarse en algunos casos de variables que forman parte de un mismo grupo analizaremos el efecto de una de ellas en concreto sobre la endógena. De tal manera que al analizar el efecto de una explicativa, se aplicará la condición ceteris paribus para el resto.
El efecto de la edad: para este caso disponemos de 2 variables. Por un lado, EDAD representando el hecho de cumplir más años implica aumentar el número de compras esperadas para ciertos grupos de edad. Y por otro lado, EDAD2 hace alusión al hecho de que, a partir de una cierta edad (40 años), el cumplir más años no implica comprar más, ver tabla 2 Anexo, se observan los efectos mencionados y de ahí la coherencia de los signos de sus regresores.
5.2.1 REGRESORES POISSON
Efecto región: habíamos visto que las regiones pertenecientes a las Comunidades Autónomas de Madrid y País Vasco era donde más se compraba. Por tanto, cabía esperar que existiera un efecto región positivo. Así, ser de Madrid frente a proceder de otra Comunidad Autónoma (ceteris paribus), incremente el número de compras esperadas en un 8,2%. Cabe apuntar que el efecto región del País Vasco es mayor que el de Madrid, lo que implica que residir en el País Vasco implica un aumento en las compras esperadas de un 20%.
Efecto de los servicios usados en internet: para las variables relativas a los servicios usados por internet, esperábamos signos positivos porque esto influiría positivamente en el número de compras esperadas. Basaremos la interpretación en el coeficiente más alto relativo a la variable SERV37_2: buscar viajes y alojamiento aumenta el número esperado de compras por internet en un 92,74% con respecto a los demás servicios. Estos servicios provocan un efecto sumamente elevado sobre las compras esperadas dado que representan el 98% de la muestra sobre el total de compras de bienes y servicios efectuadas por internet (el número de individuos que compran por internet asciende a 3.422, de los que compran viajes y alojamiento son 3.355. (Ver tabla 3 Anexo PROD14, PROD15 y NCOMPINT.).
Realización de apuestas y loterías por internet (si nos permite la licencia, lo hemos denominado “efecto ludópata/consumista”): tal y como esperábamos, el coeficiente de esta variable tiene un signo positivo. No obstante, encontramos sorprendente que esta variable, no siendo importante en la muestra, sea significativa y produzca un aumento del 27% en el número de compras esperadas.
Tareas realizadas a través de internet: la búsqueda de información utilizando en la red aumenta el número de compras esperadas. De modo que usar buscadores por internet aumenta el número esperado de compras en 48,6%.
Efecto ocupación en TIC´s: ser un trabajador TIC frente a tener una ocupación no TIC incrementa el número esperado de compras en un 12,26%.
Constante: si la hipótesis nula del contraste de significación global se acepta (todos los regresores son 0 excepto la constante. Hipótesis siempre rechazada ), esto implica que el número de compras disminuye en 1,72.
5.2.2 REGRESORES INFLATE
Efecto género: en este caso vemos que ser hombre implica comprar más. De hecho, ser hombre es un factor de protección ( ), y eso que supone menor proporción respecto a las mujeres. Los hombres representan un 44,62% de la muestra.
Efecto edad: tal y como esperábamos existe una correspondencia entre los coeficientes de la EDAD2 entre la parte Poisson y la parte Inflate. Así, en este caso, si escogiéramos a un hombre, de 50 años, con internet en casa y con una ocupación no manual, cumplir un año más implica un efecto marginal del 7,53% en detrimento del número esperado de compras.
Efecto educación: a medida que el nivel de formación aumenta, vemos que los coeficientes en valor absoluto también aumente, y es de esperar que aumenten las compras por internet (coherencia con el signo negativo). Para calcular el efecto real sobre la variable respuesta nos centraremos en la educación universitaria, siendo este análisis análogo para el resto. Así, poseer educación universitaria disminuye la probabilidad de no comprar.
Tareas realizadas a través de internet: vemos como en este caso disminuye la probabilidad de no comprar, correspondiéndose este resultado con lo obtenido en la parte Poisson donde las compras esperadas aumentan.
Internet en la vivienda: obviamente, este regresor cumple con todas nuestras expectativas y no nos ha defraudado, en el sentido de que la probabilidad de efectuar compras por internet (es decir, Pr (Y=1)) aumenta.
Efecto ocupación en trabajos manuales: recordemos que para este caso tener la característica tomaba valor 1 y 0 en caso de trabajos no manuales. Por tanto, desempeñar una ocupación manual disminuye la probabilidad de no comprar.
Efecto de la situación laboral: los estadios contemplados son trabajar, estudiar, estar parado, dedicarse a sus labores y pensionista. Recordemos que la variable TRABAJA y PENSIONISTAS fueron eliminadas por no ser significativas, y dejamos como categoría de referencia “otra situación”. Analizaremos el resto de los coeficientes. Estar parado, o bien ser estudiante, o dedicarse a labores del hogar, frente a estar en otra situación, supone un factor de riesgo para nuestra variable endógena ( )
Constante: si no se da ninguna de las características de la parte “inflate”, la probabilidad de no comprar supondría un 91,27%.
6. MODELO ZIP vs MODELO POISSON
En este apartado último la intención es verificar si para nuestra variable respuesta, que atiende a un modelo Poisson inflado de ceros, el modelo correcto hubiera sido un Poisson estándar. Para ello, empleamos el contraste de Vuong:
Vuong test of zip vs. standard Poisson: z = 20.62 Pr>z = 0.0000
Ho: El modelo es Poisson.
Conclusión: Rechazamos la hipótesis nula, el modelo ZIP es el correcto.
7. CONCLUSIONES
Como discusión final solo queda concluir si se han alcanzado los objetivos propuestos a priori en función de las premisas planteadas como hipótesis.
Hemos conseguido demostrar que efectivamente los servicios usados en internet suponen un gran impulso para efectuar compras de bienes y servicios en la red, y puesto que, los problemas sufridos del tipo pérdida de información por virus, o uso fraudulento de tarjetas, por un porcentaje no muy elevado de la muestra no han resultado relevantes, consideramos que existe un alto grado de confianza por parte de los usuarios con respecto a sus transacciones telemáticas.
Dentro de todos los servicios buscados en la red, los más relevantes han sido sin duda aquellos destinados a la búsqueda de viajes y alojamiento. De este modo, podemos afirmar que las actividades de ocio preferidas por los españoles internautas son las que están relacionadas con las vacaciones, ocupando un papel secundario el resto de bienes y servicios. Esto puede explicar en gran parte un fenómeno que estamos viviendo en nuestro país, y en general, la continua desaparición de las agencias de viajes y la dura competencia en precios entre las empresas que ofertan paquetes vacacionales online.
En relación al sexo de los informantes, se ha constatado que ser hombre supone que el número de compras efectuadas de bienes y servicios es mayor que para las mujeres. Esto se debe, probablemente, a la adquisición por parte de los varones de productos tales como software, equipos informáticos y electrónicos entre otros.
Por otra parte, el simple hecho de obtener información a través de cualquier buscador, provoca un notable crecimiento del número de compras efectuadas. Pensemos, por ejemplo, en el bombardeo de publicidad de cualesquiera empresas que saltan a la pantalla del usuario, una vez que pincha en el vínculo que le interesa. Otra razón para afirmar que publicitarse en internet es efectivo.
Ha quedado claro que hogares con niveles de ingresos altos son más propensos a efectuar compras por internet que aquellos que perciben ingresos más bajos. Si dentro del hogar, además, encontramos algún individuo cuya actividad laboral está dentro del grupo de las TIC´s, esta propensión será aún mayor.
A pesar de la baja proporción de analfabetismo en España, hay un alto porcentaje de individuos con algún tipo de estudios situados en un grupo de edad que abarca de los 40 años en adelante que no realiza compras online, ni hacen uso de la red para ninguna otra transacción, siendo los individuos más jóvenes los que representan el grueso de los usuarios de internet.
La importancia del nivel de estudios ha quedado reflejada como un factor impulsor en el fenómeno estudiado. Aquellas personas con cierta formación, y a medida que esta va alcanzando niveles superiores, tendrán una mayor disposición a realizar sus compras en internet con mayor asiduidad. Obviamente, la consecución de estudios avanzados lleva implícito el manejo de herramientas informáticas y la adquisición de conocimientos relacionados con las mismas.
Teniendo en cuenta el papel espectacular que protagonizan las TIC´s en las sociedades modernas, la importancia de la educación de los ciudadanos y las diferencias entre las provincias españolas, encontrado un “efecto región” en comunidades autónomas con mayor esfuerzo inversor en I+D, se hace necesario por parte de las Administraciones Públicas, nacionales y supranacionales, y del Sector Privado, una mayor coordinación entre regiones en su intensidad innovadora y educativa. Así mismo, no debemos olvidar el compromiso que deben adquirir los ciudadanos en aprovechar al máximo estos recursos.
BIBLIOGRAFÍA
LIBROS
Castells, Manuel: “Internet y la Sociedad red” (2001). Disponible en web:
Castells, 2001
Wooldridge, Jeffrey M.: “Introducción a la econometría. Un enfoque moderno” (2005). Ed. Thompson
ARTÍCULOS
Stata Annotated Output Zero-inflated Poisson Regression. UCLA. Disponible en web:
UCLA ZIP