Introducci�n a la regresi�n lineal

An�lisis de regresi�n
Coeficientes
Diagrama de dispersi�n
M�nimos cuadrados
Par�metros
Recta de regresi�n
Relaci�n estad�stica
Relaci�n funcional
Relaci�n lineal
Variables

El objeto de un an�lisis de regresi�n es investigar la relaci�n estad�stica que existe entre una variable dependiente (Y) y una o m�s variables independientes (, ... ). Para poder realizar esta investigaci�n, se debe postular una relaci�n funcional entre las variables. Debido a su simplicidad anal�tica, la forma funcional que m�s se utiliza en la pr�ctica es la relaci�n lineal.  Cuando solo existe una variable independiente, esto se reduce a una l�nea recta:

donde los coeficientes b0 y b1 son par�metros que definen la posici�n e inclinaci�n de la recta.  (N�tese que hemos usado el s�mbolo especial  para representar el valor de Y calculado por la recta.  Como veremos, el valor real de Y rara vez coincide exactamente con el valor calculado, por lo que es importante hacer esta distinci�n.)

El par�metro b0, conocido como la "ordenada en el origen," nos indica cu�nto es Y cuando X = 0.  El par�metro b1, conocido como la "pendiente," nos indica cu�nto aumenta Y por cada aumento de una unidad en X.  Nuestro problema consiste en obtener estimaciones de estos coeficientes a partir de una muestra de observaciones sobre las variables Y y X. En el an�lisis de regresi�n, estas estimaciones se obtienen por medio del m�todo de m�nimos cuadrados.

Cuadro 1. 
Operaciones Mensuales en
una Empresa de Transporte de Pasajeros.

                     Costos      Millas
                    Totales    Veh�culo 
                     (miles)      (miles)
    Mes N�          Y              X    


        1            213.9        3147
        2            212.6        3160
        3            215.3        3197
        4            215.3        3173
        5            215.4        3292
        6            228.2        3561
        7            245.6        4013
        8            259.9        4244
        9            250.9        4159
      10            234.5        3776
      11            205.9        3232
      12            202.7        3141
      13            198.5        2928
      14            195.6        3063
      15            200.4        3096
      16            200.1        3096
      17            201.5        3158
      18            213.2        3338
      19            219.5        3492
      20            243.7        4019
      21            262.3        4394
      22            252.3        4251
      23            224.4        3844
      24            215.3        3276
      25            202.5        3184
      26            200.7        3037
      27            201.8        3142
      28            202.1        3159
      29            200.4        3139
      30            209.3        3203
      31            213.9        3307
      32            227.0        3585
      33            246.4        4073

Fuente: J. Johnston,
An�lisis Estad�stico de los Costes

(Barcelona: Sagitario, S. A., 1966), p. 118.

Como ejemplo, consideremos las cifras del Cuadro 1, que muestra datos mensuales de producci�n y costos de operaci�n para una empresa brit�nica de transporte de pasajeros por carretera durante los a�os 1949-52 (la producci�n se mide en t�rminos de miles de millas-veh�culo recorridas por mes, y los costos se miden en t�rminos de miles de libras por mes). Para poder visualizar el grado de relaci�n que existe entre las variables, como primer paso en el an�lisis es conveniente elaborar un diagrama de dispersi�n, que es una representaci�n en un sistema de coordenadas cartesianas de los datos num�ricos observados. En el diagrama resultante, en el eje X se miden las millas-veh�culo recorridas, y en el eje Y se mide el costo de operaci�n mensual. Cada punto en el diagrama muestra la pareja de datos (millas-veh�culo y costos de operaci�n) que corresponde a un mes determinado. Como era de esperarse, existe una relaci�n positiva entre estas variables: una mayor cantidad de millas-veh�culo recorridas corresponde un mayor nivel de costos de operaci�n.

Por otro lado, tambi�n se aprecia por qu� este gr�fico se denomina un diagrama de "dispersi�n": no existe una relaci�n matem�ticamente exacta entre las variables, ya que no toda la variaci�n en el costo de operaci�n puede ser explicada por la variaci�n en las millas-veh�culo. Si entre estas variables existiera una relaci�n lineal perfecta, entonces todos los puntos caer�an a lo largo de la recta de regresi�n, que tambi�n ha sido trazada y que muestra la relaci�n "promedio" que existe entre las dos variables. En la pr�ctica, se observa que la mayor�a de los puntos no caen directamente sobre la recta, sino que est�n "dispersos" en torno a ella. Esta dispersi�n representa la variaci�n en Y que no puede atribuirse a la variaci�n en X.

Volver al �ndice

Enciclopedia Virtual
Tienda
Libros Recomendados


1647 - Investigaciones socioambientales, educativas y human�sticas para el medio rural
Por: Miguel �ngel S�mano Renter�a y Ram�n Rivera Espinosa. (Coordinadores)

Este libro es producto del trabajo desarrollado por un grupo interdisciplinario de investigadores integrantes del Instituto de Investigaciones Socioambientales, Educativas y Human�sticas para el Medio Rural (IISEHMER).
Libro gratis
Congresos

15 al 28 de febrero
III Congreso Virtual Internacional sobre

Desaf�os de las empresas del siglo XXI

15 al 29 de marzo
III Congreso Virtual Internacional sobre

La Educaci�n en el siglo XXI

Enlaces Rápidos

Fundación Inca Garcilaso
Enciclopedia y Biblioteca virtual sobre economía
Universidad de Málaga