El histograma es una gráfica que resulta de la tabla de frecuencias de los datos. Está integrada por un conjunto de barras que representan los intervalos o clases, ubicadas en un sistema de coordenadas.
Como lo expresamos anteriormente, muchas de estas herramientas estadísticas serán analizadas en su contexto de utilización dentro del control de procesos y su estudio no conlleva su estructuración metodológica primaria, es decir, que únicamente veremos cómo se utiliza la herramienta y no cómo se estructura. Esto último fue estudiado en las asignaturas de Análisis Cuantitativo I y II.
Ejemplo:
Se desea analizar el tiempo de vida de los focos de las señales direccionales para autos, producidos en un mes en la compañía ACME. Para ello, se procede a obtener una muestra de 30 focos, registrando el número de horas que duran encendidos. Los resultados obtenidos se recogen en la siguiente tabla. Construya la tabla de frecuencias para estos datos:
237 180 285 225 288 232
290 234 271 295 247 338
315 284 320 255 305 274
284 292 192 318 268 279
261 374 228 358 210 244
Solución: (no olvidar que el procedimiento ya fue visto en Análisis Cuantitativo I)
El histograma correspondiente al Ejemplo 1 es el siguiente, y se reproduce la tabla de distribución de frecuencia:
¿Qué información nos proporciona la tabla de frecuencias construida? Podemos mencionar hechos tales como los siguientes:
Los valores de las frecuencias absolutas nos dicen que los datos siguen una distribución normal (desde el punto de vista estadístico): se presentan pocos datos en los valores bajos y altos de la variable (duración), estando la mayor parte de los datos en el centro del rango de valores de la misma (aproximadamente).
El Diagrama de Dispersión es una herramienta utilizada con frecuencia cuando se desea realizar un análisis gráfico de datos bivariados. es decir. los que se refieren a dos conjuntos de datos. El resultado del análisis puede mostrar que existe una relación entre una variable y la otra, y el estudio puede ampliarse para incluir una medida cuantitativa de tal relación.
Los dos conjuntos pueden referirse a lo siguiente:
¿Para que sirve el diagrama de dispersión?
Ejemplo 1:
La gráfica siguiente es el Diagrama de Dispersión para datos relativos a las ventas totales de una compañía. por semana y el número de quejas por tardanza en la entrega de la mercancía:
El diagrama muestra que al aumentar el volumen de ventas aumenta también el número de quejas por tardanza.
En ocasiones el diagrama resultante puede conducir a resultados contradictorios en cuanto al tipo de correlación de los datos. Esto puede verse cuando el diagrama adquiere la forma de la figura siguiente. Se obtiene una correlación positiva en el rango de valores indicado por A, y una correlación negativa en la región B.
Al juzgar la correlación de esta manera, es importante notar el rango de valores de los datos considerados, y leer cuidadosamente la gráfica.
Además, un Diagrama de Dispersión no dice nada de por qué existe la correlación, de modo que es imprescindible examinar la (aparente) relación entre las variables, desde el punto de vista científico o técnico.
El uso del Diagrama de Dispersión debe completarse con las técnicas de regresión y correlación (Análisis Cuantitativo II), que involucran, respectivamente, la determinación de un modelo matemático de la relación entre los dos conjuntos de datos y una medida cuantitativa de su grado de relación.
Para verificar el grado de relación entre el esfuerzo al corte y el diámetro de los puntos de soldadura, se obtuvo la información correspondiente a 12 puntos de soldadura. Los valores resultantes se muestran en el cuadro anterior. Elaborar el Diagrama de Dispersión y comentar la solución. Determinar la recta de regresión para esos datos. La tabla de datos, además de las columnas de Xi Yi y Xi2 , se da a continuación:
Solución:
La recta de regresión de mínimos cuadrados es Y = a + b X:
Y = 94.216 + 1.036X
Con la ecuación que se obtuvo se puede ahora realizar la regresión, esto es, estimar valores de la variable Y para valores de X; por ejemplo, ¿cuál será el esfuerzo al corte si el diámetro de soldadura es de 2500 * 103 pulg?
Yest = 94.216 + 1.036 X = 94.216 + 1.036 (2500)
Yest = 2684.216 lb/pulg2
La gráfica muestra el Diagrama de Dispersión de los datos y la recta de regresión:
El coeficiente de correlación lineal
El valor de un coeficiente (r), llamado coeficiente de correlación lineal de Pearson, proporciona una medida del grado de relación entre dos variables, y se calcula mediante la expresión (ya conocida):
El valor del coeficiente de correlación
El Diagrama de Dispersión debe acompañarse del cálculo del coeficiente de correlación, sirviendo éste último para verificar el grado de relación entre las variables, que el usuario percibe de modo cualitativo en la gráfica.
Ejemplo 3:
Calcular el coeficiente de correlación para el problema planteado en el ejemplo 3, relativo a X = "semanas de experiencia" y Y = "tiempo (min.) para capturar un reporte a la computadora". La tabla muestra los datos de las variables en las dos primeras columnas, y tres restantes para simplificar el cálculo de r.
Solución: El valor del coeficiente de correlación es entonces
La respuesta indica una correlación negativa, es decir, entre más experiencia tenga un operario menos tarda en capturar un reporte, aunque esta correlación no es muy fuerte. Eliminando los puntos anómalos se puede verificar que el nuevo valor de r es de - 0.898. Este valor, muy cercano en valor absoluto a la unidad, señala una fuerte correlación, lo cual concuerda con la expectativa lógica que uno podría tener en cuanto a la relación entre las variables X y Y.
Ejercicio 1. Dentro de las variables que se manejan en un reactor químico se encuentran la temperatura y la presión, las cuales determinan cuándo debe detenerse la reacción. La tabla muestra los datos obtenidos en diez observaciones.
Elabore el Diagrama de Dispersión, determine y grafique la mejor recta de ajuste para los datos y calcule el coeficiente de correlación.
Ejercicio 2. La siguiente tabla (extendida en la siguiente página) muestra la información del registro de clientes que se atendieron y el costo del material de oficina incurrido a lo largo de 18 meses. Elabore el Diagrama de Dispersión, determine y grafique la mejor recta de ajuste para los datos y calcule el coeficiente de correlación y comente respecto a la relación (r) que existe entre las variables.
Ejercicio 3. La siguiente tabla muestra las observaciones de los pesos (en libras) de catorce piezas de metal al ser tratadas químicamente durante periodos distintos (en segundos). Elabore el Diagrama de Dispersión, determine y grafique la mejor recta de ajuste para los datos y calcule el coeficiente de correlación, utilizando los dos métodos expuestos y derive conclusiones acerca de la relación entre estas variables.
En eumed.net: |
1647 - Investigaciones socioambientales, educativas y humanísticas para el medio rural Por: Miguel Ángel Sámano Rentería y Ramón Rivera Espinosa. (Coordinadores) Este libro es producto del trabajo desarrollado por un grupo interdisciplinario de investigadores integrantes del Instituto de Investigaciones Socioambientales, Educativas y Humanísticas para el Medio Rural (IISEHMER). Libro gratis |
15 al 28 de febrero |
|
Desafíos de las empresas del siglo XXI | |
15 al 29 de marzo |
|
La Educación en el siglo XXI |