Los percentiles representan los valores de la
variable que están por debajo de un porcentaje, el cual puede ser una valor de
1% a 100% (en otras palabras, el total de los datos es divido en 100 partes
iguales).
La notación empleada será:
Donde k es equivalente al porcentaje de datos acumulados, y Pk es el valor de la variable que representa dicho porcentaje. Por ejemplo, P5 es el valor de la variable que deja por debajo el 5% de los datos. P78 será entonces el valor que agrupa el 78% de los datos.
Podemos concluir que P50 sería el valor que divide en dos parte iguales la cantidad de datos de la muestra o población siendo equivalente a la mediana.
Traslademos el gráfico de barra a su respectiva tabla de frecuencia y tratemos de localizar los Percentiles expuestos en el ejemplo:
Nc |
Lm |
Ls |
f |
F |
h |
H |
||
1 |
[ 5 |
15) |
14 |
14 |
14,00% |
14,00% |
||
2 |
[15 |
25) |
12 |
26 |
12,00% |
26,00% |
||
3 |
[25 |
35) |
20 |
46 |
20,00% |
46,00% |
||
4 |
[35 |
45) |
18 |
64 |
18,00% |
64,00% |
||
5 |
[45 |
55) |
14 |
78 |
14,00% |
78,00% |
||
6 |
[55 |
65) |
12 |
90 |
12,00% |
90,00% |
||
7 |
[65 |
75] |
10 |
100 |
10,00% |
100,00% |
||
TOTAL |
100 |
|
100,00% |
|
Podemos concluir fácilmente (con ayuda de las frecuencias acumuladas), que 14 personas (14% del total) están por debajo de los 15 años (podemos aproximarlo a 15 años), lo cual representaría al percentil 14:
El percentil 5 (P5) no puede ser calculado directamente, pero podemos concluir que dicho valor se encuentra en el primer intervalo, ya que este acumula el 14% de las personas. No ocurre lo mismo con el percentil 78 (P78) que aparece directamente en la tabla:
Nc |
Lm |
Ls |
f |
F |
h |
H |
|
1 |
[ 5 |
15) |
14 |
14 |
14,00% |
14,00% |
|
2 |
[15 |
25) |
12 |
26 |
12,00% |
26,00% |
|
3 |
[25 |
35) |
20 |
46 |
20,00% |
46,00% |
|
4 |
[35 |
45) |
18 |
64 |
18,00% |
64,00% |
|
5 |
[45 |
55) |
14 |
78 |
14,00% |
78,00% |
|
6 |
[55 |
65) |
12 |
90 |
12,00% |
90,00% |
|
7 |
[65 |
75] |
10 |
100 |
10,00% |
100,00% |
|
TOTAL |
100 |
|
100,00% |
|
El 78% de las personas consultadas poseen una edad igual o inferior a los 55 años.
A partir de la tabla de frecuencia anterior calcular el percentil 5 (P5)
SOLUCIÓN
PASO 1: Localizar en cuál de los intervalos de clase se encuentra el percentil
Como se había mencionado, el percentil 5 se encuentra en el primer intervalo.
Nc |
Lm |
Ls |
f |
F |
h |
H |
1 |
[ 5 |
15) |
14 |
14 |
14,00% |
14,00% |
2 |
[15 |
25) |
12 |
26 |
12,00% |
26,00% |
3 |
[25 |
35) |
20 |
46 |
20,00% |
46,00% |
4 |
[35 |
45) |
18 |
64 |
18,00% |
64,00% |
5 |
[45 |
55) |
14 |
78 |
14,00% |
78,00% |
6 |
[55 |
65) |
12 |
90 |
12,00% |
90,00% |
7 |
[65 |
75] |
10 |
100 |
10,00% |
100,00% |
TOTAL |
100 |
|
100,00% |
|
PASO 2: Interpolar los datos para encontrar el percentil. En resumen tenemos que:
|
Límite Superior |
H |
|
15,00 (Ls1) |
14,00% (H1) |
|
5,00 (Ls0) |
0,00% (H0) |
Diferencia |
10,00 | 14,.00% |
En este caso, suponemos un intervalo adicional cuyo límite superior llamaremos Ls0 equivalente a 5 el cual agrupa 0% de los datos. Entre los dos límites superiores abarcan un total de 14% de los datos. Si queremos llegar al 5% de los datos, debemos incrementar el porcentaje en una cantidad igual.
10,00 |
14,00% |
Incremento |
5,00% |
Para llegar al 5% de los datos, el límite 5 se debe aumentar en 3,57 unidades.
El percentil k parte desde límite superior del intervalo anterior al que se encuentra dicho percentil más un incremento
El incremento esta dado por:
Simplificando aún más la fórmula tenemos:
Para expresar la fórmula en frecuencias absolutas tenemos que:
Aplicando la fórmula al ejemplo 6.1.1, concluimos.