Anda di halaman 1dari 85

MDULO : I

CONTROL ESTADSTICO DE LA CALIDAD


ESTADSTICA DESCRIPTIVA
Mag. Ing. Gustavo Manuel Yez Wendorff

ESTADSTICA DESCRIPTIVA
Es una herramienta matemtica que permite recopilar,
organizar, presentar y analizar datos obtenidos de un
estudio estadstico.
Es una ciencia que analiza series de datos (por ejemplo,
edad de una poblacin, altura de los estudiantes de una
escuela, temperatura en los meses de verano, etc) y
trata de extraer conclusiones sobre el comportamiento
de estas variables.

http://www.youtube.com/watch?v=OPkGxnEXLsI
2

VARIABLES
Las variables pueden ser de dos tipos:
Variables cualitativas o atributos:
No se pueden medir numricamente (Ejemplo:
nacionalidad, color de la piel, sexo).

Variables cuantitativas:
Tienen valor numrico (Ejemplo: edad, precio de un
producto, ingresos anuales).

VARIABLES
Las variables tambin se pueden clasificar en:
Variables unidimensionales:
Slo recogen informacin sobre una caracterstica
(Ejemplo: edad de los alumnos de una clase).
Variables bidimensionales:
Recogen informacin sobre dos caractersticas de la
poblacin (Ejemplo: edad y altura de los alumnos de una
clase).
Variables pluridimensionales:
Recogen informacin sobre tres o ms caractersticas
(Ejemplo: edad, altura y peso de los alumnos de una
clase).

VARIABLES
Por su parte, las variables cuantitativas se pueden
clasificar en discretas y continuas:
Discretas: slo pueden tomar valores enteros (1, 2, 8,
-4, etc.). (Ejemplo: nmero de hermanos puede ser 1,
2, 3....,etc, pero nunca podr ser 3,45).
Continuas: pueden tomar cualquier valor real dentro
de un intervalo. (Ejemplo, la velocidad de un vehculo
puede ser 80,3 km/h, 94,57 km/h...etc.)

VARIABLES

COMPORTAMIENTO DE UNA VARIABLE


Cuando se estudia el comportamiento de una variable
hay que distinguir los siguientes conceptos:
Individuo
Poblacin
Muestra

COMPORTAMIENTO DE UNA VARIABLE


Individuo:
Cualquier elemento que porte informacin sobre el
fenmeno que se estudia. (Ejemplo: si estudiamos la
altura de los nios de una clase, cada alumno es un
individuo; si estudiamos el precio de la vivienda, cada
vivienda es un individuo.

COMPORTAMIENTO DE UNA VARIABLE


Poblacin:
Conjunto de todos los individuos (personas, objetos,
animales, etc.) que porten informacin sobre el
fenmeno que se estudia.
Ejemplo
Si estudiamos el precio de la vivienda en una
ciudad, la poblacin ser el total de las viviendas de
dicha ciudad
Si estudiamos las intencin de voto en una eleccin
en el Per, la poblacin ser: por pas, regin,
departamento, provincia o distrito.

COMPORTAMIENTO DE UNA VARIABLE


Muestra:
Subconjunto de la poblacin.
As, si se estudia el precio de la vivienda de una ciudad,
lo normal ser no recoger informacin sobre todas las
viviendas de la ciudad (sera una labor muy compleja),
sino que se suele seleccionar un subgrupo (muestra)
que se entienda que es suficientemente representativo.
Ejemplo:
Simulacro de Votacin en el Distrito de Chilca
http://www.datum.com.pe/pdf/CH.pdf

COMPORTAMIENTO DE UNA VARIABLE


Muestreo estratificado
Es una forma de representacin estadstica que muestra
como se comporta una caracterstica o variable en una
poblacin a travs de hacer evidente el cambio de dicha
variable en sub-poblaciones o estratos.
Consiste en la divisin previa de la poblacin de estudio en
grupos o clases que se suponen homogneos respecto a
caracterstica a estudiar y que no se solapen.
Segn la cantidad de elementos de la muestra que se han
de elegir de cada uno de los estratos, existen dos tcnicas
de muestreo estratificado:
http://www.datum.com.pe/metodologias.php

COMPORTAMIENTO DE UNA VARIABLE


Muestreo estratificado
1. Asignacin proporcional: el tamao de cada estrato en la muestra
es proporcional a su tamao en la poblacin.
2. Asignacin ptima: la muestra recoger ms individuos de
aquellos estratos que tengan ms variabilidad. Para ello es
necesario un conocimiento previo de la poblacin.
Ejemplo
Para un estudio de opinin, puede resultar interesante estudiar
por separado las opiniones de hombres y mujeres pues se estima
que, dentro de cada uno de estos grupos, puede haber cierta
homogeneidad.
As, si la poblacin est compuesta de un 55% de mujeres y un
45% de hombres, se tomara una muestra que contenga tambin
esa misma proporcin.

DISTRIBUCIN DE FRECUENCIAS
Ordenamiento de datos cuando en un estudio estadstico se
recopila una gran cantidad de ellos.
El nmero de veces que aparece repetido cada dato es la
frecuencia de dicho valor.
Es la representacin estructurada, en forma de tabla, de toda la
informacin que se ha recogido sobre la variable que se estudia.
Agrupamiento de datos en categoras mutuamente excluyentes,
que indican el nmero de observaciones en cada categora.
Es una ordenacin en forma de tabla de los datos estadsticos,
asignando a cada dato su frecuencia correspondiente.

DISTRIBUCIN DE FRECUENCIAS
Frecuencia absoluta

Es el nmero de veces que aparece un determinado valor


en un estudio estadstico.
Se representa por fi.
La suma de las frecuencias absolutas es igual al nmero
total de datos, que se representa por N.
Para indicar resumidamente estas sumas se utiliza la
letra griega (sigma mayscula) que se lee suma o
sumatoria.
i=n

f1 + f2 + f3 + f4 + . fn

fi = N
i=1

DISTRIBUCIN DE FRECUENCIAS
Frecuencia relativa
Es el cociente entre la frecuencia absoluta de un
determinado valor y el nmero total de datos.
Se puede expresar en tantos por ciento y se representa
por ni
La suma de las frecuencias relativas es igual a 1.
ni =

fi
N

Rango: Es la diferencia entre el dato mayor y el menor.

DISTRIBUCIN DE FRECUENCIAS
Frecuencia acumulada
Es la suma de las frecuencias absolutas de todos los
valores inferiores o iguales al valor considerado.
Se representa por Fi.

Frecuencia relativa acumulada


Es el cociente entre la frecuencia acumulada de un
determinado valor y el nmero total de datos.
Se puede expresar en tantos por ciento.

DISTRIBUCIN DE FRECUENCIAS
Existen dos tipos de distribucin de frecuencias:
Distribucin en datos no agrupados
Distribucin con datos agrupados

DISTRIBUCIN DE FRECUENCIAS
Distribucin en datos no agrupados
Se utiliza preferentemente cuando las opciones de la
variable son pocas.
Ejemplo:
Al lanzar un dado 10 veces, se obtuvo la siguiente
informacin:
1643126513
Rango: 6 1 = 5.

DISTRIBUCIN DE FRECUENCIAS
Distribucin en datos no agrupados
1643126513
Al sumar la columna frecuencia, se obtiene el total de
datos (n).
Nmero Frecuencia
1
3
Total datos: 10.
2
1
3
2
4
1
5
1
6
2

DISTRIBUCIN DE FRECUENCIAS
Distribucin en datos agrupados
Se utiliza cuando la variable ofrece una gran gama de
posibilidades, si es cuantitativa continua, debemos
agrupar los datos en intervalos semiabiertos, excepto
el ltimo, que es cerrado.
Al agrupar los datos en intervalos, se debe calcular la
marca de clase.
Marca de clase
Corresponde al promedio entre los extremos del
intervalo

DISTRIBUCIN DE FRECUENCIAS
Ejemplo
Durante el mes de enero, en una ciudad de la costa
peruana se registraron las siguientes temperaturas
mximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28,
29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31,
30, 31, 34, 33, 33, 29, 29.

DISTRIBUCIN DE FRECUENCIAS
En la primera columna de la tabla colocamos la variable
ordenada de menor a mayor, en la segunda hacemos el
recuento y en la tercera anotamos la frecuencia absoluta
xi

Recuento

fi

Fi

ni

Ni

27
28
29
30
31
32
33
34

I
II

1
2
6
7
8
3
3
1
31

1
3
9
16
24
27
30
31

0.032
0.065
0.194
0.226
0.258
0.097
0.097
0.032
1.000

0.032
0.097
0.290
0.516
0.774
0.871
0.968
1.000

III
III
I

Este tipo de tablas de frecuencias se utiliza con variables


discretas.

DISTRIBUCIN DE FRECUENCIAS
La distribucin de frecuencias agrupadas o tabla con datos
agrupados se emplea si las variables toman un nmero
grande de valores o la variable es continua.
Se agrupan los valores en intervalos que tengan la misma
amplitud denominados clases. A cada clase se le asigna su
frecuencia correspondiente.

DISTRIBUCIN DE FRECUENCIAS
Lmites de la clase
Cada clase est delimitada por el lmite inferior de la clase
y el lmite superior de la clase.
Amplitud de la clase
Es la diferencia entre el lmite superior e inferior de la clase.
Marca de clase
Es el punto medio de cada intervalo y es el valor que
representa a todo el intervalo para el clculo de algunos
parmetros.

DISTRIBUCIN DE FRECUENCIAS
Distribucin en datos agrupados
Ejemplo:
Peso (Kg.)

A=

Frecuencia Marca de clase

[55,59[

57

[59,63[

61

[63,67[

65

[67,71[

69

[71,75]

73

R
NC

A = Amplitud = Longitud del Intervalo


R = Rango
NC = Nmero de Clases

DISTRIBUCIN DE FRECUENCIAS
Construccin de una tabla de datos agrupados
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29,
25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22,
27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
1. Se localizan los valores menor y mayor de la distribucin.
En este caso son 3 y 48.
2. Se restan y se busca un nmero entero un poco mayor que
la diferencia y que sea divisible por el nmero de intervalos
de queramos poner.

DISTRIBUCIN DE FRECUENCIAS
Construccin de una tabla de datos agrupados
Es conveniente que el nmero de intervalos oscile entre
6 y 15.
En este caso, 48 - 3 = 45, incrementamos el nmero
hasta 50 : 5 = 10 intervalos.
Se forman los intervalos teniendo presente que el lmite
inferior de una clase pertenece al intervalo, pero el lmite
superior no pertenece intervalo, se cuenta en el
siguiente intervalo.

DISTRIBUCIN DE FRECUENCIAS
Construccin de una tabla de datos agrupados
3
27
36

[0, 5)
[5, 10)
[10, 15)

[15, 20)

[20, 25)

7
28
36

11
28
37

3
7
11
13
13
15
15
17
20
22
24

13
29
38

13
31
38

15
32
38

15
32
39

1
1
3

[25, 30)

[30, 35)

17
33
39

25
26
27
28
28
29
31
32
32
33
34
34
34

20
34
41

22
34
42

24
34
43

25
35
44

6
[35, 40)

7
[40, 45)

[45, 50)

26
35
47

35
35
36
36
37
38
38
38
39
39
41
42
43
44
47
48

48

10

DISTRIBUCIN DE FRECUENCIAS
Construccin de una tabla de datos agrupados
[0, 5)
[5, 10)
[10, 15)
[15, 20)
[20, 25)
[25, 30)
[30, 35)
[35, 40)
[40, 45)
[45, 50)

ci
2.5
7.5
12.5
17.5
22.5
27.5
32.5
37.5
42.5
47.5

fi
1
1
3
3
3
6
7
10
4
2
40

Fi
1
2
5
8
11
17
24
34
38
40

ni
0.025
0.025
0.075
0.075
0.075
0.150
0.175
0.250
0.100
0.050
1.000

Ni
0.025
0.050
0.125
0.200
0.275
0.425
0.600
0.850
0.950
1.000

https://www.youtube.com/watch?v=ByMIPmfIMTU

HISTOGRAMAS
Es un resumen grfico de un conjunto de datos.
Objetivo
Estudiar la capacidad de los procesos y mantenerlos
bajo control.
Permite ver esquemas y comportamientos que son
difciles de captar en una tabla numrica.
Su xito radica en que conjuga dos tipos de tcnicas:
La estadstica: Permite sacar conclusiones del conjunto
de los datos.
Los grficos: Permite representar los datos y hace
sencilla su interpretacin.

HISTOGRAMA
Para que se usan los Histogramas
Son una herramienta til cuando hay que analizar una
gran cantidad de datos.
Para mostrar en forma de grficos de barras las
caractersticas de un producto o servicio
Tipos de defectos, problemas, riesgos de seguridad,
etc.
Un histograma toma datos de mediciones de
Temperatura, presiones, alturas, pesos, etc.
Muestra su distribucin.
Un histograma revela la cantidad de variacin propia
de un proceso.

HISTOGRAMA
Metodologa de elaboracin
Se recogen los datos que se necesitan por el mtodo
ms adecuado.
Los datos son fundamentales para toda accin de
mejora.
Tener en cuenta que datos no es igual que
informacin.
Se clasifican los datos en una serie de grupos
representativos.
Una misma caracterstica (ejemplo: altura)
Agrupada por intervalos (ejemplo: entre 5 y 10 cm.)

HISTOGRAMA
Con los datos que se presentan a continuacin de la
presencia de hierro en la redes de agua potable de la
ciudad ABCD.

Elabore la hoja de verificacin y calcule valores


mximo, mnimo y promedio
Elabore el histograma

HISTOGRAMA
(*) =0,300
0,045

0,060

0,154

0,076

0,040

0,232

0,050

0,044

0,034
0,056

0,048
0,066

0,075
0,122

0,043
0,079

0,090
0,065

0,074
0,087

0,075
0,137

0,064
0,092

0,017

0,105

0,081

0,069

0,033

0,235

0,082

0,054

0,028
0,024

0,050
0,219

0,065
0,039

0,044
0,022

0,049
0,027

0,053
0,018

0,058
0,012

0,070
0,115

0,089

0,053

0,120

0,112

0,036

0,133

0,073

0,040

0,089
0,090
0,058
0,053
0,139
0,065
0,025
0,056

0,080
0,299
0,041
0,033
0,028
0,048
0,002
0,047

0,103
0,060
0,047
0,042
0,035
0,067
0,042
0,033

0,057
0,269
0,032
0,110
0,068
0,099
0,045
0,031

0,089
0,058
0,065
0,045
0,090
0,056
0,224
0,089

0,053
0,041
0,287
0,060
0,074
0,066
0,019
0,053

0,120
0,047
0,137
0,154
0,075
0,122
0,039
0,120

0,112
0,232
0,092
0,076
0,064
0,079
0,022
0,112

Mximo
Mnimo
Promedio

0.299
0.002
0.078

HISTOGRAMA
Histograma
120.00%

50
45

100.00%

40
35

80.00%

30
60.00%

25
20

40.00%

15
10

20.00%

5
0.00%
y mayor...

0.2693

0.2396

0.2099

0.1802

0.1505

0.1208

0.0911

0.0614

0.0317

0
0.002

Frecuencia

Clase
Frecuencia % acumulado
0.002
1
0.83%
0.0317
12
10.83%
0.0614
45
48.33%
0.0911
33
75.83%
0.1208
13
86.67%
0.1505
6
91.67%
0.1802
2
93.33%
0.2099
0
93.33%
0.2396
5
97.50%
0.2693
1
98.33%
y mayor...
2
100.00%

Clase
Frecuencia

% acumulado

HISTOGRAMA

Histograma

50
45
40
35
30
25
20
15
10
5
0

80.00%
60.00%
40.00%
20.00%

Frecuencia

% acumulado

0.2099

0.2693

0.002

0.1802

0.2396

0.1505

0.0317

0.1208

0.0911

0.00%
y mayor...

Clase

120.00%
100.00%

0.0614

Frecuencia

Clase
Frecuencia % acumulado
Clase
Frecuencia % acumulado
0.002
1
0.83%
0.0614
45
37.50%
0.0317
12
10.83%
0.0911
33
65.00%
0.0614
45
48.33%
0.1208
13
75.83%
0.0911
33
75.83%
0.0317
12
85.83%
0.1208
13
86.67%
0.1505
6
90.83%
0.1505
6
91.67%
0.2396
5
95.00%
0.1802
2
93.33%
0.1802
2
96.67%
0.2099
0
93.33% y mayor...
2
98.33%
0.2396
5
97.50%
0.002
1
99.17%
0.2693
1
98.33%
0.2693
1
100.00%
y mayor...
2
100.00%
0.2099
0
100.00%

HISTOGRAMA

HISTOGRAMA

HISTOGRAMA

HISTOGRAMA

HISTOGRAMA

GRAFICOS DE SECUENCIA
Tpicamente se examina la descripcin de un caso de uso
para determinar qu objetos son necesarios para la
implementacin del escenario.
Si se dispone de la descripcin de cada caso de uso
como una secuencia de varios pasos, entonces se puede
"caminar sobre" esos pasos para descubrir qu objetos
son necesarios para que se puedan seguir los pasos.
Un diagrama de secuencia muestra los objetos que
intervienen en el escenario con lneas discontinuas
verticales, y los mensajes pasados entre los objetos como
flechas horizontales.

GRAFICOS DE SECUENCIA

GRAFICOS DE SECUENCIA

GRAFICOS DE SECUENCIA

DIAGRAMA DE FLUJO
Es la representacin grfica del algoritmo o proceso.
Se utiliza en disciplinas como programacin, economa,
procesos industriales y psicologa cognitiva.

DIAGRAMA DE FLUJO
PARA INGRESAR EL CORREO OUTLOOK

MEDIDAS DE TENDENCIA CENTRAL


Son medidas estadsticas que se usan para describir como
se puede resumir la localizacin de los datos.
Ubican e identifican el punto alrededor del cual se centran
los datos.
Las medidas de tendencia central nos indican hacia donde
se inclinan o se agrupan ms los datos.
Las ms utilizadas son: la media, la mediana y la moda.

LA MEDIA
La media o media aritmtica o media muestral,
usualmente se le llama promedio.
Se obtiene sumando todos los valores de los datos y
dividiendo el resultado entre la cantidad de datos.
Si los datos proceden de una muestra, el promedio se
representa con X.
Si los datos proceden de la poblacin, se utiliza la letra
griega .

LA MEDIA
La frmula matemtica para calcular la media
promedio es la siguiente:
X = promedio
= signo de sumatoria
x

x =
N = numero de datos
N

Media poblacional =
La media muestral x es un estimador puntual de la media
poblacional .

LA MEDIA
A continuacin se presenta una muestra de las
puntuaciones en un examen de un curso de estadstica:
70
90
95
74
58
70
98
72
75
85
95
74
80
85
90
65
90
75
90
69
Podemos calcular el promedio de las puntuaciones para
conocer cuntos estudiantes obtuvieron puntuaciones por
encima y por debajo del promedio . Veamos

LA MEDIA
Primero, sumamos todos los valores de los datos y el
resultado lo divide entre el total de datos o tamao de
la muestra.
Al sumar todas las puntuaciones en el ejemplo anterior
obtendrs un total de 1600, que dividido por 20(total
de datos), es igual a 80.
Si empleamos la frmula obtenemos:

x=
N

1600
x=
= 80
20

LA MEDIA
Sueldos mensuales iniciales en una muestra de 12 recin
egresados de la carrera de Ingeniera Industrial:
Egresado Sueldo S/.
1
1,950
2
2,050
3
2,150
4
1,980
5
1,855
6
1,810
7
1,990
8
2,230
9
2,040
10
2,425
11
2,020
12
1,980

1,950 + 2,050 + .. + 1980


12

2,040

LA MEDIANA
La segunda medida de tendencia central que analizaremos
es la mediana, en ocasiones se le llama media posicional,
porque queda exactamente en la mitad de un grupo de
datos, luego de que los datos se han colocado de forma
ordenada.
En este caso la mitad (50%) de los datos estar por
encima de la mediana y la otra mitad (50%) estar por
debajo de ella.
La mediana es el valor intermedio cuando los valores de
los datos se han ordenado.

LA MEDIANA
La mediana es la medida de localizacin ms empleada
cuando se trata de ingresos anuales y valores de
propiedades, debido a que la media puede inflarse por
unos cuantos ingresos o valores de propiedades muy
altos.
En tales casos, la mediana es la medida de localizacin
central preferida.

LA MEDIANA
Existen dos formas para obtener la mediana.
Primero, si la cantidad de los datos es impar, la mediana
es el valor que se encuentra en la posicin (n+1)2
donde, n es el nmero de datos.
Por ejemplo, se tiene una muestra de tamao 5 con los
siguientes valores: 46, 54, 42, 48 y 32. Veamos como se
determina la mediana.

LA MEDIANA
Primer paso, ordenar los datos:
32 42 46 48 54
Como la cantidad de datos es impar
(5 datos), la mediana es el valor del dato que se
encuentra ubicado en la posicin (5+1)2=3, la
mediana es 46.
Segundo, si la cantidad de datos es par, la mediana es
el valor promedio de los datos que se encuentran en
las posiciones (n2) y (n2) + 1.

LA MEDIANA
Se ha obtenido una muestra con los valores de datos: 27,
25, 27, 30, 20 y 26. cmo se determina la mediana en
este caso?.
Primer paso, ordenar los datos de forma ascendente:
20 25 26 27 27 30
Como el nmero de datos es par (6), la mediana es el
promedio de los datos que se encuentran en las
posiciones (62) = 3 y (62) +1 = 4. por lo tanto la
mediana es:
26 + 27
= 26.5
2

LA MEDIANA
Sueldos mensuales iniciales en una muestra de 12 recin
egresados de la carrera de Ingeniera Industrial:
Egresado Sueldo S/.
1,950
1
2
2,050
3
2,150
4
1,980
1,855
5
6
1,810
7
1,990
8
2,230
9
2,040
10
2,425
11
2,020
12
1,980

6
5
1
4
12
7
11
9
2
3
8
10

1,810
1,855
1,950
1,980
1,980
1,990
2,020
2,040
2,050
2,150
2,230
2,425

1,990 + 2,020
2

2,005

1,810 1,855 1,950 1,980 1,980 1,990 2,020 2,040 2,050 2,150 2,230 2,425

LA MODA
La moda es el dato que ms se repite o el dato que
ocurre con mayor frecuencia.
En el ejemplo anterior la moda es el 27 .
Un grupo de datos puede tener ms de una moda.
Veamos el siguiente ejemplo: se tiene una muestra con
valores 20, 23, 20, 24, 25, 25, 26 y 30. El 20 y 25 son la
moda entonces, se dice que es bimodal.

LA MODA
El nico salario mensual inicial que se presenta ms de
una vez
Egresado Sueldo S/.
1,950
1
2
2,050
2,150
3
4
1,980
5
1,855
6
1,810
7
1,990
8
2,230
9
2,040
10
2,425
11
2,020
12
1,980

6
5
1
4
12
7
11
9
2
3
8
10

1,810
1,855
1,950
1,980
1,980
1,990
2,020
2,040
2,050
2,150
2,230
2,425

1,980 como este valor tiene la


frecuencia mayor, es la moda.

1,810 1,855 1,950 1,980 1,980 1,990 2,020 2,040 2,050 2,150 2,230 2,425

EJEMPLO
Ejemplo de distribucin de frecuencias, media, mediana
y moda
https://www.youtube.com/watch?v=m98364i9yRo

PERCENTILES
Un percentil nos provee informacin de como se
distribuyen los valores de los datos desde el menor
hasta el mayor.
El percentil divide los datos en dos partes,
menos el (p) por ciento de los datos tienen
menores que el percentil y aproximadamente
por ciento de los datos tienen valores mayores
percentil.

ms o
valores
(100-p)
que el

PERCENTILES
Para calcular el percentil debe seguir los siguientes pasos:
Paso 1. Ordene los datos de manera ascendente.
Paso 2. Calcule un ndice (i)
P
i
n
100

en donde:
(p) es el percentil de inters
(n) es el nmero de datos u observaciones.

PERCENTILES
Paso 3.
a) Si (i) no es entero, utilizando las reglas de redondeo, se
lleva al prximo numero entero.
El valor entero inmediato mayor que (i) indica la posicin
donde se encuentra el percentil.
Esto
significa que si (i) = 3.5, el percentil se encuentra
en la posicin 4 de los datos.
b) Si (i) es entero, el percentil es el promedio de los valores
de los datos ubicados en los lugares i e (i + 1).

PERCENTILES
Como ejemplo de este procedimiento, determina el percentil
75 de los datos sobre las edades del siguiente un grupo de
ciudadanos: 25, 20, 26, 21, 19, 23, 22, 30, 28, 27.
Paso 1.
Ordene los datos en orden ascendente:
19 20 21 22 23 25 26 27 28 30
Paso 2.
Calcule el ndice (i):

P
i
n
100

75
i
10 7.5
100

PERCENTILES
Paso 3.
Como (i) no es entero, redondeamos al prximo entero mayor
que 7.5, o sea, el lugar 8.
Al referirnos a los datos del ejemplo, vemos que el percentil 75
es el valor del dato ubicado en la posicin nmero 8, que en
este caso es 27.
19 20 21 22 23 25 26 27 28 30
Nota.
Recuerda que (i) nos indica el lugar
del dato
encuentra el percentil que estamos buscando.

donde

se

Interpretacin
Significa que el 75% de las edades son menores de 27 aos y el
25% restante (100-p) es mayor de 27 aos.

CUARTILES
Los cuartiles dividen los datos en cuatro partes.
Cada una de las partes representa una cuarta parte, o el
25% de las observaciones.
Los cuartiles son percentiles especficos; por
consiguiente, los pasos para calcular los percentiles los
podemos emplear para calcular los cuartiles.

CUARTILES
Los cuartiles se definen de la siguiente manera
Q1 = primer cuartil, o percentil 25
Q2 = segundo cuartil, o percentil 50
(tambin la mediana)
Q3 = tercer cuartil, o percentil 75

CUARTILES
A continuacin se presenta un conjunto de datos con los
siguientes valores; 10, 5, 12, 8, 14, 11, 15, 20, 18, 30 y 25.
Cmo identificamos los cuartiles en este ejemplo?
Utilizars los mismos pasos para identificar los
percentiles:
Primero, ordenamos los datos
5 8 11 12 14 15 18 20 25 30
Segundo, determinamos (i) para cada cuartil:
Q1 = primer cuartil, o percentil 25
Q2 = segundo cuartil, o percentil 50, (tambin la mediana)
Q3 = tercer cuartil, o percentil 75

CUARTILES
Cuartiles:
Q1 = primer cuartil, o percentil 25

25
i
10 = 2.5
100
Como (i) no es un nmero entero, se redondea al
prximo entero mayor que 2.5, o sea 3.
Al referirnos a los datos vemos que el primer cuartil est
ubicado en la posicin 3 de los datos que este caso es
11.
El primer cuartil en los datos se divide de la siguiente
forma:
5 8 11 12 14 15 18 20 25 30
Q1=11

CUARTILES
Segundo cuartil:
Q2 = segundo cuartil, o percentil 50 (tambin la mediana)

50
i
10
100

=5

Como (i) es un nmero entero, el segundo cuartil es el


promedio de los valores de los datos que estn en las
posiciones i e (i+1), que en este caso es, (14+15)2=14.5,
entonces, el segundo cuartil en los datos se divide as:
5 8 11 12 14 15 18 20 25 30
Q1=11
Q2=14.5

CUARTILES
Tercer cuartil:
Q3 = tercer cuartil, o percentil 75

75
i
10
100

= 7.5

Como (i) no es un nmero entero, se redondea al prximo entero


mayor que 7.5, o sea 8. Al referirnos a los datos , vemos que el
tercer cuartil est ubicado en posicin 8 de los datos que en este
caso es el 20. Finalmente, los cuartiles en este caso se presentan
de la siguiente forma:
5 8 11 12 14 15 18 20 25 30
Q1=11
Q2=14.5 Q3=20
https://www.youtube.com/watch?v=s0DYmg45ywQ

MEDIDAS DE DISPERSIN
Existe otro tipo de medidas que indican la tendencia de
los datos a dispersarse respecto al valor central
Rango, amplitud o recorrido (R)
Desviacin media (DM).
Varianza (s , )
Desviacin estndar (s,muestral y , poblacional ).
Coeficiente de Variacin (C. V.)

RANGO
Rango
Es la diferencia entre el dato mayor y el dato menor.
R= Xmx. - Xmn.

DESVIACIN MEDIA
Se conoce tambin como promedio de
desviacin.
Para una serie de N valores se puede
calcular a travs de la siguiente expresin:

Valor absoluto de las desviaciones de los x


valores, respecto de la media.

Y para datos agrupados se tiene:

DESVIACIN MEDIA

EJEMPLO:
Hallar la desviacin media de: 4,6,12,16,22.
_
x = 4 + 6+12+16+22 = 12
5
4-12 = 8
6-12 = 6
12-12 = 0
16-12 = 4
22-12= 10
= 28
D.M. = 28/ 5 = 5.6

VARIANZA
Es la suma de las desviaciones medias al cuadrado.
EJEMPLO:
Hallar la desviacin estndar y la varianza de la siguiente
serie de datos.
10, 18, 15, 12, 3,6,5,7
Para datos no agrupados

Para datos agrupados

VARIANZA
EJEMPLO:
Hallar la desviacin estndar y la varianza de la siguiente
serie de datos.
10, 18, 15, 12, 3,6,5,7
10, 18, 15, 12, 3,6,5,7
8

VARIANZA
(x x)
(10-9.5)
0.5
(18-9.5)
8.5
(15-9.5)
5.5
(12-9.5)
2.5
(3-9.5)
-6.5
(6-9.5)
-3.5
(5-9.5)
-4.5
(7-9.5)
-2.5

(x x)
0.25
72.25
30.25
6.25
42.25
12.25
20.25
6.25
190.00

VARIANZA

DESVIACIN ESTNDAR
Es la raz cuadrada de la varianza.
La desviacin estndar o desviacin tipo se define como
la raz cuadrada de los cuadrados de las desviaciones de
los valores de la variable respecto a su media.

COEFICIENTE DE VARIACIN
Es la relacin que existe entre la Desviacin Estndar (S)
y la Media Aritmtica (X), expresada en trminos de
porcentaje y se expresa:
C.V. = S (100)
X
Ejemplo
Hallar el coeficiente de variacin de una serie de datos
cuya S= 2 y X = 16.
:

C.V. =

2
16

* (100)= 12.5%

DESVIACIN ESTNDAR
Es la raz cuadrada de la varianza.
La desviacin estndar o desviacin tipo se define como
la raz cuadrada de los cuadrados de las desviaciones de
los valores de la variable respecto a su media.

DESVIACIN ESTNDAR

Anda mungkin juga menyukai