Anda di halaman 1dari 30

Al hacer

Un sondeo de opinin
El control de calidad de un artculo
Un estudio para conocer la efectividad de un
medicamento
Calcular la composicin futura de una poblacin
.... Estamos haciendo

Estadstica

Tipos de Estadstica
La Estadstica descriptiva o deductiva:
Trata del recuento, ordenacin y clasificacin de los
datos obtenidos de las observaciones:
Construccin de tablas, grficos y clculo de
parmetros.
La Estadstica inferencial o inductiva:
Utiliza los resultados de la estadstica descriptiva y se
apoya en el clculo de probabilidades para la obtencin
de conclusiones sobre una poblacin a partir de los
resultados obtenidos de una muestra.

Poblacin, muestra y variable estadstica


Poblacin: Conjunto de elementos que se quiere estudiar.
Habitantes de una ciudad.
Televisores fabricados en una factora.
Alumnos de primero de bachillerato.

Muestra: Cualquier subconjunto de una poblacin. El nmero de


elementos de una muestra se llama tamao.
Variable estadstica: Cada uno de los rasgos o caractersticas que
se quiere estudiar de los elementos de la poblacin, susceptible o no
de medida.
Color del pelo: negro, castao, rubio o pelirrojo
Sexo: hombre o mujer
Miembros asalariados de una familia: 0, 1 , 2 , 3 ,4 , 5
Alturas de alumnos:178, 169, 172, 183,

Variables cualitativas y cuantitativas


Poblacin: Alumnos de bachillerato de una localidad determinada
Sexo
Modelo de zapatillas deportivas
Barrio de la localidad en que vive
Deporte preferido

Cualitativas

(modalidad)

Discretas

Variables

Cuantitati vas

(Recuentos)

(nmeros)

Nmero de hermanos
Nm.de suspensos en la 1 evaluacin
Nm de libros ledos trimestralmente
Num. de llamadas telefnicas diarias

Continuas
(Cualquier
cantidad en
un intervalo)

Tiempo diario delante del televisor


Tiempo de estudio
Altura
Peso
Tiempo empleado en llamadas

Variables cualitativas: Distribucin de frecuencias


Clase modal o moda
Frecuencia absoluta del valor xi:
Nmero de veces que se repite.
Se representa por fi.
Frecuencia relativa del valor xi:
Cociente entre la frecuencia
absoluta de xi y el nmero total de
datos de la distribucin.
Se representa por hi.

Propiedades:

Las frecuencias absolutas fi , i= 1,..., r, verifican:


I ni 0 II n1 + n2 + n3 + ... + nr = N
Las frecuencias relativas hi, i= 1,..., r, verifican:
I hi 0 II h1 + h2 + h3 + ... + hr = 1

Variables cualitativas: Representacin grfica

Diagrama de Barras

Diagrama de Sectores

Variables cuantitativas discretas: Distribucin de frecuencias


Tabla de Frecuencias
Notas

Un profesor tiene anotadas en su


cuaderno las notas de 30 alumnos de
un clase:
5
2
7
9
1
9
8
5

3
8
6
8
0
9
8
7

4
9
6
7
1
8
8

1
8
7
7
5
0
9

Frec. Abs.

Frec. Abs.

Frec. Relat.

Acumuladas

Frec. Relat.
Acumuladas

xi

fi

Fi

hi

Hi

0,07

0,07

0,10

0,17

0,03

0,20

0,03

0,23

0,03

0,27

11

0,10

0,37

13

0,07

0,43

18

0,17

0,60

25

0,23

0,83

30

0,17

1,00

Suma

30

Frecuencia absoluta acumulada de xi: Suma de las frecuencias


absoluta de todos los valores anteriores a xi ms la frecuencia
absoluta de xi: Fi=f1+f2+f3++f1

Frecuencia relativa acumulada de xi: Cociente entre la


frecuencia absoluta acumulada de xi y el nmero total de datos:
Hi = Fi/N = h1+h2+h3++hi

Frecuencias
Frecuenciasabsolutas
absolutas
Diagrama
Diagramade
debarras
barrasyypolgono
polgono
de
defrecuencias
frecuencias

Frecuencias
Frecuenciasabsolutas
absolutas
acumuladas
acumuladas
Diagrama
Diagramade
debarras
barrasyypolgono
polgono
de
defrecuencias
frecuencias

Agrupacin de datos

Si la variable es continua, o discreta con un nmero de datos muy grande, es aconsejable


agrupar los datos en CLASES.

Cul es el nmero idneo de clases?

El nmero clases debe ser aproximadamente igual a la raz cuadrada positiva del nmero de datos.

Cmo escoger las clases?

Es aconsejable que los lmites de clase (tanto el superior como el inferior) sean nmeros redondos,
como mltiplos de 5, 10,

Se debe procurar que todas las clases tengan la misma amplitud o tamao.

Los intervalos se deben construir de modo que el lmite superior de una clase coincida con el lmite
inferior de la siguiente.

Adoptaremos el criterio de que los intervalos sean cerrados por la izquierda y abiertos por la derecha.

Variables cuantitativas discretas: Datos agrupados


Las edades de las personas que acuden al logopeda a lo largo de un mes son:
3
2
11
13
4
3
2
4
5
6
7
3
4
5
3
2
5
6
27
15
4
21
12
4
3
6
29
13
6
17
6
13
6
5
12
26

Como
Como hay
hay 36
36 datos,
datos, elel nmero
nmero
de
de clases
clases que
que debemos
debemos formar
formar
puede
puede ser
ser aproximadamente
aproximadamente 6.6.
Si
Si elel intervalo
intervalo lolo extendemos
extendemos
desde
desde00hasta
hasta30,
30,alaldividir
dividirpor
por66
se
se tiene
tieneque
quelalaamplitud
amplitud de
de cada
cada
clase
clasedebe
debeser
ser5.5.

Clases

Marcas
de clase

fi

Fi

hi

Hi

[0,5)

2,5

13

13

0,36

0,36

[5,10)

7,5

11

24

0,31

0,67

[10,15)

12,5

30

0,17

0,83

[15,20)

17,5

32

0,06

0,89

[20,25)

22.5

33

0,03

0,92

[25,30)

27,5

36

0,08

Sumas

36

Variables cuantitativas discretas: Datos agrupados


Histograma
Los histogramas se utilizan
generalmente
para
distribuciones de variable
continua o discreta con gran
nmero de datos y que se
han agrupado en clases.
Si los intervalos no son de
igual amplitud, la altura de
los
rectngulos
deben
calcularse teniendo en
cuenta que sus reas sean
proporcionales
a
la
frecuencia
de
cada
intervalo.

10

15

20

25

30

Los rectngulos tienen como base la longitud


de los intervalos y como altura la frecuencia
absoluta de cada intervalo

Variables cuantitativas: Medidas de posicin


Media aritmtica: Valor tal que si todos los N valores de la
variable tomaran dicho valor, sumaran lo mismo que suman
efectivamente. Se obtiene dividiendo la suma de todos los
valores de la variable entre el nmero de valores.
Media aritmtica
x1 x 2 x3 x 4 ... x N 1 x N
x

Si conocemos la frecuencia de cada uno de los datos:


Media aritmtica
x1.n1 x2 .n2 x3 .n3 ... xr .nr
x

x .n
i 1

i 1

Las calificaciones en la asignatura de historia de los 40 alumnos


de una clase viene dada por la tabla:
Calificaciones

N de alumnos

Hoja de clculo

Se ha aplicado un test sobre satisfaccin en el trabajo a 88


empleados de una fbrica, obtenindose las resultados:
Puntuaciones

Nm. de trabajadores

[38-44)
[44-50)
[50-56)
[56-62)
[62-68)
[68-74)
[74-80)

7
8
15
25
18
9
6

Hoja de clculo

Variables cuantitativas: Medidas de posicin


Moda: Se llama moda de una variable estadstica al valor de
dicha variable que presenta mayor frecuencia absoluta. Se
representa por Mo.
En el caso de datos agrupados en intervalos, es fcil determinar la clase
modal (clase con mayor frecuencia), pero el valor dentro del intervalo se
obtiene mediante la expresin:

D1
M o L i c.
D1 D2

Li = Lmite inferior de la clase modal


C = amplitud de los intervalos
D1 = Diferencia entre la frecuencia
absoluta de la clase modal y la
frecuencia absoluta de la clase
anterior.
D2 = Diferencia entre la frecuencia
absoluta de la clase modal y la
frecuencia absoluta de la clase
siguiente.

Clculo de la moda
D2

D1

x cx

D1
D2
x D2 c D1 x D1
x ( D2 D1 ) c D1

Mo
Li

c-x
c

x c

D1
D1 D2

Variables cuantitativas: Medidas de posicin

Mediana: Se llama mediana de una variable estadstica a un


valor de la variable, tal que el nmero de observaciones
menores que l es igual al nmero de observaciones mayores
que l. Se representa por M.

Clculo de la mediana
Variable estadstica discreta
Datos simples:
Si el n de datos es impar, el valor central de la variable es
nico.
Si el n de datos es par, existen dos trminos centrales. Se
toma como valor de la mediana la semisuma de estos dos
valores.
Datos agrupados:
Se construye la tabla de frecuencias acumuladas. La mediana
es el primer valor de la variable cuya frecuencia acumulada
excede a la mitad del nmero
de datos.
Cuando la mitad del nmero de datos coincida con la
frecuencia acumulada de un valor, la mediana es la semisuma
entre ese valor y el siguiente de la tabla.

Clculo de la mediana (II)


Variable estadstica continua o discreta con datos
agrupados en intervalos
Para determinar la clase mediana se procede del mismo modo
que en el caso de variables discretas con datos no agrupados en
intervalos.
Para determinar el valor concreto de la variable que deja a su
izquierda igual nmero de datos que a su derecha, aplicamos la
frmula:

N
Fi 1
2
M L i c.
fi

Li = Lmite inferior de la clase modal


c = amplitud de los intervalos
N = Nmero total de datos
Fi-1 = Frecuencia absoluta acumulada
de la clase anterior a la clase
mediana.
Fi = frecuencia absoluta de la clase
mediana.

Test sobre satisfaccin en el trabajo: N=88


Clases

fi

Fi

[38-44)
[44-50)
[50-56)
[56-62)
[62-68)
[68-74)
[74-80)

7
8
15
25
18
9
6

7
15
30 < 44
55 > 44
73
82
88

Aplicando la frmula:
Li = 56
44 30
c=6
M 56 6
59.36
25
N/2 = 44
Fi-1 = 30
fi = 25

Clase mediana:
[56-62)

25 14

6
x
25
14
x
56 6

62

14
x 6 3.36
25
M=56+3.36=59.36

Mtodo grfico para el clculo de la mediana


1.
2.

Representamos el histograma de frecuencias acumuladas porcentuales


Trazamos el polgono de frecuencias acumuladas, uniendo los vrtices superiores
derechos de los rectngulos del histograma.
Sobre el polgono determinamos el valor de la variable que corresponde a una frecuencia
acumulada del 50%.

3.

50

Variables cuantitativas: Medidas de posicin


Cuantiles: La mediana divide los datos de la distribucin en dos
partes iguales.
Podemos estudiar otros parmetros que dividan la distribucin de
datos en otras proporciones.
Los cuartiles son tres valores que dividen la distribucin de
datos en 4 partes iguales, dejando debajo de ellos el 25%, el 50
% y el 75 % de los datos respectivamente.
Se representan por Q1, Q2 y Q3.
0

25%
Q1

50%
Q2

75%
Q3

100%

Los quintiles son cuatro valores que dividen la distribucin de


datos en 5 partes iguales, dejando debajo de ellos el 20%, el 40 %,
60% y el 80 % de los datos respectivamente.
Se representan por K1, K2, K3 y K4.
0

20%
K1

40%
K2

60%
K3

80%
K4

100%

Los deciles son nueve valores que dividen la distribucin de datos


en 10 partes iguales, dejando debajo de ellos el 10%, el 20 %,
30%, , y el 90 % de los datos respectivamente.
Se representan por D1, D2, D3,., D9.
Los percentiles son noventa y nueve valores que dividen la
distribucin de datos en 100 partes iguales, dejando debajo de
ellos el 1%, el 2 %, 30%, , y el 99 % de los datos
respectivamente.
Se representan por P1, P2, P3,., P99.

Las calificaciones en la asignatura de historia de los 40 alumnos


de una clase viene dada por la tabla:
Calificaciones

N de alumnos

Clculo de Q1
Clculolos
de cuartiles
P70
Calcular
primero y tercero y los percentiles
de de Q3
Clculo
N/4=10.de P30
Clculo
orden
30
y
70
70.N/100=28
3.N/4=30
Xi
fi
Fi 30.N/100=12
1
2
3
4
5
6
7
8
9

2
2
4
5
8
9
3
4
3

Total = 40

2
4
8
13
21
30
33
37
40

<12
<10
>10
>12
<28
=30
>28

Q
P30
=4
1=4
PQ70=6
3=6.5

Se ha aplicado un test sobre satisfaccin en el trabajo a 88


empleados de una fbrica, obtenindose las resultados:

Calcular:

Puntuaciones

Nm. de trabajadores

[38-44)
[44-50)
[50-56)
[56-62)
[62-68)
[68-74)
[74-80)

7
8
15
25
18
9
6

a) Los cuartiles primero y tercero.


b) Los percentiles de orden 40 y 90

Test sobre satisfaccin en el trabajo: N=88


Q1 deja la cuarta parte de la distribucin a su izquierda :N/4=22
Clases
fi
Fi
Clase del primer
cuartil: [50-56)
[38-44)
7
7
[44-50)
8
15 <22
15 7

[50-56)
15
30 >22
[56-62)
[62-68)
[68-74)
[74-80)

25
18
9
6

55
73
82
88

Aplicando la frmula:
Li = 50
22 15
c=6
M 50 6
52.8
15
N/4 = 22
Fi-1 = 15
fi = 15

15
7
x
50

56

7
x 6 2.8
15

M=50+2.8=52.8

Test sobre satisfaccin en el trabajo: N=88


Q3 deja las tres cuartas partes de los datos a su izquierda :3.N/4=66
Clases

fi

Fi

[38-44)
[44-50)
[50-56)
[56-62)
[62-68)
[68-74)
[74-80)

7
8
15
25
18
9
6

7
15
30
55
73
82
88

Clase del tercer


cuartil: [62-68)

<66
>66

Aplicando la frmula:
Li = 62
66 55
c=6
M 62 6
65.67
18
N/4 = 66
Fi-1 = 55
fi = 18

18 11

6
x
18
11
x
62
x 6

68

11
3.67
18

M=62+3.67=65.67

Test sobre satisfaccin en el trabajo: N=88


P40 deja el 40% de los datos a su izquierda :88.40/100=35.2
Clases

fi

Fi

[38-44)
[44-50)
[50-56)
[56-62)
[62-68)
[68-74)
[74-80)

7
8
15
25
18
9
6

7
15
30
55
73
82
88

Clase de P40:
[56-62)
< 35.2
> 35.2

Aplicando la frmula:
Li = 56
c=6
35.2 30
M

56

57.25
40.N/100 = 35.2
25
Fi-1 = 30
fi = 25

25 5.2

6
x

25
5.2
x
56
x 6

62

5.2
1.25
25

M=56+1.25=57.25

Test sobre satisfaccin en el trabajo: N=88


P90 deja el 90% de los datos a su izquierda :88.90/100=79.2
Clases

fi

Fi

[38-44)
[44-50)
[50-56)
[56-62)
[62-68)
[68-74)
[74-80)

7
8
15
25
18
9
6

7
15
30
55
73
82
88

Clase de P90:
[68-74)
9 6.2

6
x

< 79.2
> 79.2

Aplicando la frmula:
Li = 68
c=6
79.2 73
M

68

72.13
90.N/100 = 79.2
9
Fi-1 = 73
fi = 9

9
6.2
x
68
x 6

74

6.2
4.13
9

M=68+4.13=72.13

Mtodo grfico para el clculo de los cuantiles


1.
2.
3.

Representamos el histograma de frecuencias acumuladas porcentuales


Trazamos el polgono de frecuencias acumuladas, uniendo los vrtices superiores
derechos de los rectngulos del histograma.
Sobre el polgono determinamos el valor de la variable que corresponde a una frecuencia
acumulada correspondiente al cuantil deseado

75%

25%

Q1 P40

Q3

Anda mungkin juga menyukai