Anda di halaman 1dari 35

ESTADÍSTICA

DESCRIPTIVA
EDB 2013-II – 1era parte
Facultad de Ingeniería
Introducción
 ¿Cómo informar acerca de unos datos que se acaban de
recopilar en una empresa?
 Presentarlos en un listado.
 Indicar cuál217.44
212.00 202.22 es el227.76
promedio
226.98 232.33 y la desviación
193.16 estándar
212.66 225.95 204.13

(dispersión): 215,69; 10,33.


208.10 198.10 196.53 205.22 207.26 193.82 209.32 210.96 216.35 211.35
211.73 211.30 228.43 214.15 213.14 209.87 234.72 223.66 238.76 208.45
231.61 198.88 220.39 224.02 234.19 214.15 209.76 221.75 211.19 222.58
 Presentar
200.56 206.53un resumen.
199.78 211.37 214.68 215.28 211.77 236.95 197.58 207.64
189.22 229.48 202.20 208.46 222.58 219.67 223.75 220.96 201.28 203.84
 Mediante tablas.
221.94 218.23 205.60 212.59 216.32 220.58 216.39 205.89 233.85 219.87
215.72 223.30 223.62 208.63 205.77 226.11 202.99 199.41
Límites 222.11
f 221.38
80
 Mediante gráficos.
237.06 229.44 228.04 216.13 215.02 219.54 214.74 204.45
180.01 190.00
197.25
3
223.28
70
219.44 221.18 217.13 204.73 227.38 211.89 206.60 206.79 210.71 210.47
190.01 200.00 13 60
 Una buena presentación de esos datos permitirá
209.76
209.50
223.49
223.49
220.13
223.03
208.92
219.56
228.05
221.91
197.39 220.51 213.84
231.31200.01
218.04210.00
220.89
215.42
42
233.53
208.46
50
211.64
225.38 216.44 226.41 213.52 207.20 225.76210.01
209.18220.00
220.34 70
220.46 211.84
40
analizarlos e interpretarlos bien.
210.59
216.88
201.34
220.42
234.93
212.50
209.34
202.79
215.86
227.67
220.01
212.11230.01
230.00
212.66 243.35 227.52
201.94240.00
222.64
58
223.81
13
222.84
228.32
30
219.28
20
219.04 208.52 222.23 220.25 225.75 240.01 250.00
187.31 219.64 229.67 1
197.77 215.45
228.54 231.88 217.39 216.45 233.55 214.57 208.43 224.07 214.90 10
225.39
219.35 229.53 213.79 205.38 199.61 189.35 216.03 217.99 214.82 0
217.00
217.58 229.76 215.85 203.83 201.10 216.91 224.51 199.91 208.90 220.24
212.83 211.56 213.37 210.60 206.97 221.45 215.59 227.63 217.62 215.57
Medidas descriptivas
 Medidas descriptivas

Las medidas descriptivas usadas en las


investigaciones estadísticas, nos permiten localizar
con cierta precisión un conjunto de datos.

Estas medidas pueden ser:


- de tendencia central.
- de variabilidad.
- de posición.
- de forma.
Medidas descriptivas
 De tendencia central
 Media aritmética
 Mediana
 Moda
 De variabilidad
 Amplitud
 Desviación media
 Varianza
 Desviación estándar
 Coeficiente de variación
Medidas descriptivas
 Medidas descriptivas de posición
 Cuartiles
 Percentiles
 Medidas descriptivas de forma
 Asimetría
 Curtosis
Medidas de tendencia central: Media
Aritmética

1 n
x   xi
N
1
n i 1

N
x
i 1
i

Media muestral Media poblacional


k k k

 f x‘ i i w x i i N x i i
x i 1
k x i 1 x i 1
k

f N
k

i 1
i
 wi
i 1
i 1
i

Media muestral Media ponderada Media de medias


Ejemplo: Media
 Hay 2 salones de estadística, uno de 80 alumnos cuya media de
notas es de 11,5 y otro de 90 alumnos cuya media de notas es de
12,5. ¿Cuál es el promedio de notas en el curso?

N x i i
8011,5  9012,5
x i 1
k
x
 Ni
i 1
170
Ejemplo
 Una entidad financiera ofrece los siguientes inte-reses anuales, según
los montos que depositen los ahorristas a plazo fijo: 6% para depósitos
A (de 1000 dólares); 8% para depósitos B (de 2000 dólares) y 10%
para depósitos C (de 5000 dóla-res). ¿Cuál es el interés anual
promedio que paga el banco si hay 150 depósitos A, 100 depósitos B y
50 depósitos C?

150  6  100  8  50  10
x  7,33 %
300
Ejemplo
 Se han registrado los pesos de las bol-sas de arroz empacadas por
una empre-sa durante 7 horas, resultando un pro-medio de 0,992
Kg. Si cada hora se em-bolsan 30 unidades, ¿cuál será el peso
promedio si en la octava hora se regis-tra un peso promedio de
1,025 Kg?

7  0,992  1 1,025
x  0,996 Kg.
8
Medidas de tendencia central
 Mediana
 Dado un conjunto de n datos, la mediana es aquél que ocupa
la posición central, cuando los datos se ordenan en orden
creciente (o decreciente). Es decir que el 50% de las
observaciones sean menores o iguales a él y otro 50% mayor
o igual que él.
Medidas de tendencia central:
Mediana- datos no agrupados

 Si se ordenan los datos (observaciones) de menor a mayor y


el número de éstos ( n ) es impar, la mediana será el dato que
ocupe el lugar ó estará
n 1
entre los valores si es
2el número de datos
es par. n n
y 1
2 2
Ejemplo: Mediana
 Los sueldos de una empresa están indicados en la siguiente tabla:
Hallar media y mediana

Nº de Trabajadores Sueldo en soles


5 800
1 1000
3 1200
1 2000
1 30000
11
Ejemplo: Mediana
 Los sueldos de una empresa están indicados en la siguiente tabla:
Hallar media y mediana
Nº de Trabajadores Sueldo en soles Total
5 800 4000
1 1000 1000
3 1200 3600
1 2000 2000
1 30000 30000
11 40600

40600
x ; Me  X n1  X 6  1000
11 2
Medidas de tendencia central
 Moda
 Dado un conjunto de datos, la moda (Mo) es el valor que se
repite con mayor frecuencia.
 Cuando dos o más datos son los que tienen la mayor frecuencia,
se dice que el conjunto de datos es bimodal o multimodal,
respectivamente.
Ejemplo:Moda
 En ciencias, hay 4 especialidades: química, matemática,
estadística y física.

ESPECIALIDAD Nº Matriculados
Q 20
M 15
E 10
F 5

Mo = Química con 20 matriculados


Medidas de variabilidad
¿Qué es la variabilidad?
Es la dispersión que hay entre los datos.

 Dispersión: Es la mayor o menor concentración de los datos respecto a un valor central.

1) Amplitud o Rango
Es la diferencia entre el mayor y el menor de un conjunto de datos.

A = Máx Xi - Mín Xi
Medidas de variabilidad
2) Desviación media o desviación promedio: es la media aritmética
de las desviaciones respecto a la media aritmética.

1 n
D.M .   xi  x
n i 1

1 k
DM   xi  x fi
n i 1
Medidas de variabilidad: varianza
 Para una muestra: varianza (s2)
n k
s 2    xi  x  s 2   f i  xi  x 
1 2 1 2

n i 1 n i 1

 Para una población: varianza ( 2)



N k

 x    f x  
1 1
 
2
i
2
 
2
i i
2

N i 1 N i 1
Medidas de variabilidad
 Para muestras pequeñas, se estima mejor la varianza (o la
desviación estándar) de la población, dividiendo entre n-1 en
vez de dividir entre n:

n 2 k 2

sn 1
2

1
 xi  x  sn 1
2

1
 fi xi  x 
n  1 i 1 n  1 i 1
Medidas de variabilidad

 Desviación estándar (s ó σ )
 Es la raíz cuadrada positiva de la varianza.
 Es la media aritmética del cuadrado de las desviaciones respecto
de la media aritmética.
 Es la medida de variabilidad que más se emplea, debido a que se
expresa en las mismas unidades que los datos y la media
aritmética.
Medidas de variabilidad
 Coeficiente de variación: nos permite comparar la variabilidad de
los grupos de datos aunque la magnitud de ellos sea diferente

s C.V 

Cv 
x 
Medidas de variabilidad
 Coeficiente de variación:

 s
V v
 x
 Suele ser de gran utilidad cuando se desea
comparar las dispersiones de dos conjuntos de
datos cuyas medias difieren significativamente,
e incluso si se trata de medidas diferentes.
Ejemplo: coeficiente de variación
 Coeficiente de variación
 Medio año después de haber sembrado 50 semillas, se miden las alturas
de las plantas, obteniéndose una media de 43,6 cm. y una desviación
estándar de 5,1 cm. Al cumplir un año, se vuelven a medir las alturas
de las plantas, encontrándose una media de 128,7 cm. y una desviación
estándar de 6,6 cm. Compare las dispersiones de las plantas en ambos
momentos.
 Al medio año: V1 = 5,1/43,6 = 0,117
 Al año: V2 = 6,6/128,7 = 0,051
 Si se comparasen las desviaciones estándar, se afirmaría que la
dispersión aumentó; pero comparando las dispersiones respecto a las
alturas (representadas por las medias aritméticas), se puede afirmar
que la dispersión relativa ha disminuido.
Medidas de posición

 Cuartiles
 Dado un conjunto de datos ordenados en forma ascendente, los
cuartiles lo dividen en cuatro partes iguales.
 El primer cuartil, Q1, es un valor tal que, a lo sumo, la cuarta parte de los datos es
menor que Q1, y, a lo sumo, las tres cuartas partes son mayores.
 El segundo cuartil, Q2, coincide con la mediana.
 El tercer cuartil, Q3, es un valor tal que, a lo sumo, las tres cuartas partes de los
datos son menores que Q3, y, a lo sumo, la cuarta parte es mayor.
Medidas de posición: Ejemplo
 Cuartiles: datos no agrupados

5 5 6 6 6 7 7 8 8 8 9 9 9 12 12 13 13 14 14 16
6.25 8.50 12.75

16
15
14
13
12
11
10
9
8
7
6
5
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Medidas de posición
 Ejemplo de cuartiles:
3, 6, 7, 10, 11, 14, 17, 18, 19, 21, 23, 25.

Q1 = 9,25 Q2 = 15,5 Q3 = 19,5

 Para el cálculo de los cuartiles se recomienda


recurrir a Excel.
Medidas de posición
 Percentiles
 Dado un conjunto de datos ordenados en forma ascendente, los
percentiles lo dividen en cien partes iguales.
 El k-ésimo percentil, Pk, es un valor tal que, a lo sumo, el k por ciento de
los datos son menores que Pk. Para determinar los percentiles se sigue el
mismo procedimiento que para los cuartiles.
Medidas de forma
 Coeficiente de asimetría
 Mide si un conjunto de datos están más dispersos por encima de
la media aritmética o por debajo de ella:

1) Coeficiente de asimetría de Pearson:


 xi  x 
3
n x  Mo
Assk
p =
  
n  1n  2  s 
 Assk
p =

s
Medidas de forma: coeficiente de
asimetría de Pearson
 Sólo se puede utilizar en distribuciones campaniformes,
unimodales y moderadamente asimétricas.

As p ‹ 0 As p = 0 As p > 0
Medidas de forma
 Curtosis: medida de apuntamiento
 Es la propiedad de una distribución de frecuencias por la cual se
compara la dispersión de los datos observados cercanos al valor
central con la dispersión de los datos cercanos a ambos extremos
de la distribución.
 La curtosis se mide en comparación a la curva simétrica normal
o “mesocúrtica”.

 nn  1  xi  x   3n  1
4 2
k    
 n  1n  2n  3  s   n  2n  3
Medidas de forma: curtosis

k =g2 > 0 k=g2 = 0 k=g2 < 0


Medidas de forma: curtosis
Exactitud y precisión
 Exactitud
 es la proximidad de un resultado o de un conjunto de resultados
de un experimento con el resultado verdadero o real.
 Precisión
 es la cercanía entre los resultados de un experimento.
Exactitud y precisión
Tipos de errores
 Aleatorios
 Provocan que los resultados se dispersen alrededor del valor promedio
(afectan la precisión o reproducibilidad de un experimento).
 La varianza o la desviación estándar miden qué tan grande o pequeño será el
error aleatorio.
 Sistemáticos
 Provocan que los resultados se desvíen en el mismo sentido (afectan la
exactitud de los resultados).
 La diferencia entre la media de los resultados y el valor verdadero es una
medida del error sistemático.

Anda mungkin juga menyukai