Anda di halaman 1dari 38

ASPECTOS GENERALES DE

ESTADSTICA
Anlisis Industrial - Unidad 2

Estadstica

ESTADISTICA
Definicin prctica
HERRAMIENTA UTILIZADA PARA DISCRIMINAR ENTRE
LAS PARTES SISTEMATICA (DETERMINADA) Y AL
AZAR (INDETERMINADA) DE UNA SEAL O
RESULTADO ANALITICO

y =
Resultado
analtico

+
Sistemtica

Al azar

Estadstica

MEDIDAS DE TENDENCIA CENTRAL


Son aquellas que nos indican alrededor de que valor
se agrupan el mayor nmero de observaciones.
1.MEDIA (valor medio promedio). Es la que se obtiene
sumando todos los valores y dividiendo el total entre el nmero
de observaciones. Su notacin es x
n

i 1

x1 x2 x3 x4 ... xn
x
n

Ejemplo: Calcule la media para el siguiente conjunto de datos:


39, 29, 43, 52, 39, 44, 40, 31, 44, 35
R/

x 39.6

Estadstica

MEDIDAS DE TENDENCIA CENTRAL


2. MEDIANA. Es el valor de la variable que divide en dos partes
iguales al nmero total de observaciones. Su notacin es Md.
Regla 1. Si el nmero de datos es impar, la mediana es el dato
que queda exactamente en el medio del arreglo ordenado.
Datos Menores , Md, Datos Mayores
Ejemplo: Calcule la media para el siguiente conjunto de datos:
39, 29, 43, 52, 39, 44, 40, 31, 44
Datos ordenados: 29, 31, 39, 39, 40, 43, 44, 44, 52
R/ Md = 40

Estadstica

MEDIDAS DE TENDENCIA CENTRAL


LA MEDIANA
Regla 2. Si el nmero de datos es par, la mediana es el
promedio de los dos datos medios del arreglo ordenado.
Datos Menores , a , b , Datos Mayores

ab
Md (
)
2
Ejemplo: Calcule la mediana para el siguiente conjunto de datos:
39, 29, 43, 52, 39, 44, 40, 31, 44, 35
Datos ordenados: 29, 31, 35, 39, 39, 40, 43, 44, 44, 52
R/ Md = 39.5

Estadstica

MEDIDAS DE TENDENCIA CENTRAL


3. MODA. Es el valor de la variable que se presenta con mayor
frecuencia. Su notacin es Mo.
Recuerde que la moda es el valor que aparece con
mayor frecuencia en un conjunto de datos
Ejemplo: Cual es la moda para el siguiente conjunto de datos:
39, 29, 43, 52, 39, 44, 40, 31, 39, 35
Los datos de ordenan de menor a mayor:
29, 31, 35, 39, 39, 39, 40, 43, 44, 52
R/

Mo = 39
6

Estadstica

MEDIDAS DE DISPERSIN
Son aquellas que registran la variacin que presentan
los valores de las observaciones, es decir, informan
sobre la dispersin de los datos
1.RANGO ABSOLUTO. Es la diferencia entre el valor
mayor y el valor menor de un grupo de datos.
R = valor mas grande - valor ms pequeo

Estadstica

MEDIDAS DE DISPERSIN
2. VARIANZA. Mide la dispersin de los valores respecto a la
media y se expresa en unidades cuadradas. Su notacin es S2
para una muestra.
n

(x x)

s
2

i 1

n 1

3. DESVIACION ESTANDAR. Es la raz cuadrada de la


varianza. Representa todas las diferencias de las observaciones
respecto a la media. Su notacin es S
n

(x x)

i 1

n1

Estadstica

RESUMEN SIMBOLOGA ESTADSTICA


= Sumatoria o total
= Media
Md = Mediana
Mo = Moda
R = Rango
S2 = Varianza
S = Desviacin Estndar
n = Total de Observaciones de una muestra

Pruebas de significacin

PRUEBAS DE SIGNIFICACIN
TAMBIEN LLAMADAS
PRUEBAS DE HIPTESIS NULA
UN PROCEDIMIENTO SISTEMTICO QUE NOS PERMITE
DECIDIR SI UN CONJUNTO DE MEDICIONES REPETIDAS
MUESTRA EVIDENCIA DE ERROR SISTEMTICO

EL PROPSITO DE UNA PRUEBA DE


SIGNIFICACIN ES SACAR UNA CONCLUSIN
ACERCA DE UNA POBLACIN UTILIZANDO
DATOS PROVENIENTES DE UNA MUESTRA
10

Pruebas de significacin

COMPARACIN DE UNA MEDIA


EXPERIMENTAL CON UN VALOR CONOCIDO
EJEMPLO:
En un mtodo nuevo para determinar selenourea en agua, se
obtuvieron los siguientes valores para muestras de agua de grifo
adicionadas con 50 ng/mL de selenourea:
50.4, 50.7, 49.1, 49.0, 51.1 ng/mL
Hay alguna evidencia de error sistemtico?

x 50.06

s 0.956

La cuestion es si la diferencia entre el resultado y el


valor real es estadsticamente significativa, o si se debe
a meras variaciones al azar.

11

Pruebas de significacin

PROCEDIMIENTO
Paso 1:
Hiptesis nula (H0) : se adopta la hiptesis nula de
que no hay error sistemtico. sea = 50
Paso 2:
Prueba estadstica:
t calc

x
s

t calc

50.06 50 5

0.14
0.956

Nota: lo que se compara es el valor absoluto de tcalc

12

Pruebas de significacin

Paso 3:
Valores crticos: compare el resultado de la prueba
estadstica (tcalc) con valores tcrit (ver tabla siguiente):
tcrit = 2.78

(P = 0.05, f = 4)

P = el nivel de significacin
f = grados de libertad (n-1)
El nivel de significacin (P = 0.05) proporciona la probabilidad de
rechazar una hiptesis nula cuando esta es verdadera. En este caso 5 %.
Utilizando este nivel de significacin se rechaza en promedio, la hiptesis
nula, aunque de hecho sea verdadera, 1 de cada 20 veces

Si tcalc excede el valor tcrit, la hiptesis nula se rechaza.


13

Pruebas de significacin

Valores crticos de t

14

Pruebas de significacin

Paso 4:
Decisin: Como tcalc < tcrit, la hiptesis nula se
retiene.
Por lo tanto no es significativamente diferente de 50.
Es decir, no hay evidencia de error sistemtico.

Nota importantsima:
Hay que sealar que esto no significa que no existan
errores sistemticos, si no que no se ha podido
constatar su existencia.
15

Pruebas de significacin

PRUEBAS DE SIGNIFICACIN
ENFASIS SOBRE LO IMPORTANTE

H0 ES UNA DECLARACIN DE QUE NO HAY DIFERENCIA,


ES DECIR, QUE CUALQUIER DISCREPANCIA OBSERVADA
ES DEBIDA SOLO AL AZAR.

H0 ES LA HIPOTESIS QUE EL INVESTIGADOR ESPERA


RETENER.

EL NIVEL DE SIGNIFICANCIA P ES EL RIESGO (LA


PROBABILIDAD)
QUE
EL
INVESTIGADOR
EST
DISPUESTO
A
TOMAR
SI
RECHAZARA
INCORRECTAMENTE LA H0 VERDADERA.
16

Pruebas de significacin

COMPARACIN DE DOS MEDIAS


EXPERIMENTALES
SE QUIEREN COMPARAR LOS RESULTADOS DE UN
NUEVO

MTODO

ANLITICO

CON

AQUELLOS

OBTENIDOS POR UN SEGUNDO MTODO (REFERENCIA)

CONOCIDOS:

x1 & x2
s1 & s2
n1 & n2
17

Pruebas de significacin

COMPARACIN DE DOS MEDIAS


CASO I:
s1 y s2 no son significativamente diferentes
H0:

Los dos mtodos no producen resultados


diferentes, sea 1 no es 2

Prueba estadstica:

tcalc

x1 x2
1 1
s

n1 n2

Con

2
2
f
s

f
s
2 2
s2 1 1
f1 f 2

tcalc tiene f1 + f2 (o sea, n1+ n2- 2) grados de libertad


18

Pruebas de significacin

COMPARACIN DE DOS MEDIAS


CASO II:
s1 y s2 son significativamente diferentes
H0:

Los dos mtodos no producen resultados


diferentes, sea 1 no es 2

Prueba estadstica:

tcalc

x1 x2
2
1

2
2

s
s

n1 n2

Con

grados de libertad
redondeado al
entero mas cercano

s12 s22


n n
f 12 2 2 2
s12
s22

n1 n2
n1 1 n2 1
19

Pruebas de significacin

USO CORRECTO DE LA PRUEBA t PARA


COMPARAR DOS MEDIAS

x1
x2
Use la prueba F para resolver
seste
vscondicional
s2
1
n1
n2
S1 = S2

CASO I

SI

tcalc

NO

CASO II
2

t calc

x1 x2

x1 x2
s12
s22

n1 n2

s12 s22


n
n
f 12 2 2 2
s12
s22

n
n
1 2
n1 1 n2 1

1
1

n1 n2

f1s12 f 2 s22
s
f1 f 2
2

f f1 f 2
20

Pruebas de significacin

COMPARACIN DE DOS MEDIAS


Ejemplo (caso I): En una serie de experimentos para la
determinacin de estao en productos alimenticios, Las muestras
fueron llevadas a ebullicin con HCI a reflujo para diferentes tiempos:

Estao
(mg/Kg)
55
57
59
56
56
59

30 min

75 min
Muestra

Estao
(mg/Kg)
57
55
58
59
59
59

Es significativamente diferente la cantidad media de estao


encontrada para los dos tiempos de ebullicin?

21

Pruebas de significacin

SOLUCION DEL PROBLEMA CON MICROSOFT EXCEL


Paso 1. Realice una prueba F para varianzas de dos muestras:
Hiptesis Nula : S21 = S22.
75 min

Datos con S
mas alta

55

57

Datos con S
mas baja

57

55

59

58

56

59

56

59

59

59

30 min

Esto significa 1 cola con P = 0.05


Ojo - Truco:
Cambiar este nmero a 0.025 si
se quiere dos colas con P = 0.05

_
x Conclusin:
57.00
57.83
s Como
1.673 F 1.602
calc < Fcrit entonces se retiene la

hiptesis nula. Se asume varianzas


iguales.

Prueba F para varianzas de dos muestras

(Dos colas)

Media
Varianza
Observaciones
Grados de libertad

Variable 1
Variable 2
57 57.8333333
2.8 2.56666667
6
6
5
5

1.09090909

22

Pruebas de significacin

Paso 2. Ya que la prueba F indic que S21 = S22. Realizar una


prueba t para dos muestras suponiendo varianzas iguales.

Hiptesis nula: el tiempo de ebullicin no influye en la cantidad de


estao encontrado. sea 1 = 2
30 min

75 min

55

57

57

55

59

58

56

59

56

59

59

59

_
xConclusin:
57.00
57.83
tcalc <1.602
tcrit entonces se retiene la
sComo
1.673

hiptesis nula y se concluye que el el


tiempo de ebullicin no influye en la
cantidad de estao encontrado.

Prueba t para dos muestras suponiendo varianzas iguales

Media
Varianza
Observaciones

Variable 1
Variable 2
57.00
57.83
2.80
2.57
6
6

Varianza agrupada

2.68333333

Diferencia hipottica de las medias


Grados de libertad

0
10

23

Pruebas de significacin

COMPARACIN DE DOS MEDIAS


Ejemplo (caso II). La siguiente tabla muestra la concentracin
de tiol (mM) en sangre de dos grupos de voluntarios. El primer
grupo es normal y el segundo sufre de artritis reumatoide.
Es la concentracin de tiol en la sangre de los enfermos de artritis
reumatoide diferente de aquella de los individuos normales a un
nivel de significancia P = 0.01 ?
Normal

Reumatoide

1.84

2.81

1.92

4.06

1.94

3.62

1.92

3.27

1.85

3.27

1.91

3.76

2.07

Respuesta:
Fcalc = 33.96 > Fcrit = 5.99 , sea que S21 S22.

Se realiza prueba t para dos muestras


suponiendo varianzas desiguales. Ho : 1 = 2
tcalc = 8.48 > tcrit = 4.03, por tanto se rechaza la
hiptesis nula. sea que 1 2
Se concluye que la concentracin de tiol
difiere significativamente entre los dos grupos.
24

Pruebas de significacin

LA PRUEBA t PARA DATOS EMPAREJADOS


CIRCUNSTANCIAS EN LAS CUALES ES NECESARIO O DESEABLE
HACER UNA COMPARACION DE MEDIAS POR PAREJAS:

Cantidad limitada de una o mas muestras (solo hay muestra


suficiente para una determinacin por cada metodo)

Muestras

de orgenes diferentes y posiblemente con


concentraciones diferentes *

Muestras que se reciben en un periodo de tiempo largo (se


hace necesario eliminar efectos de condiciones ambientales
variables como temperatura, presin, etc.)
* Se asume que cualquier error (sistemtico o al azar) es
independiente de la concentracin. En caso de diferencias
de concentracin muy amplias es mejor usar anlisis de
regresin (ver seccin de calibracin).
25

Pruebas de significacin

LA PRUEBA t PARA DATOS EMPAREJADOS


Ejemplo: Para la determinacin de paracetamol

(% m/m) en
comprimidos, se analizaron diez pastillas de lotes diferentes para ver
si diferan los resultados obtenidos por dos mtodos diferentes.
Paracetamol
(% m/m)

Paracetamol
(% m/m)

Muestras

84.63

83.15

84.38

83.72

84.08

83.84

84.41
83.82

Mtodo 1
UV- visible

Mtodo 2
FT-IR

84.20
83.92

83.55

84.16

83.92

84.02

83.69

83.60

84.06

84.13

84.03

84.24

26

Pruebas de significacin

SOLUCION DEL PROBLEMA MANUALMENTE


Paso 1. Calcule la diferencia entre los pares de valores. Obtenga la
media de estos valores ( ) y su desviacin estndar Sd .
Metodo 1

Metodo 2

Diferencia

84.63
84.38
84.08
84.41
83.82
83.55
83.92
83.69
84.06
84.03

83.15
83.72
83.84
84.20
83.92
84.16
84.02
83.60
84.13
84.24

1.48
0.66
0.24
0.21
-0.10
-0.61
-0.10
0.09
-0.07
-0.21

0.159

Sd =

0.570

Si el mtodo 1 y el mtodo 2
arrojaran valores idnticos de
concentracin
entonces la
diferencia entre las parejas de
datos sera = 0.

Hay que preguntarse si este


promedio difiere significativamente
de 0.

27

Pruebas de significacin

SOLUCION DEL PROBLEMA MANUALMENTE


Paso 2. Para contrastar si n resultados emparejados se extraen de
la misma poblacin, es decir, Ho : = 0, se calcula el estadstico t :

t calc

n
sd

tcalc

0.159 10

0.88
0.570

Los
grados
de
libertad son n 1.
sea f = 9.

Paso 3.

Valores crticos: compare el resultado de la prueba estadstica


(tcalc) con valores tericos tabulados:

tcrit = 2.26

(P = 0.05, f = 9)

Paso 4.

Decisin: Como tcalc < tcrit, la hiptesis nula se retiene. Es


decir, los mtodos no proporcionan resultados significativamente diferentes
para la concentracin de paracetamol.
28

Pruebas de significacin

SOLUCION DEL PROBLEMA CON MICROSOFT EXCEL


Pasos. Realice una prueba t para medias de dos muestras
emparejadas: Hiptesis nula: = 0.
Mtodo 1

Mtodo 2

84.63
84.38
84.08
84.41
83.82
83.55
83.92
83.69
84.06
84.03

83.15
83.72
83.84
84.20
83.92
84.16
84.02
83.60
84.13
84.24

Conclusin:
Decisin: Como tcalc <
tcrit, la
hiptesis nula se retiene. Es decir, los
mtodos no proporcionan resultados
significativamente diferentes.

Prueba t para medias de dos muestras emparejadas

Media
Varianza
Observaciones
Coeficiente de correlacin de Pearson

Variable 1
Variable 2
84.06
83.90
0.11391222 0.11437333
10
10
-0.42321351

Diferencia hipottica de las medias

Grados de libertad

29

Pruebas de significacin

PRUEBA F PARA LA COMPARACION DE


DESVIACIONES ESTNDAR

til para comparar la precisin de diferentes mtodos.


La prueba F considera el cociente de las dos varianzas
muestrales
Fcalc
(Ojo:

2
1
2
2

s1 s2

siempre, varianza mayor / varianza menor):

El numero de grados de libertad del numerador y denominador


son (n1 1) y (n2 1) respectivamente.
30

Pruebas de significacin

PRUEBA F PARA LA COMPARACION DE


DESVIACIONES ESTNDAR
Hiptesis nula: Las desviaciones estndar de las poblaciones
no son significativamente diferentes ( S1 No S2 )
Es decir, el cociente de varianzas no difiere
significativamente de la unidad

s12
no 1
2
s2
Evaluacin:
Rechazar la hiptesis nula si Fcalc > Fcrit

31

Pruebas de significacin

DOS FORMAS DE HACER LA PRUEBA F


PRUEBA DE UNA COLA (UNILATERAL):
Prueba si un mtodo A es mas preciso que un
mtodo B.
ojo: uno esta interesado en detectar la diferencia en una
sola direccin

PRUEBA DE DOS COLAS (BILATERAL):


Prueba si los mtodos A y B difieren en su
precisin.
Ojo: uno est interesado en detectar cualquier diferencia
en cualquier direccin

Pruebas de significacin
Valores crticos de F para un contraste de una cola (P = 0.05)
Grados de libertad
del numerador

Grados de libertad
del denominador

Valores crticos de F para un contraste de dos colas (P = 0.05)


Grados de libertad
del numerador

Grados de libertad
del denominador

Pruebas de significacin

PRUEBA F - EJEMPLOS
UNA COLA:
Se compar un mtodo propuesto para la determinacin de la
demanda de oxgeno en aguas residuales con un mtodo estndar.
se obtuvieron los siguientes resultados (ppm) en una muestra:
METODO

media

desv std

ESTANDAR

72

3.31

PROPUESTO

72

1.51

Es el mtodo propuesto mas preciso que el mtodo estndar ?


Respuesta:
Como Fcalc > Fcrit la varianza del mtodo estndar es significativamente
mayor a la del mtodo propuesto. Osea que el mtodo propuesto es mas
preciso.

Pruebas de significacin

PRUEBA F - EJEMPLOS
DOS COLAS:
Se obtuvieron los siguientes resultados en la determinacin de
Boro en material vegetal por dos mtodos diferentes.
media

desv std

MET 1. ESPECTROFOTOMTRICO

28.00

0.30

10

MET 2. FLUORIMTRICO

26.25

0.23

Son los resultados de estos dos mtodos significativamente


diferentes?
Respuesta:
Hiptesis nula: S21 = S22
Como Fcalc < Fcrit la hiptesis nula se retiene. sea que no hay diferencia
en la precisin de los dos mtodos.

Pruebas de significacin

PRUEBA Q PARA DATOS ANMALOS


Cuando se hacen mediciones por replicado, a veces un resultado
parece diferir sustancialmente de los dems. Una prueba de
significacin llamada prueba-Q puede utilizarse para chequear
si el valor sospechoso puede descartarse antes de calcular la
media y la desviacin estndar. Para aplicar esta prueba, se
calcula un cociente de rechazo Q, definido como:

Q valor sospechoso - valor ms cercano


(valor mas grande - valor ms pequeo)

y se ve si excede el valor crtico apropiado en la tabla estadstica


de cocientes, que aparece en la pgina siguiente.
Si Qcalc > Qcrit , el resultado sospechoso puede descartarse.

Pruebas de significacin

PRUEBA Q PARA DATOS ANMALOS


Aplicar la prueba-Q a los siguientes datos del contenido de
estroncio (g/mL) en una muestra, para ver si el valor sospechoso
puede o no descartarse: 1.15, 1.02, 1.10, 1.88.

Pruebas de significacin

EJEMPLO DE PRUEBA t POR PAREJAS


La siguiente tabla proporciona la concentracin de plomo (g/ml) por
dos mtodos diferentes para 4 muestras:

MUESTRA

EXTRACCIN
OXIDATIVA

EXTRACCIN
DIRECTA

71

76

61

68

50

48

60

57

Los dos mtodos proporcionan valores para las concentraciones


medias de plomo que difieren significativamente ?

38

Anda mungkin juga menyukai