Anda di halaman 1dari 20

Curso: Elementos para la Validacin de Mtodos Analticos PARTE B Pgina 1 de 20

HIPOTESIS ESTADSTICAS COMPARACION DE RESULTADOS CON PRUEBAS DE SIGNIFICACIN Dado que las medidas no se llevan a cabo sobre poblaciones estadsticas, sino sobre muestras estadsticas extradas aleatoriamente de las primeras, siempre se corre el riesgo de tomar una decisin errnea puesto que las caractersticas de la muestra pueden diferir de aquellas que posee la poblacin. Este riesgo debe hacerse cuantificable y para ello se sigue una mecnica de trabajo llamada comprobacin de hiptesis estadsticas. Una hiptesis es una suposicin que se realiza sobre un determinado hecho, por ejemplo, que una media aritmtica de un conjunto de resultados no difiera de un modo estadsticamente significativo de un valor dado, mientras que un test estadstico nos permite dilucidar la validez de dicha hiptesis. Al plantear una hiptesis, H, puede adoptarse dos decisiones: aceptarla o rechazarla. Adems puede ocurrir que dicha hiptesis sea cierta o falsa. Los resultados se esquematizan en la siguiente tabla: Decisin Tomada

Aceptar H0 H0 verdadera Resultado verdadero H0 falsa No existe error Tipo II (falso negativo, )

Rechazar H0 Tipo I (falso positivo, ) No existe error

En donde se aprecia que la decisin es correcta si se acepta una hiptesis que resulta cierta o se rechaza una hiptesis falsa. Si se refuta una hiptesis cierta se comete, un error de tipo o de primera especie, mientras que si se acepta una hiptesis falsa se comete un error tipo o de segunda especie. Las consecuencias de ambos errores pueden ser muy diferentes. Por ejemplo, si suponemos que un deportista no ingiere sustancias no permitidas y el resultado de un anlisis de orina es positivo (error de 1ra especie), la descalificacin del mismo (consecuencia) puede ser mucho ms importante que en el caso de que no se detecten los frmacos en un atleta que si los haya tomado (error de 2da especie). Rechazar una hiptesis cierta puede tener, en principio, mayor trascendencia que aceptar una hiptesis que resulte ser falsa. Por consiguiente, es necesario justificar estadsticamente las decisiones tomadas y, dada su importancia, debe acotarse el error que se comete en trminos de probabilidad. 1
Lic. Sergio G. Chesniuk http://www.metroquimica.com.ar

Curso: Elementos para la Validacin de Mtodos Analticos PARTE B Pgina 2 de 20

En primer lugar es necesario seleccionar la hiptesis. En estadstica existen al menos dos tipos: 1) La hiptesis nula, H0, que establece que no hay diferencias entre valores, es decir, que las diferencias observadas se deben solo a errores aleatorios. 2) La hiptesis alternativa, H1, que establece la existencia de una diferencia entre valores de los parmetros medidos. En segundo trmino ha de elegirse el nivel de significancia que queremos asignar al test estadstico, teniendo en cuenta el error . Volveremos a hacer referencia a los errores y en prximos prrafos.

Comprobaciones de una y dos colas En tests precedentes estbamos interesados en los valores extremos del estadstico s o en su correspondiente valor de z a ambos lados de la media (o sea, en las dos colas de la distribucin). Tales tests se llaman a dos colas o bilaterales. Con frecuencia, no obstante, estaremos interesados tan slo en valores extremos a un lado de la media (o sea, en una de las colas de la distribucin), tal como sucede cuando se verifica la hiptesis de que un proceso es mejor que otro (lo cual no es lo mismo que comprobar si un proceso es mejor o peor que el otro). Tales pruebas se llaman unilaterales, o de una cola. En tales situaciones, la regin crtica es una regin situada aun lado de la distribucin, con rea igual al nivel de significacin. La Tabla de abajo, que da valores crticos de z para pruebas de una o dos colas en varios niveles de significacin, ser til como referencia posterior. Los valores crticos de z para otros niveles de significacin se hallan a partir de la tabla de reas de la curva normal que ya hemos apreciado.

Nivel de significacin 0.10 0.05 0.010 0.005 0.002 Valores crticos de z para -1.28 -1.645 -2.33 -2.58 -2.88 pruebas a una cola o 1.28 o 1.645 o 2.33 o 2.58 o 2.88 Valores crticos de z para -1.645 -1.96 -2.58 -2.81 -3.08 pruebas a dos colas y 1.645 y 1.96 y 2.58 y 2.81 y 3.08

Comparacin de la media con un valor dado Debemos tener muy en claro que cuando se efectan comparaciones paramtricas a los fines de inferir estadsticamente, se suponen siempre distribuciones (en nuestros casos) normales para todos los conjunto de 2
Lic. Sergio G. Chesniuk http://www.metroquimica.com.ar

Curso: Elementos para la Validacin de Mtodos Analticos PARTE B Pgina 3 de 20

datos que participan en la prueba. Otra suposicin importante es la independencia entre estos conjuntos de datos. As pues, veamos el siguiente ejemplo: Supongamos que se ha preparado un determinado frmaco y se ha agregado 100.0 mg de una droga. Ejemplo 1: Se efectuaron cuatro rplicas (n= 4). El promedio = 98.2 y = 0.80.

Ejemplo 2: Se efectuaron seis rplicas y dieron los siguientes resultados: 98,9- 100,3- 99, 7- 99,0- 100,6- 98,6 (n = 6; x = 99,5; s= 0,81). 98.9 100.3 99.7 99.0 100.6 98.6 n=6 x = 99.5 s = 0.81

Se necesita saber si el promedio obtenido en el ejemplo 1, o en el ejemplo 2, es estadsticamente diferente de la cantidad 0 = 100.0 que se esperaba encontrar. El valor promedio es una estimacin del valor verdadero (promedio de la poblacin), que debera ser encontrado si se llevaran a cabo infinitas determinaciones. Se plantean ambas hiptesis: la nula y la alternativa: H: H1: =
0

= 100.0 mg

100,0 mg

Utilizando intervalos de confianza. Consideremos el ejemplo 1, el intervalo de confianza para el 95% de confianza ( = 0.05) es:

98.2 z
2

98.2 1.96

98.2 1.94 0.40

98.2 0.78

Cmo obtuvimos el valor de z


2

desde la Tabla 1?. Sabemos que el rea fuera

de este intervalo de confianza es del 5 % ( = 0.05) y como la curva de distribucin es simtrica con la media (98.2) como centro este, 5 % debe distribuirse a ambos lados (colas) de las curvas (2.5 % para cada lado, esto es: el rea no sombreada del grfico de abajo).

Lic. Sergio G. Chesniuk http://www.metroquimica.com.ar

Curso: Elementos para la Validacin de Mtodos Analticos PARTE B Pgina 4 de 20

La tabla 1 (a dos colas), muestra valores para z a dos colas, es decir, un z que abarca el 95 % del rea total y deja fuera el 5 % restante a ambos lados de la curva. Cuando buscamos en esta tabla debemos situarnos en la columna para p ( ) = 0.05 puesto que es a dos colas. Si la tabla fuese a una cola, deberamos pararnos en la columna para p ( ) = 0.025. Muchas veces ocurre que en una tabla no se expone si es a una o a dos colas. cmo puede averiguarlo mirando solo los valores de la tabla? Pinselo. Este mismo clculo puede efectuarse con Excel y su funcin INTERVALO.CONFIANZA la que se muestra debajo con sus cuadros de dilogo:

como podemos observar para un = 0.05 (95 % de confianza), = 0.80 y n = 4 se obtiene tambin un intervalo de confianza igual a 0.78. El valor de 0 queda fuera 4
Lic. Sergio G. Chesniuk http://www.metroquimica.com.ar

Curso: Elementos para la Validacin de Mtodos Analticos PARTE B Pgina 5 de 20

del intervalo de confianza, es decir que el valor medio es una estimacin improbable de Se rechaza la hiptesis nula y se acepta la hiptesis alternativa. En el ejemplo 2, es desconocida, entonces usaremos el valor de t para calcular el intervalo de confianza:

99.5 t 0.025,5 s
99.5 2.57

n
99.5 0.85

0.81 6

tambin podemos realizar este clculo utilizando Excel, obtenemos el valor de t mediante su funcin DISTR.T.INV:

0 pertenece

al intervalo, por consiguiente se acepta H0.

Comparando con un valor crtico Existe otra manera de llevar a cabo el test de hiptesis.

Lic. Sergio G. Chesniuk http://www.metroquimica.com.ar

Curso: Elementos para la Validacin de Mtodos Analticos PARTE B Pgina 6 de 20

Debe establecerse la hiptesis: Ho : H1 : =


0

= 100.0

100.0

Para el ejemplo 1, se calcula el valor de z:


z x
0

98.2 100.0 0.8 2

4.50

Se compara z con zcrtico obtenido de la funcin distribucin (Tabla o planilla de clculo Excel) si z < zcrtico se aceptar H0, si z > zcrtico se rechazar H0. En este ejemplo, z = 4.50 >1.96. Debe rechazarse H0 y aceptarse por lo tanto H1. Concluimos que 100.0

Con el ejemplo 2 realizamos lo siguiente: Calculamos t:


t x s
0

99.5 100.0 0.813 6

1.51

Comparamos t y = tcrtico (tablas y Excel), esto es: t =1.51 < tcrtico = 2,57. Concluimos en aceptar Ho.

Cmo se comparan dos varianzas? La comparacin de dos varianzas empleando el test F (a dos colas): y
s,

estimadas por s12 y s22 se lleva a cabo

F
6

s12
2 s2
Lic. Sergio G. Chesniuk http://www.metroquimica.com.ar

Curso: Elementos para la Validacin de Mtodos Analticos PARTE B Pgina 7 de 20

siendo s12 la varianza mayor. El valor de F calculado debe compararse con el valor Fcrit (obtenido en tablas (6 y 7) o en Excel) para el nivel de significancia correspondiente y los grados de libertad referidos a la varianza del numerador n 1-1 y del denominador n2-1. Si F calculado es mayor que Fcrit se concluye que existe una diferencia estadsticamente significativa entre las varianzas de los dos conjuntos de datos. Puede efectuarse otro test algo mas rpido para verificar si dos varianzas son estadsticamente iguales y es efectuar el cociente anterior y decidir acerca del resultado:

Si F

s12 2 s2
s12 2 s2

3 las varianzas son estadstic amente iguales

Si F

3 las varianzas son estadstic amente distintas

Comparacin de las medias de dos conjuntos de datos Tanto x1 como x 2 son estimaciones n2 determinaciones.
1

respectivamente que se basan en n1 y

Una de las caractersticas que deben cumplir ambos conjuntos de datos es que estos deben ser independientes entre si El objeto de esta prueba es ver que sucede con la hiptesis que afirma la inexistencia de diferencia significativa entre 1 y 2. De acuerdo a esto postulamos la hiptesis nula H0: H1:
1 1

2 2

Si ambas varianzas s12 y s22 son iguales (ver comparacin de varianzas) debe calcularse la varianza conjunta s2, que es una estimacin de la varianza comn de las dos poblaciones.

2 n1 1 s12 n2 1 s 2 n1 n2 2

Lic. Sergio G. Chesniuk http://www.metroquimica.com.ar

Curso: Elementos para la Validacin de Mtodos Analticos PARTE B Pgina 8 de 20

Se recomienda que antes de calcular las medias y las desviaciones estndar deben eliminarse los valores discrepantes para evitar conclusiones errneas. El test t se efecta de acuerdo a la siguiente expresin:

x1

x2

s 2 1 n1 1 n 2

comparamos este valor de t con el tcrit para un dado nivel de significancia, , y n1 n2 2 grados de libertad. Para un test de dos colas x1 (estimador de ) se acerca a x 2 (estimador de ) tanto por la izquierda como por la derecha. Es decir la diferencia x1 x 2 puede resultar mayor, menor o igual a 0. Entonces H0 es aceptada si t < tcrit Veamos un ejemplo: En un ejercicio de intercomparacin simple dos laboratorios analticos ejecutan en paralelo un mtodo estndar para determinar la concentracin de cadmio (Cd) en una muestra de agua de ro con un alto grado de contaminacin. Se desea verificar la existencia de diferencias estadsticamente significativas entre ambos laboratorios. Cada laboratorio efecta 8 replicados
[Cd] Lab 1 20.7 27.5 30.4 23.9 21.7 24.1 24.8 28.9 [Cd] Lab 2 20.9 21.4 24.9 20.5 19.7 26.3 22.4 20.2

Laboratorio 1: x1 = 25.25 g / L Laboratorio 2: x 2 = 22.04 g / L

s12 = 11.65 s12 = 5.62

n1 = 8 n2 = 8

H0:

Pero antes veamos si se comprueba que s12 = s22 8


Lic. Sergio G. Chesniuk http://www.metroquimica.com.ar

Curso: Elementos para la Validacin de Mtodos Analticos PARTE B Pgina 9 de 20

Efectuamos el cociente:

s12 2 s2

11.65 5.62

2.07

Como la prueba es a dos colas (se postula la hiptesis nula) debe utilizarse la tabla 6 para Fcrit= 4.99 Tenemos que F < Fcrit y tambien F < 3 Concluimos que las varianzas son estadsticamente iguales esto es: s12 = s22. Por lo tanto ya podemos calcular la varianza en comn:

2 n1 1 s12 n2 1 s 2 n1 n2 2

7 11.65 7 5.62 14

8.64

calculamos t:

x1
2

x2

s 1 n1 1 n2

3.21 1 ) 8.64( 1 7 7

2.18

Desde la Tabla 4 (que es de una cola), nos ubicamos en la columna = 0.025 y obtenemos el valor 2.145. De la misma manera nos vamos a la planilla Excel y accedemos a la funcin DISTR.T.INV (a dos colas) para = 0.05 y 14 grados de libertad obtenemos, obviamente, el mismo valor. Todos los clculos y bsquedas anteriores pueden evitarse utilizando la herramienta Prueba t para dos muestras suponiendo varianzas iguales que posee Excel. En funcin de los datos para Lab 1 y Lab 2 se obtuvo automticamente la siguiente tabla:

Lic. Sergio G. Chesniuk http://www.metroquimica.com.ar

Curso: Elementos para la Validacin de Mtodos Analticos PARTE B Pgina 10 de 20

Prueba t para dos muestras suponiendo varianzas iguales Variable 1 25.25 11.6514286 8 8.63991071 0 14 2.18584068 0.02315611 1.76130925 0.04631223 2.1447886 Variable 2 22.0375 5.62839286 8

Media Varianza Observaciones Varianza agrupada Diferencia hipottica de las medias Grados de libertad Estadstico t P(T<=t) una cola Valor crtico de t (una cola) P(T<=t) dos colas Valor crtico de t (dos colas)

(tcalc)

(tcrt)

t crtico por lo tanto rechazamos la hiptesis nula. Vemos entonces que t calc Concluimos que ambos laboratorios presentan diferencias estadsticamente significativas utilizando an la misma metodologa analtica.
Si no se cumple la condicin de homogeneidad, es decir s12 s22 , el test t anterior es inaplicable ya que no puede calcularse la varianza conjunta. Aplicamos entonces el test de Cochran, que se basa en comparar el valor de t dado por:

x1

x2

s 2 1 n1 1 n 2

con el valor de t que se obtiene de:

t1 s12 n1 s12 n1

2 t 21 s 2 n2 2 s 2 n2

donde t1: valor crtico de t para n1-1 grados de libertad t2: valor crtico de t para n2-1 grados de libertad si t < t se concluye que las medias de ambos conjuntos no son significativamente iguales.

10

Lic. Sergio G. Chesniuk http://www.metroquimica.com.ar

Curso: Elementos para la Validacin de Mtodos Analticos PARTE B Pgina 11 de 20

Ejercicio: En un nuevo ejercicio de intercomparacin simple otros dos laboratorios analticos ejecutan paralelamente el mismo mtodo estndar para determinar la concentracin de cadmio (Cd) en una muestra de agua de ro con un alto grado de contaminacin.
[Cd] Lab 3 19.9 27.5 34.1 23.9 22.7 24.3 24.8 29.0 [Cd] Lab 4 21.0 21.4 25.0 20.5 19.7 22.3 20.1

Efecte la comparacin de las varianzas para cada laboratorio y compruebe la hiptesis nula respecto de sus medias. Utilice las tablas del anexo y compare con la herramienta de Excel Prueba t para dos muestras suponiendo varianzas desiguales

Comparacin de medias de dos muestras relacionadas o apareadas Analicemos esto con un ejemplo: Se ha determinado el contenido de carbono (% C) en nueve muestras de suelos por dos procedimientos diferentes. Los resultados obtenidos son:
Suelo 1 2 3 4 5 6 7 8 9 Proc 1 2.30 1.61 2.65 1.38 2.42 1.73 2.76 2.30 2.19 Proc 2 2.07 1.73 2.88 1.15 2.30 1.50 2.65 2.42 1.96

Esto es: De cada muestra se extraen dos alcuotas, 1 y 2, a las que se les determina % C de carbono con el procedimiento 1 y el procedimiento 2 respectivamente. La comparacin debe realizarse entre ambos valores para cada muestra. Debe analizarse la diferencia de los valores para cada muestra. Esto es:

di

x1i

x 2i
11
Lic. Sergio G. Chesniuk http://www.metroquimica.com.ar

Curso: Elementos para la Validacin de Mtodos Analticos PARTE B Pgina 12 de 20

La media de las diferencias es:

d
donde: n: d:

di n

es el nmeros de pares estimador de las medias de las diferencias,

Si no hay diferencia significativa entre las medias obtenidas por ambos procedimientos tenemos que = 0. Formulamos entonces las hiptesis nula y alternativa H0: H1: =0 0

Para muestras con n < 30 debe efectuarse el test t:

d sd n

t con (n - 1) grados de libertad

donde

di n

0.08

Calculamos y obtenemos:

sd
y por tanto

di

n 1

0.18

0.08 0.18 9

1.333

12

Lic. Sergio G. Chesniuk http://www.metroquimica.com.ar

Curso: Elementos para la Validacin de Mtodos Analticos PARTE B Pgina 13 de 20

Buscamos en la Tabla 4, el valor para tcrit para n=8: tcrit = 2.306 Observamos que t < tcrit aceptamos H0 Si utilizamos la herramienta de Excel Prueba t para medias de dos muestras emparejadas obtenemos lo siguiente:
Prueba t para medias de dos muestras emparejadas Variable 1 Variable 2 2.14666667 2.07 0.224825 0.30748125 9 9 0.94940392 0 8 1.26491106 0.12075199 1.85954832 0.24150397 2.30600563

Media Varianza Observaciones Coeficiente de correlacin de Pearson Diferencia hipottica de las medias Grados de libertad Estadstico t P(T<=t) una cola Valor crtico de t (una cola) P(T<=t) dos colas Valor crtico de t (dos colas)

y por lo tanto concluimos que ambos procedimientos generan valores de % C estadsticamente iguales. Respndase a si mismo: Que significa el parmetro P(T<=t) dos colas = 0.24150397 obtenido desde la tabla anterior generada por Excel?

Comparacin de las medias de varios conjuntos de resultados. Anlisis de Varianza: ANOVA. La comparacin de medias correspondientes a diversos conjuntos de resultados puede ser habitual en los laboratorios analticos. En este caso nos ocuparemos de los ejercicios interlaboratorios, y seremos nosotros quienes nos ocuparemos de analizar los diversos conjuntos de datos para verificar si alguno de los laboratorios participantes proporciona resultados que se diferencian de forma estadsticamente significativa del resto. Otros ejemplos de aplicacin son: comparacin de distintos mtodos con distintas caractersticas o con un mtodo de referencia, comparacin entre varios analistas que analizan una muestra con el mismo mtodo. En definitiva, ANOVA se utiliza para "analizar medidas que dependen de varios tipos de efectos que operan simultneamente con el doble fin de decidir cuales de ellos son importantes y de poder estimarlos (SCHEFF, 1953). 13
Lic. Sergio G. Chesniuk http://www.metroquimica.com.ar

Curso: Elementos para la Validacin de Mtodos Analticos PARTE B Pgina 14 de 20

El nombre "anlisis de la varianza" puede arrojar confusin sobre la aplicacin de este test. Claramente, ANOVA es empleado para la comparacin de medias de diversos conjuntos de resultados y no sus varianzas. El nombre de esta tcnica se origina del hecho que utiliza la comparacin de parmetros estadsticos, en forma de varianzas, para llegar a una conclusin sobre las medias en cuestin. En este apunte vamos a referirnos a la comparacin de diversos conjuntos de resultados que difieren en slo un factor o causa de variacin. Si, por ejemplo, se desean comparar k laboratorios que determinan nj veces la concentracin de un analito en una misma muestra con un mismo mtodo, el objetivo consiste en detectar si alguno de los laboratorios proporciona resultados que difieren de forma estadsticamente significativa de los dems. En ANOVA han de cumplirse tres tipos de hiptesis, aunque se aceptan ligeras desviaciones respecto a las condiciones ideales: 1- Cada conjunto de datos debe ser independiente de los dems. 2- Los resultados obtenidos para cada conjunto han de seguir una distribucin normal. 3- Las varianzas de cada conjunto de datos no difieren significativamente. Continuando con el ejemplo propuesto, si se obtienen nj resultados para cada laboratorio, se genera un conjunto de datos que pueden ordenarse de la siguiente manera:

Tabla. Disposicin de resultados en el Anlisis de la Varianza

En esta Tabla, xij, es el resultado j del laboratorio i. El objetivo del anlisis de la varianza consiste en la comparacin de las distintas medias aritmticas x i (i = 1, 2, ... , k) con el objetivo de determinar si alguna de ellas difiere significativamente de las dems. Para ello se utiliza esta estrategia: si los resultados proporcionados por los diversos laboratorios no contienen errores sistemticos, las medias 14
Lic. Sergio G. Chesniuk http://www.metroquimica.com.ar

Curso: Elementos para la Validacin de Mtodos Analticos PARTE B Pgina 15 de 20

aritmticas respectivas no diferirn mucho unas de otras y su dispersin, debida a los errores aleatorios siempre presentes, ser comparable a la dispersin "tipo" cometida individualmente por cada laboratorio. Se obtienen, de esta manera, dos varianzas como medidas de las dispersiones comentadas y se comparan mediante el conocido test F. El empleo de estas varianzas le dan el nombre a la tcnica, ANOVA. El resultado xij, va acompaado de un error eij, que refleja la diferencia entre este valor y el valor considerado como verdadero
ij

= xij -

este error puede descomponerse de la siguiente manera:


ij

xij

xi

xi

donde
nj

xij xj
j 1

nj
k nj

xij x
i 1 j 1

N
k

N
i 1

nj

donde nj es el nmero de resultados repetidos que provee el laboratorio i, xij describe la desviacin dentro del laboratorio i; xi x expresa la desviacin del laboratorio i respecto de la media aritmtica de todos los laboratorios y, x describe una desviacin sistemtica general que solo puede calcularse si se conoce el valor considerado como verdadero Normalmente se considera que y por lo tanto x x 0 . Bajo estas condiciones rescribimos:
ij

xj

xij

xi
15

xi

x
Lic. Sergio G. Chesniuk http://www.metroquimica.com.ar

Curso: Elementos para la Validacin de Mtodos Analticos PARTE B Pgina 16 de 20

ij

eij

Donde: eij : error residual i : error entre laboratorios Tenemos que:


ij

xij

ij

xij

por lo tanto deducimos que:


xij x eij
i

ecuacin lineal que expresa cada medida xij, como suma de una constante x y de dos variables aleatorias, eij, la cual vara dentro del laboratorio y i que vara entre los laboratorios. El anlisis de la varianza consiste en calcular una serie de sumas de cuadrados que conducirn a las varianzas finales:
ij

xij

xij

xi

xi

xij

xij

xi

xi

2 xij

xi xi

y sumando para todas las i y todas las j:

nj

xij
i 1 j 1

2 i j

xij

xi

2 i

ni xi

2
j

xij

xi
i

xi

el ltimo trmino de esta ecuacin es igual a cero, dado que la suma de desviaciones con respecto a las medias aritmticas es siempre igual a cero. La suma de cuadrados total SST puede escribirse como la suma de dos sumas de cuadrados:

xij
i 1 j 1

2 i j

xij
SSR

xi

2 i

ni xi
SSlab

SST

SSR mide las desviaciones entre observaciones, xij, de cada laboratorio y la media del grupo, por tanto es una medida de la dispersin dentro de los laboratorios. Al dividir SSR por los correspondientes grados de libertad, N-k, se obtiene la varianza

16

Lic. Sergio G. Chesniuk http://www.metroquimica.com.ar

Curso: Elementos para la Validacin de Mtodos Analticos PARTE B Pgina 17 de 20

"dentro de los laboratorios". SSlab mide las desviaciones entre laboratorios y, dividida por sus grados de libertad, k-1, constituye la varianza "entre laboratorios". Si no existe diferencia estadsticamente significativa entre estos dos ltimos trminos, la presencia de errores aleatorios ser la causa predominante de la discrepancia entre los valores medios. Si, contrariamente, existe algn error sistemtico, SSlab k 1 ser mucho mayor que SSR N k con lo que el valor calculado F:

Fcal

SS lab k 1 SS R N k

ser mayor que el valor tabulado Ftab para la probabilidad , la probabilidad elegidas, y los grados de libertad mencionados. Siendo Fcal > Ftab podramos concluir que, con el grado de probabilidad escogido, al menos uno de los laboratorios produce resultados cuyo valor medio difiere de forma estadsticamente significativa de los dems. El anlisis de la varianza no nos indica cuantos laboratorios difieren ni cuales son. Una inspeccin visual de los resultados sin duda puede ayudarnos, sin embargo, con el fin de tener criterios analticamente ms slidos, existen distintos tests para identificar aquellos laboratorios cuyos resultados discrepan significativamente del resto. Otro ejemplo donde puede utilizarse ANOVA es la deteccin de errores sistemticos en los resultados proporcionados por distintos analistas utilizando cada uno, por ejemplo, dos instrumentos distintos comunes a todos ellos. Si se llevan a cabo repeticiones de los anlisis efectuados con cada instrumento, ANOVA proporciona informacin sobre la existencia de discrepancias entre analistas y entre instrumentos. Esto es un ejemplo bastante tpico de un ANOVA de dos factores. Tabla de ANOVA Grados de libertad Entre columnas Dentro de columnas Total
k 1
N k

Suma de cuadrados SSA SSR SST

Varianzas
SS lab k 1

SS R N k

MS A MS R

N 1

Ejemplo: En la tabla de abajo se exponen los resultados referidos al contenido de magnesio (mg / L) en aguas industriales. Estos datos han sido obtenidos por titulacin complejomtrica empleando diferentes indicadores de punto final. 17
Lic. Sergio G. Chesniuk http://www.metroquimica.com.ar

Curso: Elementos para la Validacin de Mtodos Analticos PARTE B Pgina 18 de 20

1
44.72 44.72 42.96 44.32 42.96 43.36

2
45.36 45.36 44.40 44.56 43.44 44.56 * * * *

3
46.00 43.76 43.44 43.60 41.92 43.76 * *

4
37.92 35.6 37.20 39.52 39.60 40.48 * *

5
44.16 43.76 45.28 44.16 44.96 46.08 * *

6
44.16 44.96 43.76 41.44 43.44 42.64 * *

7
43.44 44.16 43.44 43.44 44.16 44.16 * *

xj

sj *) Completar

La cuestin es: Existen diferencias estadsticamente significativas entre los indicadores de punto final? Efectuemos el los clculos, completando la tabla de ANOVA:

Grados de libertad Suma de cuadrados Varianzas Fcal Entre columnas 6 171.74 28.62 Dentro columnas 35 43.27 1.24 23.15 Total 41 215.01 Fcrt 0.05; (6,35)= 2.37 Podemos observar que Fcal > Fcrit por lo tanto concluimos que al menos un indicador proporciona resultados diferentes de los otros (evidencias de que el uso de que esta sustancia produce errores sistemticos). Utilizando Excel es posible analizar estos datos de una manera mas rpida y automtica. Para ello empleamos la herramienta Anlisis de Varianza de un Factor la que genera las siguientes tablas:
RESUMEN Grupos Columna 1 Columna 2 Columna 3 Columna 4 Columna 5 Columna 6 Columna 7

Cuenta 6 6 6 6 6 6 6

Suma 263.04 267.68 262.48 230.32 268.4 260.4 262.8

Promedio 43.84 44.6133333 43.7466667 38.3866667 44.7333333 43.4 43.8

Varianza 0.71168 0.50858667 1.70602667 3.30602667 0.75370667 1.51232 0.15552

ANLISIS DE VARIANZA Origen de las Suma de

Grados de

Promedio de

Probabilidad Valor crtico para F

18

Lic. Sergio G. Chesniuk http://www.metroquimica.com.ar

Curso: Elementos para la Validacin de Mtodos Analticos PARTE B Pgina 19 de 20

variaciones cuadrados Entre grupos 171.739124 Dentro de los grupos43.2693333 Total 215.008457

libertad

Los cuadrados 6 28.6231873 23.1529233 7.7269E-11 35 1.23626667 41

2.37178455

Este mismo anlisis de datos puede obtenerse tambin, empleando Minitab, que genera resultados un tanto mas grficos, nos ayuda mejor a dilucidar acerca de cual o cuales indicadores provocan los errores sistemticos:

One-way ANOVA: C10, C11, C12, C13, C14, C15, C16


Analysis of Variance Source DF SS Factor 6 171.74 Error 35 43.27 Total 41 215.01 Level C10 C11 C12 C13 C14 C15 C16 N 6 6 6 6 6 6 6 Mean 43.840 44.613 43.747 38.387 44.733 43.400 43.800 1.112 MS 28.62 1.24 F 23.15 P 0.000

Pooled StDev =

Individual 95% CIs For Mean Based on Pooled StDev StDev -+---------+---------+---------+----0.844 (--*---) 0.713 (--*---) 1.306 (---*---) 1.818 (---*--) 0.868 (---*---) 1.230 (---*--) 0.394 (--*---) -+---------+---------+---------+----37.5 40.0 42.5 45.0

Comprobacin de hiptesis estadsticas Errores de primera ( ) y segunda especie ( ) Como se viene explicando hasta ahora, la comprobacin de una hiptesis estadstica, por ejemplo, a un nivel de significacin = 0.05, supone un riesgo del 5 % de que se rechace una hiptesis nula aunque sea verdadera. A este tipo de error se lo conoce como error de primera especie o . El riesgo de cometer este error puede reducirse si se altera el nivel de significacin del test a por ejemplo = 0.01 o = 0.001. No obstante este no es el nico error que podemos esperar: Puede tambin mantenerse una hiptesis nula an cuando esta sea falsa. Este es el denominado error de segunda especie o . Si se quiere calcular la probabilidad de este tipo de error es necesario postular una alternativa a la hiptesis nula, que se conoce como, ya hemos mencionado, hiptesis alternativa. Veamos un ejemplo: Tengamos en cuenta a un determinado producto qumico del cual se piensa que posee un 3 % de hierro. Estimaciones a ojo de buen cubero indican que esta proporcin podra haberse incrementado. Para probar esto se 19
Lic. Sergio G. Chesniuk http://www.metroquimica.com.ar

Curso: Elementos para la Validacin de Mtodos Analticos PARTE B Pgina 20 de 20

han efectuado determinaciones analticas con un mtodo estndar que posee una desviacin estndar conocida del 0.03 %. Supongamos que se toman 4 medidas y se realiza una prueba de significacin al nivel de = 0.05. Formulamos la hiptesis nula: H0, = 3.0 %

La lnea continua (campana izquierda) de la figura nos muestra la distribucin muestral de la media si la hiptesis nula fuese verdadera. Esta distribucin tiene una media 3.0 y una desviacin estndar n 0.03 4 . Si la media muestral cae por encima del valor crtico indicado, x c , se rechaza la hiptesis nula. Por tanto, la regin sombreada de rea 0.05, representa la probabilidad de un error . Supongamos ahora que tenemos la hiptesis alternativa: H1: = 3.05 %

La lnea punteada (campana derecha) de la figura indica la distribucin muestral de la media si la hiptesis alternativa fuese verdadera, incluso si este fuese el caso, se aceptar la hiptesis nula si la media muestral cae por debajo de x c . La probabilidad de este error est representada por el rea rayada. En la figura tambin se muestra la interdependencia de ambos tipos de error. Si ahora cambiamos el nivel de significacin a = 0.01 para disminuir el riesgo de un error , x c aumentar al igual que el riesgo de error . Y a la inversa, disminuyendo el riesgo de error aumenta el riego de error . Existe una nica manera para reducir ambos riesgos de error (para una dada hiptesis alternativa) y consiste en aumentar el tamao de la muestra. La probabilidad de que se rechace una hiptesis nula falsa suele llamarse Potencia de una prueba y es igual a (1 probabilidad de error ). En el ejemplo desarrollado la potencia es funcin de la media especificada en la H1, del tamao de la muestra, el nivel de significacin de la prueba y si esta es de una o dos colas. Puede ocurrir el caso en donde se disponga de dos o mas pruebas para testear la misma hiptesis. Resulta interesante comparar las potencias de las pruebas con el fin de seleccionar la mas adecuada.

20

Lic. Sergio G. Chesniuk http://www.metroquimica.com.ar

Anda mungkin juga menyukai