Anda di halaman 1dari 29

EVALUACIÓN Y EXPRESIÓN

DE DATOS ANALÍTICOS
Errores en el análisis químico: evaluación de la
calidad de los resultados

Es imposible realizar un análisis químico sin que los resultados


estén libres totalmente de errores o incertidumbre. No obstante, se
espera poder minimizarlos y estimar su magnitud con una exactitud
aceptable.

Cada medición está sujeta a muchas incertidumbres que, al


combinarse producen una dispersión en los resultados. No es
posible eliminar por completo la incertidumbre en las mediciones,
por lo que no se conoce el valor verdadero de una cantidad.

Sin embargo, casi siempre se puede evaluar la magnitud del error


en una medición y de acuerdo a un cierto nivel de probabilidad, es
posible definir los límites entre los que se puede encontrar el valor
verdadero de una cantidad medida.
Definición de términos

La media y mediana

x
La media, media aritmética y el promedio ( ) son sinónimos para el
valor que se obtiene al dividir la suma de las mediciones repetidas
entre el número de mediciones del conjunto:
N
∑ xi
x = i =1

N
donde xi representa los valores individuales de x que integran el
conjunto de N mediciones repetidas.

La mediana es el valor alrededor del cual se distribuyen los datos


repetidos (conjunto impar - conjunto par de datos).
¿Qué es precisión?
Este término se utiliza para describir qué tan reproducibles son las
mediciones; es decir, qué tan semejantes son los resultados que se
ha obtenido exactamente de la misma manera.

La precisión es una medida de la concordancia de los


resultados con los otros obtenidos exactamente en la
misma forma.

Se utilizan tres términos para describir la precisión de un conjunto


de datos repetidos: la desviación estándar, la varianza y el
coeficiente de variación. Son una función de la desviación de la
media di, o desviación:
_
di =  xi − x 
¿Qué es exactitud?
El término exactitud indica qué tan cercana está una medición de
su valor verdadero o aceptado y se expresa como error (absoluto o
relativo).

El error absoluto E en la medición de una cantidad Xi está dado por


la ecuación:

E = xi − xt

donde Xt es el valor verdadero o aceptado de la cantidad.

El error relativo Er (porcentaje):

x −x
E = i t x 100%
r x
t
Tipos de errores en los datos
experimentales
En los análisis químicos influyen al menos
dos tipos de errores:

El error aleatorio o indeterminado, que


ocasiona que los datos se distribuyan más o
menos con simetría alrededor de un valor
promedio.

El error sistemático o determinado, que


ocasiona que la media de una serie de datos
sea distinta del valor aceptado.
Errores sistemáticos
Los errores sistemáticos tienen un valor definido, una causa conocida y una
magnitud semejante a la que tienen las mediciones repetidas efectuadas en la
misma forma.

¿Dónde se originan los errores sistemáticos?


Existen tres tipos de errores sistemáticos:
Errores de instrumento.
Errores del método.
Errores personales.

¿Qué efecto tienen los errores sistemáticos en los resultados analíticos?


Los errores sistemáticos pueden ser constantes o proporcionales. La magnitud
de un error constante absoluto no depende de la cantidad medida. Los errores
proporcionales aumentan o disminuyen conforme al tamaño de la muestra que
se analiza.

Detección de errores sistemáticos personales e instrumentales

Detección de errores sistemáticos del método


Análisis de estándares de referencia
Empleo de un método analítico independiente
Determinaciones blanco
Variación en el tamaño de la muestra
Errores aleatorios: ¿qué tan seguros se puede estar?
♦ Los errores aleatorios o indeterminados se manifiestan cuando se
efectúa una medición y se deben a numerosas variables no
controladas que son parte inevitable de toda medición física o
química.

♦ Muchos factores contribuyen al error aleatorio, pero ninguno puede


identificarse o medirse con certeza ya que individualmente son tan
pequeños que no pueden detectarse.

♦ El efecto acumulativo de cada uno ocasiona que los datos de una


serie de mediciones repetidas fluctúen al azar alrededor de la
media.

♦ Si se repite una experiencia un gran número de veces y los errores


son puramente aleatorios, los resultados tienden a agruparse
simétricamente en torno al valor medio en forma de una curva de
campana que se conoce como distribución gaussiana (curva
gaussiana o curva normal de error).

♦ En una serie de mediciones repetidas, la dispersión o rango es la


diferencia entre el resultado más alto y el más bajo.
Tratamiento estadístico del error aleatorio
Los errores aleatorios o indeterminados en los resultados de un
análisis pueden evaluarse mediante métodos estadísticos.

El análisis estadístico de los datos analíticos se basa en la


suposición de que los errores aleatorios siguen una distribución
gaussiana o normal.

Muestra y población

En el lenguaje estadístico se denomina muestra de datos a un


número finito de observaciones experimentales y se define como
una pequeña fracción de un número infinito de observaciones que,
en principio, podrían realizarse también en un tiempo infinito.

Se llama población o universo a este número ilimitado teórico de


datos.
Propiedades de las curvas gaussianas
Estas curvas se pueden
describir por medio de
una ecuación de sólo dos
parámetros, la media de
la población µ y la
desviación estándar de la
población σ y tiene la
forma:
−( x−µ ) / 2σ 2
2

e
y=
σ 2π
La media de la población µ y la media de la
muestra x
La media de la muestra x es el valor promedio de una
muestra limitada obtenida de una población de datos.

La media de la población µ es el verdadero valor


promedio de la población.

Cuando no hay error sistemático, la media de la


población también es el valor verdadero de la cantidad
medida.

La diferencia entre x y µ disminuye rápidamente a


medida que aumenta el número de mediciones que
conforman la muestra; por lo general, esta diferencia
es despreciable cuando N se acerca a 20 o 30.
Desviación estándar de la población
La desviación estándar de la población σ,
es una medida de la precisión o dispersión
de una población de datos y está dada por
la ecuación:

∑ ( xi − µ )
N
2

σ= i =1

N
en donde N es el número de datos de una
población.
Cálculo de la desviación estándar de la
muestra
La ecuación anterior debe modificarse cuando se aplica a una
muestra pequeña de datos. Así, la desviación estándar de la
muestra, s, está dada por la ecuación:

N N

∑ (x − x) ∑d
2 2
i i
s= i =1
= i =1

N −1 N −1
Esta ecuación difiere de la anterior en dos aspectos: primero, en
esta ecuación en el numerador aparece la media de la muestra x en
lugar de la media de la población µ y segundo, se sustituye N por el
número de grados de libertad (N – 1).
Una manera alternativa para expresar la desviación
estándar de la muestra
Para calcular s con una calculadora que no tenga la función para la
desviación estándar, es más fácil utilizar la ecuación siguiente:

2
 N

N
∑ xi 
∑ x i2 − i =1 
N
s = i =1

N −1
Ejemplo:
En la determinación repetida del contenido de plomo en una
muestra de sangre se obtuvieron los resultados siguientes: 0.752;
0.756; 0.752; 0.751 y 0.760 ppm de Pb. Calcular la media y la
desviación estándar para esta serie de datos.
Resolución
2
Muestra Xi Xi
_________________________________________________________________________
_________________________________________________________________________
1 0.752 0.565504
2 0.756 0.571536
3 0.752 0.565504
4 0.751 0.564001
5 0.760 0.577600
2
Σ xi = 3.771 Σ xi = 2.844145

√ x =
∑ xi
=
3 . 771
= 0 . 7542 ≈ 0 . 754 ppm Pb
N 5
(∑ x ) i
2

=
(3 .771 )2 =
14 .220441
= 2 .8440882
N 5 5

2.844145 − 2.8440882 0.0000568
s= = = 0.00377 ≈ 0.004 ppm Pb
5 −1 4
2 2
Nota: Se puede observar que la diferencia entre Σxi y (Σxi)/N es muy pequeña. Si
estos números se hubieran redondeados antes de restarlos, el valor calculado para s
tendría un grave error, para evitarlo nunca se debe redondear un cálculo de
desviación estándar sino hasta el final.
Términos alternativos para expresar la precisión de
datos de muestras
Los químicos, por lo general, emplean la desviación estándar de la
muestra para indicar la precisión de sus datos.

♣ La varianza de la muestra s2 es el cuadrado de la desviación


estándar y es un estimado de la varianza de la población σ2.

♣ La desviación estándar relativa (DER) se calcula al dividir la


desviación estándar entre la media de una serie de datos. La
desviación estándar relativa multiplicada por 100% se le conoce
como coeficiente de variación (CV).

s
CV = x 100%
x
♣ La dispersión o rango w es la diferencia entre el valor más alto y el
valor más bajo de la serie.
Convenio de cifras significativas
Las cifras significativas en una cantidad
son todos los dígitos ciertos y el primer
dígito incierto.

Ejemplo:

- Bureta graduada de 50 mL

- Nivel del líquido entre 30.2 y 30.3 mL

- Estimación del nivel del líquido entre


las dos graduaciones ≈ 0.02 mL

- Volumen informado 30.24 mL

- 4 cifras significativas; 3 ciertas y 1


incierta
Reglas para determinar el número de cifras
significativas
El cero puede o no ser significativo según su ubicación
en el número. El cero cuando está rodeado por otros
dígitos siempre es significativo (como en 30.24 mL)

Los ceros que sólo sitúan el punto decimal no son


significativos. Si se escribe 30.24 mL como 0.03024 L,
el número de cifras significativas es el mismo.

Los ceros al final pueden o no ser significativos.


Ejemplo: 2.0 L, tanto el 2 como el cero son cifras
significativas; 2000 mL (¿?), lo mejor emplear notación
científica, 2.0 x 103 mL.
Cifras significativas en los cálculos numéricos
En sumas y restas, el número de cifras significativas del resultado está determinado
por el número que tiene la menor cantidad de decimales:

3.4 + 0.020 + 7.31 = 10.73 = ¡10.7!

En productos y cocientes, la respuesta debe contener el mismo número de dígitos


significativos que el número original con menos cifras significativas.

(4.3179 x 1012) (3.6 x 10−19) = 1.554444 x 10−6 = ¡1.6 x 10−6!

Para logaritmos y antilogaritmos se aplican las reglas siguientes en la mayoría de los


casos:

a. En el logaritmo de un número consérvese tantos dígitos a la derecha del


punto decimal como cifras significativas tenga el número original.

log 4.000 x 10−5 = −4.397940009 = ¡−4.3979!

b. En el antilogaritmo consérvese tantos dígitos como la cantidad de dígitos a


la derecha del punto decimal que tenga el número original.

antilog 12.5 = 3.16227766 x 1012 = ¡3 x 1012!


Redondeo de datos
Los resultados calculados de un análisis químico siempre se deben redondear de
manera adecuada. Por ejemplo:

♠ Resultados de mediciones repetidas: 61.60; 61.46; 61.55 y 61.61

♠ Media = 61.555 ⇒ cuando se redondea la media, ¿se toma 61.55 o 61.56?

⇒ Al redondear un número que termina con 5 se debe hacer de manera que el


resultado termine con un número par más cercano.

♠ Desviación estándar = 0.068556546 = ± 0.07

⇒ En la desviación estándar raras veces se justifica mantener más de una cifra


significativa debido a que ya contiene un error.

♠ El resultado debe ser: ¡¡ 61.56 ± 0.07 ¡!

Redondeo de resultados de cálculos químicos

El resultado se redondea de manera que sólo contenga dígitos significativos. Es


particularmente importante hacer el redondeo hasta haber terminado el cálculo.
Análisis estadístico: evaluación de los datos
analíticos
Límites de confianza

• La teoría estadística permite fijar límites alrededor de una media


obtenida experimentalmente y dentro de los cuales se encuentra,
con un cierto grado de probabilidad, el verdadero valor µ de la
media de la población. Estos límites se denominan límites de
confianza y el intervalo que definen se conoce como intervalo de
confianza.

• La magnitud del intervalo de confianza, que se deriva de la


desviación estándar de la muestra, depende de la exactitud del
valor de s, es decir, de qué tan cercana se crea que está s de la
desviación estándar de la población, σ.

• Si: s → σ, el intervalo de confianza puede ser aún más pequeño


que cuando s sólo está basado en dos o tres determinaciones
repetidas.
Cálculo del intervalo de confianza cuando s es una
buena aproximación de σ
Una expresión general para los límites de confianza (LC) de una
sola medición es:

LC = x ± z σ
x−µ
donde: z= y puede tener valores positivos y negativos.
σ
Finalmente:

LC para µ = x ±
N
El intervalo de confianza (IC) está dado por el segundo término de
la ecuación anterior: IC = ± z σ / N . Es importante tener siempre en
cuenta que los intervalos de confianza basados en esta ecuación
sólo se aplican en los casos donde no haya tendencia y sólo
suponiendo que σ (s → σ).
En la tabla se encuentran los valores de z para varios niveles de
confianza. El nivel de confianza es la probabilidad expresada como
porcentaje.

----------------------------------------------------------
Nivel de Confianza (%) z
----------------------------------------------------------
50 0.67
68 1.00
80 1.29
90 1.64
95 1.96
95.4 2.00
99 2.58
99.7 3.00
99.9 3.29
Ejemplo: Determinar los límites de confianza de 80% y 95% para: a) el primer valor
(1.80 ppm de Hg) de tres determinaciones repetidas, y b) para el valor promedio (1.67
ppm de Hg) de estas determinaciones. Suponer que en cada caso s = 0.1 es un buen
estimado de σ (s →σ).

a) De acuerdo a la tabla los valores de z son:

1 . 29 × 0 . 10
80% LC = 1.80 ± = 1.80 ± 0.13 (1.67 – 1.93 ppm de Hg)
1
1 . 96 × 0 . 10
95% LC = 1.80 ± = 1.80 ± 0.20 (1.60 – 2.00 ppm de Hg)
1
b) Para las tres mediciones:

1 . 29 × 0 . 10
80% LC = 1.67 ± = 1.67 ± 0.07 (1.60 – 1.74 ppm de Hg)
3
1 . 96 × 0 . 10
95% LC = 1.67 ± = 1.67 ± 0.11 (1.56 – 1.78 ppm de Hg)
3
¿Cuántas mediciones repetidas se necesitan para reducir el intervalo de confianza al
95% a ± 0.07 ppm de Hg?
zs 1.96× 0.10 1.96 × 0.10
IC = 0.07 = ± =± N =± = ±2.80
N N 0.07
N = (±2.8)2 = 7.8 ≈ 8
Intervalo de confianza cuando no se conoce σ

Las limitaciones de tiempo o de cantidad de muestra disponible son


barreras que imponen estimar σ con exactitud. En estos casos con sólo una
serie de mediciones repetidas debe obtenerse no sólo la media, sino
también un estimado de la precisión.

La s calculada a partir de un conjunto pequeño de datos puede ser incierta,


razón por la cual los límites de confianza son más amplios cuando no se
tiene un buen estimado de σ.

En estos casos se utiliza un parámetro estadístico importante, el valor t,


que se define igual que z salvo que σ se sustituye por s:
x−µ
t=
s
Al igual que z, t depende del nivel de confianza deseado, pero
también depende del número de grados de libertad con que se calculó s.
En la siguiente tabla se proporciona valores de t para algunos
grados de libertad.

Valores de t para varios niveles de probabilidad

Niveles de Probabilidad
Grados de 80% 90% 95% 99% 99.9%
Libertad
1 3.08 6.31 12.7 63.7 637
2 1.89 2.92 4.30 9.92 31.6
3 1.64 2.35 3.18 5.84 12.9
4 1.53 2.13 2.78 4.60 8.60
5 1.48 2.02 2.57 4.03 6.86
6 1.44 1.94 2.45 3.71 5.96
7 1.42 1.90 2.36 3.50 5.40
8 1.40 1.86 2.31 3.36 5.04
9 1.38 1.83 2.26 3.25 4.78
10 1.37 1.81 2.23 3.17 4.59
11 1.36 1.80 2.20 3.11 4.44
12 1.36 1.78 2.18 3.06 4.32
13 1.35 1.77 2.16 3.01 4.22
14 1.34 1.76 2.14 2.98 4.14
∞ 1.29 1.64 1.96 2.58 3.29

Se puede observar de la tabla que t → z cuando el número de grados de libertad se hace


infinito.
Los límites de confianza para la de N mediciones
repetidas pueden calcularse a partir de t por medio de la
expresión:

ts
LC para µ = x±
N
Detección de errores gruesos
Un dato dudoso difiere excesivamente de la media de un conjunto de datos.
Cuando un conjunto de datos contiene un dato dudoso que está muy
alejado del promedio del conjunto, se debe decidir aceptarlo o rechazarlo.

La prueba de Q

Esta prueba estadística es simple y utilizada ampliamente. En esta prueba,


el valor absoluto de la diferencia entre el valor dudoso xq y el resultado más
próximo xn se divide entre la dispersión w del conjunto para dar la cantidad
Qexp:
xq − xn xq − xn
Qexp = =
w xalto − xbajo
Este cociente se compara con los valores de rechazo Qcrit de la tabla
(Valores críticos para el cociente de rechazo Q):
Si: Qexp > Qcrit ⇒ el valor dudoso se rechaza.
Si: Qexp < Qcrit ⇒ el valor dudoso se acepta.
Tabla de valores críticos para el cociente de
rechazo Q

Anda mungkin juga menyukai