Tratamiento de Datos

Tratamiento de Datos
Daro Browarnik
Siempre que se trabaja con un objeto de medicin, sea una regla, una pipeta, una probeta o cualquier otro, se cometen diferentes tipos de error, ya sean errores por parte del operador o errores debidos a la calibracin o fabricacin del equipo con el que se trabaja. Los errores se dividen entre errores aleatorios y sistematicos. Los errores aleatorios son los errores que se cometen por muchos motivos diferentes, y no es posible corregirlos y se distribuyen a ambos lados del valor terico a medir. A modo de ejemplo, si queremos medir 10 centmetros, y para ello utilizamos una cinta con dicha longitud, es posible que se registren marcas a 9,90cm o a 10,20 cm de distancia del punto de referencia. Los errores sistemticos son aquellos que dependen del mtodo o instrumento de medicin, por lo que siempre se encontrarn valores a un lado del promedio (hacia la derecha o izquierda). Por ejemplo, si intentamos medir con una regla una distancia de 10 centmetros y para eso se llaman a varios alumnos, lo mas probable es que las marcas que se registren sean de 10,01cm, 10,05cm o 10,10cm del punto de referencia. En todos los casos nos encontramos con un error que excede a los 10cm, pero ninguna medicin fue de menos de 10cm. Considerando que se cometen errores, a pesar de la excelente capacidad de medicin que puedan tener tanto el operador como los equipos con los que trabaja, hay que tener en cuenta otros factores. Cuando se realizan mediciones, estas pueden ser precisas, exactas o ambas, y una medicin es mejor cuanto ms precisa y exacta resulta ser. Es lo mismo decir que una medicin es precisa o exacta? La respuesta es NO. Un mtodo de medicin es exacto cuando los valores obtenidos son muy parecidos o coinciden con el valor buscado. Por otra parte, un mtodo de medicin resulta ser preciso cuando los valores obtenidos son cercanos entre s. Como se puede ver, las definiciones son diferentes. No solo no significan lo mismo, sino que un mtodo puede ser: - Ni exacto ni preciso:
- Preciso y no exacto:
- Exacto y no preciso:
- Exacto y preciso:
Teniendo esto en cuenta, queda claro que cuando nos dicen medimos 10ml no nos estn diciendo realmente 10ml, sino que hay cierto error en esa informacin. Nivel de Confianza Para poder expresar los resultados de un conjunto de mediciones hay que pautar de antemano qu confianza tenemos respecto a los valores obtenidos. Es decir, si estamos realizando un conjunto de mediciones y alguna esta muy alejada del resto, debemos aceptar ese valor o lo descartamos? Por ejemplo, midiendo una distancia de un metro con una regla de 10 centmetros, se obtienen los valores: 98cm, 107cm, 103cm, 95cm y 138cm. Aceptamos todos los valores o descartamos alguno? Para saber que criterio tomar, hay que elegir un nivel de confianza y basarnos en este para aceptar o descartar valores. El nivel de confianza no es otra cosa que cunto confo en los valores que me dan; si tomamos un nivel de confianza chico, voy a aceptar solamente valores que se encuentren muy cercanos al promedio, descartando los mas alejados. Si tomamos un nivel de confianza muy grande, vamos a aceptar casi todos los valores, incluyendo a valores muy alejados del promedio. Cuando realizamos repetidas mediciones (miles) con un mismo mtodo, y se marcan en una lnea recta, se puede observar que muchas mediciones se amontonan en torno al valor promedio:
Como se representa en la figura anterior, a medida que nos vamos alejando del promedio, hay menos mediciones. Si representamos en un eje de coordenadas lo mismo, poniendo en el eje horizontal la lnea recta que tenamos antes, y en el eje vertical la cantidad de mediciones, obtendramos algo as:
Estos porcentajes de rea del grfico son los niveles de confianza. Si nos fijamos, el nivel de confianza mas chico (por ejemplo de 68,26%) si bien encierra un rea grande del grfico, acepta solamente valores cercanos al promedio. Si elegimos un nivel de confianza intermedio (por ejemplo de 95,45%) estamos encerrando un rea mucho mayor, y adems abarcamos una cantidad de valores mayor, no solamente los que estn mas cercanos al valor promedio, sino que tambin algunos valores que se encuentran relativamente alejados. Si elegimos un nivel de confianza mas grande (por ejemplo de 99,73%), estamos aceptando valores muy alejados del promedio, en pocas palabras, estamos aceptando casi cualquier valor. Descartando resultados (Prueba de Q)
Una vez seleccionado el nivel de confianza con el que vamos a trabajar, realizamos las mediciones y las ordenamos de menor a mayor o viceversa.
Cuando ya tenemos ordenados los valores, obtenemos el rango (W), que no es otra cosa que la diferencia entre el valor mas grande y el mas chico: W =| X M X m | Con el valor del rango, luego se hace la prueba de Q con los valores de los extremos. La prueba de QM consiste en hacer la diferencia entre el valor mayor y su nmero consecutivo (siempre y cuando sean diferentes) y luego dividirlo por el rango, y Qm consiste en hacer la diferencia entre el valor menor y su nmero consecutivo (con el mismo criterio que QM) y luego dividirlo por el rango.
En formulas quedaran de la siguiente manera:

|X Xm | | X M X M 1 | y Qm = m +1 W W Luego estos valores los comparo con valores de Q tabulados segn el grado de confianza elegido y la cantidad de mediciones realizadas. QM =
Nmero de observaciones 3 4 5 6 7 8 9 10 Q critico 95% confianza 0,970 0,829 0,710 0,625 0,568 0,526 0,493 0,466
90% confianza 0,941 0,765 0,642 0,560 0,507 0,468 0,437 0,412
99% confianza 0,994 0,926 0,821 0,740 0,680 0,634 0,598 0,568
Tabla 1: Valores Crticos de Q Dixon, J.C. Miller y J. N. Miller, "Estadstica para Qumica Analtica", 2da.edicin,
Addison-Wesley - Iberoamericana, Wilmington, USA, 1993
Si QM o Qm son menores al QC (Q critico o Q de tabla) para el nivel de confianza que elegimos, esos valores son aceptados y podemos trabajar con ellos para la expresin final del resultado, pero de caso contrario, XM (para el caso que QM sea mayor a QC) o Xm (para el caso que Qm sea mayor a QC) debern ser descartados y se tendran que realizar los clculos desde el principio teniendo en cuenta que ahora hay nuevos valores. (Tengamos en cuenta que al descartar XM o Xm, W queda modificado, entonces los valores de QM y Qm van a ser otros y los tendremos que volver a comparar con QC para un nuevo nmero de observaciones, esta vez menor en una o dos unidades). Ejemplo: Dadas las siguientes mediciones, determinar si se descarta algn valor con un nivel de confianza de 90% 10,50 10,58 11,89 10,02 9,21 10,53 10,55 10,04 Reordenamos: 11,89 10,58 10,55 10,53 10,50 10,04 10,02 9,21 n= 8 W= 2,68, QC (90%) = 0,468 QM = |11,89-10,58|/2,68 = 0,489> QC (90%) Se descarta X=11,89 Ahora tengo que hallar el nuevo W 10,58 10,55 10,53 10,50 10,04 10,02 9,21 n= 7 W= 1,37, QC (90%) = 0,507 QM = |10,58-10,55|/1,37 = 0,022< QC (90%) No se descarta X=10,58 Qm = |10,02-9,21|/1,37 = 0,591> QC (90%) Se descarta X=9,21 Ahora tengo que hallar el nuevo W 10,58 10,55 10,53 10,50 10,04 10,02 n= 6 W= 0,56, QC (90%) = 0,560 QM = |10,58-10,55|/0,56 = 0,054< QC (90%) No se descarta X=10,58 Qm = |10,04-10,02|/0,56 = 0,036< QC (90%) No se descarta X=10,02 De esta forma eliminamos los valores que escapan a nuestro nivel de confianza.
Expresin de resultados
Cuando ya descartamos los valores que no sirven, realizamos el tratamiento de datos para poder informar correctamente los resultados. Estos resultados tienen que incluir el valor promedio, el desvo estndar, el intervalo de confianza y los errores absolutos, relativos y relativos porcentuales. Para ello hay que tener en cuenta sus definiciones. El promedio es la sumatoria de todos los mediciones, dividido por su cantidad: X + X 2 + X 3 + X 4 + .... + X n X i = X= 1 n n
Ejemplo: Para los siguientes datos, hallar el promedio (trabajando con un nivel de confianza del 95%): 10,91 10,83 10,79 9,97 9,83 10,54 10,03 10,23 n=8 Primero tenemos que hacer la prueba de Q, para ver que no se descarte ningn valor (no podemos incluir en ningn clculo valores que no entren en nuestro nivel de confianza). Ordenamos los valores: 10,91 10,83 10,79 10,54 10,23 10,03 9,97 9,83 W= 1,08 QC (95%) = 0,526 QM = |10,91-10,83|/1,08 = 0,074< QC (95%) No se descarta X=10,91 No se descarta X=9,83 Qm = |9,97-9,83|/1,08 = 0,130< QC (95%) Una vez realizada la prueba de Q, hacemos la sumatoria: X i = 10,91 + 10,83 + 10,79 + 9,97 + 9,83 + 10,54 + 10,03 + 10,23 = 83,13 X=
X
n
= 83,13 / 8 = 10,39125
El desvo estndar es una forma de determinar que tan preciso es nuestro mtodo.
S=
(X
X )2
n 1
Ejemplo: Con los mismos valores del ejemplo anterior, obtendremos el desvo estndar:
X ) 2 = (10,91-10,39125)2 + (10,83-10,39125)2 + (10,79-10,39125)2 + (9,9710,39125)2 + (9,83-10,39125)2 + (10,54-10,39125)2 +(10,03-10,39125)2 + (10,2310,39125)2 = 0,2691015625 + 0,1924927876 + 0,1590015625 + 0,1774515625 + 0,3150015625 + 0,0221265625 + 0,1305015625 + 0,0260015625 = 1,2916787251
(X
S=
(X
X )2
n 1
1,2916787251 = 0,1845255322 = 0,42956435159 8 1
S= 0,42956435159
Una vez obtenidos el promedio y el desvo estndar, y sabiendo con que nivel de confianza vamos a trabajar, podremos expresar el intervalo de confianza del resultado. Qu significa intervalo de confianza? Siempre que trabajamos con una serie de valores, por ms preciso o exacto que sea el mtodo con el que se obtuvieron, siempre existe un desvo del promedio a ambos lados. Este intervalo se obtiene a partir del valor promedio, el desvo estndar y un valor tabulado llamado t de student (valor que se obtiene de funciones estadsticas, pero para ahorrar trabajo se calcularon y colocaron en una tabla), que seleccionaremos segn el nivel de confianza con el que vamos a trabajar y los grados de libertad, que no son otra cosa que n-1 (la tabla se encuentra a continuacin). La formula del intervalo de confianza no da un nmero sino que da como resultado un rango de valores. Esto es debido a que cuando utilicemos el mismo mtodo para medir las mismas cantidades, es muy probable que el resultado a obtener sea un valor aleatorio dentro de ese rango. IC = X S * t n 1 n
Ejemplo: (continuamos con el anterior): Queremos saber el intervalo de confianza con un nivel de confianza del 95% Tenamos: Promedio = 10,39125 Desvo Estndar = 0,42956435159 n=8 Grados de libertad = 7. tn-1(95%) = 2,365 IC = X S * t n 1 n es el valor real a medir y X el valor obtenido = 10,39125 0,359640922
Error absoluto: Ea = | X | , donde de una medicin.
Error relativo y error relativo porcentual: Er =
| X | = Ea/X; X
Er%= Er*100
Comparacin de promedios
Cundo se realizan diferentes series de mediciones, ya sea con diferentes mtodos, o inclusive con el mismo mtodo pero realizadas por diferentes operarios, no se cuenta siempre con la misma precisin, por lo que los resultados obtenidos no siempre son comparables. Por ejemplo, si se mide repetidas veces 10,0 mililitros con una pipeta cuyo volumen es de 10,0ml y luego se realiza el mismo experimento con una pipeta de 5,0ml de volumen, existe la posibilidad de que las mediciones sean totalmente diferentes, con diferente precisin y diferente promedio. Para determinar si estos valores, a pesar de sus diferencias, son comparables, se realiza la siguiente ecuacin:
texp =
X1 X 2
[(n 1).S + (n 1).S ].(n + n ) (n + n 2).(n .n )

1 2 1 2 2 2 1 2 1 2 1 2
Donde Xi es el valor de cada medicin de la primera serie con su respectivo promedio, Yj es el valor de cada medicin de la segunda serie con su respectivo promedio, m es la cantidad de mediciones realizadas para la primera serie y n las mediciones realizadas para la segunda serie. Al valor de t obtenido hay que compararlo con t de tabla para el nivel de confianza planteado y para (m + n - 2) grados de libertad.
Ejemplo: Se realizan dos series de mediciones de 10,00ml de agua. Para la primera serie se realizaron 6 mediciones (m = 6) con una pipeta de 10,00ml. Los resultados fueron: 9,90 9,80 9,95 9,90 9,85 9,90. Para la segunda serie se realizaron 5 mediciones (n = 5) con probeta de 25ml. Los resultados fueron 10 15 12 6 7 Para un nivel de confianza del 95%, comparar las series y decidir si son significativamente diferentes. Lo primero que debemos hacer (siempre) es analizar los valores con la prueba de Q y comprobar que todos estn dentro de nuestro nivel de confianza. Para nuestra primera serie: Ordenamos los valores: 9,95 9,90 9,90 9,90 9,85 9,80. W= 0,15 QC (95%) = 0,625 QM = |9,95-9,90|/0,15 = 0,333< QC (95%) No se descarta X=9,95 Qm = |9,85-9,80|/0,15 = 0,333< QC (95%) No se descarta X=9,83 X = 9,88 Para nuestra segunda serie: Ordenamos los valores: 15 12 10 7 6. W= 9 QC (95%) = 0,710 QM = |15-12|/9 = 0,333< QC (95%) No se descarta Y=15 No se descarta Y=6 Qm = |7-6|/9 = 0,111< QC (95%) Y = 10
texp =
X1 X 2
[(n 1).S + (n 1).S ].(n + n ) (n + n 2).(n .n )

1 2 1 2 2 2 1 2 1 2 1 2
= 0,081
El valor de t de la tabla de student para (m + n 2) grados de libertad con un nivel de confianza del 95% es t = 2,262. A pesar de lo diferentes que son los valores obtenidos en ambas series, texp<ttabla por lo que se puede decir que ambas series de mediciones son comparables.
Valor de t para un nivel de probabilidad del

N-1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 40 50 60 80 90 100 80% 3.078 1.886 1.638 1.533 1.476 1.440 1.415 1.397 1.383 1.372 1.363 1.356 1.350 1.345 1.341 1.337 1.333 1.330 1.328 1.325 1.323 1.321 1.319 1.318 1.316 1.315 1.314 1.313 1.311 1.310 1.309 1.309 1.308 1.307 1.306 1.303 1.300 1.296 1.292 1.291 1.290 1.282 90% 6.314 2.920 2.353 2.132 2.015 1.943 1.895 1.860 1.833 1.812 1.796 1.782 1.771 1.761 1.753 1.746 1.740 1.734 1.729 1.725 1.721 1.717 1.714 1.711 1.708 1.706 1.703 1.701 1.699 1.697 1.696 1.694 1.692 1.691 1.690 1.684 1.680 1.671 1.664 1.662 1.660 1.645 95% 12.706 4.303 3.182 2.776 2.571 2.447 2.365 2.306 2.262 2.228 2.201 2.179 2.160 2.145 2.131 2.120 2.110 2.101 2.093 2.086 2.080 2.074 2.069 2.064 2.060 2.056 2.052 2.048 2.045 2.042 2.040 2.037 2.035 2.032 2.030 2.021 2.010 2.000 1.990 1.987 1.984 1.960 99% 63.657 9.925 5.841 4.604 4.032 3.707 3.499 3.355 3.250 3.169 3.106 3.055 3.012 2.977 2.947 2.921 2.898 2.878 2.861 2.845 2.831 2.819 2.807 2.797 2.787 2.779 2.771 2.763 2.756 2.750 2.744 2.738 2.733 2.728 2.724 2.704 2.680 2.660 2.639 2.632 2.626 2.576
Tabla 2: Tabla de t de student, Catedra de Qumica Analtica Instrumental, Facultad de Ingeniera, Universidad de Buenos Aires - 63.15, gua de Problemas: Expresin de resultados
Cifras significativas
Como vemos en el resultado del ejemplo de Intervalo de confianza, todos los valores tienen cantidades de decimales diferentes, por lo que no se puede aceptar el resultado de la forma en la que fue expresado. Muchos de los decimales expresados no tienen sentido, ya que si medimos todos los valores con un instrumento que me informa un numero definido de decimales (como por ejemplo una regla, que informa un solo decimal), al expresar mas decimales damos informacin con la que no contamos, por lo tanto ese resultado es erroneo. Para saber cuantos decimales podemos expresar, primero tenemos que tener en claro el nmero de cifras significativas con los que contamos. Las cifras significativas son los dgitos que tienen significado, dentro del nmero global que nos fue dado. Por ejemplo, cuando medimos 10 centmetros con diferentes instrumentos: Con regla graduada: 10,0 centmetros 3 cifras significativas. Con calibre: 10,00 centmetros 4 cifras significativas. Con micrmetro: 10,00000 centmetros 7 cifras significativas. Entonces, cuando sumamos 10,0 centmetros medidos con regla graduada a 10,00012 centmetros medidos con micrmetro, normalmente obtendramos 20,00012cm., pero como nosotros no sabemos bien qu pasa despus del primer decimal respecto a lo que medimos con regla, no podemos afirmar que la suma de esas dos medidas sea exactamente 20,00012cm. Totalmente contrario a lo que se pensara, el resultado correctamente expresado de esta suma sera 20,0cm.
Entonces, el nmero que define cuantas cifras significativas puede tener nuestro resultado es el nmero que menos cifras significativas tiene.
Cuando eliminamos decimales debido al acotado nmero de cifras significativas con las que trabajamos hay que tener un criterio, ya que matemticamente, esos decimales existen y si fueron obtenidos por operaciones matemticas, tienen que influir en el resultado. Uno de los criterios ms utilizados es el criterio de redondeo, que consiste en acomodar el valor de la ltima cifra significativa a partir de los decimales que le siguen. Cuando la ltima cifra significativa termina en nmero par, y las cifras contiguas a ser eliminadas son mayores a 50, el resultado es redondeado hacia arriba, es decir, se suma uno a la ltima cifra. Por otra parte, cuando la ltima cifra significativa termina en nmero par, y las cifras contiguas a ser eliminadas son iguales o menores a 50, el resultado queda como esta, eliminndose todas las cifras de ms. Por ejemplo, si tenemos el nmero 6,450, que debemos expresarlo con solo dos cifras significativas, como las cifras que continan a la ltima cifra significativa son 50, el resultado final luego del redondeo se debera expresar como 6,4. Por otra parte, si tuviramos el nmero 6,456, y debiramos tambin expresarlo solamente con dos cifras significativas, el resultado luego del redondeo debera expresarse como 6,5.
Cuando la ltima cifra significativa termina en nmero impar, y las cifras contiguas a ser eliminadas son iguales o mayores a 50, el resultado es redondeado hacia arriba, es decir, se suma uno a la ltima cifra. Por otra parte, cuando la ltima cifra significativa termina en nmero impar, y las cifras contiguas a ser eliminadas son menores a 50, el resultado queda como esta, eliminndose todas las cifras de ms. Por ejemplo, si tenemos el nmero 8,549, que debemos expresarlo con solo dos cifras significativas, como las cifras que continan a la ltima cifra significativa son 49, el resultado final luego del redondeo se debera expresar como 8,5. Por otra parte, si tuviramos el nmero 8,550, y debiramos tambin expresarlo solamente con dos cifras significativas, el resultado luego del redondeo debera expresarse como 8,6. Volviendo al ejemplo de intervalos de confianza. Tenamos: 10,91 10,83 10,79 9,97 9,83 10,54 10,03 10,23 X i = 83,13 / 8 = 10,39125 X= n n=8
n 1 tn-1(95%) = 2,365
IC = X S * t n 1 n
S=
(X
X )2
1,2916787251 = 0,1845255322 = 0,42956435159 8 1
= 10,39125 0,359640922
Lo que se puede hacer en esta situacin es redondear los resultados finales en base a las cifras significativas de los datos o se puede recalcular todo a partir de los valores ya redondeados. Existen las dos posibilidades, y pueden dar resultados diferentes como no, pero ambas formas son correctas.
Primer caso, redondeamos los resultados finales. Tengamos en cuenta que las cifras significativas para los datos que nos fueron dados son 4 para todos los casos. Luego, si el valor promedio tiene un determinado nmero de decimales, el intervalo de confianza no puede tener ms, entonces el trmino que determina los extremos del intervalo de confianza va a tener la misma cantidad de decimales.
10,39125 tiene 125 al lado de la ltima cifra significativa, por lo que me queda 10,39, que tiene solamente 2 decimales. De esta forma, sabemos que el intervalo de confianza va a contar solamente con 2 decimales. 0,359640922 tiene 96 al lado del ltimo decimal admitido, por lo que debemos redondear hacia arriba, siendo el resultado final 0,36. Finalmente expresamos el intervalo de confianza: S * t n 1 = 10,39 0,36 IC = X n
Segundo caso, redondeamos el valor del promedio, por lo que nos va a quedar diferente el valor del desvo estndar y modificar los resultados del intervalo de confianza.
X ) 2 = (10,91-10,39)2+ (10,83-10,39)2+ (10,79-10,39)2+ (9,97-10,39)2+ (9,83-10,39)2+ (10,54-10,39)2+(10,03-10,39)2+ (10,23-10,39)2= 0,2704+ 0,1936+ 0,16+ 0,1764+ 0,3136+ 0,0225+ 0,1296+ 0,0256 = 1,2917
(X
S=
(X
X )2
n 1
S * t n 1 n
1,2917 = 0,18452857143 = 0,42956789 = 0,4296 8 1

0,4296 * 2,365 8 = 10,39 0,35921166 = 10,39 0,36
IC = X
= 10,39

Tratamiento de Datos

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Tratamiento de Datos

Diunggah oleh

Hak Cipta:

Format Tersedia

Tratamiento de Datos

En formulas quedaran de la siguiente manera:

Addison-Wesley - Iberoamericana, Wilmington, USA, 1993

1,2916787251 = 0,1845255322 = 0,42956435159 8 1

Error absoluto: Ea = | X | , donde de una medicin.

Error relativo y error relativo porcentual: Er =

[(n 1).S + (n 1).S ].(n + n ) (n + n 2).(n .n )

[(n 1).S + (n 1).S ].(n + n ) (n + n 2).(n .n )

Valor de t para un nivel de probabilidad del

1,2916787251 = 0,1845255322 = 0,42956435159 8 1

1,2917 = 0,18452857143 = 0,42956789 = 0,4296 8 1

Anda mungkin juga menyukai