Anda di halaman 1dari 14

UNIVERSIDAD DE SONORA

DIVISIN DE CIENCIAS BIOLGICAS Y DE LA SALUD PROGRAMA DE POSGRADO EN BIOCIENCIAS

CONCEPTOS ESTADSTICOS

Presenta: Luisa Alondra Rascn Valenzuela

Profesor: Dr. Luis Enrique Gutirrez Milln

Hermosillo, Sonora

Agosto de 2011

INTRODUCCIN El uso de mtodos estadsticos es fundamental cuando se est desarrollando un proyecto de investigacin. Da a da obtenemos informacin referente a nuestra rea de trabajo y precisamos organizarla y analizarla para hacer uso de ella, solo as ser til para nuestro proyecto. La informacin es importante en la toma de decisiones; sin embargo es igualmente importante el procesamiento adecuado de los datos, para que de esta manera dicha informacin adquiera significado, y nos gue hacia conclusiones certeras. De lo contrario, sino se realiza un buen manejo de los daros es posible que, con base a los resultados, tomemos una mala decisin. La estadstica, nos brinda una serie de herramientas las cuales nos auxilian en la tarea de transformar un conjunto de datos, obtenidos a partir de una muestra, en informacin que nos permita deducir y evaluar conclusiones acerca de una poblacin. A continuacin, se presentan algunos conceptos fundamentales del lenguaje de la estadstica, as como los elementos que constituyen un problema estadstico con aplicacin a nuestro proyecto de investigacin, evidenciando de esta forma que no todas las clases de diseos experimentales se ven sujetos a dichos elementos.

INTRODUCCIN A LA ESTADSTICA Conceptos Bsicos Estadstica En la literatura se encuentran numerosas definiciones de estadstica, estas varan no se presentan con cierta uniformidad, sin embargo existen ciertos elementos que son constantes en todas ellas. A continuacin se encuentran algunas definiciones recopiladas de diversos autores. Estadstica es el arte de la decisin frente a la incertidumbre [1]. Estadstica es una rama de las matemticas que trata de la recopilacin, el anlisis, la interpretacin y la presentacin de una gran cantidad de datos numricos [2]. La estadstica trata del diseo de experimentos o encuestas mediante muestras a un costo mnimo y del uso ptimo de esta informacin para hacer inferencias con respecto a una poblacin [3].

As juntando los elementos proporcionados por las definiciones anteriores y tomando en cuenta que la estadstica se divide en descriptiva e inferencial podemos definir a sta como una disciplina de las matemticas cuyo campo de estudio se refiere a la organizacin y presentacin resumida de datos de una muestra, as como a la extraccin de inferencias acerca de una poblacin, con base al anlisis de un muestra de la misma.

Poblacin En estadstica se puede definir a la poblacin como la mayor coleccin de elementos por los cuales se tiene cierto inters en un instante en particular [4]. Generalmente cuando viene a nuestra mente la palabra poblacin pensamos en un conjunto de personas, sin embargo, como se indica en la definicin anterior una poblacin puede constituirse de entes muy variadas, pueden ser animales, mquinas, clulas, entre otras. De esta forma una poblacin se constituye como el conjunto de elementos que tienen una o ms caractersticas en comn que son de inters para el estudio que pretendemos llevar a cabo. Si se lleva a cabo una medicin de alguna variable sobre cada uno de los elementos de la poblacin, se genera una poblacin de valores de esa variable, la cual consiste en todos los posibles valores de una variable. Estos valores no tienen que ser todos diferentes ni en nmero finito [5].

Muestra Una muestra es un subconjunto de elementos sacado de una poblacin. Por ejemplo una poblacin consiste de los pesos de todos los nios de nivel elemental inscritos en cierto sistema escolar. Si se renen para el anlisis, los pesos de slo una fraccin de estos nios, solo se tiene una parte de la poblacin de pesos, es decir, se tiene una muestra. Existen muchos tipos de muestras que pueden seleccionarse de una poblacin. Se espera que el comportamiento de la variable aleatoria estudiada en la muestra proporcione una imagen precisa de su comportamiento en la poblacin, por lo que, normalmente, las muestras deben de ser tomadas al azar de una poblacin infinitamente grande. Por muestra al azar se entiende que cada elemento de la poblacin tiene igual posibilidad o se le d la misma oportunidad de ser miembro o componente de la muestra, y su ocurrencia no afecta a los dems elementos, de lo contrario la muestra se llama sesgada. Con los valores de la muestra se verifican las hiptesis necesarias, se realizan las pruebas de anlisis estadstico y se obtienen las conclusiones para inferir el conocimiento de la poblacin [5].

Parmetro Una medida descriptiva, como las medidas de tendencia central y de variacin, relacionada con una variable aleatoria, cuando la variable se considera sobre toda una poblacin, se denomina parmetro. stos se indican, generalmente, en letras griegas (tabla 1). Si la poblacin es muy grande, no es posible conocer el valor de estos parmetros, sin embargo, se pueden utilizar mtodos estadsticos para aproximarse a su valor basndose en datos obtenidos de una muestra [6].

Estadstico Una medida descriptiva relacionada con una variable aleatoria, cuando la variable slo se considera sobre una muestra se denomina estadstico. Los estadsticos tienen dos fines. Por un lado describen la muestra que est disponible y, por otro, sirven como aproximacin a los parmetros correspondientes a la poblacin. Se designan con letras latinas (tabla 1).

Tabla 1. Smbolos de uso frecuente para parmetros y estadsticos

Caracterstica Media Desviacin Estndar Varianza Correlacin Proporcin

Smbolo parmetro 2

Smbolo estadstico s s2 r p

Tipos de Variables Si conforme se observa una caracterstica, se encuentra que toma valores diferentes en personas, lugares o cosas diferentes, se dice que esta caracterstica es una variable [4]. Es de suma importancia conocer con qu tipo de variables se trabajar, debido a que cada tipo de variable le corresponde una manera diferente de ser presentada en forma de tablas o grficos y dependiendo del tipo de variables se emplear uno u otro procedimiento estadstico. A continuacin se presenta un diagrama con la clasificacin de las variables y despus un breve resumen de sus caractersticas principales.

Clasificacin estadstica de las variables Variables cualitativas. Son las que se refieren a caractersticas o atributos que solamente se describen con palabras; por ejemplo la presencia de enfermedad se describe en trminos de si o no. Dentro de este tipo de variables existen algunas que dan una idea de jerarqua y otras que no. Las variables cualitativas nominales adoptan modalidades que no tienen punto de comparacin, como lo es el tipo de enfermedad o la profesin; en tanto las variables cualitativas ordinales, como su nombre lo indica poseen un orden entre sus modalidades, por ejemplo, el lugar ocupado en una competencia. Variables cuantitativas. Son aquellas que se describen en trminos numricos, por ejemplo, la variable de nmero de hijos o la estatura al nacer. Estas pueden ser divididas en dos grupos, algunas variables tienen modalidades que solo se pueden expresar en nmeros enteros como lo es el ejemplo de nmero de hijos, stas son conocidas como variables cuantitativas discretas. Otras variables si son susceptibles de expresar en trminos de fracciones, por ejemplo la variable estatura, stas son conocidas como variables cuantitativas continuas. Clasificacin metodolgica de las variables En esta clasificacin las variables se dividen en independientes las cuales son antecedentes a las variables dependientes. A su vez, las variables dependientes se consideran consecuentes de las variables independientes.

Tipos de Grficos Grfico de barras Un grfico de barras es aquella representacin grfica bidimensional en que los objetos grficos elementales son un conjunto de rectngulos dispuestos paralelamente de manera que la extensin de los mismos es proporcional a la magnitud que se quiere representar. Los rectngulos pueden ser colocados tanto horizontal como verticalmente. Tpicamente los grficos de barras se utilizan para comparar magnitudes entre varias categoras, para ver la evolucin de una magnitud durante el tiempo o para la comparacin de la evolucin en el tiempo de varias categoras. Como se mencion anteriormente, dependiendo de la variable, se elige el grfico a utilizar, as el grfico de barras sirve para representar variables de tipo cualitativas nominales y ordinales; este tipo de representacin no es muy apropiada para representar variables cuantitativas. Un grfico de barras se compone de un eje cuantitativo con una escala lineal(donde se representa la magnitud de la variable), un eje nominal u ordinal (donde se representa la variable) y un conjunto de rectngulos cuya extensin paralela al eje cuantitativo es proporcional a la magnitud de la categora o secuencia representada en el eje. Existen varios tipos de grficos de barras, entre ellos. Sencillos: Los cuales contienen solo una serie de datos. Agrupados: stos representan varias series de datos. En cada categora o secuencia los rectngulos suelen estar juntos, mientras que entre grupos se deja un espacio. Apilados: Es similar al agrupado pero cada uno de los segmentos en que est dividida la barra pertenece a una serie de datos diferente. Pictricos: Se denominan as cuando las barras estn constituidas por la repeticin de una serie de smbolos que tpicamente representan la naturaleza de los datos. Por ejemplo una serie de motocicletas o coches uno detrs de otro para representar las ventas comparativas de motos y coches. Los smbolos pueden ser todos del mismo tamao o estar distorsionados para ajustarse a la longitud requerida de la barra [7].

Figura 1. Ejemplo de grfico de barras sencillo.

Grfico de pastel Se usa, fundamentalmente, para representar distribuciones de frecuencias relativas (%) de una variable cualitativa o cuantitativa discreta. En este grfico se hace corresponder la medida del ngulo de cada sector con la frecuencia correspondiente a la clase en cuestin. Si los 360 del crculo representan el 100 % de los datos clasificados, a cada 1% le correspondern 3,6. Luego, para obtener el tamao del ngulo para un sector dado bastara con multiplicar el por ciento correspondiente por 3.6 [7].

Figura 2. Ejemplo de grafico de pastel.

Histograma Un histograma es una grfica que da una idea de la forma de una muestra, indicando las regiones donde los puntos de la muestra estn concentrados y las regiones donde son escasos [8]. Este grfico se usa para representar una distribucin de frecuencias de una variable cuantitativa continua. Habitualmente se representa la frecuencia observada en el eje y, y en el eje x la variable. La escala del eje correspondiente a la variable se rotula con los lmites inferiores de notacin de las clases consideradas y se agrega al final el que le correspondera a una clase subsiguiente inexistente. En este caso, las frecuencias deben resultar proporcionales no a la altura de las barras, sino al rea de las mismas. Adems, las barras van contiguas y no separadas, por la naturaleza continua de la variable de clasificacin. Para lograr la proporcionalidad entre la frecuencia y el rea de la barra que esta representa el procedimiento es el siguiente: sabemos que el rea de un rectngulo es el producto de la base por la altura y que la base de una barra en el grfico es, precisamente, la amplitud del intervalo de clase, luego la formulacin de esa proporcionalidad estar dada por: Frecuencia observada = (Amplitud del intervalo) (Altura de la barra) Conocemos la frecuencia observada y la amplitud de cada uno de los intervalos, por tanto, para calcular las alturas de las barras slo se tendra que despejar en la frmula correspondiente. As restara slo dibujar un rectngulo para cada clase.

Figura 3. Ejemplo de histograma.

Grfico de Lneas Se utiliza, al igual que el histograma, para representar distribuciones de frecuencias de variables cuantitativas continuas, pero como no se utilizan barras en su confeccin sino segmentos de recta, de ah el nombre de polgono. Habitualmente se usa cuando se quiere mostrar en el mismo grfico ms de una distribucin o una clasificacin cruzada de una variable cuantitativa continua con una cualitativa o cuantitativa discreta, ya que por la forma de construccin del histograma slo se puede representar una distribucin. Para su confeccin, una vez construidas y rotuladas las escalas, de manera similar a como se realiza para un histograma, los valores de alturas obtenidos se grafican sobre el punto medio o marca de clase de los intervalos correspondientes y luego se procede a unir esos puntos con segmentos de recta [7].

Figura 4. Ejemplo de grfico de lneas.

Grficos de caja y bigotes Los diagramas de caja y bigotes son representaciones grficas de un conjunto de datos que facilita la percepcin visual de su localizacin, extensin, y del grado y direccin del sesgo. Tambin permite identificar datos atpicos [1]. La mayor utilidad de estos diagramas es para comparar dos o ms conjuntos de datos. El diagrama de caja y bigotes incluye la mediana, el primero y tercer cuartil y cualquier dato atpico que se presente en la muestra. Un trmino utilizado en este tipo de grficos es el rango intercuartil (iqr) el cual es la diferencia entre el tercer y primer cuartil; ste representa la distancia necesaria para atravesar la mitad de los datos de en medio [8].

Observando la figura 5 podemos observar que un diagrama de caja y bigote consta de una caja cuyo lado inferior es el primer cuartil (q1) y el lado superior es el tercer cuartil(q3). La mediana se dibuja como una lnea horizontal. Los datos atpicos se grafican por separado y se indican con cruces. Las lneas verticales que se extienden desde la parte superior e inferior de la caja son llamados bigotes. Estos terminan en los puntos ms extremos que no son atpicos. Para la construccin de un diagrama de caja y bigotes se siguen los pasos que se presentan a continuacin: Se calcula la mediana, el primer y tercer cuartil de la muestra. Indique estos con lneas horizontales. Dibuje lneas verticales para completar la caja. Se determinan los puntos f1 y f3 mediante f1= q1-1.5 iqr y f3=q3+1.5 iqr. Los puntos por debajo de f1 o por encima de f3 se consideraran atpicos. Se determinan dos puntos a1 y a3 denominados valores adyacentes. El punto a1 es el dato ms cercano a f1, sin que su valor este debajo de f1. El punto a3 es el dato ms cercano a f3, sin que su valor est por encima de f3. Los bigotes se disean hasta los puntos a en ambas direcciones. Se determinan los puntos F1 y F3, mediante F1= q1-(2)1.5 iqr y F3=q3+(2)1.5 iqr. Los datos que caigan fuera de dichos puntos son considerados datos atpicos extremos.

Figura 5. Ejemplo de diagrama de caja y bigotes.

Partes de un Problema Estadstico Como se plasm en la definicin de estadstica, el fin ltimo de sta es hacer inferencias sobre ciertas caractersticas de la poblacin con base a la informacin generada por una muestra. Esta finalidad slo se logra cumpliendo con las cinco partes de un problema estadstico, las cuales se exponen a continuacin. 1. Definicin clara de la poblacin de inters. Es la parte ms importante ya que se hace una especificacin clara de la pregunta a contestar y de la poblacin sobre la cual dicha pregunta se hace. 2. Diseo del experimento o procedimiento de muestreo. Toda investigacin genera costos por lo que es de suma importancia que se disee el procedimiento correcto para la obtencin de datos de manera que estos sean suficientes para cumplir con los objetivos planteados. 3. Recopilacin y anlisis de los datos. En este paso es preciso utilizar el mtodo estadstico apropiado para extraer la informacin de los datos recopilados. 4. Inferir sobre la poblacin haciendo uso de la informacin muestral. En esta parte se quiere utilizar el mejor procedimiento de inferencia para estimar, decidir o predecir con base en la informacin muestral. 5. Obtencin de una medida de bondad de la inferencia. En esta parte se contesta la pregunta de Qu tan buena es la inferencia?

Aplicando las Partes de un Problema Estadstico a mi Proyecto de Investigacin Mi proyecto de investigacin tiene el ttulo tentativo de caracterizacin qumica y biolgica de los componentes con actividad antiproliferativa del extracto metanlico de Asclepias subulata. En este tipo de investigacin se utiliza una estadstica bsica en la que se calculan algunas medidas de tendencia central y de dispersin ,solamente. Para obtener la decisin de si los compuestos poseen actividad anticancergena se establecen simples comparaciones con valores establecidos por organizaciones como el instituto nacional del cncer y con controles internos, por lo que no se tiene mayor problema con el uso de estimadores. A continuacin se muestra un intento por aplicar algunas de las partes de un problema estadstico al proyecto mencionado. 1. Definicin clara de la poblacin de inters En el estudio solo una parte utiliza una parte donde se utiliza estadstica por lo cual se limitar la discusin a las pruebas de actividad antiproliferativa del extracto metanlico de la planta y sus componentes aislados en lneas celulares cancergenas.

Especificacin clara de la pregunta a contestar El extracto metanlico de Asclepias subulata y sus componentes aislados tienen actividad antiproliferativa en lneas celulares cancerosas? La pregunta fue planteada de esa manera debido a que en el estudio de drogas se tienen diversas etapas de experimentacin, en las primeras se prueba la actividad del extracto en sistemas in vitro, se aslan compuestos activos los cuales, posteriormente, se modifican para obtener mejores perfiles farmacolgicos, se elucidan los mecanismos de accin y despus se inicia con las pruebas en animales, una vez que se comprueba la seguridad del compuesto se llevan a cabo estudios en humanos. Este proyecto se encuentra en una etapa inicial, razn por la cual las poblaciones a estudiar se encuentran restringidas a lneas celulares. Poblacin de estudio Como poblaciones de estudio se eligieron las lneas celulares M12.Ak.C3.F6 (linfoma de clulas B ) y RAW 264.7 (macrfagos transformados por el virus de la leucemia de Abelson); as como las lneas celulares humanas HeLa (adenocarcinoma de crvix), A-549 (adenocarcinoma de pulmn), PC-3 (cncer de prstata) y SKLU-1 (adenocarcinoma de pulmn) , obedeciendo a la prevalencia de este tipo de cnceres en el Estado. 2. Diseo del experimento o procedimiento de muestreo Las clulas pertenecientes a una lnea celular dada muestran patrones genticos idnticos, por lo que poseen las mismas caractersticas, el nmero de clulas a utilizar en cierto experimento se determina por medio de ensayos cinticos y no por tcnicas estadsticas. Como es una investigacin experimental para evaluar la caracterstica de inters se utiliza un ensayo experimental, en este caso el ensayo de reduccin del MTT, esto porque se trata de un mtodo econmico, seguro y reproducible. 3. Recopilacin y anlisis de datos Para determinar la actividad anticancergena se establecern simples comparaciones entre los valores de inhibicin celular, razn por la cual el anlisis estadstico se limita a calcular la media +/- la desviacin estndar de 3 mediciones paralelas.

4. Inferir sobre la poblacin haciendo uso de la informacin muestral. Las clulas poseen constitucin gentica similar por lo que los valores obtenidos para la muestra aplican para la lnea celular. En este caso no se aplican procedimientos de estimacin, solo se generan comparaciones el instituto nacional del cncer cuenta con valores de corte para determinar si un compuesto posee o no actividad antiproliferativa. 5. Obtencin de una medida de bondad de la inferencia. Como se mencion anteriormente, no existen inferencias, por lo tanto no existe la necesidad de aplicar medidas de bondad.

CONCLUSIN Un anlisis estadstico adecuado es muy importante para la obtencin de conclusiones acertadas, es imperativo tener una nocin clara de los conceptos fundamentales de la estadstica de manera que se nos permita tener nocin de cmo dirigir nuestro estudio, la definicin de la poblacin y de la muestra es fundamental para la realizacin de los objetivos planteados en cierto proyecto. Tambin es importante mencionar que aunque existan directores estadsticos como las partes de un problema estadstico, no todas las investigaciones cumplen con dichos requisitos, no porque se encuentren errados, sino porque el anlisis no lo precisa.

REFERENCIAS

[1] Milton, S. Estadstica para Biologa y Ciencias de la Salud. McGraw- Hill Interamerricana. 3 edicin. 2001. Mxico. [2] New Collegiate Dictionary [3] Mendenhall W., Wackerly D., Scheaffer R. Estadstica Matemtica con Aplicaciones. Grupo Editorial Iberoamerica. 2 edicin. 1994. Mxico. [4] Daniels [5] Valenzuela, O. Bioestadstica Aplicada. Editorial UniSon. 2006. Sonora, Mxico. [6] Dawson- Sanders, B., Trapp R. Bioestadstica Mdica. Ed. Manual Moderno. 2 edicin. 1999. Mxico. [7] http://www.infovis.net/printMag.php?num=157&lang=1 [8] Navidi, W. Estadstica para Ingenieros. McGraw- Hill Interamerricana. 2006. Mxico.

Anda mungkin juga menyukai