Anda di halaman 1dari 13

Repblica Bolivariana de Venezuela Ministerio del Poder Popular para la Educacin Superior Universitaria Misin Sucre Frente Francisco

de Miranda

Profesor: Alirio Perez

Bachiller: Marcos Rangel Blanquez Jose Greimar Araujo Darlys Ortiz Raquel Ortiz

San Fernando, Marzo de 2.013

ESTADISTICA La Estadstica es una ciencia formal que estudia la recoleccin, anlisis e interpretacin de datos de una muestra representativa, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algn fenmeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadstica es ms que eso, es decir, es el vehculo que permite llevar a cabo el proceso relacionado con la investigacin cientfica. Distribucin normal Es transversal a una amplia variedad de disciplinas, desde la fsica hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en reas de negocios o instituciones gubernamentales. La estadstica se divide en dos grandes reas: La estadstica descriptiva, se dedica a la descripcin, visualizacin y resumen de datos originados a partir de los fenmenos de estudio. Los datos pueden ser resumidos numrica o grficamente. Ejemplos bsicos de parmetros estadsticos son: la media y la desviacin estndar. Algunos ejemplos grficos son: histograma, pirmide poblacional, grfico circular, entre otros. La estadstica inferencial, se dedica a la generacin de los modelos, inferencias y predicciones asociadas a los fenmenos en cuestin teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la poblacin bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hiptesis), estimaciones de unas caractersticas numricas (estimacin), pronsticos de futuras observaciones, descripciones de asociacin (correlacin) o modelamiento de relaciones entre variables (anlisis de regresin). Otras tcnicas de modelamiento incluyen anova, series de tiempo y minera de datos. Ambas ramas (descriptiva e inferencial) comprenden la estadstica aplicada. Hay tambin una disciplina llamada estadstica matemtica, la que se refiere a las bases tericas de la materia. La palabra estadsticas tambin se refiere al resultado de aplicar un algoritmo estadstico a un conjunto de datos, como en estadsticas econmicas, estadsticas criminales, entre otros.

SMBOLOS ESTADSTICOS La estadstica como toda ciencia tiene su forma particular de expresarse, a travs de smbolos o palabras que denotan un determinado concepto, y es comn que se vuelva un leguaje o una jerga (segn definicin de la RAE, jerga significa un lenguaje especial y familiar que usan entre s los individuos de ciertas profesiones y oficios, como los toreros, los estudiantes, etc.) y hasta parece que fuera otro idioma. Los smbolos utilizados, permiten abreviar y universalizar la comunicacin y por tanto se vuelve un elemento esencial y poderoso en la ciencia estadstica, por ejemplo si se desea mencionar que en una poblacin una variable X se distribuye como una distribucin normal con media = 50 y variancia s2 = 6, bastara expresarlo de la siguiente manera: X ~ N(50,6). Sin embargo, algunas abreviaturas utilizadas dependen del idioma en que se usa, por ejemplo si en castellano se quiere dar a entender grados de libertad, se utilizar g.l., pero en ingls se le designar d.f. por degrees of freedom; detalles que hay que tener en cuenta cuando se revisa bibliografa en otro idioma diferente al espaol. En realidad, la notacin estadstica utiliza de manera combinada la notacin algebraica, aritmtica y matricial, en resumen notacin matemtica y que por esta razn se necesita conocer los smbolos matemticos, los cuales en forma particular van adquiriendo una denominacin especfica segn el tema estadstico que se trate. As como las matemticas son universales y todo estudiante de pre-grado, de cualquier lugar del mundo, puede comprender la expresin aj 4 E(X) = n x p, es necesario, que se conozca el concepto que est detrs de cada smbolo, ya que as como la matemticas, la estadstica busca hacer una abstraccin de la realidad, para comprenderla y luego explicarla a travs de los datos (que en la mayora de las veces son nmeros). El proceso simple de uso de los smbolos y notacin que se usa en estadstica y en matemticas, requiere de una preparacin, que muchos docentes pasan por alto y que muchas veces comienza a crear fobia a los estudiantes en los temas de estadstica, sobre todo en aquellos cuya base en matemticas no es la idnea, sobre todo en las profesiones que no estn dentro de las ingenieras. Ahora que cada vez es ms comn el uso de la estadstica, hay que hacer un esfuerzo para que la simbologa y el lenguaje estadstico pueda ser comprendido por el usuario, por eso es vlido utilizar recursos como el que presenta Margarita Villagran, para indicar en forma breve y concisa algunos smbolos estadsticos utilizados en Bioestadstica, slo as empezaremos a ser entendidos.

DATOS ESTADISTICOS Son nmeros que pueden ser comparados, analizados e interpretados. El campo del cual son tomados los datos estadsticos se identifican como poblacin o universo. En un estudio estadstico los mtodos que se aplican son: A) RECOPILACION: De acuerdo con la localizacin de la informacin los datos estadsticos pueden ser internos y externos.

Los internos son los registros obtenidos dentro de la organizacin que hace un estudio estadstico, Los externos se obtienen de datos publicados y encuestas. B) ORGANIZACIN: En la organizacin de los datos recopilados, el primer paso es corregir cada uno de los elementos recopilados. C) REPRESENTACION: Hay 3 maneras de presentar un conjunto de datos mediante enunciados tablas estadsticas y grficas estadsticas. D) ANALISIS: Despus de los datos anteriores los datos estadsticos estn listos para hacer analizados, para lo cual frecuentemente se emplean operaciones matemticas durante el proceso de anlisis. Si una muestra es representativa de una poblacin se pueden deducir importantes deducciones acerca de esta a partir del anlisis de la misma. Una muestra es un conjunto de medidas u observaciones tomadas a partir de una poblacin dada. CLASIFICACIN DE LOS DATOS ESTADSTICOS. DATOS AGRUPADOS

1.- Su fin es resumir la informacin. Generalmente, los elementos son de mayor tamao, por lo cual requieren ser agrupados, esto implica: ordenar, clasificar y expresar los en una tabla de frecuencias.

2.- se agrupa a los datos, si se cuenta con 20 o ms elementos. Aunque contemos con ms de 20 elementos, debe de verificarse que los datos n sean significativos, Esto es: que la informacin sea repetitiva, tambin debemos de verificar que los datos puedan clasificarse. Y que dicha clasificacin tiene coherencia y lgica (de acuerdo a lo que se nos esta pidiendo) . 3-Son datos estadsticos que se encuentran ordenados en clases y con la frecuencia de cada clase, es decir; los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase. No existen normas establecidas para determinar cuando es apropiado para utilizar datos agrupados o no agrupados; sin embargo, se sugiere que cuando el nmero de datos (N) es igual o superior 50 y adems el rango o el recorrido de la serie de datos es mayor de 20, se utilizara la distribucin de frecuencia de datos agrupados, tambin se utilizar este tipo de distribucin cuando se requiera elaborar grficos lineales como el histograma, el polgono de frecuencia, o la ojiva. Una vez que ya hemos ordenado y clasificado, presentaremos la informacin obtenida mediante una tabla de frecuencias

4.- la agrupacin de los datos puede ser simple o mediante intervalos de clase. Por ejemplo: Alturas de los estudiantes de la Universidad. Altura Nmero (Pulgadas) estudiantes 60-62 5 63-65 18 66-68 42

69-71 27 72-74 8 Total-100

La presente tabla es una distribucin de frecuencias de alturas (registradas con una aproximacin de pulgada) de 100 estudiantes de la Universidad.

Donde la primera clase o categora por ejemplo, comprende las alturas de 60 a 62 pulgadas y viene indicada por el smbolo 60-62.Puesto que 5 estudiantes tienen una altura perteneciente a esta clase, la correspondiente frecuencia de clase es 5. DATOS NO AGRUPADOS. -Los datos son brutos(es decir, no se presentan clasificados).Elementos que menor tamao (generalmente menor a 20 elementos).Esto no sucede as siempre. Aunque contemos con menos de 20 elementos, debe de verificarse que los datos no sean significativos, Esto es: que la informacin no sea repetitiva, de esta forma, sabremos que no se podr clasificar y por lo tanto ser resumida en una tabla de frecuencias. En caso de que una vez que hayamos ordenado los elementos, se cuente con datos significativos. Procedemos a clasificarlos (si es posible, ya que tambin debemos de buscar la lgica al clasificar los elementos) para convertirlos en datos agrupados

-Son datos estadsticos desde el menor de ellos hasta el mayor de un conjunto sin que se haya hecho alguna modificacin al tamao de las unidades originales. Mantienen su propia identidad despus de una elaboracin de frecuencia. En estas distribuciones los valores de cada variable han sido solamente reagrupados, siguiendo un orden lgico con sus respectivas frecuencias

DEFINIRA LA DISTRIBUCION DE FRECUENCIA Una distribucin de frecuencia es una tabla en la cual se agrupan los valores posibles para una variable y se registran para una variable el nmero de valores observados que corresponde a cada clase. La siguiente es una tabla de distribucin de frecuencia de alturas registradas de 100 estudiantes. ALTURAS ESTUDIANTES 5 18 42 27 8 100

Conviene recordar frecuencia absoluta es l nmero de datos contenidos en determinado intervalo. FRECUENCIA RELATIVA: Es el porcentaje que representa la frecuencia absoluta de determinado intervalo con respecto al total de datos proporcionados. FRECUENCIA ACOMULADA: Es la suma acumulativa de las frecuencias absolutas de cada uno de los intervalos. FRECUENCIA ACUMULADA RELATIVA: Es el porcentaje que expresa la frecuencia acumulada con respecto al total de datos proporcionados. Los nmeros extremos 60 y 62 de la tabla anterior se conocen como los lmites de clase. El nmero menor 60 es el lmite inferior de la clase y el 62 es el superior. El punto medio de clase que tambin se llama marca de clase se obtiene sumando los limites inferior y superior y dividiendo entre dos. A veces se necesita obtener lo que llamamos frontera de clase o limites exactos y esto se logra efectuando una suma entre el lmite inferior de la clase inmediata cuyo resultado se divide entre dos.

MEDIDAS DE TENDENCIA CENTRAL: MEDIA, MEDIANA, MODA

Supngase que un determinado alumno obtiene 35 puntos en una prueba de matemtica. Este puntaje, por s mismo tiene muy poco significado a menos que podamos conocer el total de puntos que obtiene una persona promedio al participar en esa prueba, saber cul es la calificacin menor y mayor que se obtiene, y cun variadas son esas calificaciones. En otras palabras, para que una calificacin tenga significado hay que contar con elementos de referencia generalmente relacionados con ciertos El promedio de notas es muy criterios estadsticos. importante. Las medidas de tendencia central (media, mediana y moda) sirven como puntos de referencia para interpretar las calificaciones que se obtienen en una prueba. Volviendo a nuestro ejemplo, digamos que la calificacin promedio en la prueba que hizo el alumno fue de 20 puntos. Con este dato podemos decir que la calificacin del alumno se ubica notablemente sobre el promedio. Pero si la calificacin promedio fue de 65 puntos, entonces la conclusin sera muy diferente, debido a que se ubicara muy por debajo del promedio de la clase. En resumen, el propsito de las medidas de tendencia central es: Mostrar en qu lugar se ubica la persona promedio o tpica del grupo. Sirve como un mtodo para comparar o interpretar cualquier puntaje en relacin con el puntaje central o tpico. Sirve como un mtodo para comparar el puntaje obtenido por una misma persona en dos diferentes ocasiones. Sirve como un mtodo para comparar los resultados medios obtenidos por dos o ms grupos. Las medidas de tendencia central ms comunes son: La media aritmtica: comnmente conocida como media o promedio. Se representa por medio de una letra M o por una X con una lnea en la parte superior. La mediana: la cual es el puntaje que se ubica en el centro de una distribucin. Se representa como Md. La moda: que es el puntaje que se presenta con mayor frecuencia en una distribucin. Se representa Mo.

De estas tres medidas de tendencia central, la media es reconocida como la mejor y ms til. Sin embargo, cuando en una distribucin se presentan casos cuyos puntajes son muy bajos o muy altos respecto al resto del grupo, es recomendable utilizar la mediana o la moda. (Porque dadas las caractersticas de la media, esta es afectada por los valores extremos). La media es considerada como la mejor medida de tendencia central, por las siguientes razones: Los puntajes contribuyen de manera proporcional al

La media, el mejor dato. hacer el cmputo de la media.

Es la medida de tendencia central ms conocida y utilizada. Las medias de dos o ms distribuciones pueden ser fcilmente promediadas mientras que las medianas y las modas de las distribuciones no se promedian. La media se utiliza en procesos y tcnicas estadsticas ms complejas mientras que la mediana y la moda en muy pocos casos. Cmo calcular, la media, la moda y la mediana Media aritmtica o promedio

Es aquella medida que se obtiene al dividir la suma de todos los valores de una variable por la frecuencia total. En palabras ms simples, corresponde a la suma de un conjunto de datos dividida por el nmero total de dichos datos.

Ejemplo 1: En matemticas, un alumno tiene las siguientes notas: 4, 7, 7, 2, 5, 3 n = 6 (nmero total de datos)

La media aritmtica de las notas de esa asignatura es 4,8. Este nmero representa el promedio. Ejemplo 2: Cuando se tienen muchos datos es ms conveniente agruparlos en una tabla de frecuencias y luego calcular la media aritmtica. El siguiente cuadro con las medidas de 63 varas de pino lo ilustra.

Largo (en m) 5 6 7 8 9

Frecuencia absoluta 10 15 20 12 6 Frecuencia total = 63

Largo por Frecuencia absoluta 5 6 7 8 9 430 . . . . . 10 = 50 15 = 90 20 = 140 12 = 96

6 = 54

Se debe recordar que la frecuencia absoluta indica cuntas veces se repite cada valor, por lo tanto, la tabla es una manera ms corta de anotar los datos (si la frecuencia absoluta es 10, significa que el valor a que corresponde se repite 10 veces). Moda (Mo) Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos; o sea, cual se repite ms. Ejemplo 1: Determinar la moda en el siguiente conjunto de datos que corresponden a las edades de nias de un Jardn Infantil. 5, 7, 3, 3, 7, 8, 3, 5, 9, 5, 3, 4, 3 La edad que ms se repite es 3, por lo tanto, la Moda es 3 (Mo = 3) Ejemplo 2: 20, 12, 14, 23, 78, 56, 96 En este conjunto de datos no existe ningn valor que se repita, por lo tanto, este conjunto de valores no tiene moda. Mediana (Med) Para reconocer la mediana, es necesario tener ordenados los valores sea de mayor a menor o lo contrario. Usted divide el total de casos (N) entre dos, y el valor resultante corresponde al nmero del caso que representa la mediana de la distribucin. Es el valor central de un conjunto de valores ordenados en forma creciente o decreciente. Dicho en otras palabras, la Mediana corresponde al valor que deja igual nmero de valores antes y despus de l en un conjunto de datos agrupados. Segn el nmero de valores que se tengan se pueden presentar dos casos: Si el nmero de valores es impar, la Mediana corresponder al valor central de dicho conjunto de datos.

Si el nmero de valores es par, la Mediana corresponder al promedio de los dos valores centrales (los valores centrales se suman y se dividen por 2). Ejemplo 1: Se tienen los siguientes datos: 5, 4, 8, 10, 9, 1, 2 Al ordenarlos en forma creciente, es decir de menor a mayor, se tiene: 1, 2, 4, 5, 8, 9, 10 El 5 corresponde a la Med, porque es el valor central en este conjunto de datos impares. Ejemplo 2: El siguiente conjunto de datos est ordenado en forma decreciente, de mayor a menor, y corresponde a un conjunto de valores pares, por lo tanto, la Med ser el promedio de los valores centrales. 21, 19, 18, 15, 13, 11, 10, 9, 5, 3

Ejemplo 3:

Interpretando el grfico de barras podemos deducir que: 5 alumnos obtienen puntaje de 62 5 alumnos obtienen puntaje de 67 8 alumnos obtienen puntaje de 72 12 alumnos obtienen puntaje de 77 16 alumnos obtienen puntaje de 82 4 alumnos obtienen puntaje de 87

lo que hace un total de 50 alumnos Sabemos que la mediana se obtiene haciendo

lo cual significa que la mediana se ubica en la posicin intermedia entre los alumnos 25 y 26 (cuyo promedio es 25,5), lo cual vemos en el siguiente cuadro:

puntaje 62 62 62 62 62 67 67 67 67 67 72 72 72 72 72 72 72 72 77 77 77 77 77 77 77 77 77 77 77 77

alumnos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

82 82 82 82 82 82 82 82 82 82 82 82 82 82 82 82 87 87 87 87 El alumno 25 obtuvo puntaje de 77 El alumno 26 obtuvo puntaje de 77

31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50

Entonces, como el total de alumnos es par debemos promediar esos puntajes:

La mediana es 77, lo cual significa que 25 alumnos obtuvieron puntaje desde 77 hacia abajo (alumnos 25 hasta el 1 en el cuadro) y 25 alumnos obtuvieron puntaje de 77 hacia arriba (alumnos 26 hasta el 50 en el cuadro).

Anda mungkin juga menyukai