Anda di halaman 1dari 41

Unidad 1.

Fundamentos de la estadstica Presentacin de la unidad La palabra estadstica a menudo te remite a grficas y tablas; cifras relativas a nacimientos, muertes, impuestos, demografa, ingresos, deudas, crditos, etc. No obstante, para aprovechar las herramientas de anlisis estadstico, es necesario comprender qu representa cada concepto y la metodologa mediante la cual se obtiene un dato estadstico. En esta unidad se hablar sobre la importancia de la estadstica, conocers sus conceptos bsicos, as como la metodologa del muestreo para que al final, obtengas una muestra aleatoria simple.

Propsitos de la unidad

Identificars los conceptos bsicos relacionados con la Estadstica. Reconocers la utilidad e importacia de la Estadstica. Aplicars el procedimiento para obtener una muestra aleatoria simple.

Competencia especfica

Aplica la metodologa estadstica para obtener una muestra aleatoria simple, identificando los elementos que intervienen en un problema estadstico.

1.1. Introduccin a la estadstica

La estadstica es la ciencia cuyo objetivo es reunir informacin cuantitativa relacionada a individuos, grupos, series de hechos, entre otros. Gracias al anlisis de estos datos se pueden deducir algunos significados precisos o algunas previsiones para el futuro. La estadstica, en general, es la ciencia que trata la recopilacin, la organizacin, la presentacin, el anlisis y la interpretacin de datos numricos con el fin de realizar una toma de decisiones ms efectiva.

Haz clic en la imagen para conocer ms informacin.

Las estadsticas La palabra estadstica tambin se utiliza para referirse a la informacin estadstica (descripcin de parmetros); es decir, a series de datos, tablas y grficas que presentan resultados. Por ejemplo, cuando leemos las estadsticas de los equipos o escuchamos la estadstica muestra que el ndice de reprobacin en las escuelas es tal, se hace referencia a los datos y no al procedimiento o metodologa de anlisis.

1.1. Introduccin a la estadstica Utilidad e importancia de la estadstica La estadstica resulta muy til no slo para recopilar y describir datos, sino tambin para interpretar la informacin obtenida, que puede ser aprovechada para demostrar la evolucin de un fenmeno a travs de cierto tiempo. En Mxico, el Instituto Nacional de Estadstica y Geografa (INEGI) se encarga de recabar informacin estadstica y geogrfica de todo el pas, en diferentes reas y contextos. Los mtodos estadsticos se utilizan en investigaciones de todas las reas del conocimiento en el mbito acadmico, profesional y laboral. La finalidad es resolver un problema, entendiendo ste como la diferencia entre lo real y lo deseado, donde la estadstica muestra la realidad para que el investigador la analice y tome una decisin.

Divisin de la estadstica La estadstica, por su aplicacin se divide en:

1) Estadstica descriptiva. La funcin descriptiva de la estadstica se enfoca en la presentacin y clasificacin de los datos obtenidos de la poblacin que se analiza. 2) Estadstica inferencial. Esta aplicacin de la estadstica busca plantear y resolver problemas especficos y/o hacer previsiones a partir de los datos de una muestra, dado que es muy difcil estudiar a la poblacin completa.

Actividad 1. Encuesta

Antes de continuar con el contenido de la asignatura, responde la encuesta Preferencias por carrera. Es necesario que participes en este ejercicio, porque a partir de los datos que arroje la encuesta, realizars las actividades para evaluar las tres unidades de la asignatura. Para ingresar a la Encuesta: En la ruta (parte superior izquierda del aula) da clic en Estadstica. Se enlistarn las actividades de la unidad, da clic en la Actividad 1. Encuesta Preferencias por carrerra.

1.2. Conceptos de estadstica La estadstica tiene aplicacin en prcticamente todas las reas del conocimiento, inclusive en la vida cotidiana, mucho ms a menudo de lo que crees. La siguiente actividad te permitir apreciar una aplicacin simple de la estadstica e identificar algunos conceptos relacionados con ella: 1. Lee el texto La estadstica y la salud. 2. Identifica los conceptos relacionados con la estadstica. 3. Define cada concepto utilizando slo la informacin de la lectura. No es necesario que busques definiciones. Da clic en el icono para descargar el documento.

Conceptos bsicos de estadstica Los conceptos ms utilizados en estadstica son los que a continuacin se presentan. Poblacin: Conjunto de todos los elementos que permiten resolver un problema, que presentan una caracterstica comn determinada, observable y medible. Por ejemplo, si el elemento es una persona, se pueden estudiar las caractersticas edad, peso, nacionalidad, sexo, etc. Los elementos que integran una poblacin pueden corresponder a personas, objetos o grupos (por ejemplo, familias, las manzanas de una cosecha, empleados de una empresa, etc.). Individuo: Un individuo o unidad estadstica es cada uno de los elementos que componen la poblacin. Nota que un individuo en estadstica puede ser distinto a un individuo como persona. Por ejemplo, en los censos econmicos se obtienen datos de los negocios. En este caso cada negocio, que est formado por varias personas, es un individuo de la poblacin. Muestra: Cuando es difcil estudiar la poblacin debido a su gran tamao o que provenga de un proceso que no se detiene (como la produccin de un bien), se debe analizar un subconjunto o parte de sta que la represente, llamado muestra, partiendo del supuesto de que este subconjunto presenta el mismo comportamiento y caractersticas que la poblacin. En general el tamao de la muestra es mucho menor al tamao de la poblacin. Muestreo: Es el proceso de recabar los datos que se desean analizar, obtenidos de una proporcin reducida y representativa de la poblacin.

Dato: El dato es cada uno de los valores que se han obtenido al realizar un estudio estadstico. Por ejemplo: Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz.

Variable: Se llama variable a una caracterstica que se observa en una poblacin o muestra, y a la cual se desea estudiar. La variable puede tomar diferentes valores dependiendo de cada individuo. Las variables se pueden clasificar en dos tipos: 1. Variable cuantitativa. Puede ser escala continua o discreta. 2. Variable cualitativa. Puede ser escala nominal u ordinal. Tipos de variables

La variable es una caracterstica de la poblacin o muestra que desea estudiarse. Las variables pueden ser:

Cmo utilizamos los conceptos? En el ejemplo La estadstica y la salud identificaste algunos conceptos bsicos de estadstica. Ahora, revisemos juntos(as) los conceptos que estaban en el texto. La poblacin de estudio es la sangre del individuo, de la cual se toma una muestra que representa una pequea parte de esta poblacin. Esta muestra contiene informacin sobre las caractersticas que se desean observar. Los (las) expertos(as) de laboratorio preparan la sangre para observar en un microscopio electrnico los elementos (variables) que contiene, por ejemplo pueden observar la cantidad de plaquetas o neutrfilos (las plaquetas y los neutrfilos son los individuos y la cantidad que contiene la sangre de estos elementos son los datos) que contiene la muestra por unidad de volumen. Se realiza un conteo, en este caso, del nmero de plaquetas y del nmero de neutrfilos, esta informacin se representa por medio de un estadstico, caracterstica numrica que refleja la informacin contenida en la muestra, en la que se observa el total de plaquetas. Aunque, en realidad, lo que nos interesa conocer o estimar es el total de plaquetas en el total de la sangre (poblacin) del individuo. Cuntos conceptos identificaste en la lectura?

La metodologa para solucionar un problema estadstico comprende los siguientes pasos:

1. Planteamiento del problema. En el planteamiento se define si se requiere de una muestra o es posible estudiar la poblacin, las caractersticas a estudiar (las variables), si es necesario establecer una hiptesis, entre otros. En este punto tambin se analizan los medios de los que se dispone y el procedimiento a seguir. 2. Elaboracin de un modelo. Se establece un modelo terico de comportamiento de las variables de estudio. En ocasiones no es posible disear el modelo hasta realizar un estudio previo. Los posibles modelos son normal, binomial, poisson, uniforme, y otros como binomial negativa, geomtrico. 3. Extraccin de la muestra. Se usa alguna tcnica de muestreo o un diseo experimental para obtener informacin de una pequea parte de la poblacin. 4. Tratamiento de los datos. En esta fase se eliminan posibles errores, se depura la muestra, se tabulan los datos y se calculan los valores que sern necesarios en pasos posteriores, como la media y la varianza de la muestra. Los mtodos de esta etapa corresponden a los mtodos de la estadstica descriptiva. Algunas de las etapas de esta fase son: recopilacin, clasificacin y presentacin de la informacin. 5. Estimacin de los parmetros. La estadstica inferencial nos proporciona herramientas para la prediccin o estimacin de los parmetros de la poblacin que nos ayudarn a resolver el problema. Un ejemplo de estas herramientas son las pruebas de hiptesis que se obtienen del anlisis de los datos y los intervalos de confianza. 1.3. Muestreo aleatorio Introduccin Los estudios estadsticos normalmente se hacen con una parte de la poblacin, ya que realizarlos sobre la totalidad resultara demasiado complicado. Para que la informacin obtenida tenga validez y confiabilidad es necesario que la muestra cumpla con ciertas condiciones especficas. Estas condiciones estn relacionadas con el mtodo para determinar el tamao y caractersticas de la muestra y los individuos que la componen. Los mtodos de muestreo se pueden clasificar en:

Revisa los mtodos de muestreo probabilstico, para ello, lee el texto Tipos de muestreo. Da clic en el icono para descargar el documento.

1.3.1. Conceptos bsicos de muestreo aleatorio Muestreo aleatorio simple El muestreo aleatorio simple es el procedimiento por medio del cual se obtiene una muestra aleatoria simple. Una muestra aleatoria simple es la que resulta de aplicar un mtodo por el cual todos los elementos de la poblacin tienen la misma probabilidad de ser elegidos.

A continuacin, conocers cules son los pasos para obtener una muestra aleatoria simple. Paso 1. Definir la poblacin de estudio y el parmetro a estudiar. Paso 2. Enumerar a todas las unidades de anlisis que integran la poblacin, asignndoles un nmero de identidad o identificacin. Paso 3. Determinar el tamao de la poblacin, determinar el porcentaje de error y el porcentaje de confianza y obtener una muestra preliminar. Paso 4. Determinar el tamao ptimo de la muestra para el estudio. Paso 5. Seleccionar los sujetos dela muestra usando nmeros aleatorios 1.3.2. Metodologa del muestreo aleatorio Pasos para obtener una muestra aleatoria simple Has visto una descripcin general del procedimiento que debes seguir para obtener una muestra aleatoria simple, ahora revisars cada paso especfico. Paso 1. Definir la poblacin de estudio y las variables a estudiar.

Recuerda que la poblacin es el grupo formado por el conjunto total de individuos, objetos o medidas que poseen algunas caractersticas comunes, observables en un lugar y en un momento determinado. Por lo tanto, el paso 1 es determinar qu se estudiar. Ejemplo Un investigador realiza un estudio sobre las relaciones de gnero en el noviazgo, su objeto de estudio son las manifestaciones de violencia fsica y psicolgica entre los (las) estudiantes del ltimo ao de la carrera de qumica. Su poblacin es el total de estudiantes del ltimo ao de ingeniera qumica que tengan novio o novia; el total de individuos con esta caracterstica es de 386. Por lo que, la poblacin es de 386 individuos y las variables son: violencia fsica y violencia psicolgica.

Paso 2. Numerar todas las unidades de anlisis que integran la poblacin, asignndoles un nmero de identificacin. Una vez que has definido la poblacin y las variables a estudiar, es necesario asignar un nmero de identificacin a cada individuo de la poblacin. Siguiendo con el ejemplo de la relaciones de gnero en el noviazgo de los (las) estudiantes de qumica, lo que sigue es numerar a los 386 estudiantes un nmero del 1 al 386. Paso 3. Definir la poblacin, determinar el porcentaje de error y el porcentaje de confianza. Para calcular el tamao de una muestra hay que tomar en cuenta tres factores: 1. El porcentaje de confianza con el que se quiere generalizar los datos, desde la muestra hacia la poblacin total. 2. El porcentaje de error que se pretende aceptar al momento de hacer la generalizacin. 3. El nivel de variabilidad que se calcula para comprobar la hiptesis. A continuacin definiremos estos conceptos. 1.3.2. Metodologa del muestreo aleatorio Ahora veamos una definicin de los conceptos implicados en el paso 3. Definir el tamao de la poblacin. Significa determinar el nmero de individuos que la constituyen; la variable N representa el tamao de la poblacin. N=X Porcentaje de confianza. Es el grado o nivel de seguridad que existe para generalizar los resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a decir que no existe ninguna duda para generalizar tales resultados, pero tambin implica estudiar a la totalidad de los casos de la poblacin. Para evitar un costo muy alto se busca un porcentaje de confianza menor, comnmente es un 95%. El nivel de confianza es la probabilidad que establecemos (sin hacer ningn clculo) para poder acertar al valor verdadero de la poblacin . Este dato se obtiene a partir de la distribucin normal estndar.

Porcentaje de error. Este error es una distancia alrededor del valor que deseamos estimar y nos da un margen de aproximacin. Al igual que en el caso de la confianza, si se quiere eliminar el riesgo del error y considerarlo como 0%, entonces la muestra es del mismo tamao que la poblacin, por lo que conviene correr un cierto riesgo de equivocarse. Comnmente se aceptan entre el 4% y el 6% como error, tomando en cuenta de que no son complementarios la confianza y el error. Variabilidad. Es la probabilidad (o porcentaje) con el que se acept y se rechaz la hiptesis que se quiere comprobar. El porcentaje con que se acept tal hiptesis se denomina variabilidad positiva y se indica con p (tambin llamada probabilidad de xito ), y el porcentaje con el que se rechaz la hiptesis es la variabilidad negativa, identificada por q (tambin llamada probabilidad de fracaso y se obtiene 1-p). Variabilidad positiva=p= a la probabilidad de que suceda el evento

Variabilidad negativa=q=a la probabilidad de que no suceda el evento La variabilidad positiva (p) al sumarla con la negativa (q) siempre nos debe dar la unidad p+q=1. Cuando no se tienen antecedentes sobre la investigacin, entonces los valores de variabilidad son p=q=0.5 Paso 4. Determinar el tamao de la muestra ptimo para el estudio.

Una vez que la poblacin, el porcentaje de confianza, el porcentaje de error y el nivel de variabilidad han sido determinados, se debe determinar el tamao de la muestra. Puedes calcularlo mediante alguna de las dos frmulas que examinars: una para los casos en que se conoce el tamao de la poblacin y la otra para cuando este dato se desconoce. Frmula para cuando no se conoce el tamao de la poblacin Frmula para cuando se conoce el tamao de la poblacin

Nota. En este momento no conoces los procedimientos para obtener todos los componentes de las frmulas, en los ejemplos, estos componentes ya estn dados. Estos procedimientos se vern ms adelante. 1.Haz clic sobre las frmulas para ver un ejemplo de cmo se aplican. 2.Observa el video Determinar el tamao de la poblacin, que se encuentra en la pestaa Material de apoyo, en la pgina de inicio del curso. n es el tamao de la muestra Z es el nivel de confianza p es la variabilidad positiva q es la variabilidad negativa E es la precisin o error Ejemplo: En un lote grande de medicinas, se desea verificar que la proporcin de los ingredientes activos sea el adecuado. Se debe determinar el tamao de la muestra para un nivel de confianza del 95% con un error del 5%. Supn que la variabilidad p=q=0.5. Solucin: Para el nivel de confianza sea igual al 95%, tienes que P(Z)=0.95 si Z=1.96. Debido a que la variabilidad y el error se pueden expresar por medio de porcentajes, en el caso necesario, hay que convertir esos valores a proporciones.

Sustituyendo: Es decir, se ocupar una muestra de aproximadamente 384 unidades.

n es el tamao de la muestra Z es el nivel de confianza p es la variabilidad positiva q es la variabilidad negativa N es el tamao de la poblacin E es la precisin o error Ejemplo: En un lote de 25,000 cajas de medicina, se desea verificar que la proporcin de los ingredientes activos sea el adecuado. Se debe determinar el tamao de la muestra para un nivel de confianza del 95% con un error del 5%. Supn que la variabilidad p=q=0.5. Solucin: Para el nivel de confianza sea igual al 95%, tienes que p(Z)=0.95 si Z=1.96. Sustituyendo:

En otras palabras, se ocupar una muestra de aproximadamente 378 cajas.

Paso 5. Seleccionar los sujetos de la muestra usando nmeros aleatorios. El ltimo paso para obtener la muestra es saber qu individuos especficos de la poblacin se tomarn. Para hacer esto debes: 1. Numerar a los individuos de la poblacin del 1 a N (donde N es el tamao de la poblacin). 2. Generar nmeros aleatorios para seleccionar los individuos de la muestra. 3. Tomar los individuos correspondientes a los nmeros elegidos.

Los nmeros aleatorios se pueden generar por diversos mtodos, por ejemplo mediante programas computaciones (por ejemplo en Excel con la funcin =aleatorio()), funciones en calculadora, sacando nmeros de una urna o lanzando una moneda al aire, o bien utilizando tablas de nmeros aleatorios. Para obtener los nmeros aleatorios, utilizars la tabla, para ello lee el documento Uso de la tabla de nmeros aleatorios.

Da clic en el icono para descargar el documento. Actividad 2. Problemas para determinar el tamao de la muestra

1. Descarga el archivo Determinacin de muestras y realiza lo que se te pide. 2. Guarda tu documento como EB_A2_Mu_XXYZ. Sustituye las XX por las dos primeras letras de tu primer nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno. 3. Sube tu archivo para que tus compaeros(as) y tu Facilitador(a) lo revisen y te retroalimenten. En esta actividad es muy importante que revises los trabajos de tus compaeros(as) y los evales, dndoles una retroalimentacin sobre los aciertos de sus trabajos y tambin de los errores. Da clic en el icono para descargar el documento. Para subir tu documento: En la ruta (parte superior izquierda del aula) da clic en Estadstica. Se enlistarn las actividades de la unidad, da clic en la Actividad 2. Problemas para determinar el tamao de la muestra. Actividad 3. Problemas 1. Descarga el documento adjunto Problemas y resuelve los ejercicios que se presentan. 2. Guarda tu documento como EB_A3_PR_XXYZ y envalo a tu Facilitador(a). Sustituye las XX por las dos primeras letras de tu primer nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno. Para enviar tu documento: En la ruta (parte superior izquierda del aula) da clic en Estadstica. Se enlistarn las actividades, da clic en la Actividad 3. Problemas. Da clic en el icono para descargar el documento. Actividad 4. Foro: La importancia de la estadstica

El foro La importancia de la estadstica tiene como propsito que reflexiones acerca de la percepcin que tienes sobre la estadstica y su utilidad, y la compartas con tus compaeros(as) de grupo y el (la) Facilitador(a). Responde las siguientes preguntas en el foro: Qu importancia tiene el uso de la estadstica? Quin usa la estadstica y para qu la usa? Qu utilidad le encuentras a esta asignatura? Revisa las aportaciones de tus compaeros(as) y comntalas. Al final del foro, el (la) Facilitador(a) retomar todos los comentarios para dar una conclusin general sobre el tema.

Consulta la rbrica del foro para conocer cmo se evaluar tu participacin. Da clic en el icono para descargar el documento. Para ingresar al foro: En la ruta (parte superior izquierda del aula) da clic en Estadstica. Se enlistarn las actividades de la unidad, da clic en Actividad 4. Foro: La importancia de la estadstica.

Autoevaluacin Antes de concluir la unidad resuelve el ejercicio de autoevaluacin. Lee las preguntas que se te presentan y elije la respuesta correcta. Para ingresar a la Autoevaluacin: En la ruta (parte superior izquierda del aula) da clic en Estadstica. Se enlistarn las actividades, da clic en Autoevaluacin. Evidencia de aprendizaje 1. Descarga la base de datos Preferencias por carrera, disponible en la pestaa Material de apoyo. En este documento encontrars los resultados de la encuesta en que participaste en la actividad 1. Los resultados presentados son de todos los (las) alumnos(as) que respondieron.

2. En un documento aparte, y con base en los datos, determina lo siguiente:

Cul es la poblacin de estudio? Cules son los individuos de esa poblacin? De cuntos individuos consta la poblacin? Nombra el rango que abarca la poblacin (numralos comenzando por el 1 y ocupa la cantidad de ceros necesaria para completar los dgitos del nmero total de la poblacin, por ejemplo del 0001 al 1845).

Obtn el nmero de elementos necesarios para seleccionar una muestra aleatoria simple tal que los resultados del estudio tengan un porcentaje de error del 5% y un porcentaje de confianza del 95%. Para ello considera que Z = 1.96 y que la variabilidad positiva es igual a la negativa. Cul es la variable o cules son las variables a estudiar en esa muestra? Obtn la muestra en base a la tabla de nmeros aleatorios que tienes (no olvides indicar el rengln que elegiste para comenzar a seleccionar los individuos de la muestra).

3. Guarda tu archivo como EB_U1_EV_XXYZ y envalo a tu Facilitador(a) para que lo revise y te retroalimente. No olvides darle seguimiento! Para enviar tu documento: En la ruta (parte superior izquierda del aula) da clic en Estadstica. Se enlistarn las actividades, da clic en la Evidencia de aprendizaje.

Unidad 2. Representacin numrica y grfica de datos Presentacin de la unidad

En la unidad anterior, conociste las dos grandes divisiones de la estadstica: la que se dedica a la recoleccin, presentacin y categorizacin de datos, llamada estadstica descriptiva y la que se dedica a realizar hiptesis con base en dichos datos, la inferencial. Tambin aprendiste a determinar el espacio de estudio (es decir, la poblacin) y las variables que se van a estudiar de acuerdo al problema planteado. En esta unidad estudiars la estadstica descriptiva y aprenders cmo organizar y presentar los datos obtenidos mediante el muestreo en poblaciones.
Cuando se realiza un trabajo que requiere a la estadstica, se disean instrumentos para obtener los datos deseados. Existen muchos mtodos para recolectar informacin, pero los ms frecuentes son:

Otra de las tcnicas ms recurridas en estadstica para recolectar informacin son los experimentos, revisa en qu consisten. Un experimento es una prueba que se realiza para determinar las caractersticas o comportamientos de una cosa. Por ejemplo, experimentar mediante el sentido del gusto, qu alimentos te parecen ms salados. Tambin, experimento se define como el proceso que se realiza para verificar una serie de hiptesis relacionadas con un determinado fenmeno, en el cual se determinan las caractersticas o comportamientos del fenmeno que se analiza. Por ejemplo, un experimento para determinar la velocidad de la luz en el vaco. La diferencia entre la primera y la segunda definicin es que en la segunda se parte de una hiptesis mientras que en la primera no necesariamente. En el primer ejemplo, experimentas los sabores de los alimentos sin antes predecir cul ser ms salado. En el segundo ejemplo, la hiptesis, a partir de estudios anteriores, es que la velocidad de la luz en el vaco es de 300 000 km/seg. Por lo tanto, el experimento verifica si esta hiptesis es cierta o no y en l cabe un margen de error experimental.

Los datos que se recopilan, usando alguna tcnica de las que acabamos de describir u otra, son organizados de acuerdo a los parmetros de la estadstica descriptiva que estudiars en esta unidad.

Propsitos de la unidad En esta unidad:


Identificars algunos conceptos que se utilizan en estadstica descriptiva. Organizars datos en diferentes tipos de tablas y elaborars varios tipos de grficas

Competencia especfica

Utiliza las tcnicas de representacin numrica y grfica para representar informacin a travs de la organizacin de los datos obtenidos de una muestra o poblacin.

2.1. Organizacin de datos y distribucin de frecuencias Introduccin La descripcin estadstica organiza los datos y los presenta en forma de tablas y grficas. Esta rea slo describe, resume, organiza y representa los datos obtenidos de una poblacin o muestra de la poblacin, sin elaborar inferencias ni obtener conclusiones. La organizacin de datos se realiza a travs de tablas que se utilizan para simplificar la presentacin y distribucin de estos datos. A continuacin, conocers que existen diferentes tipos de presentacin de datos y con base en ellos, distintas clasificaciones de frecuencia, como: frecuencia relativa, frecuencia acumulada y frecuencia absoluta.

Actividad 1: Datos agrupados y datos no agrupados

Antes de comenzar con el tema de tablas de datos, realiza la siguiente actividad: 1. Organzate junto con tus compaeros(as) de grupo, en un equipo de 6 integrantes y nombren un responsable del mismo. 2. De manera individual, investiga en fuentes confiables qu son los datos agrupados y lo datos no agrupados. Comparte la informacin con el resto del equipo. 3. De manera grupal, elaboren un resumen donde expliquen en qu consisten estos tipos de datos incluyendo, por lo menos, dos ejemplos para cada uno; y publquenlo en la wiki Datos agrupados y datos no agrupados. Nota: No olviden incluir el nombre de todos los integrantes del equipo y las fuentes de donde obtuvieron la informacin. Para ingresar a la wiki: En la ruta (parte superior izquierda del aula) da clic en Estadstica. Se enlistarn las actividades, da clic en la Actividad 1: Datos agrupados y no agrupados. 2.1.1. Frecuencias Antes de comenzar con el tema, es importante que consideres lo siguiente:

Frecuencia o Frecuencia absoluta La frecuencia o frecuencia absoluta es el nmero de veces que se repite un valor dentro de un conjunto de datos, se denota como fi. Por ejemplo, supongamos que tienes la siguiente serie de datos: 3, 2, 5, 7, 3, 7, 7, 5, 2, 7, 3. Si los organizas en una tabla, tendras: Dato 2 3 4 5 Total de datos (N) Frecuencia 2 (porque se repite 2 veces) 3 (porque se repite 3 veces) 2 (porque se repite 2 veces) 4 (porque se repite 4 veces) 11

Frecuencia absoluta acumulada La frecuencia absoluta acumulada es la suma de las frecuencias de las variables hasta el rengln i, se representa como Fi. Tambin es conocida como frecuencia acumulada. Siguiendo con el ejemplo anterior: Dato 2 3 5 7 Total de datos (N) Frecuencia relativa La frecuencia relativa es el resultado de dividir la frecuencia de cada dato entre el nmero total de datos (N). La suma de esta columna da 1 (excepto cuando el resultado de las divisiones se redondea). Este dato tambin puede verse como un porcentaje, se representa como hi. Siguiendo con el ejemplo anterior: Dato 2 3 4 5 Total de datos (N) Frecuencia 2 3 2 4 11 Frecuencia acumulada 2 5 7 11 Frecuancia relativa 0.181 (se divide 2/11) 0.272 (se divide 3/11) 0.181 (se divide 2/11) 0.363 (se divide 4/11) Frecuencia 2 3 2 4 11 Frecuencia acumulada 2 (hasta aqu tienes 2 datos 5 (la suma de la frecuencia del primer dato con la del segundo dato 2+3) 7 (frecuencia de 2+frecuencia de 3+frecuencia de 5) 11 (frecuencia de 2+frecuencia de 3+frecuencia de 5 frecuencia de 7)

Frecuencia relativa acumulada La frecuencia relativa acumulada es la suma de las frecuencias relativas hasta el rengln i. Se representa como Hi, observa el ejemplo: Dato 2 3 5 7 Frecuencia 2 3 2 4 Frecuencia acumulada 2 5 7 11 Frecuencia relativa 0.1818 0.2727 0.1818 0.3636 Frecuencia relativa acumulada 0.1818 (hasta este rengln slo tienes esta frecuencia relativa) 0.4545 (se suma la frecuencia relativa del primer dato con la del segundo dato 0.1818+0.2727) 0.6363 (la frecuencia relativa de 2+la frecuencia relativa de 3+la frecuencia relativa de 5) 0.9999 (la frecuencia relativa de 2+la frecuencia relativa de 3+la frecuencia relativa de 5+la frecuencia relativa de 7)

Total de 11 datos (N)

Ejemplo de organizacin de frecuencias En la siguiente pantalla observars una tabla con la organizacin de frecuencias, los datos presentados son los siguientes: 18, 41, 23, 47,18, 23, 23, 41, 41, 47, 47, 52, 23, 47, 23, 47, 18, 47, 7, 23, 18, 47, 52, 41, 52, 18, 23, 52, 7, 18, 52, 23.

Frecuencias Datos No. obtenidos Frecuencia Frecuencia rengln de la fi acumulada Fi variable 1 7 f1= 2 f1=F1= 2 2 3 4 5 6 Total 18 23 41 47 52 f2= 6 f3= 8 f4= 4 f5= 7 f6= 5 N=32 Otra forma para obtener Fi f1 = F1=2 Frecuencia relativa hi Frecuencia relativa acumulada Hi

h1=f1/N=0.0625 h1=H1=0.0625 h1+h2=H2= f1+f2= F2= 8 F1+f2=F2=8 h2=f2/N=0.1875 0.2500 h1+h2+h3= f1+f2+f3= F3=16 F2+f3=F3=16 h3=f3/N=0.2500 H3=0.5000 f1+f2+f3+f4= h1+h2+h3+h4 F3+f4=F4=20 h4=f4/N=0.1250 F4=20 =H4=0.6250 f1+f2+f3+f4+f5= h1+h2+h3+ F4+f5=F5=27 h5=f5/N=0.2187 F5=27 h4+h5=H5=0.8430 h1+h2+h3+ f1+f2+f3+f4+f5+f6= F5+f6=F6=32 h6=f6/N=0.1563 h4+h5+h6= F6=32 H6=1.0000 1.0000

Actividad 2: Frecuencias 1. Descarga el archivo Frecuencias y resuelve el problema que se te presenta. 2. Guarda tu archivo como EB_U2_FR_XXYZ y comprtelo en la base de datos con el resto de tus compaeros(as). Sustituye las XX por las dos primeras letras de tu primer nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno. Revisa que el peso de tu archivo no sea mayor a 4 MB. 3. En la entrada que agregues, escribe tus dudas o dificultades al momento de realizar la tabla. Revisa las entradas de tus compaeros(as) y comntalas tratando de complementar la informacin o de resolver sus inquietudes. 4. Compara tus tablas con las de tus compaeros(as). Para enviar tu documento: En la ruta (parte superior izquierda del aula) da clic en Estadstica. Se enlistarn las actividades, da clic en la Actividad 2: Frecuencias. Da clic en el icono para descargar el documento. Es importante que realices esta actividad porque la ocupars ms adelante.

2.1.2. Intervalos Otro concepto muy utilizado en estadstica descriptiva es el de intervalo. Conoce qu es y los dems conceptos asociados. Intervalos Conjunto de valores agrupados entre dos nmeros, conocidos como lmites, en este caso, lmites del intervalo. Intervalo de clase Se llama intervalo de clase a la expresin que denota un intervalo. Amplitud del intervalo La amplitud del intervalo es la distancia que hay entre los lmites superior e inferior del intervalo. Se calcula restando el valor del lmite inferior al valor del lmite superior. Frontera de clase Son los puntos medios entre los lmites de intervalos consecutivos. Las fronteras de clase se utilizan para recuperar los datos entre el lmite superior de un intervalo y el lmite inferior del siguiente. Marca de clase Tambin conocida como punto medio de clase, es el resultado de la suma de los lmites inferior y superior del intervalo, dividido entre dos.

Ejemplo de intervalos Observa cmo se representan los conceptos relacionados con los intervalos, coloca el cursor sobre las palabras resaltadas. Dados los nmeros 15 y 25, tendras que: El intervalo corresponde a todos los nmeros que se encuentran entre 15 y 25. El intervalo de clase sera: 15-25 Los lmites del intervalo son: Lmite inferior=15 Lmite superior=25 La amplitud del intervalo 15-25 sera: 25 menos 15, es decir, 10. Es recomendable que todos los intervalos tengan la misma amplitud, por lo que se puede restar el dato menor al dato mayor y dividir el resultado entre el nmero de intervalos. La frontera de clase: dados los intervalos 4-14, 15-25 y 26-36, las fronteras de clase seran: 3.5 y 14.5, para el primer intervalo, 14.5 y 25.5 para el segundo intervalo, por ltimo, 25.5 y 36.5 para el tercer intervalo. La marca de clase del intervalo 15-25 es igual a: 15+25=40/2=20.

Es recomendable que la marca del intervalo coincida con alguno de los datos, aunque esto no es necesario ni siempre se logra; sobre todo cuando los intervalos tienen la misma amplitud. 2.1.3. Construccin de intervalos de clase La formacin de clases o intervalos de clase, que se representa con (k), depende, generalmente, del tamao del rango de la poblacin o muestra. Lo que se debe hacer para determinar los intervalos de clase es lo siguiente. Paso 1. Calcular el rango Se identifica el nmero mayor (Xn) y el nmero menor (X1) en los datos. El rango es el resultado de restar el nmero menor al nmero mayor; esto es: 240 R= Xn X1 Por ejemplo: Para una serie de datos que van desde el 18 hasta el 56,se tiene lo siguiente: Xn= 56 X1= 18 por lo tanto, R= Xn X1= 56 18= 38

Paso 2. Determinar el nmero de intervalos que se desea tener No existe una regla para determinar el nmero de intervalos, pero generalmente se suelen crear entre 5 y 20 intervalos. La decisin la toma el investigador. Siguiendo con el ejemplo, se van a construir 7 intervalos. Entonces k= 7 Paso 3. Dividir el rango entre el nmero de intervalos que se desea tener Recuerda que es recomendable elegir un nmero entre 5 y 20 para los intervalos y dividir el rango entre el nmero deseado de intervalos. Siguiendo con el ejemplo: Si son 7 intervalos 38/7 = 5.428 sta ser la amplitud de los intervalos. Cuando no es un nmero entero, se escoge el entero sin decimales. Paso 4. Formacin de intervalos: Los intervalos se forman comenzando un nmero antes del primer dato. Intervalos: 17 a 22 (se cuenta 5 desde 18 hasta 22) 23 a 28 (el siguiente intervalo comienza a partir del lmite superior del intervalo anterior) 29 a 34 35 a 40

41 a 46 47 a 52 53 a 58 Nota. No importa que el ltimo intervalo exceda el ltimo dato.

Ejemplo de construccin de intervalos El director de una consultora en desarrollo de software desea conocer el nmero de incidencias en sus desarrollos reportadas durante los meses de agosto y septiembre. Para ello registra los siguientes datos: 35, 24, 26, 23, 50, 20, 25, 56, 30, 30, 38, 36, 35, 29, 28, 30, 40, 39, 38, 40, 27, 24, 30, 32, 35, 27, 29, 22, 28, 27, 48, 40, 48, 31, 39, 28, 46, 36, 37, 52, 44, 49, 52, 41, 31, 31, 56, 58, 38, 26, 25, 24, 60, 55, 48, 37, 31, 30, 22, 20. Observa cada paso: 1. 2. 3. 4. Calcular el rango: R=XnX1=60-20=40 Determinar el nmero de intervalos entre 5 y 20: Elegir 8 intervalos. Dividir el rango entre el nmero de intervalos: 40/8=5 Se forman los intervalos: Comenzar por un nmero anterior al lmite inferior: 19-24, 25-30, 31-36, 3742, 43-48, 49-54, 55-60

Revisa el video Construccin de intervalos que se encuentra en la seccin Material de apoyo. Actividad 3: Intervalos 1. Descarga el archivo Intervalos y resuelve el problema elaborando los intervalos de clase de los datos que se presentan y la tabla de frecuencias correspondiente. 2. Guarda tu documento como EB_U2_IN_XXYZ, en formato Word 97-2003, y envaselo al (a la) Facilitador(a). Sustituye las XX por las dos primeras letras de tu primer nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno. Revisa que el peso de tu archivo no sea mayor a 4 MB. Para enviar tu documento: En la ruta (parte superior izquierda del aula) da clic en Estadstica. Se enlistarn las actividades, da clic en la Actividad 3: Intervalos. Da clic en el icono para descargar el documento. Es importante que elabores esta actividad porque la ocupars para realizar las actividades siguientes.

2.1.4. Tablas de datos

Existen diferentes tipos de tablas para presentar datos, las ms utilizadas son: Tabla de datos, Tabla de frecuencias, Tabla por intervalos de clase y Tablas de doble entrada. Conoce en qu consiste cada una: Tablas de datos Una tabla de datos es la forma ms sencilla de organizar un conjunto de datos y se utiliza cuando la informacin que necesitas son los datos mismos. Se organizan en columnas o renglones y se registran las mediciones o datos obtenidos. Ejemplo: Imagina que la medicin de temperatura a lo largo del da da como resultado los siguientes valores (en grados Celsius): 20.4, 21.2, 22.1, 23.9, 25.3, 26.9, 27.7 A partir de estos valores construyes la siguiente tabla:

2.1.5. Tablas de frecuencias Las tablas de frecuencia aportan mayor informacin que las tablas de datos, ya que estn construidas con las categoras de la variable que se est midiendo y su frecuencia. Ejemplo: Un experimento da como resultado los siguientes valores: 1, 2, 2, 2, 1, 1, 5, 4, 3, 2, 2, 1, 3, 4, 5, 6, 2, 3, 4, 5, 5, 4, 3, 3, 2 Si agrupas los datos por categoras, segn la frecuencia o nmero de veces que aparece cada dato, tendras la siguiente tabla: Las tablas de frecuencias pueden construirse anexando las columnas correspondientes a la frecuencia acumulada, la frecuencia relativa y frecuencia relativa acumulada.

2.1.6. Tablas por intervalos de clase

En este tipo de tablas los datos son presentados por intervalos de clase y no por los valores correspondientes a cada variable. Ejemplo: En una encuesta sobre el desempleo en el rea metropolitana de la ciudad de Mxico, se organizan los datos por grupos de edades (intervalos de clase) y se presenta la frecuencia de cada intervalo, teniendo un total de 23,700 desempleados.

2.1.7. Tablas de doble entrada


Estas tablas proporcionan informacin referente a dos variables o eventos relacionados entre s. La informacin se distribuye poniendo en los renglones de la tabla la informacin de una de las variables y en las columnas la informacin de la otra variable. Ejemplo: Se cuenta el nmero de cirugas realizadas por edades en una muestra de 100 personas, los resultados son los siguientes:

En el ejemplo las variables relacionadas son la edad y el nmero de cirugas.

Una tabla cualquiera puede ser vista como una tabla de doble entrada, en la cual las variables relacionadas son los rangos contra el valor de las variables en dicho rango. Por ejemplo, imagina que mides la temperatura de un lquido con respecto al tiempo de calentamiento. En el rengln colocas los tiempos y en las columnas la temperatura obtenida. Puedes considerar la tabla como una tabla de frecuencias o como una tabla de doble entrada:

2.2. Representacin grfica de los datos Introduccin


El tema anterior present diferentes formas de organizar o de tabular datos y la distribucin de frecuencias. Ahora estudiars la representacin grfica de los datos. Las grficas son representaciones visuales de los datos que se muestran en una tabla. Existen diferentes tipos de grficas, cada una de ellas se elabora con base en el tipo de informacin que se quiere representar.

2.2.1. Histograma
El histograma es la representacin grfica de una variable continua. Se elabora en un sistema de coordenadas rectangulares. El eje horizontal se utiliza para representar la variable independiente, es decir, la escala de medicin o fronteras de clase. El eje vertical representa la escala de frecuencias. Si los intervalos de clase tienen el mismo ancho, las alturas de las barras sern proporcionales a las frecuencias. El histograma permite apreciar visualmente la distribucin y dispersin de las mediciones.

2.2.2. Grfica de barras

Este tipo de grfica se utiliza para datos de tipo ordinal, nominal y discreto. En stas se muestran la frecuencia, la frecuencia relativa y el porcentaje por medio de la altura y no por el rea de la barra. Esta grfica muestra las discontinuidades en las mediciones por medio de espacios vacios entre las barras. La grfica de barras se traza sobre un eje de coordenadas. Y puede ser de dos formas:

Un histograma y una grfica de barras son muy semejantes, la diferencia radica en que el histograma no presenta separacin entre las barras.

2.2.3. Grfica de lneas


Una grfica de lneas tambin se construye en un sistema coordenado rectangular y muestra la relacin entre las variables mediante puntos conectados por lneas continuas. La frecuencia de cada valor medido es representada por la altura del punto. En el eje horizontal se representa la variable y en el eje vertical, la frecuencia. Se determinan los puntos de corte del valor de la variable con su frecuencia y se unen, obtenindose la grfica de lnea.

2.2.4. Grfica de reas o de pastel

Una forma de representar datos u observaciones de una variable cualitativa es mediante un diagrama circular. Esta grfica muestra la relacin entre las variables dividiendo un crculo (o pastel) en sectores (o rebanadas). Tambin, se utilizan para representar la distribucin de frecuencias, pero es el rea de cada sector la proporcional a los valores medidos. Para trazar la grfica, se hace una distribucin proporcional de las frecuencias del problema con respecto a la circunferencia, determinando sectores circulares para cada categora.

Medicin Frecuencia Frecuencia Porcentaje en cm acumulada 30 3 3 3% 30.1 7 10 6% 30.2 12 22 10% 30.3 18 40 15% 30.4. 23 63 19% 30.5 21 84 18% 30.6 17 101 14% 30.7 11 112 9% 30.8 5 117 4% 30.9 1 118 1%

Histograma En esta figura se muestra el histograma de las mediciones en cm vs la frecuencia, nota como el ancho de las clases es el mismo.

Medicin Frecuencia Frecuencia Porcentaje en cm acumulada 30 3 3 3% 30.1 7 10 6% 30.2 12 22 10% 30.3 18 40 15% 30.4. 23 63 19% 30.5 21 84 18% 30.6 17 101 14% 30.7 11 112 9% 30.8 5 117 4% 30.9 1 118 1% Medicin Frecuencia Frecuencia Porcentaje en cm acumulada 30 3 3 3%

Grfica de pastel En la grfica de pastel se muestra dentro de cada rebanada la medicin en cm y el porcentaje que corresponde a la frecuencia relativa.

Grfica de lnea En esta figura se muestra la frecuencia acumulada mediante una grfica de lnea.

30.1 30.2 30.3 30.4. 30.5 30.6 30.7 30.8 30.9

7 12 18 23 21 17 11 5 1

10 22 40 63 84 101 112 117 118

6% 10% 15% 19% 18% 14% 9% 4% 1%

Actividad 4: Grficas Los parmetros que has visto hasta aqu, la organizacin numrica de los datos en tablas y las representaciones grficas de stas, pueden ser realizados de forma manual, pero existen programas informticos como Excel, software libre y programas especializados para estadstica, que permiten realizar todos estos trabajos. Realiza la siguiente actividad: 1. Retoma los problemas que realizaste en la Actividad 2: Frecuencias, con los datos de la tabla elabora las grficas que revisaste en este tema e inclyelas en el mismo documento. 2. Entra a la base de datos "Grficas" y publica tu archivo con la nomenclatura EB_U2_GR_XXYZ. Sustituye las XX por las dos primeras letras de tu primer nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno. Revisa que el peso de tu archivo no sea mayor a 4 MB. 3. Comparte con tus compaeros(as) el procedimiento que seguiste para graficar los datos del problema, si utilizaste algn software comenta cul. Agrega una conclusin sobre la utilidad de la representacin grfica de datos. 4. Consulta las aportaciones de tus compaeros(as) y comntalas, tratando de complementar las ideas que exponen y tus propias ideas. Para ingresar a la actividad: En la ruta (parte superior izquierda del aula) da clic en Estadstica. Se enlistarn las actividades, da clic en la Actividad 4: Grficas.

Actividad 5: Uso cotidiano de la estadstica descriptiva

Como mencionamos al inicio de la unidad, los temas que has visto hasta aqu son procedimientos que utiliza la estadstica descriptiva para trabajar con un conjunto de datos. Has pensado que los datos as representados se usan frecuentemente en la vida cotidiana? Investiga al respecto y realiza lo siguiente: 1. Entra al foro Uso cotidiano de la estadstica descriptiva y responde las siguientes preguntas:

En qu casos de la cotidianeidad se utiliza la estadstica descriptiva? Has utilizado la estadstica descriptiva?Cmo? Cul es la utilidad de las tcnicas de representacin numrica y grfica de datos en la vida cotidiana?

2. Consulta y comenta las aportaciones de tus compaeros(as), tratando de complementar sus respuestas y las tuyas.

Da clic en el icono para descargar la Rbrica del foro. Para ingresar al foro: En la ruta (parte superior izquierda del aula) da clic en Estadstica. Se enlistarn las actividades, da clic en la Actividad 5: Uso cotidiano de la estadstica descriptiva.

Autoevaluacin Antes de realizar la evidencia de aprendizaje y con el objetivo de que evales los conocimientos que aprendiste en esta unidad, resuelve el ejercicio de autoevaluacin. Para ingresar a la autoevaluacin: En la ruta (parte superior izquierda del aula) da clic en Estadstica. Se enlistarn las actividades, da clic en la Autoevaluacin.

Evidencia de aprendizaje: Representacin de datos

Para generar la evidencia de aprendizaje de esta unidad realiza lo siguiente: 1. Retoma los datos de la muestra que obtuviste y organzalos en tablas de la siguiente manera:

Elabora una tabla de frecuencias por intervalos con la variable edad para toda la muestra. Para la variable carrera, elabora una tabla de frecuencias simple para cada una de las carreras. Elabora las grficas correspondientes a cada una de las variables.

2. Organiza tu trabajo de la siguiente manera:


Incluye una presentacin donde describas de dnde se obtuvieron los datos y la finalidad del anlisis de los mismos. El procedimiento que seguiste para obtener la muestra. Las tablas con una descripcin. Las grficas con su respectiva descripcin.

3. Guarda tu trabajo como EB_U2_EA_XXYZ. Sustituye las dos X por las iniciales de tu nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno. Revisa que el peso de tu archivo no sea mayor a 4 MB. 4. Enva tu trabajo al (a la) Facilitador(a) para que lo revise y te retroalimente. Recuerda que una vez que recibas las observaciones, puedes enviar una segunda versin de tu trabajo con las adecuaciones necesarias. 5. Consulta la escala de evaluacin de esta evidencia.

Da clic en el icono para descargar la Escala de evaluacin. Para enviar tu documento: En la ruta (parte superior izquierda del aula) da clic en Estadstica, se enlistarn las actividades, da clic en Evidencia de aprendizaje. Cierre de la unidad Has concluido la unidad 2, en la que conociste los fundamentos de la estadstica descriptiva, la utilidad de sta y el tipo de informacin que puedes obtener a travs de ella. Recuerda que la organizacin de los datos se hace a travs de tablas que pueden ser de frecuencias o intervalos de clase. La frecuencia es el nmero de veces que se repite un dato. Puede ser:

Frecuencia absoluta Frecuencia acumulada Frecuencia relativa Frecuencia relativa acumulada

Los intervalos de clase son un conjunto de nmeros comprendidos entre un nmero lmite inferior y un nmero lmite superior. Tambin las grficas ayudan a visualizar la informacin contenida en las tablas de frecuencia. No olvides que la estadstica descriptiva es muy til en todo tipo de investigaciones; por ejemplo, cuando muestran grficas o estadsticas en los medios de comunicacin. Para saber ms

Consulta la siguiente direccin electrnica para saber ms sobre las tcnicas para recolectar informacin: http://www.tec.url.edu.gt/boletin/URL_03_BAS01.pdf En la siguiente direccin electrnica puedes encontrar explicaciones, ejemplos y ejercicios sobre los temas que se abordaron en esta unidad: http://www.vitutor.com/estadistica.html

Fuentes de consulta

Montgomery, Douglas C. y Runger, George C. (1996). Probabilidad y Estadstica aplicadas a la ingeniera (4 ed.). McGraw-Hill, Mxico. Walpole, Ronald E., Myers Raymond H., et al. (2007). Probabilidad y Estadstica para Ingeniera y ciencias (8 ed.). Mxico: Pearson Educacin. Intervalos de clase, consultado el 26 de abril de 2010 en:
http://www.virtual.unal.edu.co/cursos/odontologia/2002890/lecciones/estadistica_descriptiva_2

Censo y entrevista, consultados el 26 de abril de 2010 en:


http://www.indec.gov.ar/proyectos/censo2001/maestros/quees/masinfo.doc http://www.tec.url.edu.gt/boletin/URL_03_BAS01.pdf

Unidad 3. Medidas de tendencia central y dispersin Presentacin de la unidad Para cualquier conjunto de datos estudiados es importante tener un resumen de la informacin y sus caractersticas. Esta informacin indica cmo se comporta la poblacin de datos que tienes. Para resumir la informacin se utilizan dos tipos de valores que, en vez de representar cada uno de los datos, representan conjuntos de datos. Estos dos tipos de indicadores estadsticos son: las medidas de tendencia central, que muestran hacia qu valores se agrupan o acumulan los datos; y las medidas de dispersin, que de forma contraria a las anteriores, muestran cmo se dispersan o separan los datos. Propsito de la unidad

En esta unidad: Aplicars el procedimiento para obtener las medidas de tendencia central y dispersin en datos agrupados y no agrupados.

Competencia especfica Utiliza las medidas de tendencia central y dispersin para describir un conjunto de datos mediante la representacin numrica y grfica de la informacin obtenida en una muestra o poblacin.

3.1. Medidas de tendencia central Las medidas de tendencia central Las medidas de tendencia central son los valores que representan un conjunto de datos de forma tal que te ayudan a saber dnde estn acumulados los datos sin indicar cmo se distribuyen. Se llaman as porque tienden a ubicarse en la parte central del conjunto de datos. Las medidas de tendencia central ms comunes son: la media aritmtica (conocida como media o promedio), la mediana y la moda.

3.1.1. Media

Media aritmtica La media aritmtica o, simplemente, media, se denota por x la letra segn se calcule en una muestra o en la poblacin, respectivamente. La media es resultado de dividir la suma de todos los valores de los datos entre el nmero total de datos. La manera como se organizan los datos: no agrupados y agrupados (por frecuencias o intervalos),determina la expresin de la frmula para calcular la media. Frmula para datos no agrupados Los datos no agrupados son aquellos datos que se organizan en una tabla de datos, es decir, cada valor se representa de manera individual. Las frmulas para calcular la media son:

En estas frmulas la diferencia radica en que, el total de la poblacin se representa con la letra N y el total de la muestra se representa con la letra n. Frmula para datos agrupados en frecuencias Los datos agrupados en frecuencias son aquellos que se organizan en una tabla de frecuencias, es decir, las tablas que contienen, en una columna, el valor de la variable y, en otra columna, la frecuencia o el nmero de veces que se repite cada valor en una serie de datos. Las frmulas para calcular la media con los datos organizados de esta manera son:

Frmula para datos agrupados en intervalos Los datos agrupados en intervalos son los que se organizan dentro de un rango establecido entre un lmite inferior y un lmite superior. Recuerda que las tablas de intervalos muestran el nmero de datos que abarca cada intervalo (frecuencia por intervalo). Las frmulas para calcular la media con los datos organizados de esta manera son:

Los suguientes documentos te ayudarn a comprender cmo se usan las frmulas,da clic en los iconos para descargarlos. Reglas de las sumatorias Ejemplo de media en datos no agrupados Ejemplo de media en datos agrupados por frecuencias Ejemplo de media en datos agrupados por intervalos Actividad 1: Medidas de tendencia central. Media

Para realizar las actividades de esta unidad, utilizars los problemas que resolviste en la Actividad 2: Frecuencias de la Unidad 2. Lo recomendable es que trabajes con las tablas que ya habas elaborado, si no tienes el archivo puedes descargarlo a continuacin. Da clic en el icono para descargar el documento Frecuencias. Con los datos de este problema, tendrs que obtener las medidas de tendencia central y dispersin que revisars a lo largo de la unidad, por lo tanto, esta actividad est dividida en seis momentos. Es importante que la actividad la realices paso a paso, ya que si tienes dudas sobre el uso de las frmulas, puedes consultarlas a tiempo con tu Facilitador(a); adems, tendrs que entregar tu trabajo al final del tema. 1. Analiza el problema y selecciona la frmula adecuada para obtener la media aritmtica. 2. Si tienes dudas sobre el uso de la frmula que seleccionaste, puedes consultar a tus compaeros(as) y/o a tu Facilitador(a). Para ello, utiliza el foro Medidas de tendencia central, donde puedes publicar todas tus inquietudes sobre el tema y comentar las de tus compaeros(as). 3. Guarda tu documento como EB_U3_MTC_XXYZ, en formato Word 97-2003. Sustituye las XX por las dos primeras letras de tu primer nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno. Recuerda que tu archivo no debe pesar ms de 4 MB. An no debes enviar tu documento, recuerda tenerlo a la mano para realizar la Actividad 2. No olvides incluir la frmula y las operaciones que realices. Para ingresar al foro: En la ruta (parte superior izquierda del aula) da clic en Estadstica. Se enlistarn las actividades, da clic en Foro: Medidas de tendencia central. 3.1.2. Mediana Mediana La segunda medida de tendencia central es la mediana, esta se define como: El valor que divide en dos partes iguales una serie de datos, es decir, la cantidad de datos que quedan a la derecha de la mediana es igual a la cantidad de datos que quedan a la izquierda. Se representa por Me.

Para calcular la mediana, debes hacer lo siguiente: Para cuando la cantidad de valores es impar Ordena los valores de menor a mayor y busca el valor del centro. Por ejemplo: Por ejemplo: 1. Supn que tienes los siguientes valores: 2, 4, 0, 8, 6, 4, 7, 1, 1, 0, 8, 6, 9 2. Ordena: 0, 0, 1, 1, 2, 4, 4, 6, 6, 7, 8, 8, 9 1. Supn que tienes los siguientes valores: 5, 7, 2, 3, 1, 6, 9, 8, 6, 4, 7, 1 ,3, 2 2. Ordena: Para cuando la cantidad de valores es par Ordena los valores de menor a mayor, busca y promedia los valores del centro.

3. El dato que divide a la mitad es: 4, por lo tanto Me: 4

1, 1, 2, 2, 3, 3, 4, 5, 6, 6, 7, 7, 8, 9 3. Busca y promedia los datos del centro: 4+5=9/2= 4.5, por lo tanto Me: 4.5

Mediana en datos agrupados por intervalos Cuando quieres calcular la mediana en datos agrupados por intervalos, tienes que buscar el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas, es decir, es necesario localizar el intervalo donde se encuentre N/2, para ello utiliza la siguiente frmula:

Donde: es el lmite inferior del intervalo donde se encuentra la Li mediana. es la divisin de las frecuencias absolutas entre 2. es la frecuencia acumulada anterior al intervalo de la Fi-1 mediana. es la frecuencia absoluta del intervalo donde se encuentra la fi mediana. ai es la amplitud del intervalo. Lee el documento Mediana por intervalos. Ejemplo de mediana por intervalos

Actividad 2: Medidas de tendencia central. Mediana

1. Retoma el problema que utilizaste en la actividad anterior para obtener la media aritmtica. 2. Con los datos obtenidos, calcula la mediana, incluyendo frmula y las operaciones que realices. 3. Recuerda que en el foro Medidas de tendencia central, puedes plantear tus dudas sobre el tema. 4. La nomenclatura que debe tener tu archivo es la misma que se defini en la actividad anterior, EB_U3_MTC_XXYZ. Sustituye las XX por las dos primeras letras de tu primer nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno. Recuerda que tu archivo no debe pesar ms de 4 MB. Nota: Todava no debes enviar tu documento, consrvalo.

3.1.3. Moda La tercera medida de tendencia central es la moda. La moda es el valor que tiene mayor frecuencia absoluta, es decir, el valor que se repite ms veces en una serie de datos. La moda se denota por Mo.

Cuando todos los valores de la distribucin de datos tienen igual nmero de frecuencia, se dice que no hay moda.

Moda en datos agrupados por intervalos Cuando la distribucin de datos es por intervalos de clase, primero se localiza el intervalo que tiene mayor frecuencia absoluta utilizando la siguiente
Donde: Li es el lmite inferior del intervalo modal. fi es la frecuencia absoluta del intervalo modal.

frmula para calcular la moda:

fi1 es la frecuencia absoluta del intervalo anterior al intervalo modal. fi-+1 es la frecuencia absoluta del intervalo siguiente al intervalo modal. ai es la amplitud del intervalo.

Lee el documento Moda por intervalos de clase. Ejemplo de moda por intervalos Actividad 3: Medidas de tendencia central. Moda

1. Calcula la moda en el problema Frecuencias. Recuerda que ya debiste haber obtenido la media y la mediana. 2. Si tienes dudas, plantalas en el foro Medidas de tendencia central, para que sean resueltas de manera grupal. 3. Conserva el nombre que ya le habas dado a tu documento, EB_U3_MTC_XXYZ. Sbelo a la base de datos para que tus compaeros(as) y tu Facilitador(a) lo revisen y te retroalimenten. Recuerda que tu archivo no debe pesar ms de 4 MB. 4. Revisa los trabajos de tus compaeros(as) y comntalos. Para subir tu documento: En la ruta(parte superior izquierda del aula) da clic en Estadstica. Se enlistarn las actividades, da clic en Actividad 3: Medidas de tendencia central.

3.2. Medidas de dispersin A diferencia de las medidas de tendencia central, que miden acumulaciones en un solo punto, las medidas de dispersin miden el grado de separacin o alejamiento que tiene una variable estadstica con respecto a una medida de posicin o tendencia central. Dicho grado de separacin indica lo representativa que es la medida de posicin con respecto al conjunto total de datos. A mayor dispersin, menor representatividad de la medida de posicin y viceversa. 3.2.1. Recorrido El recorrido representa la diferencia que hay entre el primero y el ltimo valor de la variable, tambin se le conoce como rango y se denota por Re. La frmula para calcularlo es: Donde: Por ejemplo: Si tienes la siguiente distribucin de datos: 69, 68, 52, 57, 69, 71, 78, 52, 74, 74, 69, 52, 76, calcula el rango, sustituyendo los valores Re=78-52=26 mx xi es el valor mximo de la variable min xi es el valor mnimo de la variable

Actividad 4: Medidas de tendencia central. Recorrido Las actividades de este tema se desarrollarn de manera similar que las actividades del tema anterior. En esta actividad tambin est disponible un espacio para que plantees tus dudas sobre le tema y el uso de las frmulas, este foro se titula Medidas de dispersin. 1. Con los datos del problema Frecuencias (el cual trabajaste en actividades anteriores), calcula el recorrido de la distribucin. 2. Guarda tu documento como EB_U3_MD_XXYZ. Sustituye las XX por las dos primeras letras de tu primer nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno. Recuerda que el peso de tu archivo no debe ser mayor a 4 MB. 3. Conserva tu archivo porque lo utilizars en las Actividades 5 y 6. No olvides incluir las frmulas y las operaciones que realizas. Para ingresar al foro: En la ruta (parte superior izquierda del aula) da clic en Estadstica. Se enlistarn las actividades, da clic en Foro: Medidas de tendencia central. 3.2.2. Varianza La varianza mide la mayor o menor dispersin de los valores de la variable respecto a la media aritmtica. Siempre es mayor o igual que cero y menor que infinito. Se define como la media de los cuadrados de las diferencias del valor de los datos menos la media aritmtica de stos. La frmula de la varianza para datos no agrupados es: Para calcularla en una poblacin: Para calcularla en una muestra: Donde N, n es la suma de los cuadrados de los valores de X menos la media es el nmero total de datos.

Lee el archivo Varianza para datos no agrupados. Ejemplo de varianza para datos no agrupados

Varianza para datos agrupados por intervalos


La frmula para calcular la varianza en datos agrupados por intervalos es la siguiente:

Para calcularla en una poblacin: Donde: Para calcularla en una muestra:

Fi es la frecuencia del intervalo.


Mci

es la marca de clase del intervalo.

es la media de la distribucin de datos. es el nmero total de datos de la N, n distribucin.

Para ver un ejemplo, lee el documento Varianza en datos agrupados por intervalos. Ejemplo de varianza en datos agrupados por intervalos.

Actividad 5: Medidas de dispersin. Varianza 1. Ya que obtuviste el recorrido de la distribucin de datos del problema Frecuencias, calcula la varianza, incluyendo la frmula y las operaciones. 2. Conserva tu archivo como EB_U3_MD_XXYZ. Sustituye las XX por las dos primeras letras de tu primer nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno. 3. Recuerda, si tienes dudas puedes comentarlas en el foro Medidas de dispersin. Nota: An no enves tu tarea. Hace falta trabajar una medida ms. Para ingresar al foro: En la ruta (parte superior izquierda del aula) da clic en Estadstica. Se enlistarn las actividades, da clic en Foro: Medidas de dispersin.

3.2.3. Desviacin tpica La desviacin tpica o estndar muestra qu tan alejado est un dato del valor de la media aritmtica, es decir, la diferencia que hay entre un dato y la media aritmtica. Se denota como S o segn se calcule en una muestra o en toda la poblacin, respectivamente. Se define como la raz cuadrada positiva de la varianza. Se expresa mediante las siguientes frmulas: En datos no agrupados Para una poblacin Para una muestra

En datos agrupados agrupados por intervalos

Para ver un ejemplo de la aplicacin de la frmula, descarga los documentos Desviacin estndar en datos no agrupados y Desviacin estndar en datos agrupados por intervalos. Ejemplo de desviacin estndar en datos no agrupados

Ejemplo de desviacin estndar en datos agrupados por intervalos Actividad 6: Medidas de dispersin. Desviacin tpica 1. Con los datos de la varianza que obtuviste en la actividad anterior, calcula la desviacin tpica en el mismo problema. 2. Conserva el nombre que ya le habas dado a tu documento (EB_U3_MD_XXYZ) y comprtelo en la base de datos para que tus compaeros(as) y tu Facilitador(a) lo revisen y te retroalimenten. 3. Revisa los trabajos de tus compaeros(as) y comntalos. Recuerda que tu documento debe incluir las frmulas y operaciones correspondientes a cada medida. Para subir tu documento: En la ruta (parte superior izquierda del aula) da clic en Estadstica. Se enlistarn las actividades de la unidad, da clic en la Actividad 6: Medidas de dispersin. Actividad 7: Problemas 1. Descarga el documento Problemas y elabora lo que se te pide. 2. Guarda tu documento como EB_U3_PR_XXYZ, en formato Word 97-2003, y envaselo al (a la) Facilitador(a). Sustituye las XX por las dos primeras letras de tu primer nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno. Recuerda que tu archivo no debe pesar ms de 4 MB. No olvides incluir en tu documento las frmulas que utilices y las operaciones que realizaste para resolver los problemas, al igual que las tablas de frecuencias, si es el caso. Para enviar tu documento: En la ruta (parte superior izquierda del aula) da clic en Estadstica. Se enlistarn las actividades, da clic en la Actividad 7: Problemas. Da clic en el icono para descargar el documento Problemas. Autoevaluacin

Autoevaluacin Has llegado al final de la unidad, ahora resuelve el ejercicio de autoevaluacin. Para resolver la autoevaluacin: En la ruta (parte superior izquierda del aula) da clic en Estadstica. Se enlistarn las actividades, da clic en la Autoevaluacin.

Evidencia de aprendizaje: Medidas de tendencia central y dispersin

Para elaborar la evidencia de esta unidad, realiza lo siguiente: 1. Retoma el trabajo que entregaste como evidencia en la Unidad 2. 2. Para la variable edad y la variable carrera, obtn las medidas de tendencia central y dispersin. Para la variable carrera, debes obtener las medidas por carrera, del mismo modo como elaboraste las tablas de frecuencias. 3. Describe brevemente qu significa cada una de las medidas. 4. Al final de tu trabajo incluye, a manera de conclusin, una reflexin sobre lo siguiente:

Qu tipo de informacin obtuviste con el anlisis de los datos? Si fueras director del campus virtual para qu podras utilizar esta informacin? Describe, de manera breve, algunos ejemplos.

Cul es la utilidad de la estadstica en tu formacin acadmica, tus actividades profesionales y tu vida personal? 5. Entrega tu trabajo organizado del mismo modo que lo entregaste en la Unidad 2, es decir:

Incluye una presentacin donde describas de dnde se obtuvieron los datos y la finalidad del anlisis de los mismos. El procedimiento que seguiste para obtener la muestra. Las tablas, las grficas, las medidas de tendencia central y dispersin con una descripcin. Agrega tu conclusin.

6. Enva tu trabajo como EB_U3_EA_XXYZ. Sustituye las XX por las dos primeras letras de tu primer nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno. Revisa que tu documento no pese ms de 4 MB. Recuerda que una vez que recibas las observaciones, puedes enviar una segunda versin de tu trabajo con las adecuaciones necesarias. 7. Consulta la escala de evaluacin de esta evidencia de aprendizaje. Da clic en el icono para descargar la Escala de evaluacin. Cierre Has concluido la Unidad 3 y con ella la asignatura Estadstica bsica. En esta unidad revisaste qu son y cmo se calculan la medidas de tendencia central y dispersin. Recuerda que las medidas de tendencia central son la media, la mediana y la moda y que las medidas de dispersin son el recorrido, la varianza y la desviacin tpica. Estos datos se utilizan para resumir la informacin que se est estudiando. En esta asignatura viste los conceptos bsicos de la estadstica descriptiva y revisaste algunas de sus aplicaciones, esperamos que te sea de utilidad. Para saber ms

En la siguiente direccin electrnica puedes encontrar explicaciones, ejemplos y ejercicios sobre los temas que se abordaron en esta unidad: http://www.vitutor.com/estadistica.html

Fuentes de consulta

Montgomery, Douglas C. y Runger, George C. (1996). Probabilidad y Estadstica aplicadas a la ingeniera (4 ed.). McGraw-Hill, Mxico. Walpole, Ronald E., Myers Raymond H., et al. (2007). Probabilidad y Estadstica para Ingeniera y ciencias (8 ed.). Mxico: Pearson Educacin. Medidas de tendencia central y dispersin. Consultado el 27 de abril de 2010 en: http://bibliotecavirtual.lasalleurubamba.edu.pe/Estadistica/res/pdf/ estadisticadescriptivavariables2.pdf http://www.vitutor.com.estadistica.html

Anda mungkin juga menyukai