Anda di halaman 1dari 179

Estadstica Descriptiva

Gua de autoaprendizaje
Estadstica Descriptiva
Modalidad de Educacin Abierta y a Distancia

Rita Oliva Maya Hernndez

Secretara de Educacin Pblica Direccin General de Educacin Superior Escuela Nacional de Biblioteconoma y Archivonoma Mxico 1998

Secretara de Educacin Pblica Subsecretara de Educacin Superior e Investigacin Cientfica Direccin General de Educacin Superior Escuela Nacional de Biblioteconoma y Archivonoma Estadstica Descriptiva (Serie guas de autoaprendizaje) Modalidad de Educacin Abierta y a Distancia Primera edicin 1998
ISBN 970-18-0985-8

Impreso en Mxico Diseo: Ivonne Bautista Carmona Portada: Patricia Vzquez Langle

Estadstica Descriptiva

Empezamos a conocer un fenmeno cuando somos capaces de medirlo y expresarlo en nmeros; mientras tanto, nuestro conocimiento de dicho fenmeno ser deficiente e insatisfactorio Lord Kelvin

Estadstica Descriptiva

NDICE
Presentacin Introduccin UNIDAD 1 CONCEPTOS BSICOS 1.1 Definicin, objeto y clasificacin de la Estadstica 16 1.2 Poblacin y muestra 1.3 Variables 27 1.4 Escalas de medicin 1.4.1 Escala nominal 31 1.4.2 Escala ordinal 32 1.4.3 Escala de intervalo 1.4.4 Escala absoluta 32 31 20 7 9 13

32

UNIDAD 2 PRESENTACIN DE DATOS 2.1 Tipos de datos 2.1.1 Datos categricos 2.1.2 Datos ordenados por rango 43 2.1.3 Datos mtricos 43 2.2 Distribucin de frecuencias 2.2.1 Simples 47 2.2.2 Para datos agrupados 57

39 42 42

46

UNIDAD 3 REPRESENTACIONES GRFICAS 73 3.1 Grfica de barras 77 3.2 Grfica de sectores 3.3 Histograma de frecuencias absolutas 86 3.4 Polgono de frecuencias absolutas 92 3.5 Polgono de frecuencias relativas acumuladas u ojiva porcentual 95 80

UNIDAD 4 ESTADSTICA DESCRIPTIVA 109 4.1 Medidas de tendencia central 111 4.1.1 Media 111 4.1.2 Mediana 111 4.1.3 Moda 111 4.2 Medidas de dispersin 127 4.2.1 Rango 127 4.2.2 Cuartiles 127 4.2.3 Desviacin media 132 4.2.4 Varianza 138

Estadstica Descriptiva

4.2.5 Desviacin estndar 138 4.2.6 Coeficiente de variacin 143 4.2.7 Teorema de Chebyshev 145 Resumen de la unidad 1 153 Resumen de la unidad 2 154 Resumen de la unidad 3 155 Resumen de la unidad 4 157 Lecturas 159

PRESENTACIN
La Biblioteconoma y la Archivonoma son dos profesiones que han cobrado un fuerte impulso durante los ltimos aos. Las condiciones cambiantes que han intervenido en su entorno y que han originado nuevos problemas y nuevos enfoques en sus campos de aplicacin se han debido principalmente al progreso cientfico y tecnolgico y a la explosin documental: una mayor produccin y explotacin de material, un notable incremento de usuarios y el uso cada vez ms intenso de los medios informticos y de las telecomunicaciones para el almacenamiento, organizacin e intercambio de informacin. Esta situacin contrasta con la carencia de recursos humanos con una adecuada preparacin acadmica que permita brindar una atencin profesional a las necesidades que, en materia de informacin, constantemente van en aumento entre la sociedad mexicana. Es por ello que la Escuela Nacional de Biblioteconoma y Archivonoma (ENBA), como institucin de educacin superior formadora de profesionistas especializados en el manejo de la informacin, ha emprendido la imparticin de sus licenciaturas en la modalidad abierta y a distancia, con el propsito de ofrecer una cobertura educativa a nivel nacional en ambas especialidades, coadyuvar en la superacin de los rezagos de personal profesional en las bibliotecas y archivos de Mxico, propiciar la investigacin y la difusin de la cultura bibliotecaria y archivstica y participar activamente en las polticas educativas del gobierno federal manifestadas en el Programa de Desarrollo Educativo 1995-2000. La modalidad abierta y a distancia se convierte as en una opcin dirigida a todas aquellas personas formadas con la experiencia pero que carecen de una preparacin acadmica en las reas de Biblioteconoma o de Archivonoma. En este sentido, se pretende rescatar, valorar, reconocer y acreditar esa experiencia adquirida a travs del tiempo en el entorno laboral de las bibliotecas y los archivos, utilizando estrategias de aprendizaje que resulten congruentes con las caractersticas de la modalidad. Es decir, para superar los obstculos de distancia y las dificultades de tiempo y espacio para el estudio se recurre a aspectos acadmicos que generalmente son poco comunes en la modalidad escolarizada, pero que tambin persiguen los mismos propsitos.

Estadstica Descriptiva

Los materiales didcticos surgen entonces como uno de los soportes ms importantes, junto con las asesoras y los medios de comunicacin a distancia, en los que habrs de sustentar tu formacin. Las guas de autoaprendizaje representan la parte medular de los materiales didcticos. Son el principal medio de apoyo con el que cuentas para avanzar en tu proceso de aprendizaje, tomando en cuenta que asumes una responsabilidad compartida con el asesor y que eres t quien determina su propio ritmo de avance. Su contenido se encuentra adaptado convenientemente a la lgica del problema, de la disciplina y del campo del conocimiento que se aborda y responde a los elementos didcticos y comunicacionales que permiten favorecer de mejor manera el estudio independiente. En cada asignatura cuentas con una gua de autoaprendizaje y en muchas de ellas sta se encuentra complementada con una gua de lecturas. Esta gua es un material de estudio que contiene lecturas tomadas de diversos libros que, a juicio del autor de la gua de autoaprendizaje correspondiente, necesitars consultar para apoyar tu aprendizaje. Las asesoras son un medio al que podrs recurrir en cualquier momento para consultar tus dudas o solicitar sugerencias sobre tus mtodos y hbitos de estudio. Los medios de comunicacin a distancia te permitirn establecer comunicacin con los asesores desde cualquier parte en que te encuentres. La presente gua representa entonces slo una pequea parte del gran apoyo con el que cuentas, pero constituye tambin el trabajo colectivo que la ENBA ha venido desarrollando con el firme propsito de contribuir en tu formacin profesional. Estamos seguros que hars un correcto uso de ella y que sabrs aprovecharla adecuadamente.

INTRODUCCIN
La evolucin del uso y manejo de la informacin ha motivado que estructuras importantes y vitales como son las de enseanza modifiquen sus planes de estudio, y la Escuela Nacional de Biblioteconoma y Archivonoma no poda ser la excepcin, por tal motivo ha instaurado su Modalidad Abierta y a Distancia con el objeto de impartir las carreras de Biblioteconoma y Archivonoma y as formar parte activa en el desarrollo de profesionales de estas reas. Dentro de este Sistema se ha creado para ti esta Gua de Autoaprendizaje como un apoyo para que puedas aprender la materia de Estadstica Descriptiva, la cual forma parte del Plan de Estudios de estas carreras en su tronco comn. Antes de que inicies tu aprendizaje te invito a conocer los antecedentes de la materia que nos ocupa. La historia de la Estadstica es extensa, surge como todo lo creado por el hombre: por la necesidad de conocer y modificar su entorno a fin de entenderlo. Aunque existen antecedentes de que los chinos efectuaron censos hace ms de 40 siglos y de que en la Biblia se mencionan datos estadsticos en el Libro de los Nmeros, la etapa moderna, arbitrariamente elegida se encuentra comprendida en el perodo 1890-1940. Es importante destacar que en sus inicios la Estadstica se utiliz con el propsito de interpretar fenmenos biolgicos y la conducta social de grandes masas, un ejemplo de ello son las primeras Tablas de mortalidad elaboradas por John Graunt (1620-1674) que contenan el nmero de nacimientos, matrimonios, bautizos y defunciones, antecedente de las que hoy se utilizan en los Seguros de Vida. Actualmente la Estadstica es una herramienta importante y necesaria en todas las reas del conocimiento ya que permite interpretar los datos obtenidos a travs de investigaciones y en su caso, tomar una decisin que tenga como fundamento el comportamiento observado y analizado. Como vers, los antecedentes de la Estadstica o Mtodos Estadsticos como algunos le llaman, resultan bastante interesantes y en tu caso, en el rea de la cual ya formas parte como estudiante de la informacin es de vital importancia que los manejes y apliques en la solucin de problemas.

10

Estadstica Descriptiva

Una de las ventajas que tiene el uso de esta herramienta en el campo laboral de estas dos profesiones es la facilidad de poder manipular grandes cantidades de datos que al ser analizados en forma manual o a travs de una computadora permiten obtener indicadores especficos ya sea para conocer la satisfaccin de un servicio, el promedio de la carga de trabajo e inclusive para planear el crecimiento de volmenes, costos, etc., en cierta rea, permitiendo realizar planes de expansin para el futuro. Es preciso hacer notar que se debe tener cuidado al hacer uso de la Estadstica, ya que la presentacin de datos equivocados puede provocar una falsa interpretacin y como consecuencia llegar a una conclusin errnea. Es de suma importancia mencionar que la interpretacin es la base fundamental del uso de esta herramienta. Algunas recomendaciones que te hago con el propsito de facilitarte la comprensin y manejo adecuado de las unidades que integran esta asignatura son que revises cuidadosamente el material que se te presenta en cada tema, leas las instrucciones de cada actividad y las ejecutes tomando en cuenta lo aprendido, sin perder de vista tu experiencia previa que es muy valiosa y que te ayudar a apropiarte de la informacin nueva que aqu se te presenta. No olvides que el xito para lograr la meta que te has propuesto lo alcanzars a travs del estudio y del trabajo que se te solicita en actividades a desarrollar en cada tema, retroalimentndote de tal forma que t mismo tengas conciencia del progreso que obtienes cada da que te esfuerzas. Adelante, t puedes. Al trmino de cada unidad encontrars un resumen de los conceptos ms importantes que espero te sea de gran utilidad para que reflexiones sobre lo aprendido antes de contestar la EVALUACIN que debes enviar a tu asesor una vez que la hayas resuelto correctamente y en su totalidad. Tu calificacin final ser el resultado de considerar: 4 evaluaciones de aprendizaje (una por unidad), las cuales cuentan un 40% y una evaluacin final que tiene un valor del 60%. Para la mejor comprensin del objetivo es necesario reiterar una vez ms que el uso adecuado de la Estadstica es bsico en cualquier campo de la investigacin, es por ello que los conocimientos que adquieras en esta asignatura te servirn de apoyo para el mejor desarrollo de temas incluidos en otras materias de la carrera ya sea si estudias Archivonoma, o si te
11

encuentras cursando la carrera de Biblioteconoma y en general en todas aquellas donde se requiera la representacin de datos de tal forma que su interpretacin correcta permita la mejor toma de decisiones. EL OBJETIVO GENERAL de esta asignatura es proporcionarte los elementos fundamentales necesarios para elaborar tablas de distribucin de frecuencias y grficas, as como calcular medidas descriptivas, todo lo cual te permitir reconocer la importancia de la estadstica en los procesos de planeacin, toma de decisiones, administracin y medicin del comportamiento de los servicios ofrecidos en los campos bibliotecario y archivstico. Esta gua contempla 4 unidades:
1.- CONCEPTOS BSICOS 2.- PRESENTACIN DE DATOS 3.- REPRESENTACIONES GRFICAS 4.- ESTADSTICA DESCRIPTIVA

Iniciamos la primera unidad con los conceptos bsicos de la asignatura, para continuar con la presentacin de datos, posteriormente se te indicar el procedimiento a seguir para obtener su representacin grfica. En la unidad 4 calculars los valores centrales de una muestra o poblacin as como las medidas que te indican el grado de dispersin entre sus elementos. Al principio de cada unidad se te pide contestar algunas preguntas que integran el DIAGNSTICO, las cuales permitirn identificar tus ideas previas sobre la misma, haciendo una breve REFLEXIN que despejar tus dudas y te preparar para el desarrollo de los temas, cada uno de ellos contiene una seccin de actividades denominada QU HE APRENDIDO? que te retroalimentar a travs de preguntas y/o problemas que debes resolver en el espacio correspondiente. Para que te familiarices con las unidades de esta asignatura, echa un vistazo al ndice; una vez que conozcas los temas que se desarrollarn, es necesario que reflexiones y contestes la siguiente pregunta: Cules son tus expectativas sobre el aprendizaje del contenido que se te ha planteado? ________________________________________________________ ____________________________________________________________ _______________

12

Estadstica Descriptiva

Espero que todo lo que hasta aqu has conocido te motive para continuar y adems, cubra tus expectativas, ya que como t lo irs descubriendo, el mundo de la Estadstica es realmente excitante. Avanza
firmemente para que llegues a la meta, t puedes.

13

14

Estadstica Descriptiva

UNIDAD 1 CONCEPTOS BSICOS

En esta primera unidad, t como estudiante deseoso de conocer los conceptos ms usados en esta asignatura tendrs a tu alcance una breve definicin de cada uno de ellos, este conocimiento debe ser complementado con tus actividades de aprendizaje a fin de que en lo sucesivo seas capaz de identificarlos y manejarlos adecuadamente.

QU VOY A APRENDER EN ESTA UNIDAD? A definir e identificar los conceptos bsicos elementales que se utilizan en Estadstica. Para conocer tus ideas previas sobre cada uno de los temas a desarrollar en esta gua, es necesario que antes de iniciar las unidades contestes lo que se te solicita en el Diagnstico, el cual forma parte importante en tu formacin ya que por medio de el estaremos en posibilidad de recuperar tu experiencia previa y prepararte para la apropiacin de conocimientos nuevos.

15

DIAGNSTICO 1) Escribe el significado que tiene para ti la palabra Estadstica. ________________________________________________________ ____________________________________________________________ ______________ 2) Recorta, lee y pega cualquier artculo de un peridico reciente que contenga grficas y destaca los trminos estadsticos que contenga.

3) Anota algunos de los mensajes que ves en televisin en donde consideres que se estn utilizando conceptos de estadstica. ________________________________________________________ ____________________________________________________________ _______________ 4) Busca en el diccionario el significado de la palabra inferir y antalo. ________________________________________________________ ____________________________________________________________ _______________

16

Estadstica Descriptiva

Si al realizar las actividades del diagnstico advertiste que desconoces el significado de la palabra Estadstica, no te preocupes, en seguida podrs leer una breve definicin:
La palabra Estadstica est relacionada con la palabra estado, y originalmente la actividad llamada estadstica fue una clase sistemtica de ciencia poltica comparada. Esta actividad se centr gradualmente en tablas numricas de hechos econmicos, demogrficos y polticos, y as estadstica vino a significar la recopilacin y anlisis de tablas numricas

Tanto en la lectura del artculo que se te solicit, como en los mensajes televisados, encontraste trminos utilizados en la Estadstica como son: se ha demostrado estadsticamente, estadsticas relativas a, proporcin, por ciento, en base a los datos obtenidos se infiere que... entre otros, todos ellos nos muestran su utilidad en el mundo actual en que vivimos ya que nos auxilian a planear y obtener informacin de diversos fenmenos a fin de organizarla y analizarla para predecir a partir de lo calculado (inferir) y llegar a conclusiones que nos permitan tomar decisiones. Es muy importante que recuerdes el significado de inferir: inducir o predecir a partir de ciertos resultados. Muy bien, ahora que ya tienes idea de lo que se puede realizar utilizando como herramienta la estadstica iniciaremos nuestro aprendizaje formal.

17

1.1 DEFINICIN, OBJETO Y CLASIFICACIN DE LA

ESTADSTICA
Actualmente, la Estadstica se utiliza en todas las reas, no hay ciencia que no la use o profesin que no la aplique, ya que los mtodos que desarrolla se manejan en todos los campos porque permiten describir la informacin recopilada por diversos medios, hacindola ms accesible a fin de poder analizarla e interpretarla fcilmente. Es preciso hacer notar que la Estadstica es una rama de la Matemtica aplicada, razn por la cual se requiere manejar ciertos conceptos sobre la materia, que en su momento se te explicarn brevemente as como la notacin correspondiente. La utilidad que tienen los mtodos estadsticos en diversas reas es quiz el motivo por el cual existen mltiples definiciones de Estadstica como las que se te presentan a continuacin y que se te sugiere leer con detenimiento, SUBRAYANDO las palabras que consideres ms importantes en cada una. Robert Johnson escribe: Estadstica es la ciencia de recolectar, clasificar, describir e interpretar datos numricos. Para Enrique Portilla Chimal la Estadstica o Mtodos Estadsticos son los mtodos que se aplican a la recoleccin, organizacin, presentacin, anlisis e interpretacin de datos numricos. Luis Magaa Cullar indica: Estadstica es un conjunto de procedimientos que sirven para organizar y resumir datos, hacer inferencias a partir de ellos y transmitir los resultados de manera clara, concisa y significativa. William Mendenhall explica El objetivo de la Estadstica es hacer inferencias (predicciones) acerca de una poblacin (total de datos), sobre la base de la informacin contenida en una muestra (parte de la poblacin) para ello afirma que como principio se debe tener un problema estadstico el cual debe contener 6 elementos donde los primeros 3 se analizan a travs de la Estadstica Descriptiva y los 3 restantes con la Estadstica Inferencial. A continuacin se describen: 1) Definicin clara del conjunto de datos de inters.

18

Estadstica Descriptiva

Conocer el problema e identificar las preguntas claves de la investigacin: Qu quiero? 2) Diseo del experimento, considerado ste como un proceso por medio del cual se obtiene un dato. Procedimiento para elegir la muestra adecuada que permita contestar las preguntas planteadas y extraer la informacin que se requiere de la poblacin. 3) Manejo de la informacin. Los datos obtenidos se ordenan, se presentan en tablas estadsticas, se calculan medidas que informen sobre el comportamiento de los mismos y se elaboran grficas. 4) Anlisis de los datos. Identificacin del procedimiento para hacer inferencias sobre el total de datos con base en la informacin que proporciona una parte de ellos. 5) Obtencin de una medida que muestre qu tan confiable es la inferencia a la que se lleg. 6) Conclusiones y toma de decisiones. De todo lo anterior se desprende entonces que el objeto de la Estadstica es obtener, organizar y resumir informacin en tablas y grficas que al mismo tiempo que describan la forma en que se comportan los datos, tambin faciliten el clculo de parmetros o estadsticos, esto es, nmeros que describan las caractersticas de una categora que agrupa elementos comunes con respecto a una poblacin o a una muestra segn sea el caso. La Estadstica para su estudio se clasifica en Estadstica Descriptiva o Deductiva y Estadstica Inferencial o Inductiva. En la siguiente tabla se observan claramente las partes que integran cada divisin:

19

DESCRIPTIVA O DEDUCTIVA Incluye las fases de: -Obtencin de datos a travs de encuestas o investigaciones de campo -Organizacin de los mismos (orden ascendente o descendente si son numricos) y conteo -Presentacin de la informacin en cuadros y/o tablas -Grficos que muestren el comportamiento de la informacin -Clculo de medidas descriptivas (media, moda, mediana, etc.)

ESTADSTICA

INFERENCIAL O INDUCTIVA Contempla los mtodos que permiten: - Generalizar a partir de los valores calculados con tcnicas descriptivas - Obtener conclusiones - Tomar decisiones

DEDUCTIVA: Parte de lo general para llegar a lo particular INDUCTIVA: Considera lo particular para generalizar

Claramente se puede observar en la tabla que ambas divisiones se complementan ya que por medio de la Estadstica Descriptiva es posible obtener informacin que se organiza, presenta y describe en forma numrica para posteriormente, a travs de la Estadstica Inferencial generalizar y tomar decisiones teniendo como soporte la informacin que se obtuvo a travs de la primera. Cabe hacer mencin de que el proceso de interpretar los datos no es infalible.

QU HE APRENDIDO? Es de suma importancia que evales tus conocimientos, verifiques tu avances y planifiques tu aprendizaje, para ello debes participar ACTIVAMENTE desarrollando lo que se te solicita. Por favor, no contines si tienes dudas o errores en tus respuestas. 1) De las definiciones de Estadstica que se te han presentado, elabora una relacin de las palabras comunes a todas.

20

Estadstica Descriptiva

________________________________________________________ ____________________________________________________________ _______________ 2) Utilizando los trminos escritos en el anterior inciso, escribe tu propia definicin de Estadstica. ________________________________________________________ ____________________________________________________________ _______________ 3) Acude con un Bibliotecario o Archivnomo dentro de tu localidad y pregntale en qu aspectos de las tareas que se realizan en su profesin aplica la Estadstica. Anota su respuesta, el lugar al que acudiste y la profesin de la persona que contest tus preguntas. ________________________________________________________ ____________________________________________________________ ____________________________________________________________ ____________________________________________________________ _______________________________ 4) Anota como mnimo 3 disciplinas en donde se aplique la Estadstica y describe brevemente un ejemplo en cada una de ellas. ________________________________________________________ ____________________________________________________________ ____________________________________________________________ ____________________________________________________________ ____________________________________________________________ ____________________________________________________________ _______________________________________________

21

1.2 POBLACIN Y MUESTRA

POBLACIN TAMAO N n

MUESTRA TAMAO

La POBLACIN Estadstica se encuentra formada por un conjunto de personas, entidades u objetos bien definidos, del cual se quiere saber algo que nos interesa, el nmero total de elementos que la forman, llamado tamao de la poblacin, se denota con la letra ene mayscula N. Existen 2 tipos de poblacin: Finita: {a, e, i, o, u}. Formada por un nmero limitado de observaciones, por ejemplo las vocales, el nmero total de libros que existen en una biblioteca o el nmero de investigadores que acuden a un archivo en un perodo determinado. Infinita: {1, 2, 3, 4, ... } Contiene un gran conjunto de medidas u observaciones que no pueden alcanzarse por conteo, es decir, se puede numerar el primer elemento pero no el ltimo como el conjunto de los nmeros Naturales, el nmero de expedientes que contienen la Historia de Mxico o el nmero de libros impresos. MUESTRA REPRESENTATIVA o MUESTRA es un subconjunto de la poblacin de inters donde el nmero de datos es menor que el de la poblacin. En este caso el tamao de la muestra se simboliza con la letra ene (n) minscula. Una muestra del nmero total de libros que existe en una biblioteca puede estar formada por los volmenes de una asignatura, en un Archivo la muestra puede ser un cierto nmero de expedientes que se refieran a un tema en comn.

22

Estadstica Descriptiva

En caso de contar con el total de datos de una poblacin es posible calcular sus parmetros o caractersticas medibles como el promedio o la proporcin entre una categora y el total de datos obtenido; sin embargo, si se trata de una poblacin infinita la estimacin de un parmetro de la misma se realiza a travs de la informacin que proporciona la muestra con los llamados estadsticos o estadgrafos, los cuales tambin son caractersticas medibles.

Parmetro

POBLACIN (tamao N) MUESTRA (tamao n)

Estadstico

Un parmetro es para una poblacin lo que un estadstico para una muestra. Es necesario aclarar que no cualquier muestra es adecuada para fines estadsticos, se debe tener en cuenta que la muestra con la que se realizarn clculos reproduzca en lo posible los rasgos generales de la poblacin, para ello se tiene que considerar lo siguiente: - Los elementos se deben escoger en forma aleatoria, esto es al azar. Para ilustrar el trmino aleatorio o al azar, consideremos el siguiente ejemplo: Si de un grupo de 10 personas se quiere escoger aleatoriamente a 3, a cada una se le asigna un nmero y sin relacionar dicho nmero con la persona se selecciona cualquier terna que puede ser: 1, 3, 8 2, 5, 10, etc. - Cada elemento de la poblacin debe tener la misma oportunidad de ser escogido. A los valores de los parmetros se les conoce con el nombre de valores verdaderos. Uno de los parmetros ms utilizados es la proporcin que se denota con la letra P mayscula y compara el nmero de casos o frecuencia (f) de una categora dada con el tamao total de la poblacin (N) o con la muestra (n).
POBLACIN TAMAO N PARMETRO f P = -----MUESTRA TAMAO n ESTADSTICO f P = -------

23

P es la proporcin, f es la frecuencia y N n es el tamao de la poblacin o muestra respectivamente. Para entender lo que es un parmetro y un estadstico veamos los siguientes ejemplos:
PARMETRO: POBLACIN tamao N f P = -------N

1) Supongamos que en tu biblioteca personal tienes distribuidos de la siguiente manera :


ASIGNATURA MATEMTICAS ESTADSTICA INGLS HISTORIA NOVELA GEOGRAFA No. DE LIBROS 5 4 8 7 15 1 40

40 libros

CATEGORAS

FRECUENCIAS (f)

Aqu el tamao de la poblacin o N es igual a 40, las categoras formadas por las diferentes asignaturas son 6 y cada una tiene el nmero de libros que le corresponde, el cual recibe el nombre de frecuencia y se denota con la letra efe minscula (f). Si consideramos el nmero de novelas con respecto al tamao de la poblacin, formamos la proporcin: 15 P = --------- que resulta ser P = 0.375 40 El valor del parmetro tiene mayor sentido cuando lo transformamos en porcentaje, esto quiere decir que se desea obtener la frecuencia de ocurrencia de una categora por cada 100 casos. Para hacer el clculo de un porcentaje slo se multiplica cualquier proporcin ya sea de una poblacin de una muestra por 100, por lo que % = (100) f % =(100) f N n

24

Estadstica Descriptiva

En este caso al valor de P=0.375 lo multiplicamos por 100: % = (100)(0.375) = (0.375)(100) = 37.5 % Concluimos entonces que el porcentaje de novelas que tienes en tu biblioteca es del 37.5 % con respecto al total de libros considerados. Encuentra el porcentaje de cada una de las categoras con respecto a N y escrbelas:
ASIGNATURA PROPORCIN EN PORCENTAJE (PARMETRO)

MATEMTICAS ESTADSTICA INGLS HISTORIA NOVELA GEOGRAFA

37.5 %

Despus de calcular los porcentajes suma todas las proporciones obtenidas, si tus valores estn correctos el resultado debe ser 100% o un valor aproximado.
ESTADSTICO: MUESTRA tamao n f P = -------n

La proporcin es un estadstico si se considera el tamao de una muestra (n). 2) En una escuela laboran 500 personas, al extraerse una muestra de 90 trabajadores en diferentes reas se tiene la siguiente tabla:
REA ADMINISTRATIVA BIBLIOTECA DOCENTES f 20 40 30 90

La proporcin del rea administrativa con respecto a 90 es: 20 P = -------- = 0.22 90

25

Al tomar el estadstico que se obtuvo y multiplicarlo por 100 se obtiene el siguiente porcentaje: % = 0.22 (100) = 22 % El resultado anterior indica que el 22% de los trabajadores considerados en la muestra laboran en el rea administrativa. Calcula los valores de los estadsticos y antalos:

REA ADMINISTRATIVA BIBLIOTECA DOCENTES

ESTADSTICO 22%

La suma de esta columna debe ser 100% o un valor aproximado. 3) En una biblioteca se tienen 2,000 volmenes y se revisa una muestra tomada al azar formada por 130 libros. a) La poblacin es finita ya que est formada por el total de volmenes de la biblioteca que son 2,000. b) Muestra integrada por los 130 libros revisados. c) Parmetro de la poblacin: Comparacin entre los libros revisados y el total de volmenes que en este caso es 130/2000 = 0.065, este valor tambin se puede expresar como porcentaje al multiplicarlo por 100, entonces se tiene que de un total de 2,000 libros se revis el 6.5%. Anteriormente se ha expresado que las caractersticas de una poblacin son los parmetros y las de una muestra estadgrafos o estadsticos, en cada caso se utilizan smbolos que las representen, como ejemplo tenemos:

CARACTERSTIC A MEDIA VARIANZA DESVIACIN ESTNDAR

PARMETR O 2

ESTADGRAFO X s o S s2 o S2

26

Estadstica Descriptiva

QU HE APRENDIDO? Si al contestar lo que se te pide a continuacin tienes dudas, regresa y vuelve a empezar con ms nimo. Adelante. 1)Escribe un enunciado en donde se identifique claramente la poblacin y una muestra de la misma. ________________________________________________________ ____________________________________________________________ _______________ 2)Redacta dos ejemplos en donde no es posible trabajar con la poblacin, pero si con una muestra representativa de cada una de ellas. ________________________________________________________ ____________________________________________________________ _______________ 3) Anota dos caractersticas bsicas de la poblacin finita. ________________________________________________________ ____________________________________________________________ _______________ 4) Escribe 2 caractersticas importantes de la poblacin infinita. ________________________________________________________ ____________________________________________________________ _______________ 5)Da un ejemplo de parmetro y otro de estadstico como en el inciso 3. ________________________________________________________ ____________________________________________________________ _______________

6) Escribe en cada caso si es poblacin finita o infinita: POBLACIN a) Nmero de alumnos de la ENBA,
27

FINITA/INFINITA

considerando a los que pertenecen al Sistema Escolarizado y los del Sistema Abierto y a Distancia. b) Lanzamiento indefinido de 2 dados, anotando la suma de puntos. c) Nmero de nios del mundo. d) Libros de la biblioteca de una escuela. e) Expedientes que se encuentran en trmite en un Archivo. f) Documentos que describen la historia del ser humano en el pasado y en el futuro (considerando que el mundo nunca ser destruido).

7) Arroja 30 veces una moneda, anota el nmero de cara o cruces y contesta: Nmero de caras ____________________ Nmero de cruces ____________________ 8) Contesta las siguientes cuestiones, considerando el enunciado del inciso anterior: a) La poblacin est formada por: ________________________ b) La muestra es: _____________________________________ c) Es finita o infinita la poblacin:_________________________ d) Describe un parmetro. ________________________________________________________ _______ e) Describe un estadstico. ________________________________________________________ _______

28

Estadstica Descriptiva

1.3 VARIABLES
Variable es cualquier unidad, cualidad, operacin o fenmeno que se desee analizar. VARIABLE: FORMA Y TAMAO DE LAS SIGUIENTES FIGURAS

a)

b)

Escribe las caractersticas diferentes de las figuras para cada una de las variables: Variable Caracterstica de a) Caracterstica de b) 1.2.-

Forma de la figura 1.-. Tamao de la 2.figura

Una vez definida la poblacin de inters, el procedimiento para la obtencin de datos indispensables para el uso de mtodos estadsticos se puede dar en dos formas: 1) Recabar informacin de registros como puede ser el nmero de personas que acuden diariamente a una biblioteca o a un archivo. 2) Llevar a cabo una encuesta (cuestionario formado por una serie de preguntas relacionadas lgicamente con un tema central). En ambos casos se obtendrn caractersticas de inters sobre la poblacin con la que se est trabajando, stas reciben el nombre de Variables. VARIABLE (de respuesta). Caracterstica de inters acerca de cada elemento de una poblacin o una muestra representativa que permite ordenar las observaciones e identificar sus diferencias. Son variables la edad de un estudiante, el color de su pelo, la asignatura a la cual pertenece
29

un libro o clasificacin de expedientes segn el tipo de archivo al que pertenecen. Se tienen 2 tipos de variables: CUALITATIVA Y CUANTITATIVA CUALITATIVA se refiere a cualidad. Los datos cualitativos se consideran en categoras o grupos. CUANTITATIVA se refiere a cantidad. Los datos cuantitativos estn representados por un nmero.
TIPOS DE VARIABLES: NOMINAL Variables que no se pueden ordenar CUALITATIVA Describe y clasifica en categoras a los elementos de una muestra o poblacin VARIABLE CUANTITATIVA Permite el conteo o medicin DISCRETA Variables que slo toman valores enteros CONTINUA Variables con valores enteros y/o decimales

ORDINAL Variables que se pueden ordenar

VARIABLE CUALITATIVA O ATRIBUTO. Es el resultado de un proceso que permite describir o formar categoras con los elementos de una poblacin y se divide en Nominal y Ordinal. VARIABLE CUALITATIVA NOMINAL. Cuando los valores de una variable cualitativa permiten nicamente ubicar a cada individuo en una categora y no hay orden entre los valores, por ejemplo si a los alumnos del grupo de Estadstica Descriptiva se les pregunta el nombre de la escuela en donde estudiaron bachillerato, algunas de las posibles respuestas seran: Preparatoria, CCH, Bachilleres. VARIABLE CUALITATIVA ORDINAL. Cuando a los valores de una variable se les puede dar un orden, por ejemplo para conocer el gusto de los alumnos de la ENBA por las Matemticas, se podran considerar las respuestas: Mucho, Regular o Poco, las cuales se pueden ordenar de mayor a menor o viceversa.

30

Estadstica Descriptiva

VARIABLE CUANTITATIVA O NUMRICA. Es el resultado de un proceso que cuantifica, es decir, que cuenta o mide (longitud o peso), a estas variables se les asignan nmeros reales con los cuales tiene sentido efectuar operaciones aritmticas, as es posible compararlas, como ejemplo tenemos el nmero de libros de una materia determinada o nmero de expedientes que tiene un Archivo de Concentracin. Este tipo de variable se divide en Discreta y Continua. VARIABLE CUANTITATIVA DISCRETA. Toma valores enteros, un ejemplo es la cantidad de alumnos que asisten a una conferencia. VARIABLE CUANTITATIVA CONTINUA. Toma valores enteros y decimales, como el peso de cada uno de los trabajadores que laboran en un Archivo. DATO. Valor de la variable asociado a un elemento de la poblacin o muestra. Si la muestra representativa es el grupo de Estadstica Descriptiva y la variable es la edad (cuantitativa discreta si se toman slo los aos cumplidos), se dice que el dato de x estudiante es 23 aos.

QU HE APRENDIDO? Es necesario que respondas lo que se te pide enseguida, si tienes dudas vuelve a iniciar la lectura de este tema. 1) Completa el siguiente cuadro y agrega en cada caso un ejemplo de la variable de que se trata:

CUALITATIVA

VARIABLE CUANTITATIVA

31

2) Identifica en cada caso si se trata de una variable nominal, ordinal, discreta o continua: TIPO DE VARIABLE a) Nombre ________________________ b) Color de cabello ________________________ c) Peso ________________________ d) Color de ojos ________________________ e) Estado civil ________________________ f) Sexo ________________________ g) Profesin ________________________ h) Nmero de alumnos de la ENBA ________________________ i) Nmero de preguntas en un examen

________________________

32

Estadstica Descriptiva

j) Resultado de una encuesta ________________________ k) Nmero de pginas de un expediente

________________________ l) Libros de una biblioteca

________________________ m)Satisfaccin al realizar una investigacin en una biblioteca o archivo ________________________

33

1.4 ESCALAS DE MEDICIN


ESCALA DE 1 EN 1

ESCALA DE 2 EN 2

Escala: Sucesin ordenada de puntos en la que se considera a cada una de las partes del mismo tamao. Medida: Nmero o denominacin que se observacin. Si se obtiene un nmero que capacidades, se llama medicin cuantitativa, y denominacin que slo registra caractersticas, conoce con el nombre de medicin cualitativa. asigna a la unidad de expresa dimensiones o si el resultado es una atributos o actitudes, se

Las variables son conceptos fundamentales para el estudio de los mtodos estadsticos, su clasificacin muestra el nivel de medicin de las caractersticas que pueden ser cuantitativas o cualitativas. Las mediciones cuantitativas son de dimensin o capacidad como: Estatura, peso, volumen, rea, tiempo, longitud, etc. Las mediciones cualitativas se refieren a caractersticas, atributos o actitudes, las cuales no pueden ser representadas numricamente tal es el caso de: Opiniones, formacin de grupos por ingreso familiar, profesin, religin, clasificacin de libros o expedientes por el estado fsico que presentan. En una investigacin, cuando se comparan los valores (o datos) obtenidos, se est realizando un proceso de medicin el cual permite establecer una escala de valores. De acuerdo al tipo de variables se tienen las siguientes escalas: 1.4.1 ESCALA NOMINAL. Cuando a las categoras utilizadas slo se les dan nombres arbitrarios a manera de etiquetas, sin que exista

34

Estadstica Descriptiva

orden o relacin entre ellas, como puede ser agradable o no agradable. En esta escala los datos que son iguales forman una categora y al contarlos se obtiene la frecuencia absoluta o simplemente frecuencia. En esta escala se proporciona informacin sobre la forma en que estn organizadas las categoras, aunque no indica la magnitud de las diferencias entre los nmeros, como en el caso de que en una biblioteca se desee saber con qu material se cuenta en el rea de consulta: Libros, Revistas, Enciclopedias o Folletos. En un archivo podemos investigar el sexo de los investigadores a fin de averiguar si entre ellos hay ms hombres que mujeres, de esta forma tendramos las opciones masculino o femenino. 1.4.2 ESCALA ORDINAL. Las categoras que se construyen pueden ser ordenadas o jerarquizadas, segn el nivel en que se sita una determinada categora con relacin a otra, sin utilizar valores cuantitativos, aunque las variables si se pueden relacionar por medio de los operadores relacionales como son mayor (>), menor(<) o igual(=) o comparar, como ejemplo de esta escala tenemos los resultados de una encuesta en donde se desea conocer la satisfaccin de un usuario, formndose las categoras: Ninguna (N), Regular (R), Buena (B) y Excelente (E). Un archivo puede ser mayor o menor que cualquier otro si tomamos como medida de comparacin una variable determinada. 1.4.3 ESCALA DE INTERVALO. Usa como 0 un valor arbitrario y se utiliza cuando al formar categoras se est en posibilidad no slo de clasificar y ordenar, sino adems de cuantificar las diferencias entre ellas. En este caso se requiere de establecimiento de algn tipo de medida, que puede considerarse como patrn o norma y la aplicacin de este patrn se puede llevar a cabo tantas veces como sea necesario, originando los mismos resultados, los patrones utilizados pueden ser metros, kilos, litros, pesos, etc. Esta escala indica que un individuo u objeto es tantas unidades ms grande o ms pequeo, ms pesado o ms ligero, ms claro o ms obscuro que otro, etc. Un ejemplo de esta escala es la puntuacin obtenida por una persona en un test de inteligencia, en donde el cero no significa que un individuo tenga vaca la cabeza. 1.4.4 ESCALA ABSOLUTA o racional. Las distancias entre puntos en la escala son precisos y conocidos y no existe cero absoluto. En esta escala las unidades son fijas y normalizadas, permitindonos realizar anlisis mucho ms rigurosos y precisos. Ejemplo: Si la biblioteca x tiene un presupuesto para materiales de $4,600, un sistema semejante

35

$800 y otro $650, se puede expresar exactamente y sin dificultad las diferencias en pesos y en porcentajes y definir cmo es un presupuesto con respecto al otro, observemos que en esta escala no se puede cambiar nada, ya que bsicamente se utiliza para conteos.

QU HE APRENDIDO? Ha llegado el momento de hacer una revisin del aprendizaje adquirido. 1) Escribe tu propia definicin de escala. ________________________________________________________ ____________________________________________________________ _______________ 2) Elabora un cuadro que muestre los diferentes tipos de escalas con un ejemplo cada una:

ESCALAS

3) Indica en cada caso el tipo de medicin que se est utilizando (Escalas: Nominal, Ordinal, de Intervalo o Absoluta): a) Se inscriben varios alumnos de la ENBA para participar en un concurso y a cada uno se le entrega un nmero para su participacin. ________________________ b) Al terminar el concurso se informa el resultado y aparece un primer lugar, segundo, etc. Los resultados forman una ESCALA ________________________ c) Si adems a cada participante se le tom el tiempo de exposicin de su proyecto bajo las mismas bases, se puede saber quin es el ms
36

Estadstica Descriptiva

rpido y quin el ms lento. A estos resultados se les puede incluir en una ESCALA ________________________ d) Cmo es la medicin que se hace al anotar si una persona recibe el primer premio, el segundo, etc. ________________________ e) Un Archivista anota el nmero que le corresponde a cada legajo en una muestra especfica .________________________ f) Un Bibliotecario registra el nmero de usuarios que solicitan determinado material para sus investigaciones . ________________________ g) Uso del Sistema Dewey. ________________________ h) Pblico que se presenta en una biblioteca o en un archivo para solicitar informacin. ________________________ i) Comparacin del tipo y cantidad de libros que se encuentran en una biblioteca. ________________________

37

Elabora el Resumen de la Unidad I completando el siguiente mapa conceptual, al final de la gua lo encontrars resuelto, de ser posible, confronta tus respuestas y corrgelas en caso de ser errneas:
ESTADSTICA
Ciencia de la recopilacin, clasificacin, presentacin e interpretacin de datos OBJETO Inferir el comportamiento de una poblacin a travs del anlisis de t

SE CLASIFICA EN

TIENEN COMO BASE UNA POBLACIN QUE ES: MUESTRA REPRESENTATIVA: O UNA PARTE

PUEDE SER: 1) FINITA 2) INFINITA

SUS CARACTERSTICAS SE DENOMINAN VARIABLES Y SON: CUALITATIVA

CUANTITATIVA

CLASIFICNDOSE SEGN LAS SIGUIENTES ESCALAS DE MEDICIN:*

*Escalas de medicin: a) Nominal.- Se utiliza como medida de identificacin con variables nominales. b) Ordinal.- Permite la manipulacin de variables ordinales. c) Intervalo o Absoluta:- Maneja variables cuantitativas.

38

Estadstica Descriptiva

EVALUACIN
Lee cuidadosamente cada inciso y contesta en forma clara y breve lo que se te solicita, ya que esta evaluacin se la debes enviar a tu asesor: 1) Escribe tu propia definicin de Estadstica ________________________________________________________ ____________________________________________________________ ____________________________________________________________ _______________________ 2) Se sabe que cierto Archivo tiene un total de 5,000 expedientes, si a cada uno de ellos se le asigna un nmero para su identificacin, contestar: a) Cuando se habla de 5,000 expedientes en total nos estamos refiriendo a la ________________ b) La escala que se ha utilizado es ______________ ya que ____________________________________________________________ ________ 3) En la biblioteca de una Institucin Educativa se pretende dar plticas durante el perodo intersemestral, al personal docente y administrativo sobre el uso y manejo de sus diferentes servicios, para ello realiza una encuesta con 850 personas para saber su opinin, si 245 estn a favor contestar lo siguiente: a) La poblacin est formada por: b) Es poblacin finita o infinita? c) Cul es la muestra? ________________________ ________________________

________________________

d) Describir un parmetro ________________________________________________________ ____________________________________________________________ ______________ e) Calcular un estadstico

39

________________________________________________________ ____________________________________________________________ _______________ f) Cul consideras que es la variable de inters? ________________________________________________________ ____________________________________________________________ _______________ g) A qu escala pertenece esta variable? Explica tu respuesta ________________________________________________________ ____________________________________________________________ _______________

INSTRUCCIN GENERAL De los siguientes dos ejercicios, resuelve el que corresponda a tu rea, en caso de que as lo desees, puedes resolver ambos. 4) Acude a una biblioteca de tu localidad y pregunta: - Total de libros de la biblioteca - Nmero de volmenes que se tiene para prstamo a domicilio - Volmenes para prstamo en sala - Del total de volmenes para prstamo a domicilio cul es el rea del conocimiento que tiene mayor nmero de libros? - En qu lugar se registra mayor movimiento, en prstamo a domicilio o en consulta en sala? Con la informacin que obtengas contesta lo siguiente: a) Cul es la poblacin? ________________________________________________________ _______ b) Se trata de una poblacin finita o infinita? ________________________________________________________ _______ c) Anota como mnimo 3 diferentes muestras que puedes formar considerando el total de libros:

40

Estadstica Descriptiva

________________________________________________________ _______ d) Efecta los clculos necesarios para encontrar la proporcin que existe entre los libros que se prestan y el total de libros, anota el resultado y expresa si se trata de un parmetro o de un estadstico. ________________________________________________________ _______ d) Calcula la proporcin de ejemplares de la asignatura que ms se presta con respecto a los libros que se prestan a domicilio e indica si se trata de un parmetro o de un estadstico. ________________________________________________________ _______ 5) Investiga en un Archivo de Trmite (Oficina de Gobierno Administrativa, Archivo Estatal, Municipal o de la Localidad):
-Total de expedientes que maneja el Archivo -Promedio de documentos que entran diariamente -Promedio de documentos que salen diariamente -Qu da de la semana se recibe ms correspondencia y qu da menos y preguntar el promedio en cada caso -Nmero de expedientes que son susceptibles de ser prestados para su consulta

Con la informacin que obtengas contesta lo siguiente: a) Cul es la poblacin? ________________________________________________________ _______ b) Se trata de una poblacin finita o infinita? ________________________________________________________ _______ c) Anota como mnimo 3 diferentes muestras que puedes formar en el Archivo al que acudiste: ________________________________________________________ _______ d) Calcular la proporcin entre el nmero de expedientes susceptibles de ser prestados para su consulta y el total de expedientes con que cuenta el archivo, indica si se trata de un parmetro o de un estadstico:

41

________________________________________________________ _______ e) Calcula un estadstico de la informacin obtenida: ________________________________________________________ _______

ENVA A TU ASESOR

Felicidades, has logrado un importante avance.

42

Estadstica Descriptiva

UNIDAD 2 PRESENTACIN DE DATOS

Una vez que se tiene una muestra aleatoria de tamao n de la poblacin de inters, los datos considerados deben ser ordenados y presentados en tablas de distribucin que pueden ser simples, cuando se habla de datos cualitativos o de una poblacin o muestra pequea, o para datos agrupados cuando se tiene una poblacin o muestra grande. Los datos presentados en una tabla permiten observar claramente la naturaleza y comportamiento de la informacin sobre la cual se tiene inters. QU VOY A APRENDER EN ESTA UNIDAD? A organizar, manejar y presentar los datos obtenidos a travs de una investigacin en una Tabla de Distribucin de frecuencia simple o para datos agrupados que te faciliten identificar el comportamiento de una variable. Antes de iniciar esta unidad realiza las siguientes actividades diagnsticas.

39

DIAGNSTICO 1) Escribe los primeros conceptos de Estadstica que te quedan claros. ________________________________________________________ ____________________________________________________________ _______________ 2) Si al ir a comprar un libro te informan que su costo es de $120.00 pero que tiene un descuento del 15%, cunto vas a pagar? __________________. Describe el procedimiento que realizaste para su clculo. ________________________________________________________ _______ 3) Ahora, supongamos que otro libro cuesta $150.00 ms el 15% de IVA cunto pagaras por l? ___________________. 4) Ordena en forma ascendente y descendente los siguientes nmeros 8, 7, 1, 4, 10, 2 ASCENDENTE:____________________________________________ ______ DESCENDENTE:__________________________________________ _______

Es muy importante que no olvides lo que vas aprendiendo en cada unidad, por ello en la pregunta 1 del diagnstico se te solicita que anotes los conceptos estadsticos que consideras ms importantes, si no los recuerdas repasa tu resumen y contesta en forma correcta. No olvides que la constancia en el estudio da sus frutos al alcanzar una meta.

40

Estadstica Descriptiva

En las preguntas 2 y 3 tuviste que haber realizado clculos para encontrar los porcentajes que se te solicitan, si tus respuestas son $102.00 y $172.50 respectivamente puedes continuar, si no fue as lee con atencin lo siguiente: Recordemos que el porcentaje de un nmero es igual al mismo nmero dividido entre 100, esto es: 5 5% =------ = .05 100 9 9% =------ = .09 100 10 10% = ---- = .10 100 y en general si a es cualquier nmero a a% =-------100

Si utilizamos esta sencilla regla para el clculo del 15% de $120.00 entonces tenemos que multiplicar 120 por .15 y obtenemos 18 que se resta a 120 porque se trata de un descuento, el resultado es $102.00 a pagar por el libro. De igual forma se calcula el 15% de $150.00 que es 22.5 el cual se suma al costo dando un total de $172.50, ya que se trata de un cargo al costo. Finalmente, en la ordenacin de nmeros te habrs dado cuenta que cuando se te solicita orden ascendente escribes el nmero menor y continas escribiendo los restantes hasta llegar al nmero ms grande y la numeracin en forma descendente se obtiene iniciando con el mayor y terminando con el menor. Bien, ya ests listo para continuar? Adelante.

41

2.1 TIPOS DE DATOS


En el desarrollo de este tema, consideramos 3 tipos de datos: Categricos, Ordenados por rango y Mtricos. Con el propsito de entender su utilidad, para cada uno de ellos elaboraremos una tabla o cuadro estadstico colocando en la primera columna las diferentes categoras que se forman al tomar en cuenta al total de datos, sin que se repita ninguna y, en otra columna el nmero de elementos que pertenecen a cada categora.
TABLA O CUADRO ESTADSTICO CATEGORAS frecuencias absolutas o frecuencias (f) A nmero de datos que caen en esta categora B TOTALES suma de todas las frecuencias

2.1.1 DATOS CATEGRICOS. Agrupan a los individuos en categoras, contando el nmero de sujetos que pertenecen a cada una. El nmero que indica cuntos elementos tiene una categora recibe el nombre de frecuencia absoluta o simplemente frecuencia y se denota con la letra efe minscula f. Al realizar el conteo cada sujeto debe adaptarse exactamente a una categora. Supongamos que en cierta rea existen 33 bibliotecas, las cuales se pueden agrupar por categoras obtenindose la tabla siguiente:
BIBLIOTECAS DEL REA Y TIPO DE BIBLIOTECAS NMERO (f) ACADMICAS 2 Categoras PUBLICAS 8 categora ESCOLARES 20 ESPECIALIZADAS 3 Total: 33

frecuencia de cada

En este cuadro aparece la variable nominal tipo de bibliotecas con las categoras: Acadmicas, Pblicas, Escolares y Especializadas; en la segunda columna estn sus frecuencias respectivas.

42

Estadstica Descriptiva

Si se trata de Archivos, tambin se puede elaborar un cuadro con datos categricos. Tomemos como ejemplo una Secretara de Estado.
SECRETARA DE ESTADO X TIPO DE ARCHIVO NM. DE EXPEDIENTES TRMITE 25 CONCENTRACIN 4 HISTRICO 1 Total: 30

2.1.2 DATOS ORDENADOS POR RANGO. Establecen un orden entre categoras y son utilizados para comparar. Considerando la tabla que muestra las diferentes bibliotecas en una rea, es fcil comparar la categora de Bibliotecas Acadmicas con la de Bibliotecas Escolares, de acuerdo a las frecuencias de cada una de ellas se puede asegurar que es mayor el nmero de Escolares que de Acadmicas.
BIBLIOTECAS DEL REA Y TIPO DE BIBLIOTECAS NUMERO ACADMICAS 2 PUBLICAS 8 ESCOLARES 20 ESPECIALIZADAS 3 Total: 33

Otro ejemplo en donde se puede utilizar la ordenacin por rango es en la edicin de libros en donde las categoras son las fechas de edicin:
BIBLIOTECA X FECHA DE EDICIN ENERO 1991 JUNIO 1991 FEBRERO 1992 AGOSTO 1992 Total:

NMERO 23 10 21 3 57

2.1.3 DATOS MTRICOS. Permiten la introduccin de medidas, lo cual facilita la comparacin de los datos obtenidos.

43

Si consideramos nuevamente la edicin de libros y asignamos unidades (aos) con intervalos iguales, se pueden efectuar operaciones aritmticas:
BIBLIOTECA X AO DE EDICIN 1991 1992 Total:

NMERO 33 24 57

Con esta informacin se puede establecer la comparacin entre los dos aos de edicin que aparecen en la tabla. Es posible efectuar esta misma comparacin si se consideran los documentos de un archivo con respecto al ao de su elaboracin.

QU HE APRENDIDO? 1) Haz un cuadro que muestre los diferentes tipos de datos anotando adems, un ejemplo de cada uno.

TIPOS DE DATOS

2) Al investigar en una biblioteca escolar el sexo de usuarios que solicitan prstamo a domicilio, a fin de conocer los elementos que forman cada categora se encontr:
BIBLIOTECA X PRSTAMO A DOMICILIO NMERO

44

Estadstica Descriptiva
HOMBRES MUJERES Total: 210 198 408

En cada uno de los incisos escribe el tipo de dato que se est utilizando y que pueden ser categricos, ordenado por rango o mtrico. a) Los datos ___________________ son de tipo __________________porque

b) Al comparar el nmero de hombres y mujeres se estn manejando los datos tipo ________________. c) Si se considerara el servicio de prstamo a domicilio mensual se estara trabajando con datos ________________.

45

2.2 DISTRIBUCIN DE FRECUENCIAS

6 3

1 1, 2, 3, 4, 5, 6 2 5

Datos sin organizar

Datos organizados

Una vez que se ha recopilado informacin ya sea por medio de una encuesta o a travs de una investigacin, sobre una poblacin y decidido trabajar con ella si es pequea o con una muestra representativa si es muy grande, se obtiene un arreglo de datos en desorden que no es de gran utilidad para conocer el comportamiento de la informacin, lo cual provoca la necesidad de elaborar tablas de distribucin de frecuencias. Iniciaremos la explicacin de dichas tablas con un ejemplo muy sencillo: El Departamento de Control Escolar informa que el nmero de alumnos de la Escuela Nacional de Biblioteconoma durante el semestre 97I es de 621 de los cuales 270 pertenecen a Archivonoma y el resto a Biblioteconoma. Con este enunciado es muy difcil analizar y comparar los elementos que pertenecen a cada categora, sin embargo, si elaboramos una tabla de distribucin de frecuencia simple veremos que es fcil identificar las categoras y sus frecuencias respectivas:
TABLA DE DISTRIBUCIN DE FRECUENCIA SIMPLE Ttulo Perodo Encabezados cuerpo Final ALUMNOS DE LA ENBA Semestre 97-I CARRERA NM.DE ALUMNOS (X) (f) ARCHIVONOMA 270 BIBLIOTECONOMA 351 Total: 621

Fuente: Informacin proporcionada por la Subdireccin de Planeacin y Evaluacin de la ENBA a travs de su Departamento de Control Escolar el 28 de abril de 1997. Pie: Slo se ha considerado el total de alumnos en el Sistema Escolarizado.

46

Estadstica Descriptiva

Las tablas de distribucin de frecuencias o tabla de frecuencias permiten estructurar y ordenar la informacin, para que su contenido sea lo ms claro posible siempre se debe incluir: Ttulo. Describe la informacin ms importante del problema. Fecha o Perodo de tiempo en que se realiz la investigacin. Encabezado. Informa el contenido de cada columna. Cuerpo. Agrupa la informacin en categoras con sus frecuencias respectivas. Final. Registra los totales de las columnas numricas. Fuente. Se debe especificar cmo, cundo, quin y dnde se tomaron los datos. Pie. Contiene observaciones. (En algunos casos no existe).

Una vez que ya identificamos las partes que forman una tabla de distribucin de frecuencias, conozcamos los diferentes tipos de distribuciones de acuerdo a la variable que se est manejando.

2.2.1 SIMPLES
DISTRIBUCIN NOMINALES DE FRECUENCIAS SIMPLES PARA DATOS

Esta tabla de distribucin es til cuando se trata de una variable de tipo nominal. 1) Al grupo 6101 formado por 21 alumnos de la carrera de Archivonoma en la ENBA se le pregunt cul es la materia de su preferencia de Estadstica Descriptiva (ED), Ingls (I) o Computacin (C), siendo las respuestas: ED, I, ED, I, C,C,C, I, ED, I, C,C,C, I, C,C,C,C,C, I, C. Con esta informacin elaboraremos un tabla de distribucin de frecuencias simple que muestre los datos de la variable nominal Materia de preferencia.

47

MATERIAS DE PREFERENCIA DE LOS ALUMNOS DE ARCHIVONOMA DE LA ENBA GRUPO 6101 -SEMESTRE 97-1

ASIGNATURA NMERO DE ALUMNOS ESTADSTICA 3 DESCRIPTIVA INGLS 6 COMPUTACIN 12 TOTAL: 21 Fuente: Encuesta realizada por la Coordinacin de la Carrera de Archivonoma al grupo 6101 en junio de 1997. Observaciones: Slo se consider al turno matutino y a los Alumnos inscritos en el Sistema Escolarizado.

Las tablas de distribucin permiten manejar la informacin ms fcilmente, con los datos del cuadro anterior calcularemos algo tan importante como lo es la proporcin en porcentaje de cada categora con respecto a la muestra: a) El porcentaje de alumnos que prefieren Estadstica Descriptiva es: f 3 % = -------- (100) = ------- (100) = 14.28% n 21 b) El porcentaje de alumnos que prefieren Ingls es: f 6 % = -------- (100) = ------- (100) = 28.57% n 21 c) El nmero de alumnos que prefiere Computacin representa un porcentaje de: f 12 % = -------- (100) = ------- (100) = 57.14% n 21 Estos clculos se pueden agregar en la tabla de distribucin teniendo como encabezado frecuencia relativa o fr:

48

Estadstica Descriptiva
MATERIAS DE PREFERENCIA DE LOS ALUMNOS DE ARCHIVONOMA DE LA ENBA GRUPO 6101 SEMESTRE 97-1 ASIGNATURA NMERO DE ALUMNOS fr (%) ESTADSTICA 3 14.28 DESCRIPTIVA INGLS 6 28.57 COMPUTACIN 12 57.14 TOTAL: 21 99.99 Fuente: Encuesta realizada por la Coordinacin de la Carrera de Archivonoma al grupo 6101 en junio de 1997. Observaciones: Slo se consider al turno matutino y a los alumnos inscritos en el Sistema Escolarizado.

La tabla de distribucin de frecuencias simple no sera de gran utilidad si slo se llegara hasta aqu, su importancia radica en que permite analizar la informacin que contiene, como por ejemplo comparar las frecuencias entre las categoras, lo que recibe el nombre de razn que es un cociente en donde se comparan dos cantidades que se encuentran en las mismas unidades.

LECTURA 1 Con el propsito de que conozcas un poco ms sobre la proporcin adems de saber cmo y para qu se calculan la razn y las tasas, te sugiero leas la primera lectura que se encuentra al final de esta gua, escrita por Ray I. Carpenter y que forma parte del libro Mtodos Estadsticos para Bibliotecarios. (pginas de la 25 a la 30). Se hace hincapi en que estos conceptos tambin son de vital importancia para los Archivnomos, como lo veremos ms adelante con ejemplos. Para la mejor comprensin de la lectura subraya los conceptos ms importantes, realiza anotaciones al margen, busca las palabras desconocidas en el diccionario y elabora un resumen que te permita confrontar el desarrollo del tema. Despus de leer regresa para continuar con ms nimo.

49

Una vez realizada tu lectura reforzaremos con ejemplos su aprendizaje. Consideremos los datos de la tabla construida antes de la lectura.

ASIGNATURA ESTADSTICA DESCRIPTIVA INGLS COMPUTACIN TOTAL:

NMERO DE ALUMNOS 3 6 12 21

fr (%) 14.28 28.57 57.14 99.99

Si el nmero de alumnos que prefiere Estadstica Descriptiva es 3 y los que prefieren Ingls son 6, cul es la razn entre los alumnos que tienen estas preferencias?: frecuencia de Estadstica Descriptiva Razn = ---------------------------------------------frecuencia de Ingls 3 1 Razn = -------- = -----6 2 Conclusin: Por cada alumno que prefiere Estadstica Descriptiva existen 2 que prefieren Ingls, esto es, la preferencia es 1 a 2. Veamos la razn que existe entre los alumnos que prefieren Computacin con los que prefieren Estadstica Descriptiva: frecuencia de Computacin Razn = ---------------------------------------------frecuencia de Estadstica Descriptiva

Razn = ----------- = -------Conclusin: ________________________________________________________ ____________________________________________________________ _______________

50

Estadstica Descriptiva

2) Observa la informacin que aparece en la siguiente tabla:


ALUMNOS INSCRITOS EN BIBLIOTECONOMA POR SEXO Semestre 97-I SEXO NM.DE ALUMNOS (X) (f) HOMBRES 288 MUJERES 144 Total: 432

f1 es la frecuencia de una categora y f2 de otra diferente. f1 Razn = ------f2 Si consideramos a f1 como la frecuencia de la categora de hombres entonces f1=288 y similarmente si tomamos a f2 como la frecuencia de la categora de mujeres f2=144. Al comparar el nmero de hombres con el nmero de mujeres que estudian la carrera de Biblioteconoma: 288 Razn = --------144 Como 288 es el doble de 144 entonces: 288 2 Razn= ------------- = ---144 1 Conclusin: La razn indica que por cada 2 hombres hay 1 mujer o viceversa que por cada mujer hay 2 hombres. 3) Con la informacin que se te muestra contesta lo que se te pide:
SECRETARA DE ESTADO X TIPO DE ARCHIVO NM. DE EXPEDIENTES TRMITE 25 CONCENTRACIN 4 HISTRICO 50 Total: 79

a) Cul es la razn entre los expedientes en trmite y los que se encuentran en el Archivo Histrico: Razn = ---------

51

Conclusin:_______________________________________________ ____________________________________________________________ _______________ b) Calcula la proporcin de expedientes en trmite con respecto al total. ________________________________________________________ ____________________________________________________________ _______________ c) Escribe la proporcin anterior en forma de porcentaje. ________________________________________________________ ____________________________________________________________ _______________ Ahora que ya hemos entendido el concepto de razn continuaremos con un ejemplo en donde se utiliza la tasa de cambio. 4) Si en la biblioteca de la escuela haba 456 libros al inicio de un perodo escolar y al finalizar el mismo este nmero disminuy a 422 cul es la tasa de cambio de libros extraviados? En la lectura se nos indic que la forma de calcular la tasa de cambio es la siguiente: Valor final - Valor inicial Numerador Tasa de cambio = --------------------------------------- = -------------------Valor inicial Denominador En el numerador se escribe la diferencia entre el valor inicial del perodo y el valor final del mismo: 422 - 456= -34
Nota: Si la cantidad que se obtiene es negativa representa una disminucin y si es positiva se trata de un incremento.

En el denominador se escribe el valor de la variable al principio del perodo: 456 -34 Tasa de cambio = --------- = -0.074 = -7.4% 456

52

Estadstica Descriptiva

Como el resultado es negativo se obtiene la siguiente conclusin: Durante el perodo escolar considerado el acervo ha disminuido en un 7.4%.
5)Si en el ao de 1990 en un Archivo existan 256,000 expedientes y en 1996 se increment este nmero a 321,000 cul es la tasa de cambio en el perodo de 6 aos? 321,000 - 256,000 65,000 Tasa de cambio = -------------------------- = -------------------=.2539 =25.39% 256,000 256,000

Conclusin: El Archivo increment su nmero de expedientes en 65,000, lo cual da como resultado un crecimiento del 25.39% en un perodo de 6 aos.

QU HE APRENDIDO? Para poder continuar se requiere que contestes correctamente lo que se solicita en cada inciso: 1) De acuerdo a la lectura la razn es til para__________________________ _______________________________________________________________ _____ 2) La tasa de cambio, permite______________________________________ _______________________________________________________________ _____ 3) En una biblioteca se tienen 2,340 libros para prstamo a domicilio y 780 para consulta interna. Con esta informacin identifica en cada caso si se tiene que calcular una razn, proporcin o tasa de cambio. a) A fin de establecer la relacin que existe entre los libros para prstamo a domicilio con los de consulta interna. ___________________________________________________________ ____

53

b) Para conocer cuntos libros existen en una categora con respecto a la otra. ___________________________________________________________ ____ c) Con el objeto de calcular el incremento de libros durante los ltimos dos aos. ________________________________________________________ _______

4) Pregunta a 15 personas su grado mximo de estudios y con las respuestas elabora una tabla de distribucin simple.

DISTRIBUCIN ORDINALES

DE

FRECUENCIAS

SIMPLES

DE

DATOS

Las categoras utilizadas deben tener un orden al ir construyendo la distribucin de frecuencias, algunos autores consideran el orden de menor a mayor (ascendente) y otros por el contrario ordenan los datos de mayor a menor (descendente). En esta gua se utilizar el orden ascendente. 6) Un ejemplo que se puede presentar es el hecho de conocer la satisfaccin de los usuarios en relacin con los servicios que presta al pblico ya sea una Biblioteca o un Archivo, en cuyo caso lo ms conveniente es tomar una muestra que represente al total de la poblacin y realizar una encuesta, supongamos que los resultados de la misma son: Ninguna = 20, Regular = 30, Buena = 15 y Excelente = 18. Con estos datos ya se est en posibilidad de elaborar una Tabla de Distribucin de Frecuencias Simple que muestre claramente la informacin obtenida, ya sea desde su valor ms pequeo hasta el ms alto o viceversa como se ilustra en las dos tablas siguientes:
Orden ascendente ENCUESTA PARA CONOCER LA SATISFACCIN DEL USO DE SERVICIOS SATISFACCIN No. DE USUARIOS NINGUNA 20 REGULAR 30 BUENA 15 EXCELENTE 18 TOTAL 83

54

Estadstica Descriptiva

Orden descendente ENCUESTA PARA CONOCER LA SATISFACCIN DEL USO DE SERVICIOS SATISFACCIN No. DE USUARIOS EXCELENTE 18 BUENA 15 REGULAR 30 NINGUNA 20 TOTAL 83

QU HE APRENDIDO? 1) Escribe la diferencia que existe entre la tabla de distribucin de frecuencias simples para datos ordinales y la de datos nominales. ________________________________________________________ ____________________________________________________________ _______________ 2) Elabora una tabla de distribucin de frecuencia simple con todos sus elementos, considerando la informacin que obtengas al preguntar a 15 de tus compaeros si les gustan las Matemticas, utilizando para ello las categoras: Nada, Poco, Regular y Mucho.

3) Calcula la proporcin que existe entre las personas a quienes les gusta mucho Matemticas y a las que no les gusta. ________________________________________________________ ____________________________________________________________ _______________

DISTRIBUCIN DE FRECUENCIA SIMPLE DE DATOS CONTINUOS O DISCRETOS

55

Cuando se tiene un nmero pequeo de observaciones representadas por nmeros continuos o discretos, se construye una tabla parecida a las dos explicadas anteriormente, escribiendo en la primera columna la variable y en la segunda la frecuencia con que aparecen los datos. Como ejemplo usaremos las calificaciones de Cmputo obtenidas por 25 alumnos y que son: 3 alumnos obtuvieron cinco, 5 alumnos seis, 6 alumnos siete, 5 alumnos ocho, 3 alumnos nueve y 3 alumnos diez.
CALIFICACIONES DEL GRUPO 337 PRIMER PARCIAL DE CMPUTO SEMESTRE 97-I CALIFICACIN No. DE ALUMNOS (X) (f) 5 3 6 5 7 6 8 5 9 3 10 3 TOTAL 25 Fuente: Lista del grupo 337 proporcionada por el Profesor de la Materia.

QU HE APRENDIDO? Observa la tabla que se acaba de construir y contesta: 1) En este caso la primera columna contiene ___________ que representan a la variable cuantitativa. 2) Existe alguna diferencia entre esta tabla y las dos construidas anteriormente? Explica tu respuesta:______________________________________ ____________________________________________________________ ________ 3) La distancia que recorren tus compaeros en metros de sus respectivas casas al trabajo podran proporcionarte informacin para

56

Estadstica Descriptiva

construir una tabla para datos continuos o discretos? Explica tu respuesta:____________________________ ____________________________________________________________ ________ 4) Qu categoras te gustara considerar en el inciso 3? ____________________________________________________________ ____________________________________________________________ ________________

57

2.2.2 PARA DATOS AGRUPADOS


DISTRIBUCIN DE FRECUENCIAS AGRUPADAS DE DATOS POR INTERVALOS Cuando se tiene una gran cantidad de datos numricos, la distribucin de frecuencia simple resulta larga y difcil de leer, por ello, se recomienda agruparlos en categoras llamadas intervalos de clase, y elaborar tablas que muestren la informacin en una forma ms eficiente que permita averiguar rpidamente su comportamiento, sin embargo, al considerar intervalos de clase se tiene la desventaja de perder el valor original e individual de cada uno de los datos. Antes de iniciar con la construccin de una tabla de distribucin de frecuencia de este tipo, mostraremos el contenido de las columnas bsicas que la forman:

CLASES o INTERVALOS f Mc Lmite inferior-Lmite superior frecuenci Marca de clase o o Frontera inf.- Frontera sup. a de Punto medio cada clase

La siguiente grfica te permitir visualizar la frecuencia, el nmero de intervalos, la amplitud y la marca de clase:
Nmero de intervalos= nmero de barras=K= 5 Amplitud = ancho de cada columna= A (todas tienen la misma amplitud) Frecuencia= Frecuencia de clase = f Es la altura de cada barra
25 35 45 55 65

15 10 5 0

Marca de clase= Mc Punto medio de cada barra

Cada una de las clases o intervalos se encuentra formada por dos lmites llamados aparentes que son el lmite inferior(o frontera inferior) y el lmite superior (o frontera superior), es necesario calcular el nmero de intervalos al cual llamaremos K, con la nica condicin de que todos los datos queden incluidos en los intervalos considerados; la distancia entre los
58

lmites inferior y superior de un intervalo recibe el nombre de amplitud y se denota con la letra A. La frecuencia de cada clase (f) se obtiene al contar el nmero de datos que caen dentro de cada intervalo. La marca de clase o punto medio (Mc) es el nmero que se obtiene al dividir la suma de los lmites inferior y superior entre dos, dando como resultado un valor que se encuentra a la mitad de los lmites considerados. 7) Apoyados por estos conceptos procedamos a la elaboracin de una tabla de distribucin de frecuencia agrupada por intervalos tomando los datos de un Archivo en donde se quiere conocer el promedio de expedientes que se presta, considerando una muestra de 50 das al azar. El nmero de libros o expedientes prestados durante los 50 das considerados son:
61 64 62 60 65 50 54 57 63 56 65 65 75 56 57 70 67 53 53 58 45 48 58 61 55 60 64 59 62 51 80 56 56 69 43 65 60 54 70 79 60 61 67 44 72 65 62 68 47 48

Esta informacin la proporcion el encargado del Departamento de Control Escolar.

Primero se ordenan los datos de menor a mayor.


43 44 45 47 48 48 50 51 53 53 54 54 55 56 56 56 56 57 57 58 58 59 60 60 60 60 61 61 61 62 62 62 63 64 64 65 65 65 65 65 67 67 68 69 70 70 72 75 79 80

58

Estadstica Descriptiva

Notemos que el dato mayor es 80 y el menor 43 y que es fcil ubicarlo slo despus de haber ordenado en forma ascendente a todos los elementos de la muestra. En Estadstica se acostumbra utilizar la letra equis mayscula X para que represente a un dato, por lo que una vez ordenados se determina el recorrido o rango, es decir, la diferencia entre el dato mayor y el menor; utilizando la letra X para representar a estos dos datos se tiene lo siguiente:
Rango o Recorrido = R R = X mxima - X mnima R = X mx - X mn R = 80 - 43 = 37

Como siguiente paso se calcula el nmero de intervalos, donde intervalo es cada una de las partes iguales en que se divide el rango. No olvidemos que cada intervalo est formado por lmites superior e inferior en la columna de clases y se representa con la letra K. K= nmero de intervalos El nmero de intervalos en una tabla de distribucin para datos agrupados no debe ser muy grande ni muy pequea sino suficiente para contener toda la informacin. El autor Howard B. Christensen en su libro Estadstica Paso a Paso sugiere una regla llamada de Sturges para establecer el nmero de intervalos de acuerdo con el nmero de datos:
Nmero de valores en el conjunto 10 a 100 100 a 1000 1000 a 10000 Nmero apropiado de intervalos 4a8 8 a 11 11 a 14

Para calcular el nmero de intervalos de una tabla de distribucin para datos agrupados, se puede utilizar nuevamente la Regla de Sturges que indica que K= 1+ 3.322 x log (n) donde:
n es el tamao de la muestra 1 y 3.322 son dos valores constantes que nunca cambian log (n) es el logaritmo de n

En el ejemplo que nos ocupa tenemos que n=50, obteniendo en la calculadora el valor que le corresponde al log(50) se tiene que es 1.69.

59

Sustituyendo estos valores en la frmula: K = l + 3.322 x (1.69) Al resolver primero se multiplica 3.322 por el resultado del logaritmo y al valor que se obtiene se le suma 1, con lo cual K = 1 + 3.322 x (1.69) =1 + 5.64 = 6.64. Como el nmero de intervalos debe ser entero porque representa al nmero de barras en una grfica como la que aparece al inicio de esta unidad, se debe redondear de la siguiente manera: Si el primer dgito decimal es mayor o igual que .5 entonces K ser igual al valor entero siguiente, si por el contrario el dgito decimal es menor que .5 entonces K tendr el valor del entero anterior, por ejemplo si se obtiene 5.8 K=6 y si se tiene 7.2 entonces K=7. En este caso K=7 porque el valor obtenido fue 6.64. Es importante hacer notar que esta Regla no es infalible y que si en un momento dado se quiere considerar otro nmero de intervalos diferente al obtenido, se puede hacer, con la nica condicin de que todos los datos de la muestra queden contenidos en los intervalos. Despus de obtener K, se calcula la amplitud de los intervalos realizando la divisin del rango entre el nmero de intervalos de la siguiente manera: R A= --------K 37 A= ------- = 5.2 7 La amplitud tambin es un nmero entero por lo que A se redondea a 5. Hasta ahora hemos obtenido R= 37, K=7 y A=5, con esta informacin ya estamos preparados para construir la tabla de distribucin. Adelante! Escribimos como primer encabezado CLASES y anotamos como primer lmite inferior el valor ms pequeo o si desea un valor cercano como puede ser 40, 41 42; en este caso, consideraremos al 43 que es el dato menor, para encontrar el segundo lmite inferior se le suma la amplitud que es 5 y as sucesivamente hasta tener 7 intervalos que es el valor de K.

60

Estadstica Descriptiva

A=5
CLASES 43 48 53 58 63 68 73 1) 2) 3) K 4) 5) 6) 7)

+5= +5=

Nmero de clases o intervalos =

K=7

Para realizar el clculo de los lmites superiores o fronteras superiores, se procede de la siguiente manera: Al primer lmite inferior se le suma lo que vale la amplitud menos 1, esto es, 4 y el resultado es el primer lmite superior, de esta forma se contina hasta completar los 7 intervalos considerados en este caso: Lmites aparentes:
lmite inferior lmite inferior CLASES 43- 47 48- 52 53- 57 58- 62 63- 67 68- 72 73- 77 lmite superior lmite superior

A los lmites o fronteras inferior y superior que acabamos de encontrar se les llama lmites aparentes, existen otros lmites que no aparecen en la tabla pero que tambin es necesario que conozcas, son los lmites reales, tambin llamados verdaderos, los cuales se calculan muy fcilmente:

a) A cada lmite inferior se le resta .5 y se obtienen los lmites reales o verdaderos. b) Se agrega .5 a cada lmite superior para obtener el lmite superior real o verdadero de cada clase.
lmite inferior aparente 43 48 53 58 63 68 73 lmite inferior real o verdadero 42.5 47.5 52.5 57.5 62.5 67.5 72.5 lmite superior aparente 47 52 57 62 67 72 77 lmite superior real o verdadero 47.5 52.5 57.5 62.5 67.5 72.5 77.5

61

Lmites reales o verdaderos:


lmite inferior real o verdadero 42.5 47.5 52.5 57.5 62.5 67.5 72.5 lmite superior real o verdadero 47.5 52.5 57.5 62.5 67.5 72.5 77.5

Como vers, para construir la columna de las clases o intervalos de clase se utilizaron Rango (R), nmero de intervalos (K) y amplitud (A). Para llenar la columna de frecuencias absolutas o simplemente f, se maneja la lista ordenada de los datos, contando el nmero de los que caen dentro de cada intervalo, por ejemplo en el primer intervalo 43-43 caen: 43, 44, 45, 47, lo cual significa que tiene frecuencia 4. En esta forma se contina hasta tener el total de datos incluidos en los intervalos. Para verificar que el conteo fue correcto, se suman todas las frecuencias y su resultado debe ser el tamao de la muestra que en este caso es 50.
CLASES 43- 47 48- 52 53- 57 58- 62 63- 67 68- 72 73- 77 TOTAL: f 4 4 11 13 10 5 3 50

Al tener datos agrupados se pierde la individualidad de cada uno, es por esta razn que se calcula el punto medio o marca de clase, el cual representa a todos los datos que caen en cada uno de los intervalos. La marca de clase se calcula en cada intervalo sumando sus lmites y dividiendo entre 2: lmite inferior + lmite superior Mc = ---------------------------------------2

62

Estadstica Descriptiva
CLASES 43- 47 48- 52 53- 57 58- 62 63- 67 68- 72 73- 77 TOTAL: f 4 4 11 13 10 5 3 50 Mc 45 50 55 60 65 70 75

Esta es la tabla de distribucin de frecuencia agrupada de datos por intervalos.

Existen algunas consideraciones sobre la elaboracin de una tabla de este tipo: 1.- Se sugiere que la amplitud de los intervalos sea impar como en este caso, ya que de esta forma, se asegura que el punto medio sea entero, en caso contrario se tendrn decimales. 2.- No es necesario utilizar la Regla de Sturges para el clculo de K, t puedes manejar el nmero de intervalos que consideres suficientes. 3.- La marca de clase o punto medio representan al nmero total de datos que caen en cada intervalo. A esta tabla se le pueden agregar ms columnas como las siguientes:

CLASES 43- 47 48- 52 53- 57 58- 62 63- 67 68- 72 73- 77 TOTAL:

f 4 4 11 13 10 5 3 50

Mc 45 50 55 60 65 70 75

fa

fr

far

La columna de fa o frecuencias acumuladas tiene como primer dato el que aparece en la columna f que es 4, se le suma la siguiente frecuencia que tambin es 4 y se obtiene 8 que es el nmero que aparece en el siguiente rengln y as hasta terminar con todas las frecuencias:

63

f 4 4 11 13 10 5 3

fa 4 8 19 32 42 47 50

La ltima frecuencia acumulada (fa) es el tamao de la muestra.

La columna de frecuencia acumulada es sumamente importante, para entenderla mejor regresemos a la lista ordenada de datos y coloquemos a cada uno de ellos el nmero que le corresponde por su posicin ordenada.
1.- 43 2.- 44 3.- 45 4.- 47 5.- 48 6.- 48 7.- 50 8.- 51 9.- 53 10.- 53 11.-54 12.- 54 13.-55 14.-56 15.-56 16.-56 17.-56 18.-57 19.-57 20.-58 21.- 58 22.-59 23.- 60 24.- 60 25.- 60 26.- 60 27.- 61 28.- 61 29.- 61 30.- 62 31.- 62 32.- 62 33.- 63 34.- 64 35.- 64 36.- 65 37.- 65 38.- 65 39.- 65 40.- 65 41.- 67 42.- 67 43.- 68 44.- 69 45.- 70 46.- 70 47.- 72 48.- 75 49.- 79 50.- 80

Con la informacin de la columna fa se puede ubicar en un intervalo desde el primer nmero que cae hasta el ltimo segn su posicin en la lista ordenada en forma ascendente.

CLASES 43- 47 48- 52 53- 57 58- 62 63- 67 68- 72 73- 77

fa 4 8 19 32 42 47 50

La columna fa indica que los primeros 4 datos caen en este intervalo En esta clase caen desde el dato que ocupa el 5o. lugar hasta el 8vo. Aqu caen los datos desde el lugar 9o. hasta el 19vo.

De esta forma la columna de frecuencias acumuladas nos proporciona informacin sobre los datos que caen en determinado intervalo de clase, por ejemplo para saber en qu intervalo cae el dato que ocupa el lugar 30, lo buscamos en fa y aseguramos que cae en el intervalo 58-62 ya que ste contiene a los datos que ocupan desde el lugar 20 hasta el lugar 32.

64

Estadstica Descriptiva

La columna fr es la frecuencia relativa de cada intervalo, se calcula en cada intervalo dividiendo su frecuencia entre el tamao de la muestra, obtenindose una razn que se puede escribir de tres formas diferentes.

f 4 4 11 13 10 5 3 50

fr (fraccin) 4/50 4/50 11/50 13/50 10/50 5/50 3/50 50/50

fr (decimal) .08 .08 .22 .26 .20 .10 .06 1

fr % (porcentaje) 8 8 22 26 20 10 6 100

En este ltimo rengln se encuentra la suma de cada columna, es preciso hacer hincapi en que los tres resultados de las columnas fr son los mismos, esto significa entonces que fr se puede escribir de cualquiera de las tres maneras slo que la ltima que est en porcentaje es la que ms se utiliza para el tema de grficas. De manera similar que fr se calcula la columna de far (fra) o frecuencia acumulada relativa en porcentaje, solamente que para sta se toma como referencia la columna de fa. Veamos, para calcular el primer valor de far se efecta la divisin de cada rengln de fa entre el tamao de la muestra y el resultado se multiplica por 100 para tenerlo en porcentaje.

fa 4 8 19 32 42 47 50

far % 8 16 38 64 84 94 100

No hay que perder de vista esta columna ya que es muy importante por 2 motivos: 1) Se utiliza para encontrar porcentajes 2) Sus valores se acumulan hasta completar el 100%

Con todo lo anterior se tiene la tabla de distribucin de frecuencia agrupada de datos por intervalos:

TABLA DE DISTRIBUCIN DE FRECUENCIAS DE DATOS POR INTERVALOS

65

NMERO DE LIBROS O EXPEDIENTES PRESTADOS DURANTE 50 DAS PERODO ENERO-MARZO 1997 CLASES f Mc fa fr far 43- 47 4 45 4 8 8 48- 52 4 50 8 8 16 53- 57 11 55 19 22 38 58- 62 13 60 32 26 64 63- 67 10 65 42 20 84 68- 72 5 70 47 10 94 73- 77 3 75 50 6 100 TOTAL: 50 100 Fuente: Informacin proporcionada por el Departamento de Control Escolar.

La presentacin de una tabla de distribucin de frecuencias para datos agrupados como la anterior no es la nica, en ocasiones, algunos autores muestran sus tablas iniciando con la clase o intervalo mayor hasta llegar al ms pequeo, es obvio que las dems columnas tambin sufren esta modificacin, observemos:
TABLA DE DISTRIBUCIN DE FRECUENCIAS DE DATOS POR INTERVALOS NMERO DE LIBROS O EXPEDIENTES PRESTADOS DURANTE 50 DAS PERODO ENERO-MARZO 1997 CLASES f Mc fa fr far 73-77 3 75 50 6 100 68-72 5 70 47 20 94 63-67 10 65 42 20 84 58-62 13 60 32 26 64 53-57 11 55 19 22 38 48-52 4 50 8 8 16 43-47 4 45 4 8 8 50 100 Fuente: Informacin proporcionada por el Departamento de Control Escolar.

En este caso la columna de frecuencia acumulada se inicia con el tamao de la muestra que es 50 y se le va restando la frecuencia hasta obtener el valor de la primera:
f 3 5 10 13 11 4 4 50 fa 50 47 42 32 19 8 4 50 - 3

66

Estadstica Descriptiva

QU HE APRENDIDO? Es muy importante que recuerdes la forma en que se construye una tabla de distribucin de frecuencias para datos por intervalos, tambin llamada para datos agrupados, ya que en tu futuro como profesional de la informacin es una herramienta que te ser de gran utilidad. 1) Escribe claramente tus propias definiciones de Rango, Amplitud y Nmero de intervalos. ________________________________________________________ ____________________________________________________________ ________ 2) Qu diferencias encuentras entre frecuencia absoluta (f) y frecuencia relativa (fr)? _________________________________________________________ ____________________________________________________________ ________ 3) Por qu es importante la columna de frecuencias acumuladas (fa)? Explica tu respuesta. _________________________________________________________ ____________________________________________________________ ________

67

Elabora el Resumen de la Unidad 2 completando el siguiente mapa conceptual, al final de la gua lo encontrars resuelto, de ser posible, confronta tus respuestas y corrgelas en caso de ser errneas:
TIPOS DE DATOS

CATEGRICOS

ORDENADOS POR RANGO

MTRICOS

DISTRIBUCIONES DE FRECUENCIA

POBLACIN O MUESTRA PEQUEA

POBLACIN O MUESTRA GRANDE

SIMPLE CUYA ESTRUCTURA ES: a) b) c) d) A B f f SUMA DE f

PARA DATOS AGRUPADOS CUYA ESTRUCTURA ES:

TO T A L e) f) g) donde: a) Ttulo que explique brevemente el contenido de la tabla b) c) d) e) f) g)

a) b) c) d) e) f) donde: a)Clases o intervalos formados por lmite inferior y lmite superior b) c) d) e) f)

TIPO DE VARIABLES QUE UTILIZAN a) ORDINALES b) c) d) a) b)

68

Estadstica Descriptiva

EVALUACIN 1)Se atendieron en un mes a 40 investigadores en cierta rea, si el mes anterior se haban atendido 80 cul es el porcentaje de disminucin? ____________________________________________________________ ________ 2) Un empleado atiende 200 personas durante una semana cuntas personas ms deber atender la prxima para obtener un incremento del 25%? ____________________________________________________________ ________ 3) Si en el rea de Prstamo a domicilio existen 125 volmenes y en el rea de consulta 375: a) Cul es la razn entre las dos reas? ______________________________ b) En qu porcentaje es mayor el volumen de consulta con respecto al prstamo a domicilio?__________________________________________________ 4) Si en un Archivo se tienen 50 legajos sobre el Tratado de Libre Comercio y sobre Posesin de la tierra 100 cul es la razn entre los primeros y los segundos? ____________________________________________________________ ________ 5) Con los datos proporcionados por el Departamento de Control Escolar de una Universidad, que representan las horas dedicadas semanalmente al estudio fuera de clases por los estudiantes que asisten regularmente, completa la tabla de distribucin para datos agrupados, anotando todo lo que se te solicita:
3 2 5 8 2 5 11 11 4 3 15 4 5 16 8 9 20 4 3 12 1 22 6 17 5 2 13 8 7 4 2 15 6 4 14 5 2 10 17 9 2 1 3 18 18 3 6 1 6

69

21 7 1

6 13 10

12 23 11

1 10 3

5 12 10

6 16 1

11 4 12

a) Escribe la variable de inters y el tipo al que pertenece: ________________________________________________________ ______ b) Cul es la poblacin del problema? ________________________________________________________ _______ c) Es poblacin finita o infinita: ________________________________________________________ _______ d) La muestra est formada por ______________ elementos. e) Ordena los datos en forma ascendente:

f) Calcula y escribe el valor de: R= Rango = K= Nmero de intervalos= A= Amplitud=

g) Completa la tabla de distribucin para datos agrupados indicando claramente ttulo y fuente segn la informacin proporcionada:
CLASES f Mc fr fa far

70

Estadstica Descriptiva

6) En un Archivo diariamente se devuelven en promedio 520 expedientes que fueron solicitados para su consulta y se colocan en el lugar que les corresponde. Para llevar un control adecuado, semanalmente se hace una revisin a fin de que la suma de los entregados ms los que estn en prstamo nos de el total de expedientes, por lo general de cada 13 expedientes uno se encuentra extraviado, ya sea porque est en prstamo sin vale o porque est mal colocado, el porcentaje con que se presenta la primera opcin es del 65%. Con esta informacin realiza las operaciones necesarias para contestar correctamente:
a) Considerando el promedio de expedientes que se devuelven, aproximadamente cuntos expedientes devuelven al Archivo durante los 5 das de la semana? ________________________________________________________ _______

b) Aproximadamente cuntos expedientes se extravan a la semana? ________________________________________________________ _______ c) Cuntos expedientes se extravan semanalmente por estar prestados sin el vale respectivo? ________________________________________________________ _______ d) Cuntos expedientes estn extraviados semanalmente por estar mal colocados? ________________________________________________________ _______ 7) En una biblioteca semanalmente (lunes a sbado) se solicita en prstamo a domicilio un promedio de 830 libros, si cada domingo se hace una revisin para comprobar que el nmero de ejemplares prestados ms los que se tienen suman el total disponible para este servicio, encontrndose que aproximadamente de cada 20 libros 3 estn extraviados, efecta las operaciones correspondientes y anota el resultado en cada inciso: a) Cuntos libros en promedio se prestan diariamente (de lunes a sbado)?

71

________________________________________________________ _______ b)Cul es la cantidad de libros que se extravan diariamente? ________________________________________________________ _______ c)Qu porcentaje de libros se extravan semanalmente? ________________________________________________________ _______

ENVA A TU ASESOR

Si has llegado hasta aqu, te felicito, tu esfuerzo tendr una recompensa.

72

Estadstica Descriptiva

1st Qtr 2nd Qtr 3rd Qtr 4th Qtr

UNIDAD 3 REPRESENTACIONES GRFICAS

En esta unidad aprenders a elaborar diferentes grficas a partir de los datos contenidos en tablas de distribucin de frecuencias, por ello es necesario que prepares papel milimtrico, comps, regla y transportador.

QU VOY A APRENDER EN ESTA UNIDAD? A trazar grficas de barras horizontales o verticales y de sectores cuando se trate de variables cualitativas, y si se tienen datos cuantitativos a elaborar histogramas y polgonos de frecuencia, ya que al ser presentados los datos en forma resumida podemos observar grficamente sus principales caractersticas.

73

DIAGNSTICO 1) Dibuja el Sistema de Coordenadas Rectangulares o plano cartesiano indicando el nombre de los ejes, el origen, y los cuadrantes.

2) Para cada inciso traza un plano cartesiano y utilizando slo el primer cuadrante marca en ambos ejes las escalas que se te solicitan: a) Ambos ejes a escala 1:1 hasta 10 (un centmetro equivale a la unidad).

b)Ambos ejes a escala 1:2 hasta 20, esto es, iniciando en uno y de dos en dos hasta 20. (un centmetro equivale a 2 unidades).

c) Ambos ejes a escala 1:5 iniciando en 1 y terminando en 50 (un centmetro equivale a 5 unidades).

74

Estadstica Descriptiva

d) El eje X de 1:2 hasta 20 y en el eje Y de 1:10 hasta 100.

3) Busca en el diccionario el significado de simetra y dibuja una figura simtrica.

Si al realizar la actividad diagnstica tuviste problemas para trazar el Sistema de Coordenadas Rectangulares mejor conocido como el plano cartesiano, recordemos que ste se encuentra formado por dos rectas perpendiculares entre s, las cuales reciben el nombre de ejes coordenados, siendo el horizontal el de las X o abscisas y el vertical el de las Y o de las ordenadas, su punto de interseccin es el origen.
Sistema de Coordenadas Rectangulares II eje Y (o de las ordenadas) III origen (punto 0) eje X (o de las abscisas) IV I

Los nmeros romanos nos indican los cuadrantes. En cada uno de los incisos en donde se te solicitan escalas se requiere trazar el plano cartesiano, los primeros 3 incisos son muy fciles como lo viste en Escalas de Medicin, slo veremos el inciso d) en donde se te pide trazar en el eje X una escala de 1:2 hasta 20 y en el eje Y de 1: 10 hasta 100:

75

100

EJE Y

30 20 10
2 4 6 8 10 12 14 16 18 20

origen

EJE X

Para terminar con la reflexin de esta unidad, no debes olvidar que una figura es simtrica cuando se divide en dos partes iguales de tal forma que stas coinciden al girar una de ellas 180 grados. Bien, una vez que ya nos familiarizamos con el Sistema de Coordenadas Rectangulares y recordado lo que significa que una figura sea simtrica, continuemos con el tema de representaciones grficas en donde debes tener en cuenta las siguientes observaciones: a) Todas las grficas, menos la de sectores se trazan en el primer cuadrante del Sistema de Coordenadas Rectangulares. b) Es indispensable que en todas las grficas aparezca en primer lugar un ttulo que describa brevemente la informacin que est siendo representada y la fuente de informacin, ya que stas deben ser autoexplicativas, con excepcin de la grfica de sectores, todas deben contener un ttulo en cada uno de los ejes que indique el tipo de datos que se estn representando. c) Las grficas son necesarias y tiles para conocer el comportamiento de los datos, es por ello que se recomienda tener cuidado tanto en su elaboracin como en su revisin, ya que de lo contrario se podra caer en interpretaciones errneas.

76

Estadstica Descriptiva

3.1 GRFICA DE BARRAS

N M E R O

GRFICA DE BARRAS (HORIZONTAL) 100 50 0


RUSO ALEMAN CHINO ESPAOL

IDIOMAS

Conocida tambin como diagrama de barras, por estar formada por barras que tienen el mismo ancho y estn separadas por espacios en blanco, los datos deben estar incluidos en unas cuantas categoras (representadas por los rectngulos o barras), ya que esta grfica no es recomendable cuando se tiene una gran cantidad de informacin. Consideremos la informacin de la tabla que aparece enseguida y que contiene 2 categoras: Archivonoma y Biblioteconoma.
ALUMNOS DE LA ENBA Semestre 97-I CARRERA NM.DE ALUMNOS (X) (f) ARCHIVONOMA 270 BIBLIOTECONOMA 351 Total: 621

Primero trazamos el primer cuadrante del plano cartesiano, en el eje horizontal se anotan las categoras, en el eje vertical se considera una escala o divisin conveniente para marcar las frecuencias respectivas, posteriormente se trazan barras del mismo ancho y con la misma separacin. En la actualidad cuando se realizan este tipo de grficas, sobre todo en la computadora, se tiene la opcin de escoger barras con o sin separacin y horizontales o verticales. Al trazar las barras se debe tener en cuenta que la separacin entre ellas no debe ser menor que la mitad de su ancho ni mayor que el mismo y la altura de cada una queda determinada por la frecuencia que le corresponde, de esta forma cada categora queda representada por una columna.
77

GRFICA DE BARRAS VERTICALES

La informacin contenida en la tabla anterior de distribucin simple aparece grficamente en el diagrama: Notemos que se destaca inmediatamente la categora de mayor frecuencia, por lo que en este caso es claro que la carrera de Biblioteconoma tiene ms alumnos inscritos que la de Archivonoma.

ALUMNOS INSCRITOS EN LA ENBA SEMESTRE 97-I


N M E R O D E A L U M N O S

400 350 300 250 200 150 100 50

El Autor Luis Magaa Cullar en su libro Estadstica y 0 probabilidad indica que en la representacin grfica se debe construir, cada vez que se pueda, el eje vertical de tal modo que la altura del punto mximo (que representa el dato asociado a la frecuencia ms alta) sea aproximadamente igual a de la longitud que media entre el origen y el ltimo dato indicado en el eje horizontal.
ARCHIVONOMA BIBLIOTECONOMA

CARRERAS

Por qu crees que se deba seguir esta regla en la elaboracin de una grfica?

GRFICA DE BARRAS HORIZONTALES

A continuacin se muestra la misma informacin en un diagrama de barras horizontales, en donde se ha cambiado el papel de los ejes, anotando los nombres de las categoras en el eje vertical y las frecuencias en el eje horizontal:

ALUMNOS INSCRITOS EN LA ENBA SEMESTRE 97-I


BIBLIOTECONOMA

CARRERAS

ARCHIVONOMA

50

100 150 200 250 300 350 400 NMERO DE ALUMNOS

Como ya hemos mencionado las categoras al ser representadas en una grfica o diagrama de barras permiten visualizar fcilmente el comportamiento de los datos.
78

Estadstica Descriptiva

QU HE APRENDIDO? 1) Con los datos de la siguiente tabla elabora una grfica de barras.
OCUPACIN DE LAS PERSONAS USUARIAS DE UN ARCHIVO JUNIO 1997 OCUPACIN NM.DE PERSONAS (X) (f) INVESTIGADORES 150 DOCENTES 120 ESTUDIANTES 230 Total: 500

Con la informacin que aparece en la grfica calcula: 2) La proporcin entre docentes y estudiantes. ________________________________________________________ ____________________________________________________________ ____________________________________________________________ _______________________ 3) El porcentaje de investigadores con respecto a la poblacin. ________________________________________________________ ____________________________________________________________

79

____________________________________________________________ _______________________

80

Estadstica Descriptiva

3.2 GRFICA DE SECTORES


Como primer punto recordemos dos definiciones que son importantes para comprender mejor la forma en que se elabora una grfica de este tipo: Circunferencia: curva plana y cerrada, todos los puntos que la forman estn a la misma distancia del centro.

Crculo: superficie plana limitada por la circunferencia. En seguida, veamos un ejemplo en donde es claro observar que a cada categora se le asocia un sector o gajo proporcional de la circunferencia, el cual depende de su frecuencia.
GRFICA DE SECTORES
ALEMN 13% RUSO 18% CHINO 24% ESPAOL 45%

Para la construccin de esta grfica no se requiere el trazo del plano cartesiano, en su lugar, se dibuja una circunferencia donde, como ya dijimos anteriormente, a cada categora le va a corresponder un sector del crculo. A fin de contar con toda la informacin necesaria para trazar esta grfica, se recomienda elaborar una tabla auxiliar que contenga todos los datos que se requieren. Consideremos nuevamente la tabla de distribucin de frecuencias simple:
ALUMNOS DE LA ENBA SEMESTRE 97-I X f % ARCHIVONOMA 270 BIBLIOTECONOMA 351 621

GRADOS

81

Aparecen dos columnas adicionales: En una de ellas se anota el porcentaje que le corresponde a cada categora con respecto a la poblacin (o muestra), y en la otra se anotan los grados que servirn para la medicin del ngulo de cada sector, sin olvidar que todas las circunferencias abarcan un ngulo de 360 grados. Para el clculo del porcentaje se realiza el siguiente procedimiento en cada categora: Al total se le considera el 100%, en este caso como N=621 621 100% Estas dos cantidades permanecen constantes al efectuar el clculo en todas las categoras. La primera categora tiene una frecuencia de 270 y desconocemos el porcentaje que le corresponde con respecto al total, si asignamos con una letra a el valor desconocido y escribimos:
621 270 100% a

Este planteamiento corresponde a una regla de tres simple, ya que consta de 4 trminos donde 3 son conocidos y uno desconocido. Esta se resuelve en cruz de la siguiente manera:
621 270 100% a

El trmino desconocido a es igual al producto de 270 por 100 entre 621. a= (270x100)/621=43.4 entonces el porcentaje que le corresponde a 270 es 43.4%. Cuando se tienen nmeros decimales como en este caso, es conveniente redondear hasta el entero o decimal ms prximo tomando en consideracin los siguientes criterios: a) Aproximacin a un entero 9.2 = 9 9.8 = 10 4.5 = 5

Si el ltimo dgito de un nmero es menor que 5, se redondea al entero inmediato inferior como en el primer ejemplo que se muestra, en caso de
82

Estadstica Descriptiva

que el dgito de que se trata sea mayor o igual a 5 se considera el entero inmediato superior.
b) Aproximacin a la dcima 3.17 =3.2 5.11 =5.1 0.09 =0.1

c) Aproximacin a la centsima 6.177=6.18 0.674=0.67 2.098=1.10

En estos dos incisos se observa que si el ltimo dgito es menor que 5, no se toma en cuenta y si el ltimo dgito es mayor que 5, el anterior se aumenta en una unidad. Cuando la parte decimal de un nmero termina en 5 es necesario considerar el dgito anterior: d) Si es impar, se incrementa en una unidad
7.875 =7.88 18.755 =18.76

e) Si es par se redondea conservando el penltimo dgito


2.25 = 2.2 8.05 = 8.0

Ahora calculemos el porcentaje de la siguiente categora 621 351 a=(351x100)/621=56.5, corresponde el 57% redondeando se 100% a tiene que a 351 le

Los valores obtenidos se anotan en la columna de porcentaje (%)


X ARCHIVONOMA BIBLIOTECONOMA f 270 351 621 % 43 57 GRADOS

En la ltima columna se anotan los grados calculados con la regla de tres simple para cada categora:

83

Cabe hacernos en este momento una pregunta Si a N=625 le corresponden 360 grados, cuntos le corresponden a 270? Para responder, planteamos una regla de 3 simple y la resolvemos: 621----- 360 grados 270 ------ a a = (270(360))/621= 156.52, la fraccin .52 se transforma a minutos, es decir, se multiplica .52 por 60. .52(60) = 31.2 Redondeando el valor obtenido se tienen 31 minutos, esto indica que a la primera categora le corresponden 156 grados con 31 minutos. Efectuemos la misma operacin para el clculo de los grados de la siguiente categora que tiene una frecuencia de 351: 621 ----- 360 grados 351 ------ a a = (351(360))/621 = 203.47, realizando la misma transformacin de la parte decimal: .47(60) = 28.2 Al redondear se obtienen 28 minutos, por lo que a la segunda categora le corresponden 203 grados con 28 minutos. Ya estamos en condiciones de completar la tabla:
X ARCHIVONOMA BIBLIOTECONOMA f 270 351 621 % 43 57 100 GRADO S 15631 20328 35959

Es recomendable obtener el total de las columnas de porcentaje y de grados para verificar que los clculos estn correctos, en algunos casos debido al redondeo no se llega al 100% ni a 360 grados, sin embargo, no te preocupes si obtienes como mnimo 99% 359 grados los resultados estn correctos y son aceptables. Con los datos obtenidos se realiza el trazo de la grfica circular o de sectores en la forma que se indica:

84

Estadstica Descriptiva

1) Se dibuja una circunferencia y el radio vertical principal y a partir de ste, en el sentido de las manecillas del reloj se miden con un transportador los grados que le corresponden a cada categora:

2) Como indica la flecha se miden los grados que se calcularon, iniciando con el valor ms grande hasta llegar al ms pequeo. Conforme se marcan los grados en la circunferencia, se van trazando los radios que formarn los sectores de la grfica. 3) Los grados no aparecen en la grfica, ya que slo se utilizan para marcar el sector que le corresponde a cada categora.

ALUMNOS DE LA ENBA SEMESTRE 97-I

ARCHIVONOMA

BIBLIOTECONOMA

43%

57%

Aqu aparecen todas las categoras con su porcentaje respectivo, el cual ha sido calculado tomando en cuenta el tamao de la muestra (o poblacin). Se observa que la Carrera de Biblioteconoma presenta un porcentaje mayor de alumnos inscritos.

85

QU HE APRENDIDO? 1) Completa la tabla siguiente y elabora la grfica de sectores correspondiente:


OCUPACIN DE LOS USUARIOS DE UN ARCHIVO JUNIO 1997 OCUPACIN NM.DE % (X) PERSONAS GRADO (f) S INVESTIGADORES 150 DOCENTES 120 ESTUDIANTES 230 Total: 500

Con la informacin de la grfica que acabas de elaborar contesta: 2) La categora que tiene mayor porcentaje es : ________________________________________________________ ____________________________________________________________ _______________ 3) El porcentaje de la categora que tiene menor frecuencia es: ________________________________________________________ ____________________________________________________________ _______________

86

Estadstica Descriptiva
Nota: No olvides que el total de la columna del porcentaje debe estar entre 99 y 101% y la que corresponde a los grados entre 359 y 361 grados.

87

3.3 HISTOGRAMA DE FRECUENCIAS ABSOLUTAS


Es la representacin grfica de una tabla de frecuencias para datos cuantitativos agrupados y se construye trazando en el primer cuadrante del plano cartesiano rectngulos unidos, donde los intervalos de clase determinan el ancho de cada uno de los rectngulos y las frecuencias sus alturas correspondientes. Si se consideran las frecuencias absolutas el grfico recibe el nombre de Histograma de frecuencias absolutas o simplemente de frecuencias, si se consideran las frecuencias relativas se trata de un Histograma de frecuencias relativas.

HISTOGRAMA DE FRECUENCIAS ABSOLUTAS


14 12 10 8 6 4 2 0 3 4 7 10 13 16 19 22 25 FRECUENCIAS ABSOLUTAS

MARCAS DE CLASE

Para construir un histograma como el anterior utilizaremos la distribucin de frecuencias para datos agrupados de la Unidad 2:
TABLA DE DISTRIBUCIN DE FRECUENCIAS DE DATOS POR INTERVALOS NMERO DE LIBROS O EXPEDIENTES PRESTADOS DURANTE 50 DAS PERODO ENERO-MARZO 1997 CLASES 43- 47 48- 52 53- 57 58- 62 63- 67 68- 72 73- 77 f 4 4 11 13 10 5 3 50 Mc 45 50 55 60 65 70 75 fa 4 8 19 32 42 47 50 fr 8 8 22 26 20 10 6 100 far 8 16 38 64 84 94 100

88

Estadstica Descriptiva

Los datos que se toman en cuenta para trazar el histograma son las marcas de clase de cada intervalo y sus frecuencias absolutas (f):
Mc 45 50 55 60 65 70 75 f 4 4 11 13 10 5 3 50

Ya estamos listos para efectuar el trazo del histograma de frecuencias absolutas: 1) Se dibuja el primer cuadrante del plano cartesiano. 2) A fin de mostrar que se ha considerado el origen se inserta una marca de rompimiento:
eje Y marca de rompimiento

origen

eje X

La marca de rompimiento evita que tengamos que marcar en el eje horizontal desde el cero que es el origen hasta la primera marca de clase que es 45. 3) A lo largo del eje horizontal o de las X se trazan las marcas de clase, tomando en cuenta que la grfica debe quedar equilibrada (o centrada), por lo que es necesario dejar el mismo espacio antes de la primera marca de clase y despus de marcar la ltima (es opcional).

45

50

55

60

65

70

75

Estas dos distancias deben ser iguales y mayores que la longitud que separa una marca de clase con otra.

89

4) Sobre el eje vertical trazar una escala adecuada que permita ubicar las frecuencias de cada intervalo, en este caso si el valor ms pequeo es 3 y el mayor 13, se puede considerar una escala de 2 en 2:
. . . 6 4 2 0

45

50

55 60 ...

Es conveniente que la escala se tome de acuerdo a los valores extremos, ya que si se presenta un caso en que el valor mnimo es 20 y el mximo 100, se tiene la opcin de escoger una escala de 5 en 5 o de 10 en 10 o cualquier otra que no tenga valores tan pequeos como la anterior. 5) Es importante anotar ttulos, uno principal que especifique en forma clara y breve la informacin que contiene el histograma y en cada uno de los ejes para indicar lo que se est graficando. Tambin es necesario anotar la fuente de la informacin.
EXPEDIENTES PRESTADOS PERODO ENERO-MARZO 1997
14 12 10 DAS 8 6 4 2 0 40 45 50 55 60 65 70 75 80

NMERO DE EXPEDIENTES

Fuente: Informacin proporcionada por el Departamento de Control Escolar.

Informacin que muestra el histograma: 1)La barra ms alta tiene una altura de 13 y corresponde a la marca de clase 60, esto significa que durante 13 das se prestaron en promedio 60 expedientes.

90

Estadstica Descriptiva

2) Durante 4 das se prestaron en trmino medio 45 expedientes y en el mismo nmero de das se prestaron 50 expedientes. 3) El mximo nmero de expedientes que son 75 se prestaron durante 3 das. 4) El rea de cada rectngulo, en relacin con los restantes, muestra la proporcin del nmero total de observaciones que ocurren en cada clase. 5) Al estar los datos agrupados se pierde la informacin individual de cada uno, pero se tiene una visin general de la distribucin de los mismos. 6) Al intervalo que le corresponde la barra con mayor nmero de datos o ms alta, se le llama clase modal, en este caso es 58-62.

LECTURA 2 Con el propsito de que conozcas un poco ms sobre los diferentes tipos de grficas, es necesario que leas del Captulo 3 del libro Fundamentos de Estadstica en la Investigacin Social de Jack Levin incluido al final de esta gua y elabores un breve resumen para reafirmar tu aprendizaje. Despus de la lectura contina con ms mpetu el desarrollo de esta unidad.

Las formas de los histogramas continuacin:

ms comunes se muestran a

91

HISTOGRAMA SIMTRICO
12 10 8 6 4 2 0 25 35 45 55 65

Presentan a la clase de mayor

HISTOGRAMA ASIMTRICO A LA DERECHA


12 10 8 6 4 2 0

frecuencia o clase modal a la mitad del histograma. Se observan dos colas, la ms 25 35 45 55 65 pequea a la izquierda y la mayor hacia la derecha del intervalo de mayor frecuencia. Si con esta misma informacin se considera el polgono de frecuencias absolutas tendremos una distribucin con sesgo hacia la derecha (se considera positivo).

La cola ms larga se extiende hacia la izquierda de la clase mayor, de igual manera si consideramos su polgono de frecuencia respectivo, se tiene una distribucin sesgada hacia la HISTOGRAMA ASIMTRICO izquierda. A LA IZQUIERDA
12 10 8 6 4 2 0 25 35 45 55 65

HISTOGRAMA RECTANGULAR
12 10 8 6 4 2 0 25 35 45 55 65

92

Estadstica Descriptiva

Todas las categoras tienen la misma frecuencia.

HISTOGRAMA EN FORMA DE "J"


12 10 8 6 4 2 0 25 35 45 55 65

No se observa ninguna cola en el lado donde se encuentra la categora con mayor frecuencia.
NOTA: Estas grficas se elaboraron en computadora y no aparecen espacios en blanco, antes y despus del primer y ltimo rectngulo.

QU HE APRENDIDO? 1) Completa la siguiente tabla que contiene los retardos en minutos que 50 personas tuvieron en un mes.
CLASES 5- 9 10-14 15-19 20-24 25-29 f 10 8 15 5 12 50 Mc

2) Anota el intervalo que tiene mayor frecuencia, el cual por esta razn recibe el nombre de clase modal:______________________________________________ 3) Con la informacin de la tabla elabora el histograma de frecuencias absolutas correspondiente y destaca la barra ms alta o de mayor frecuencia.

93

4) Compara la forma que presenta el histograma con las que se mostraron anteriormente y escribe a qu categora corresponde:________________________ ____________________________________________________________ ________

94

Estadstica Descriptiva

3.4 POLGONO DE FRECUENCIAS ABSOLUTAS


Es una grfica lineal que muestra los datos que contiene una distribucin de frecuencia para datos agrupados, en el eje X se colocan las marcas de clase y en el eje Y las frecuencias. Se unen los puntos medios de cada clase a la altura de su frecuencia correspondiente.
POLGONO DE FRECUENCIAS ABSOLUTAS
12
FRECUENCIAS ABSOLUTAS

10 8 6 4 2 0 1 4 7 10 13 16 19 22 25

MARCAS DE CLASE

Recordemos que un polgono es una figura plana limitada por rectas que forman una lnea quebrada cerrada, por ello, es necesario agregar una marca de clase al principio y otra al final, ambas con frecuencia cero 0 a fin de cerrar la poligonal. Veamos nuevamente las columnas que se usaron para la elaboracin del Histograma de frecuencias absolutas:

Mc 40 45 50 55 60 65 70 75 80

f 0 4 4 11 13 10 5 3 0 50

Estas dos marcas de clase con frecuencia 0 se agregaron para cerrar la curva.

Parte ms alta o pico

95

EXPEDIENTES PRESTADOS PERODO ENERO-MARZO 1997


14 12 10 DAS 8 6 4 2 0 35 40 45 50 55 60 65 70 75 80 85 NMERO DE EXPEDIENTES

Es importante observar que la curva comienza en el punto medio de la clase anterior a 45 y termina en el punto medio de la clase posterior a la ltima, de no ser as, slo se tendra una poligonal. Informacin que muestra el polgono: 1) El rea total bajo la curva es igual al rea total bajo el histograma correspondiente. 2) Muestra un esquema ms claro del comportamiento de los datos, como por ejemplo, su parte ms alta corresponde a la mayor frecuencia. 3) Si slo presenta un pico, como en este ejemplo, significa que su categora correspondiente contiene el dato que se repite ms veces. 4) En caso de que se observe ms de un pico se tienen varios datos con frecuencia mayor (o muy parecida).
NOTA: Tambin se puede utilizar la columna de frecuencias relativas (fr) en lugar de la de frecuencias absolutas y graficarse para obtener un polgono de frecuencias relativas.

96

Estadstica Descriptiva

QU HE APRENDIDO? 1) A continuacin se muestran las edades de 55 trabajadores de cierta empresa, completa la tabla:
CLASES 20-29 30-39 40-49 50-59 f 25 10 15 5 55 Mc

2) Escribe la clase ________________________

modal

de

mayor

frecuencia

3) En qu intervalo se encuentran agrupados los empleados ms jvenes? ____________________________________________________________ ________ 4) Traza el polgono de frecuencias respectivo.

97

3.5 POLGONO DE FRECUENCIAS RELATIVAS ACUMULADAS U OJIVA PORCENTUAL


Tambin conocido como Polgono de frecuencias acumuladas relativas, es una curva que representa el rea proporcional relativa acumulada en cada clase y permite calcular de manera visual las proporciones de sus valores que se acumulan al final de cada clase, en otras palabras muestra grficamente cuntas observaciones se encuentran por arriba o debajo de ciertos valores, en lugar de limitarnos a conocer el nmero de elementos que caen dentro de cada uno de los intervalos. Algunos autores como Agustn Montao en su libro Estadstica I, utilizan en el eje de las X las marcas de clase y otros como Jack Levin en su libro Fundamentos de Estadstica en la Investigacin Social usan en el mismo eje los lmites reales superiores de cada intervalo. No hay por qu preocuparse, ambas formas tienen el mismo propsito y no hay mayor problema en considerar marcas de clase o lmites reales superiores. Utilizando la misma informacin se ha trazado una grfica con cada uno de ellos:

OJIVA PORCENTUAL CON MARCAS DE CLASE EN EL EJE DE LAS X:

POLGONO DE FRECUENCIAS RELATIVAS ACUMULADAS U OJIVA PORCENTUAL


FRECUENCIAS RELATIVAS ACUMULADAS (%) 100 80 60 40 20 0 10 15 20 25 30 35 40

MARCAS DE CLASE

98

Estadstica Descriptiva

OJIVA PORCENTUAL CON LMITES REALES SUPERIORES EN EL EJE DE LAS X


POLGONO DE FRECUENCIAS RELATIVAS ACUMULADAS U OJIVA PORCENTAL
FRECUENCIAS RELATIVAS ACUMULADAS (%) 100 80 60 40 20 0 12.5 17.5 22.5 27.5 32.5 37.5 42.5 LMITES REALES SUPERIORES

A simple vista se observa que la forma de las dos ojivas es la misma, veamos que sucede cuando consideramos un problema y obtenemos su polgono de frecuencias acumuladas en las dos formas descritas anteriormente. Durante un mes se tomaron las temperaturas en una bveda donde se guardan expedientes, obtenindose las siguientes lecturas: 3, 12, 21, 30, 15, 24, 6, 15, 21, 3, 15, 21, 3, 18, 24, 12, 27, 6, 9, 6, 27, 18, 18, 9, 27, 6, 30, 18, 24 y 9 grados respectivamente. Primero se ordenan los datos:
3 3 3 6 6 6 6 9 9 9 12 12 15 15 15 18 18 18 18 21 21 21 24 24 24 27 27 27 30 30

R=30-3 = 27 K= 1 + 3.322(log 30) = 1 + 3.322(1.47) = 5.9 redondeando K=6 A= 27/6 = 4.5 al redondear A=5

CLASES 3-7 8-12 13-17 18-22 23-27 28-32

f 7 4 3 7 7 2 30

Mc 5 10 15 20 25 30

fa 7 11 14 21 28 30

far 23 37 47 70 93 100

99

OJIVA PORCENTUAL CON MARCAS DE CLASE EN EL EJE DE LAS X


TEMPERATURAS LEDAS DURANTE UN MES EN UN ARCHIVO
100

FRECUENCIA ACUMULADA RELATIVA (%)

90 80 70 60 50 40 30 20 10 0 5 10 15 20 25 30

Para estimar el porcentaje de temperaturas menores de 20 grados, localizamos la frecuencia acumulada relativa que se intersecta con este dato. As encontramos que aproximadamente el 70% del total de datos es menor que 20, para verificarlo veamos cuntos nmeros son

TEMPERATURAS

menor de 20:
3,3,3,6,6,6,6,9,12,12,15,15,15, 18, 18, 18, 18 (un total de 17 datos que representan un 56.6%) Al calcular el 70% del total de 30 datos, obtenemos 21 datos, cantidad que es ligeramente mayor que el nmero de datos listados anteriormente. De igual manera si deseamos saber cuntas temperaturas del mes considerado fueron mayores de 25 grados, veremos que las menores fueron aproximadamente el 92%, por lo tanto, las mayores tienen un porcentaje del 8% es decir, que aproximadamente de 2 a 3 lecturas son mayores de 25 grados. Nuevamente, de la lista de datos ordenada tenemos que los grados mayores a 25 son: 27, 27, 27, 30, 30, estos 5 datos representan el 16.6% de todas las temperaturas. En ambas estimaciones existe diferencia entre los porcentajes obtenidos a travs de la grfica y los calculados con los datos proporcionados inicialmente.

100

Estadstica Descriptiva

OJIVA PORCENTUAL CON LMITES REALES SUPERIORES EN EL EJE DE LAS X Realicemos la misma estimacin de porcentajes que en la anterior grfica:

TEMPERATURAS LEDAS DURANTE UN MES EN UN ARCHIVO 100 90 80 70 60 50 40 30 20 10 0 7.5 12.5 17.5 22.5 27.5 32.5 TEMPERATURAS FRECUENCIAS ACUMULADAS RELATIVAS (%)

Primero observemos que 20 grados se localiza a la mitad de 17.5 y 22.5, para estimar el porcentaje de temperaturas mayores de esta cantidad vemos que en el eje de las Y, la frecuencia acumulada relativa que le corresponde es 60%, lo cual implica que 18 datos (el 60% de 30) son mayores de 20, este valor es ms cercano que el que se obtuvo en la anterior ojiva. Ahora para conocer el nmero de datos mayores de 25 grados, localiza esta temperatura en el eje de las X, el cual se encuentra a la mitad de 22.5 y 27.5 y le corresponde un porcentaje del 80%, entonces podemos decir que la estimacin de valores mayores de 25 es 20%, esto es, 6 datos.

101

TEMPERATURAS LEDAS DURANTE UN MES EN UN ARCHIVO 100 90 80 70 60 50 40 30 20 10 0 7.5 12.5 17.5 22.5 27.5 32.5 TEMPERATURAS FRECUENCIAS ACUMULADAS RELATIVAS (%)

Comparemos los porcentajes y valores obtenidos en las dos ojivas:


ESTIMACIN % de datos menores de 20 grados valores menores de 20 grados % de datos mayores de 25 grados valores mayores de 25 grados OJIVA CON MARCAS DE CLASE 70% OJIVA CON LMITES REALES SUP. 60% PORCENTAJE REAL 56.6%

21 8% 2.4

18 20% 6

17 16.6% 5

En esta tabla se nota claramente que las estimaciones con la ojiva que utiliza lmites reales superiores en el eje de las X se acerca ms a la realidad que la ojiva con marcas de clase, esta es la razn de que a partir de este momento, cuando se trate de trazar una ojiva porcentual se considerar en el eje de las X a los lmites reales superiores y en el eje de las Y las frecuencias relativas acumuladas o frecuencias acumuladas relativas. En la ojiva porcentual con lmites reales superiores, tambin se puede estimar el porcentaje de datos que caen entre dos valores dados, por ejemplo entre 10 y 25:

102

Estadstica Descriptiva

TEMPERATURAS LEDAS DURANTE UN MES EN UN ARCHIVO 100 90 80 70 60 50 40 30 20 10 0 7.5 12.5 17.5 22.5 27.5 32.5 TEMPERATURAS FRECUENCIAS ACUMULADAS RELATIVAS (%)

El porcentaje de datos que se desea estimar caen entre estos dos valores, de tal forma que a 10 le corresponde el 30% y a 25 el 80%, por lo que una aproximacin estar dada por 80%-30%=50%, lo cual nos dice que 15 datos caen en este rango, para verificar si esto es verdadero contemos los datos utilizando la lista ordenada: 12, 12, 15, 15, 15, 18, 18, 18, 18, 21, 21, 21, 24, 24, 24 que son exactamente 15 temperaturas. Adems de las estimaciones anteriores, existen otros trminos que se usan para localizar puntos especficos en una distribucin, tal es el caso de los CUARTILES. Los cuartiles son tres valores representados por Q1, Q2 y Q3 que dividen a la poblacin en cuatro partes iguales, cada uno de ellos contiene el 25% del total de los datos considerados, denominndose respectivamente primer cuartil =Q1, segundo cuartil =Q2 y tercer cuartil=Q3. Si se considera una lista ordenada de todas las observaciones, es fcil observar los puntos que representaran grficamente a los cuartiles.
25% primer dato Q1 25% 25% Q2 50% 25% Q3 75% 25% ltimo dato

Ubiquemos en la ojiva porcentual el valor que le corresponde a cada uno de los cuartiles:

103

TEMPERATURAS LEDAS DURANTE UN MES EN UN ARCHIVO 100 95 90 85 80 75 70 65 60 55 50 45 40 35 30 25 20 15 10 5 0 7.5 12.5 17.5 22.5 27.5 32.5 TEMPERATURAS

aproximadamente

FRECUENCIAS ACUMULADAS RELATIVAS (%)

Q1=8.5

Q2=18.5

Q3=23.5

El segundo cuartil Q2 divide al total de las observaciones en dos partes iguales de tal manera que a su izquierda se encuentra el 50% y a su derecha el otro 50%. En la siguiente unidad se te mostrar el procedimiento a seguir para calcular los cuartiles en una distribucin.

QU HE APRENDIDO? Antes de elaborar una grfica es indispensable reflexionar sobre el tipo de variable de que se trata a fin de que su representacin sea lo ms ilustrativa posible del comportamiento de los datos considerados, por esta razn te pido que en cada inciso indiques el tipo de variable (cualitativa o cuantitativa) y la grfica que utilizaras: 1) El nmero de libros por asignatura que tienes en tu biblioteca personal.

104

Estadstica Descriptiva

variable__________________________________________________ _______ grfica___________________________________________________ _______ 2) El nmero de libros por asignatura que existen en la biblioteca ms importante de tu comunidad. variable__________________________________________________ _______ grfica___________________________________________________ _______ 3) El nmero de nacimientos de tu localidad considerando intervalos de 5 aos durante el perodo 1970-1995. variable__________________________________________________ _______ grfica___________________________________________________ _______

105

Elabora el Resumen de la Unidad 3 ANOTANDO en cada descripcin la grfica de que se trata y completando las caractersticas que encuentres en blanco, al final de la gua lo encontrars resuelto, de ser posible, confronta tus respuestas y corrgelas en caso de ser errneas.
TIPOS DE GRFICAS _______________________________________ Caractersticas: a)Es una circunferencia en el primer cuadrante del plano cartesiano donde a la frecuencia de cada categora le corresponde un __________ b) Representacin grfica de ____________________ ____________________________________________ c) El nmero de categoras a considerar debe ser menor que en el de barras ________________________________________ Caractersticas: a) Son barras unidas que se trazan en el primer cuadrante del plano cartesiano b) Representacin grfica de____________________ ____________________________________________ c) En el eje de las X se marcan los puntos medios de cada intervalo d) En el eje de las Y se consideran las ___________ ____________________________________________ ________________________________________ Caractersticas: a) Grfica lineal trazada en el primer cuadrante del plano cartesiano que tiene forma de S b) Representacin grfica de ____________________ ____________________________________________ c) En el eje de las X se marcan los ______________ ____________________________________________ d) En el eje de las Y se marcan las frecuencias acumuladas correspondientes a cada intervalo e) Permite hacer estimaciones del comportamiento de los datos considerando uno en particular ________________________________________ Caractersticas: a) Son barras del mismo ancho trazadas en el primer cuadrante del plano cartesiano b) Las barras deben estar separadas _______________ ____________________________________________ c) Representacin grfica de _____________________ ____________________________________________ d) Considera pocas categoras

VARIABLES CONSIDERADAS a) Nominal b) Ordinal

VARIABLES CONSIDERADAS a) Continuas b) Discretas

VARIABLES CONSIDERADAS a) Continuas b) Discretas

VARIABLES CONSIDERADAS a) Nominal b) Ordinal

Contina Resumen de la Unidad 3:

106

Estadstica Descriptiva

TIPOS DE GRFICAS ______________________________________ Caractersticas: a) Grfica lineal trazada en el primer cuadrante del plano cartesiano que une los puntos medios de cada clase a la altura de su frecuencia correspondiente b) Representacin grfica de _________________ ________________________________________ c) En el eje de las X se marcan los puntos medios de cada intervalo, agregndose uno al inicio y otro al final de los que se estn considerando d) En el eje de las Y las frecuencias correspondientes a cada intervalo, agregndose _____________________ ____________________________________________ ____________________________________________

VARIABLES CONSIDERADAS a) Continuas b) Discretas

NOTA: Es recomendable que todas las grficas tengan un ttulo que describa brevemente la informacin que est siendo representada, as como la fuente de informacin, ya que stas deben ser autoexplicativas; con excepcin de la grfica de sectores, todas deben contener un ttulo en cada uno de los ejes que indique el tipo de datos que se estn representando.

107

EVALUACIN
1) Con los datos de la tabla de distribucin para datos agrupados que se elabor en la Unidad 2 en el tema Distribucin de Frecuencias Agrupadas, realiza lo que se te pide en cada inciso:
TABLA DE DISTRIBUCIN DE FRECUENCIAS DE DATOS POR INTERVALOS NMERO DE LIBROS O EXPEDIENTES PRESTADOS DURANTE 50 DAS PERODO ENERO-MARZO 1997 CLASES f Mc fa fr far 43- 47 4 45 4 8 8 48- 52 4 50 8 8 16 53- 57 11 55 19 22 38 58- 62 13 60 32 26 64 63- 67 10 65 42 20 84 68- 72 5 70 47 10 94 73- 77 3 75 50 6 100 TOTAL: 50 100 Fuente: Informacin proporcionada por el Departamento de Control Escolar.

a) Elabora histograma, polgono de frecuencias y ojiva porcentual en papel milimtrico (una hoja por cada grfica). b) La forma del _______________________________________ histograma es

c) El polgono de _________________________

frecuencias

presenta

un

sesgo

De acuerdo a la informacin contenida en la ojiva porcentual estimar: d) El porcentaje de das en que se prestaron menos de 50 libros o expedientes ________________________________________________________ _______ e)El porcentaje de das en que se prestaron ms de 70 libros ________________________________________________________ _______

108

Estadstica Descriptiva

f) A los 25 das del perodo considerado se prestaron de ______ a ______ expedientes. g) El porcentaje de das en que se prestaron de 63 a 68 expedientes. ________________________________________________________ _______ Verifica tus respuestas con la lista ordenada del nmero de libros o expedientes prestados durante 50 das. 2) El Jefe de un Archivo (o Biblioteca que slo atiende de lunes a viernes), quiere conocer cmo se comporta la entrada de usuarios durante el turno matutino, a fin de realizar una mejor distribucin de tareas entre su personal, para ello elige a una persona a quien le solicita obtenga la informacin correspondiente. El encargado de realizar la investigacin recopila los datos considerando una muestra de dos meses elegidos arbitrariamente y le presenta a su jefe el siguiente grfico:
AFLUENCIA DE USUARIOS DURANTE 61 DAS
100 90 80 70 60 50 40 30 20 10 0 19.5 25.5 31.5 37.5 43.5 49.5 55.5 61.5 % DE DAS CONSIDERADOS

NMERO DE USUARIOS

Ayuda al Jefe de Archivo (o Biblioteca) a contestar las siguientes preguntas: a) Si la persona que atiende al pblico en la maana se queja de que slo puede atender satisfactoriamente un mximo de 52 usuarios y quiere que se asigne otra persona que la auxilie en su labor qu porcentaje de das se atiende a un nmero mayor de personas?___________________________________________________

109

b) Lo anterior indica entonces que ________ das atiende a menos de 52 usuarios. c) La solucin al problema de atencin al pblico que tu daras es: ________________________________________________________ ____________________________________________________________ ______________ d) Obtener grficamente Q2 que tiene un valor de ________________________, significa que la mitad de los 61 das (30 aproximadamente) se atienden entre ________ y __________ usuarios.

INSTRUCCIN GENERAL De los siguientes ejercicios, resuelve el que corresponda a tu rea, en caso de que as lo desees, puedes resolver ambos. 3) Acude a una Biblioteca de tu localidad y durante 3 horas observa la afluencia de usuarios a la misma y anota: Tipo de biblioteca________________________________________________ Nmero de usuarios biblioteca_________________________ Nmero de usuarios servicio_____________________________ que entran a la

por

rea

de

Con la informacin obtenida realiza lo que se te pide en cada inciso: a) Elabora una tabla de distribucin de frecuencias simple con todos sus datos (ttulo, perodo, etc.)

110

Estadstica Descriptiva

b) Traza la grfica que consideres ms conveniente en papel milimtrico y escribe cul fue el motivo de tu decisin.

c) Qu servicio tuvo usuarios?_______________________

mayor

nmero

de

d) Calcula la proporcin del servicio con mayor nmero de usuarios con respecto al total de personas que entraron a solicitar un servicio durante el tiempo de la investigacin.__________________________________________________ ___ e) Estima un porcentaje con los datos de la grfica y verifica tu respuesta con la informacin obtenida en tu investigacin.___________________________________ f) Marca en la grfica con color rojo los cuartiles. 4) Con la informacin que obtuviste al acudir a un Archivo de Trmite (Oficina de Gobierno Administrativa, Archivo Estatal, Municipal o de la Localidad) en la Evaluacin de la UNIDAD I, realiza lo que se te pide en cada inciso: a) Elabora una tabla de distribucin de frecuencia simple con todos sus datos que muestre el comportamiento de la entrada de documentacin durante 30 das tomados arbitrariamente.

b) Traza la grfica que consideres ms adecuada en papel milimtrico y explica el motivo de tu decisin.

111

c) Estima un porcentaje a travs de la grfica y verifica tu respuesta con la informacin obtenida inicialmente. d) Calcula el nmero aproximado de documentos que se atienden mensualmente. e) Marca en la grfica con color rojo los cuartiles. ENVA A TU ASESOR

Ahora slo te falta una unidad para terminar. Bien hecho!

112

Estadstica Descriptiva

EDADES 16 17 18

f 2 1 3

UNIDAD 4 ESTADSTICA DESCRIPTIVA

En esta unidad analizaremos la informacin que aparece en las diferentes tablas de distribucin. Primeramente conoceremos los valores de la variable que sealan un valor central alrededor del que se agrupa el mayor nmero de los datos obtenidos y que indican el comportamiento de la poblacin; estos valores se encuentran incluidos en el tema de Medidas de Tendencia Central. Posteriormente, calcularemos las Medidas de Dispersin, las cuales describen la forma en que se distribuyen los datos, para finalmente terminar con el Teorema de Chebyshev que permite medir las variaciones de los datos con respecto a la media.

QU VOY A APRENDER EN ESTA UNIDAD? A calcular Medidas de Tendencia Central (Media, Moda y Mediana) que muestran los valores centrales de una distribucin y Medidas de dispersin (Rango, Desviacin Media, Varianza, Desviacin Estndar, Coeficiente de variacin y Cuartiles) que tambin reciben el nombre de medidas de variabilidad porque permiten calcular el valor de la dispersin de los datos, finalmente a travs del Teorema de Chebyshev se manejar y entender el concepto de desviacin tpica.

109

DIAGNSTICO 1) Pregntales a 10 de tus amigos su edad y antala, incluye la tuya. ________________________________________________________ _______ 2) Las edades que obtuviste ordnalas en forma ascendente. ________________________________________________________ _______ 3) Observa y escribe la edad que se localiza en el centro de la lista ordenada.____________________________________________________ ________ 4) Calcula y anota _________________________________ 5) Escribe la edad ____________________________ que la edad promedio.

se

repite

ms

veces.

6) Cmo son los valores que obtuviste en los incisos 3, 4 y 5, estn prximos o alejados? __________________________________________________________

Es de gran utilidad que recuerdes tu experiencia previa sobre el clculo de promedios, ya que slo se trata de sumar todos los valores considerados y el resultado dividirlo entre el nmero de datos. Tambin es importante que a lo largo de esta unidad observes cuidadosamente los valores que vas obteniendo, esto te permitir ms adelante inferir y llegar a conclusiones vlidas y verdaderas que reflejen no slo el cuidado de tus clculos sino la lgica de ver ms all de lo que tu ojos pueden observar.

110

Estadstica Descriptiva

111

4.1 MEDIDAS DE TENDENCIA CENTRAL

?
4.1.1 MEDIA 4.1.2 MEDIANA 4.1.3 MODA Como se mencion al principio de esta unidad, las medidas de Tendencia Central son valores representativos de la poblacin que nos indican los valores centrales alrededor de los cuales se agrupa el total de datos y son MEDIA, MODA y MEDIANA. El clculo de estas medidas depende de los datos que se estn considerando y que pueden ser: 1) DATOS NO AGRUPADOS a) Si se trata de una lista de nmeros como: 18, 17, 19, 16, 20 b) Datos en una tabla de distribucin de frecuencias simple (en donde no aparecen intervalos):
EDADES 16 17 18 f 2 1 3

2) DATOS AGRUPADOS a) Si estos se encuentran en una tabla de distribucin de frecuencias (con intervalos):
CLASES 18 - 20 21 - 23 24 - 26 f 5 6 3

Antes de definir cada una de las Medidas de Tendencia Central, introduciremos la notacin matemtica que se utiliza para abreviar sumas, denominada notacin Sigma debido a que usa la letra griega sigma ().

112

Estadstica Descriptiva

n xi i=1 x representa el valor del dato a considerar, el cual inicia con i=1 hasta el ensimo (n). Para comprender mejor esta notacin, consideremos algunos datos del mismo tipo:
2 x1 5 x2 4 x3 6 x4 9 x5

A los nmeros se les ha colocado una etiqueta, la letra x, con un subndice para saber de cuntos nmeros se trata. Se hace hincapi en que los datos no necesariamente tienen que estar ordenados. La notacin sigma es de gran utilidad ya que para indicar la suma de estos 5 nmeros se escribe: n xi
i=1

En este caso el primer subndice es 1, lo cual se expresa con i=1 y el ltimo es 5, por ello n=5 y se lee La suma de las xi donde i (el subndice) inicia con 1 y termina en 5, esta es la forma abreviada de indicar la suma de los cinco nmeros anteriores. Al substituir se tiene: 5 xi = x1 +x2 + x3 + x4 + x5 = 2 + 5+ 4+ 6+ 9 = 26 i=1 1) Considerando la siguiente serie contesta lo que se te pide en los incisos: 4 x1 2 x2 7 x3 6 x4 10 x5

3 a) xi = x1 +x2 + x3 = i=1

113

5 b) xi = x2 +x3 + x4 + x5 = i=2 5 c) xi = x1 +x2 + x3 + x4 + x5 = i=1 MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS: _ MEDIA ARITMTICA (X) Esta Medida de Tendencia Central es la que se utiliza con mayor frecuencia, t ya la has manejado, se conoce tambin con los nombres de Valor medio, Promedio Aritmtico, Media Aritmtica o simplemente Media y es la suma de los datos o puntuaciones consideradas, dividida entre el nmero de casos. Ms formalmente se dice que la Media de un conjunto de datos x1, x2, x3, ... xn, es igual a la suma de los valores de las xs divida entre el tamao de la muestra (n) o poblacin (N); esto queda representado en la siguiente frmula: MUESTRA tamao n: n xi _ i=1 X MEDIA= X = ------------- = ------------------------n n _ X se lee equis barra. POBLACIN tamao N: n xi i=1 X MEDIA= = ------------- = ------------------------N N es la letra griega mu 2) Obtener la media de las calificaciones que un alumno obtuvo durante un semestre en la Asignatura de Mtodos Estadsticos : 8, 7, 6 y 10.

114

Estadstica Descriptiva

_ X 8 + 7 + 6 + 10 31 X= -------------------- = ----------------------- = -------- = 7.75 n 4 4

Redondeando al entero ms prximo se tiene que la calificacin promedio que este alumno logr en el semestre es de 8. MODA (Mo) En un conjunto de datos la moda es el valor que se repite ms veces o que tiene mayor frecuencia. Para encontrar esta medida cuando se tienen datos no agrupados, primero se ordenan los datos en forma ascendente. 3) A un grupo de 20 alumnos se les pregunt su promedio del semestre, los valores proporcionados fueron: 8, 7, 9, 9, 10, 10, 8, 6, 7, 7, 8, 9, 9, 8, 8, 9, 10, 7, 9, 10. Calcular media y moda. La media es:
_ X 8+7+9+9+10+10+8+6+7+7+8+9+9+8+8+9+10+7+9+10 168 X= -------------------- = ---------------------------------------------------------------------- =------------ =8.4 n 20 20 _ X= 8

Para encontrar la moda, primero se ordenan los datos en forma ascendente: 6, 7, 7, 7, 7, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 10, 10, 10, 10. El valor de mayor frecuencia es 9, entonces Mo=9 y es unimodal.
Nota: Toda distribucin que tiene una sola moda recibe el nombre de unimodal, si tiene 2 bimodal y si tiene ms de 2 multimodal.

MEDIANA (Md) Dado un conjunto de valores ordenados en forma ascendente, la mediana es el valor que se encuentra a la mitad de la serie, arriba de ella

115

est el 50% del total de datos y abajo el 50% restante. Dependiendo del nmero de datos, se consideran dos casos: a)En una serie formada por un nmero impar de datos la mediana ocupa el lugar (n+1)/2. Si los valores ordenados son: 1, 2, 2, 3, 3, 5, 7, 8, 8, el valor de la mediana ocupa el lugar (9+1)/2 = 5, lo cual indica que es el valor del quinto lugar que en este caso es el nmero 3. b) Si n es par la mediana es el promedio de los valores centrales. Tomemos los siguientes datos: 23, 27, 36, 38, 40, 51 La mediana es igual al promedio del valor que ocupa el lugar n/2 y del que ocupa el lugar n/2 + 1
n/2 = 6/2 = 3 este lugar es ocupado por el 36. n/2 + 1 = 6/2 + 1 = 4 aqu se encuentra el 38.

Calculando el promedio de 36 y 38 tenemos que:


36 + 38 Md= ------------ = 37 2

Para encontrar la mediana de los promedios de los alumnos considerados en el inciso 3) se debe trabajar nuevamente con la lista ordenada en forma ascendente. Como se tiene un nmero par de datos, la mediana es el promedio del valor central: 6, 7, 7, 7, 7, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 10, 10, 10, 10 La mediana es (8+9)/2 )= 8.5 Agrupemos en una tabla de distribucin de frecuencia simple los promedios de los 20 alumnos y calculemos su media con la frmula: n fx i=1 X= -------------------n

116

Estadstica Descriptiva

fx es el producto de cada valor (x) por su frecuencia (f).


PROMEDIO x 6 7 8 9 10 FRECUENCIA f 1 4 5 6 4 20

Observemos que la suma de la columna de frecuencias es el valor de n (20). Para encontrar la media se obtiene la suma de todos los datos, para ello se multiplica en cada rengln el valor de equis x por el nmero de veces que se repite, esto es, por su frecuencia. Los resultados se escriben en la columna correspondiente:
PROMEDIO x 6 7 8 9 10 FRECUENCIA f 1 4 5 6 4 20 PROMEDIO MULTIPLICADO POR FRECUENCIA (fx) 6 28 40 54 40 168

En este caso 168 es la sumatoria de las frecuencias multiplicadas por x, esto es igual a fx Al sustituir los valores correspondientes:
_ fx 168 X= -------------------- = ----------- = 8.4 que redondeando es 8. n 20

La moda (Mo) es la categora con mayor frecuencia, que en este caso es 9, ya que tiene frecuencia 6. A fin de encontrar la mediana se calcula la columna de frecuencias acumuladas (fa).
PROMEDIO x 6 7 FRECUENCIA f 1 4 fa 1 5

117

8 9 10

5 6 4 20

10 16 20

y se realizan los siguientes pasos: 1) Calcular el cociente n/2 = 20/2 = 10 2) Ubicar en qu rengln de fa cae el nmero n/2=10 3) La categora que contiene a n/2 es el valor de la mediana
PROMEDIO x 6 7 8 9 10 FRECUENCIA f 1 4 5 6 4 20 fa 1 5 10 16 20

n/2= 10 cae aqu

Entonces Md = 8 Como te habrs dado cuenta, tanto la media como la moda aunque fueron calculadas por diferentes procedimientos se obtuvieron los mismos resultados; sin embargo, la mediana tuvo una mnima diferencia de .5. En ocasiones se presentan series que no tienen moda como: 1, 3, 5, 7, 8, 12, aunque si media (6) y mediana (7).

CARACTERSTICAS TENDENCIA CENTRAL:

IMPORTANTES

DE

LAS

MEDIDAS

DE

La media tiene la desventaja de ser sensible a valores extremos, esto significa que si dentro de una serie de nmeros se considera un valor distinto a los dems, la media vara considerablemente. La moda no es sensible a valores extremos, pero tiene el inconveniente de no ser nica y en algunos casos sta difiere en muy poco de otros valores del conjunto o es un valor extremo. Al obtener la moda de un conjunto de datos, es necesario expresar claramente si es unimodal por tener una moda, bimodal por tener dos o si tiene una moda principal y una secundaria en caso de que la diferencia entre ambos valores sea mnima.

118

Estadstica Descriptiva

La medida de tendencia central que se recomienda para ser utilizada en el anlisis de datos es la mediana, por su virtud de no ser sensible a valores extremos y adems, ser nica. Consideremos el conjunto formado por: 3, 6, 7, 8, 10 y calculemos sus medidas de tendencia central: MEDIA:
_ 3+6+7+8+10 34 La media es igual a X = ------------------------------- = ------------- = 6.8 aproximadamente 7. 5 5

MODA: No tiene MEDIANA: es 7. Si en lugar del nmero 10 tomamos al 40 (que es un valor diferente a los dems), tendremos: 3, 6, 7, 8, 40 MEDIA:
_ 3+6+7+8+40 64 La media es igual a X = ------------------------------- = ------------- = 12.8 aproximadamente 13. 5 5

MODA: No tiene MEDIANA: sigue siendo el nmero 7. Si comparamos los resultados obtenidos en la serie 3, 6, 7, 8,10 con los que se obtienen al sustituir el 10 por 40, la media ha cambiado, mientras que la mediana sigue siendo la misma. En el siguiente ejemplo calcularemos las Medidas de Tendencia Central: El personal de un Archivo est integrado por 110 personas, de las cuales 70 son de base con un sueldo mensual de $1,800.00 y el resto estn contratadas por honorarios con un sueldo mensual de $3,000.00, en una junta se solicita al Director del mismo un aumento salarial y ste les informa que no es posible ya que el salario promedio de los empleados es de $2,236.00 y rebasa al que actualmente se paga en otros archivos. Calculemos las medidas de tendencia central:

119

SUELDO MENSUAL x 1,800.00 3,000.00

FRECUENCIA f 70 40 110

SUELDO MULTIPLICADO POR FRECUENCIA (fx) 126000 120000 246000

_ 246000 X = --------------- = 2236.36 110 La categora de mayor frecuencia $1,8000.00 pertenece a la Moda: Mo =

En este ejercicio, escribir 70 veces $1,800.00 y 40 veces $3,000.00 para conocer el valor central resulta bastante tedioso, as que primero averiguaremos en qu categora cae el valor central, recordando que la columna de frecuencias acumuladas (fa) nos permite conocer la ubicacin del dato que buscamos:
SUELDO MENSUAL x 1,800.00 3,000.00 FRECUENCIA f 70 40 110 SUELDO MULTIPLICADO POR FRECUENCIA (fx) 126000 120000 246000 FRECUENCIA ACUMULADA fa 70 110

Como n es par (n=110), calculemos el lugar que ocupan los valores centrales: n/2= 55 n/2 + 1 = 56 Ambos valores caen en la primera categora ya que sta contiene a los valores que ocupan el primer lugar hasta el septuagsimo, por lo que la Mediana es $1,800.00

120

Estadstica Descriptiva

QU HE APRENDIDO? 1) En este ltimo ejemplo consideras que el Director del Archivo ha optado por la mejor medida de tendencia central para no permitir el aumento de sueldo? ________________________________________________________ ____________________________________________________________ ______________ 2) Qu argumento daras para convencer al Director del Archivo, a fin de que modifique su opinin acerca de considerar el salario promedio como un parmetro confiable? ________________________________________________________ ____________________________________________________________ _______________ 3) Escribe tu propia definicin de cada una de las Medidas de Tendencia Central. ________________________________________________________ ____________________________________________________________ _______________

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS: Como ya se dijo al inicio de esta unidad, los datos agrupados se encuentran en una tabla de distribucin de frecuencias en donde el representante de cada intervalo es la Marca de clase tambin denominada punto medio, esta es la razn por la cual para encontrar la media, se multiplica la marca de clase de cada intervalo por su frecuencia respectiva (indica el nmero de datos del intervalo), se suman los resultados obtenidos y se divide entre la suma de frecuencias. La frmula que representa las operaciones ya descritas es: n Mcf f(Mc) _ i=1 MEDIA= X = --------------= --------------n n
121

Considerando a n como el tamao de la muestra. A fin de establecer el procedimiento para el clculo de las Medidas de Tendencia Central para datos que se encuentran incluidos en intervalos, realicemos el siguiente ejercicio. Se pretende conocer la asistencia promedio de usuarios a una biblioteca que atiende al pblico durante todos los das del ao, en el receso julio-agosto, para ello se considera el nmero de usuarios que acudieron en la misma fecha el ao pasado, obtenindose la siguiente tabla de distribucin de frecuencias para datos agrupados:
CLASES (USUARIOS) X 20-24 25-29 30-34 35-39 40-44 45-49 NMERO DE DAS f 12 9 19 8 7 6 61

Es necesario encontrar la marca de clase de cada intervalo y multiplicarla por su frecuencia respectiva (columna fMc):
CLASES 20 24 25 29 30 34 35 39 40 44 45 49 f 12 9 19 8 7 6 61 Mc 22 27 32 37 42 47 fMc 264 243 608 296 294 282 1987

Se sustituye fMc= 1987 y n=61 en la frmula para obtener la media:


_ Mcf f(Mc) 1987 _ MEDIA= X = --------------= --------------- = ----------- =32.5 redondeando X= 33 n n 61

La asistencia promedio de usuarios a la biblioteca durante el periodo julio-agosto fue de 33 personas.

122

Estadstica Descriptiva

Esta medida de tendencia central que acabamos de calcular recibe el nombre de MEDIA PONDERADA, ya que se obtuvo al multiplicar cada representante (Mc) por su peso que en este caso es su frecuencia (f) correspondiente y el resultado se dividi entre la suma de todos los pesos o frecuencias. Para encontrar la moda se debe aplicar la frmula: d1 MODA = Mo = Li + ( -------------- ) A d1 + d2 Para algunos autores Li es el lmite inferior y para otros el lmite real inferior, cualquiera de las dos alternativas es vlida, ya que si recordamos, la diferencia entre ambos lmites es .5. En el clculo de esta medida nosotros definimos a Li = lmite inferior del intervalo de la clase de mayor frecuencia o clase modal. d1 = frecuencia de la clase modal menos la frecuencia de la clase anterior. d2= frecuencia de la clase modal menos la frecuencia de la clase posterior a la clase de la moda. A = amplitud de cualquiera de los intervalos de la tabla (todos tienen la misma amplitud) es la diferencia entre cualesquiera 2 fronteras o lmites inferiores. Observemos las frecuencias de los intervalos y destaquemos el mayor.
CLASES (USUARIOS) X 20-24 25-29 30-34 35-39 40-44 45-49 A = 25-20 = 5 NMERO DE DAS f 12 9 19 8 7 6 61

intervalo de mayor frecuencia o clase modal Li =30 d1 = 19 - 9 = 10 d2 = 19 - 8 = 11

Los valores obtenidos se sustituyen en la frmula: d1


123

Mo = Li + ( -------------- ) A d1 + d2
10 50 Mo = 30 + ( ----------- ) 5 = 30 + ----- = 30 + 2.3 = 32.3 redondeando Mo = 32 10 + 11 21

La mediana (Md) de un conjunto de datos en una tabla de distribucin para datos agrupados, se calcula con: n/2 - F MEDIANA = Md = Li + ( -------------- ) A f donde: Li = lmite inferior del intervalo que contiene a la mediana o clase de la mediana. n/2 = es el tamao de la muestra dividido entre dos. F = frecuencia acumulada (fa) de la clase anterior a la clase de la mediana. f= frecuencia absoluta (f) del intervalo que contiene a la mediana. A = amplitud de la clase de la mediana. Iniciamos agregando a la tabla de frecuencias la columna de frecuencias acumuladas:
CLASES 20 24 25 29 30 34 35 39 40 44 45 49 f 12 9 19 8 7 6 61 Mc 22 27 32 37 42 47 fMc 264 243 608 296 294 282 1987 fa 12 21 40 48 55 61 Para encontrar la clase de la mediana calculamos n/2 = 61/2 = 30.5 y vemos dnde cae este valor en fa. en este intervalo cae 30.5 por lo que 30-34 es la clase de la mediana.

Li = 30 n/2 = 30.5 F = 21 f = 19

124

Estadstica Descriptiva

A= 5 Al sustituir estos valores en la frmula tenemos:


n/2 - F 30.5 - 21 47.5 Md = Li + ( -------------- ) A = 30 + ( --------------) 5 = 30 + ------- = 30 + 2.5 redondeando Md =33 f 19 19

Podemos concluir que durante el perodo julio - agosto: _ X = 33 El promedio de usuarios fue de 33 personas.
Mo = 32 Durante 19 das asistieron 32 usuarios a la biblioteca, estos fueron los das de mayor asistencia. Md = 33 Este es el nmero de usuarios que asistieron a la biblioteca y que tiene tanto a su derecha como a su izquierda la mitad de las frecuencias.

Para concluir este tema y analizar las medidas de tendencia central, veamos el siguiente ejemplo en donde se ha tomado el nmero de expedientes que solicitan en un mes los investigadores que acuden a un Archivo:
NMERO DE NMERO DE EXPEDIENTE INVESTIGADOR S ES (x) (f) 1 3 50 4 6 35 7 9 22 10 12 36 13 15 21 16 18 9 19 21 7 180 Mc fMc fa

2 5 8 11 14 17 20

100 175 176 396 294 153 140 1434

50 85 107 143 164 173 180

1434 X = ---------- = 7.9 8 expedientes 180

Conclusin: En promedio los investigadores solicitan mensualmente un promedio de 8 expedientes.

125

Para la moda encontramos los valores necesarios y los sustituimos en la expresin correspondiente:
clase modal 1- 3 Li =1 d1 = 50-0 = 50 (la frecuencia anterior a la clase modal es 0) d2 = 50- 35 = 15 A = 4-1 = 3

d1 Mo = Li + ( -------------- ) A d1 + d2 50 150 Mo = 1 + ( ----------- ) 3 = 1 + ----- = 1 + 2.3 = 3.3 3 expedientes 50 + 15 65 Conclusin: El nmero de investigadores que solicitan 3 expedientes es el ms numeroso, ya que le corresponde un total del 27.7% que es el porcentaje de la clase modal. A fin de ubicar la clase de la mediana primero calculamos n/2 = 90 al observar la columna de fa podemos decir que se trata del intervalo 7-9 por lo que: Li =7 F =85 f =22 A=3 n/2 - F MEDIANA = Md = Li + ( -------------- ) A f 90-85 15 Md = 7 + ( -------------- ) 3 = 7 + ------- = 7 + .68 = 7.68 8 22 22 Si se tuviera el listado de todos los datos ordenados en forma ascendente, tendramos que el valor central es 8, esto quiere decir que el 50% del total de investigadores (90) solicitan en un mes de 1 a 8 expedientes, es decir, como mximo 8 expedientes.

126

Estadstica Descriptiva

QU HE APRENDIDO?

LECTURA 3 A fin de reforzar los conocimientos que acabas de adquirir sobre las medidas de tendencia central, es necesario que leas el libro Estadstica Paso a Paso de Howard B. Christensen de la pgina 102 a la 111, incluido al final de esta gua, revises los ejemplos y verifiques el resultado por lo menos en 3 de ellos; despus de leer elabora el resumen correspondiente y resuelve los ejercicios que se te solicitan enseguida.

1) Explica por lo menos dos caractersticas de las siguientes distribuciones: a) Unimodal b) Bimodal 2) Traza en papel milimtrico un polgono unimodal y simtrico de frecuencias absolutas y localiza la media, la moda y la mediana. 3) Pregunta a 8 de tus amigos su ingreso mensual, ordnalo en forma ascendente y encuentra las medidas de tendencia central indicando la cantidad que es la ms representativa de todas.

127

4.2 MEDIDAS DE DISPERSIN

X 4.2.1 RANGO 4.2.2 CUARTILES Hasta aqu slo se han considerado los valores centrales de una distribucin, esto no es suficiente para conocer el comportamiento de los datos, razn que nos motiva a calcular otro tipo de medidas que nos informen qu tan prximos o alejados estn de la media (X), por lo que ahora nos ocuparemos de las medidas de dispersin que nos permiten evaluar la variabilidad y dispersin de los datos en una distribucin, siendo las ms conocidas: RANGO, DESVIACIN MEDIA, VARIANZA y DESVIACIN ESTNDAR. RANGO O AMPLITUD total (tambin llamado extensin o recorrido) slo considera los valores extremos, por lo que debe tomarse nicamente como un ndice preliminar o muy aproximado, ste se calcula restando al valor mximo alcanzado por la variable el valor mnimo. Esta medida se obtuvo cuando se elabor la tabla de distribucin de frecuencias para datos agrupados. Rango = R = Valor mximo - Valor mnimo Supongamos que en un examen de Estadstica practicado a los grupos A y B las calificaciones fueron:
GRUPO A 6 GRUPO 6 B 7 7 7 7 8 7 8 7 8 8 8 9 9 9 9 10 10 10

_ MEDIA DEL GRUPO A= X = 8 RANGO= R= 10 - 6 = 4 _ MEDIA DEL GRUPO B= X = 8 RANGO = R = 10 - 6 = 4 Ambos grupos tienen la misma media, lo que podra hacernos suponer que no hay diferencias entre las calificaciones de ambos grupos, sin

128

Estadstica Descriptiva

embargo, claramente se observa que s existe variacin, lo que tampoco es reportado por el rango. Lo anterior indica que el rango no es una medicin precisa y slo se debe utilizar como un valor aproximado. RANGO INTERCUARTIL de un grupo de observaciones es la diferencia entre los valores del primero y tercer cuartil y se simboliza con Q: Q = Q3 - Q1 Antes de continuar, veamos la forma en que se calculan los cuartiles, para posteriormente poder calcular el rango intercuartil. CLCULO DE LOS CUARTILES Anteriormente ya nos habamos referido a los cuartiles como tres valores denominados Q1, Q2 y Q3 que dividen al total de datos de una distribucin en tres partes iguales, aunque slo los habamos visualizado en la ojiva porcentual, en este captulo haremos los clculos correspondientes para obtenerlos no sin antes indicarte que tambin son medidas de dispersin. Para calcular los tres cuartiles ya mencionados se utilizan las frmulas que aparecen en seguida, ten cuidado en la sustitucin de los datos. En todos los casos A es la amplitud del intervalo respectivo (todos son iguales): n/4 - F1 Q1 = L1 + ( -------------- ) A f1 L1 es el lmite inferior del intervalo del primer cuartil. f1 frecuencia absoluta del primer cuartil. F1 frecuencia acumulada anterior al intervalo del primer cuartil. n nmero total de datos. 2n/4 - F2 Q2 = L2 + ( -------------- ) A f2 L2 es el lmite inferior del intervalo del segundo cuartil. f2 frecuencia absoluta del segundo cuartil. F2 frecuencia acumulada anterior al intervalo del segundo cuartil. n nmero total de datos.

129

3n/4 - F3 Q3 = L3 + ( -------------- ) A f3 L3 es el lmite inferior del intervalo del tercer cuartil. f3 frecuencia absoluta del tercer cuartil. F3 frecuencia acumulada anterior al intervalo del tercer cuartil. n nmero total de datos. Iniciemos el clculo de los cuartiles en la tabla que hemos venido trabajando:
CLASES 20 24 25 29 30 34 35 39 40 44 45 49 f 12 9 19 8 7 6 61 Mc 22 27 32 37 42 47 fMc 264 243 608 296 294 282 1987 fa 12 21 40 48 55 61

En el clculo de cada uno de los cuartiles, el primer paso es encontrar el intervalo del cuartil que ese est calculando, la clave est en efectuar las operaciones que involucran al nmero total de datos que es n: n/4 - F1 Q1 = L1 + ( -------------- ) A f1 n/4 = 61/4 = 15.25 este valor al ser localizado en la columna de frecuencias acumuladas (fa), nos indica el intervalo que estamos buscando, en este caso es 25-29 de donde tenemos:
A= amplitud del intervalo = 5 L1 es el lmite inferior del intervalo del primer cuartil = 25 f1 frecuencia absoluta del primer cuartil = 9 F1 frecuencia acumulada anterior al intervalo del primer cuartil = 12

Estos datos se sustituyen en la frmula:


15.25 - 12 16.25 Q1 = 25 + ( -------------- ) 5 = 25 + ---------------= 25 + 1.8 = 26.8 9 9

130

Estadstica Descriptiva

Por lo tanto Q1 = 26.8 27 (el smbolo significa aproximadamente igual a) Al realizar el mismo procedimiento para el segundo cuartil tenemos que 2n/4 = 122/4 = 30.5 al localizarlo en fa obtenemos el intervalo del segundo cuartil que es 30-34. L2 = 30 f2 = 19 F2 = 21 Al ser sustituidos los valores encontrados en la frmula que le corresponde, observamos que son los mismos que dieron origen a la mediana: 30.5 - 19 Q2 = 30 + ( -------------- ) 5 = 30 + 2.5 33 21 Como resultado se tiene entonces que Q2 = mediana distribucin, ya que ambos la dividen en dos partes iguales. de la

Realiza los clculos necesarios para encontrar el valor del tercer cuartil. Intervalo del tercer cuartil = L3= f3 = F3 = Q3 = Ya podemos calcular el rango intercuartil: Q3 = 39 Q2 = 33

Q = 39 - 33 = 6

131

QU HE APRENDIDO? 1) Con la informacin de la siguiente tabla encuentra los cuartiles y contesta lo que se te pide:
CLASES 4-10 10-16 16-22 22-28 28-34 TOTAL f 5 15 30 10 6 66

a) Si Q1 = ___________ quiere decir que el 25% de los datos tiene valores comprendidos entre ________ y ___________________.

b) Como Q2= _________ significa que el ________ de los datos se encuentran entre 4 y ____________.

c) Dado que Q3= ___________ el ________ de los datos son valores entre _________ y ____________.

132

Estadstica Descriptiva

4.2.3 DESVIACIN MEDIA CLCULO DE LA DESVIACIN MEDIA PARA DATOS NO AGRUPADOS: DESVIACIN MEDIA (DM) es el promedio de las desviaciones a partir de un valor central (media, moda o mediana), lo ms comn es trabajar con la Media. A fin de ejemplificar el uso de esta medida tomemos nuevamente la tabla de la pgina 127. Para conocer la variabilidad de las calificaciones del grupo A con respecto a la media se requiere encontrar la diferencia entre cada calificacin y la media, la cual recibe el nombre de desvo o desviacin: _ desvo o desviacin = d = x - X donde x es el dato y X la media de la distribucin _ A cada uno de los datos se le resta la media X= 8 para obtener el desvo correspondiente:
GRUPO A DESVO 6 6 -8 -2 7 7-8 -1 7 7-8 -1 8 8-8 0 8 8-8 0 8 8-8 0 8 8-8 0 9 9-8 1 9 9-8 1 10 10-8 2

El signo menos (-) est indicando que la direccin de los desvos es hacia la izquierda de la media. Al sumar los desvos se tiene: -2-1-1+1+1+2= 0, lo cual indica que la suma de las desviaciones de las variables mayores que la media es igual y de signo contrario a la suma de las desviaciones de las variables menores que la media, esto significa que siempre que se consideran a los desvos con su signo correspondiente se llega a que la suma de todas es cero 0, lo cual no tiene sentido, es por ello que para calcular la cantidad de variabilidad o distancia de las desviaciones, no se deben tomar en cuenta las direcciones, es decir, los desvos se suman considerndolos positivos, lo que se conoce como valor absoluto y el resultado se divide entre el tamao de la poblacin o muestra.

133

Debemos tener presente que dado cualquier nmero positivo o negativo, su valor absoluto es el nmero que representa, por ejemplo:
El valor absoluto de 2 se escribe 2 = 2 absoluto y el valor absoluto de -2 es -2 = 2 en ambos casos las barras indican valor

Ahora veamos la forma en que se calcula la desviacin media de datos contenidos en una tabla de distribucin simple, utilizando las mismas calificaciones del grupo A: El clculo de la desviacin media del grupo A considerando el valor absoluto de los desvos es: 2+1+1+1+1+2 8 DMA = ------------------------------ = ------ = .8 10 10 Esta medida de dispersin indica que la variabilidad promedio de todos los valores de la distribucin con respecto a la media es .8, en otras palabras, que en promedio el grupo obtuvo una calificacin de 8 con una desviacin promedio de .8 de ms o de menos. Una caracterstica de las desviaciones absolutas es que su suma tiende a agrandarse a medida que aumenta la dispersin o variabilidad de la distribucin. La desviacin media para datos no agrupados considerando una muestra con tamao n se calcula con la frmula:
n n _ x xi - X i=1 i=1 DM = --------- = -------------n n

Para una poblacin de tamao N la desviacin media es:


n n x xi - i=1 i=1 DM = --------- = ----------------N N

134

Estadstica Descriptiva

Las diferencias xi - X y xi - reciben el nombre de desvo o desviacin, como ya se dijo anteriormente, y x= xi - X representa la suma de las desviaciones absolutas, esto es, sin tomar en cuenta los signos de los valores de la variable.
CALIFICACIONES OBTENIDAS POR EL GRUPO A EN UN EXAMEN DE ESTADSTICA CALIFICACIONES NMERO DE x ALUMNOS f 6 1 7 2 8 4 9 2 10 1 TOTAL 10

En una tabla de distribucin de frecuencia simple la DM se encuentra con la siguiente expresin: _ fxi - X _ DM = -------------------- en donde se puede sustituir d=xi - X n _ Encontremos la DM en la siguiente tabla con X=8:
CALIFICACIONES x 6 7 8 9 10 TOTAL NMERO DE ALUMNOS f 1 2 4 2 1 10 _ xi - X -2 -1 0 1 2 _ xi - X 2 1 0 1 2 _ fxi - X 2 2 0 2 2 8

este total es _ f xi - X

fxi - X 8 DMA = -------------------- = ------- = .8 n 10

Como te habrs dado cuenta, el resultado obtenido para el grupo A en la lista de calificaciones y en la tabla de distribucin de frecuencia simple es el mismo. Como DMA = .8 podemos asegurar que la dispersin de los valores es relativamente pequea.
135

QU HE APRENDIDO? Para reforzar tu aprendizaje resuelve lo que se te solicita considerando los datos del Grupo B:
GRUPO B 6 7 7 7 7 8 9 9 10 10

1) Calcula la desviacin media para datos en forma de lista.

DMB=
CALIFICACIONES x 6 7 8 9 10 TOTAL NMERO DE ALUMNOS f _ xi - X _ xi - X _ fxi - X

DMB= 3) Verifica que los resultados obtenidos en los dos incisos anteriores sean los mismos. 4) Cul de los dos grupos (A o B) presenta mayor desviacin media y por lo tanto tiene mayor dispersin o variabilidad en sus calificaciones? ____________________________________________________________ ________

136

Estadstica Descriptiva

CLCULO AGRUPADOS

DE

LA

DESVIACIN

MEDIA

PARA

DATOS

Con el propsito de encontrar la desviacin media en una tabla de distribucin de frecuencias para datos agrupados, supongamos que en un Archivo se desea conocer el nmero promedio de expedientes que son revisados diariamente y la desviacin media correspondiente, si se tiene una muestra de 40 das:
CLASES 13 17 18 22 23 27 28 32 33 37 38 42 f Mc fMc 3 15 45 1 20 20 4 25 100 11 30 330 8 35 280 13 40 520 40 1295 Mc-X 17 12 7 2 3 8 f Mc-X 51 12 28 22 24 104 241

_ 1295 El nmero promedio de expedientes revisados durante 40 das es: X = --------- = 32.3 aproximadamente 32 40

La frmula para calcular la desviacin media en datos agrupados en una distribucin con intervalos es: fMc-X DM = ---------------n por lo que sustituyendo : es 6 40 CONCLUSIN: En promedio se revisan 32 expedientes diariamente con una desviacin promedio de ms o de menos 6 expedientes diarios. 241 DM = --------- = 6.02 redondeando

137

QU HE APRENDIDO? La siguiente tabla muestra el tiempo en minutos que tarda una persona en realizar los trmites necesarios para recibir un libro para prstamo a domicilio:
CLASES 7-9 10-12 13-15 16-18 19-21 TOTAL f 5 15 12 8 5 45

1) Calcula el promedio y la desviacin media e interprtala.

138

Estadstica Descriptiva

4.2.4 VARIANZA 4.2.5 DESVIACIN ESTNDAR CLCULO DE LA VARIANZA O VARIANCIA (Var(X)) PARA DATOS NO AGRUPADOS Es una medida de dispersin en donde se calculan los cuadrados de las desviaciones entre los valores de la variable y la media (xi - X)2 y su suma se divide entre n-1 si se trata de una muestra de tamao n y entre N si se trata de una poblacin:
Muestra tamao n: n _ (xi - X)2 i=1 2 VAR(X) = S = ---------------------- VARIANZA MUESTRAL n -1 Poblacin tamao N: n _ (xi - X)2 i=1 VAR(X) = 2 = ---------------------- VARIANZA POBLACIONAL N

En una biblioteca se ha reportando la prdida de 36 libros distribuidos de la siguiente manera: enero 4, febrero 5, marzo 9, abril 10, mayo 5 y junio 3. En este ejercicio podemos trabajar con la lista o con la tabla, para agilizar los clculos utilicemos la tabla:
NMERO DE LIBROS EXTRAVIADOS EN LA BIBLIOTECA DURANTE EL PERODO ENERO-JUNIO --Al elevar al cuadrado las MESES xi xi -X (xi - X)2 desviaciones reales de la ENERO 4 4-6=-2 4 variable con respecto a la FEBRERO 5 5-6=-1 1 media se evita el manejo MARZO 9 9-6=3 9 de nmeros negativos, ya ABRIL 10 10-6=4 16 que todo nmero elevado MAYO 5 5-6=-1 1 al cuadrado es positivo. JUNIO 3 3-6=-3 9 36 0 40

La suma de los desvos es cero _ 36

139

El promedio de libros extraviados es X = ------- = 6 6 Usemos la frmula para calcular la varianza respectiva: _ 40 40 (xi - X)2 2 VAR(X) = S = ---------------------- = ---------------- = -------- = 1.14 n -1 36-1 35 Un ejemplo ms lo realizaremos con la tabla de calificaciones del grupo A, tomando en cuenta que su media es 8.
CALIFICACIONES DEL GRUPO A CALIFICACIN f xi-X (xi - X)2 f(xi - X)2 6 1 -2 4 4 7 2 -1 1 2 8 4 0 0 0 9 2 1 1 2 10 1 2 4 4 10 12 12 S2A = -------- = 1.2 10

De igual manera que se hicieron los clculos de la varianza para el grupo A, encuentra la misma medida de dispersin para el grupo B completando la tabla que aparece a continuacin:
GRUPO B 6 7 7 7 7 8 9 9 10 10

CALIFICACIONES DEL GRUPO B CALIFICACIN f xi-X (xi - X)2 f(xi - X)2 6 7 8 9 10

S2B = -------- =

Como te habrs dado cuenta mientras mayor es la dispersin, mayor es la varianza, por ello es que en este caso la varianza mayor es del grupo ___________

140

Estadstica Descriptiva

La varianza es una excelente medida que indica la dispersin de los datos, el nico inconveniente es que sus unidades son cuadradas lo cual no tiene ningn sentido, con el propsito de superar este problema se utiliza la DESVIACIN ESTNDAR, que se define como la raz cuadrada de la varianza y es la medida de variabilidad que veremos a continuacin.

CLCULO DE LA DESVIACIN TPICA O ESTNDAR PARA DATOS NO AGRUPADOS Esta medida de dispersin es muy parecida a la desviacin media, tiene como base la media y sus unidades de medida son iguales a las unidades de los datos, por ejemplo si los datos son libros o expedientes, la desviacin estndar tambin son libros o expedientes segn corresponda. En trminos generales podemos decir que la desviacin estndar representa la variabilidad promedio de los datos de una distribucin con respecto a la media, de tal manera que, mientras mayor sea la dispersin alrededor de la media, mayor ser la desviacin estndar. Al calcular la varianza de las calificaciones del grupo A obtuvimos: 12 S2 A= -------- = 1.2 10 Es claro entonces que la desviacin estndar para una muestra de 10 calificaciones es: SA = 1.2 = 1.09 Calcula la desviacin estndar para el grupo B: SB =

141

CLCULO DE LA VARIANZA Y DESVIACIN ESTNDAR PARA DATOS AGRUPADOS Consideremos nuevamente la informacin de la tabla que muestra el nmero de expedientes que son revisados durante 40 das en un Archivo:

CLASES 13 17 18 22 23 27 28 32 33 37 38 42

f 3 1 4 11 8 13 40

Mc 15 20 25 30 35 40

fMc 45 20 100 330 280 520 1295

La frmula que se utiliza es:


n n fMc2 fMc i=1 i=1 VAR(X) = S2 = --------------- - ---------------n n f f i=1 i=1 2

A la tabla anterior le agregamos las columnas Mc2 y fMc2

CLASES 13 17 18 22 23 27 28 32 33 37 38 42

f 3 1 4 11 8 13 40

Mc 15 20 25 30 35 40

Mc2 225 400 625 900 1225 1600

fMc 45 20 100 330 280 520 1295 1677025

fMc2 675 400 2500 9900 9800 20800 44075

Sustituyendo los valores: 44075 (1295)2

1677025 VAR(X) = S2 = --------------- - ---------------- = 1101.875 - --------------40 (40)2 1600

142

Estadstica Descriptiva

S2 = 1101.875 - 1048.1406 = 53.73 S2 = 53.73 sacando raz encontramos el valor de la desviacin estndar S = 7.3 Ray I. Carpenter en su libro Mtodos Estadsticos para Bibliotecarios dice: Por ser una medida de dispersin estandarizada, la desviacin estndar se puede emplear para comparar la igualdad o la desigualdad de dos o ms grupos. Si los grupos son comparables, cuanto mayor sea la diferencia en las desviaciones estndar, mayor ser la desigualdad. Con frecuencia, la sola comparacin de las desviaciones estndar puede conducir a interpretaciones incorrectas. Un mtodo para evitar lo anterior es el coeficiente de variacin.

143

4.2.6 COEFICIENTE DE VARIACIN Tambin conocido como DISPERSIN RELATIVA (CV) es un indicador expresado en porcentaje de la dispersin de dos o ms conjuntos que se comparan entre s, considerando la desviacin estndar y la media de los datos observados. Coeficiente de variacin muestral S CV= ---------(100) X _ donde S es la desviacin estndar de la muestra y X la media. Coeficiente de variacin poblacional CV= ---------(100) es la desviacin estndar de la poblacin y la media. Un ejemplo que muestra claramente la utilidad del coeficiente de variacin es cuando se desean comparar los presupuestos de una biblioteca o de un archivo durante 2 aos, a fin de averiguar en cul de los dos perodos (1995 1996) las cantidades asignadas a las diferentes reas fue ms homognea, entendindose sta como aquella distribucin en que las cantidades bajas, intermedias y altas son muy parecidas.
AO PRESUPUESTO PROMEDIO X $14,400 $21,000 DESVIACIN ESTNDAR S $1,200 $1,500 COEFICIENTE DE VARIACIN V 1,200/14,400= 12/144=2/24=1/12 1,500/21,000= 15/210=3/42=1/14 1 CV1996 = ------ (100) = 7.14% 14

1995 1996

1 CV1995 = ------ (100) = 8.33% 12

>

En trminos absolutos se tiene que la desviacin estndar es mayor en 1996, sin embargo, desde un punto de vista relativo existe menos dispersin en ese mismo perodo, segn podemos observar en los dos coeficientes de variacin, ya que el menor de ellos pertenece a la distribucin ms homognea.
144

Estadstica Descriptiva

El porcentaje de disminucin de la variabilidad o dispersin se encuentra a travs de la tasa de cambio en donde se deben considerar los coeficientes de variacin al inicio del perodo (.0833) y al final del perodo (.0714): .071-.083 .-012 Tasa de cambio = ------------------- = ----------- = -0.144 .083 .083 Esto significa que en 1996 se tuvo una disminucin del 14% de dispersin con respecto a 1995.

145

4.2.7 TEOREMA DE CHEBYSHEV La desviacin estndar permite medir las variaciones con respecto a la media de los valores de las observaciones, ya que mientras ms pequea sea es ms probable obtener un valor cercano a la media y viceversa, se tiene mayor probabilidad de obtener un valor ms alejado a la media a medida que sta es mayor, para encontrar estas variaciones en cualquier distribucin, se utiliza el Teorema de Chebyshev que dice: La proporcin de cualquier conjunto de valores que caen dentro de k desviaciones tpicas medidas a partir de la media es al menos 1 - 1/k2, en donde k es cualquier nmero mayor de 1. Si consideramos k=2 (2 desviaciones tpicas o estndar), tendremos que los valores dentro del intervalo formado por las dos desviaciones estndar medidas a partir de la media es 1-1/22 = 1 - = , esto indica que dentro de 2 desviaciones estndar de la media, siempre se encuentra al menos el 75% ( 75% como mnimo) de los datos. De igual forma si k=3 al menos 8/9 (88% o ms) de los datos caen dentro del intervalo (X-3S, X+3S). Retomando el ejercicio en donde se conoce el nmero de libros o expedientes prestados durante 50 das, verifiquemos el Teorema que nos ocupa: 43 44 45 47 48 48 50 51 53 53 54 54 55 56 56 56 56 57 57 58 58 59 60 60 60 60 61 61 61 62 62 62 63 64 64 65 65 65 65 65 67 67 68 69 70 70 72 75 79 80

146

Estadstica Descriptiva

Calculando las columnas necesarias para encontrar la desviacin estndar:


CLASES 73-77 68-72 63-67 58-62 53-57 48-52 43-47 f 3 5 10 13 11 4 4 50 Mc 75 70 65 60 55 50 45 Mc2 5625 4900 4225 3600 3025 2500 2025 fMc 225 350 650 780 605 200 180 2990 fMc2 16875 24500 42250 46800 33275 10000 8100 181800

_ X 60

181800 S = ------------- 30
2 2

(2990)2 --------------(50)2

S = 3636

8940100 - ------------2500 entonces S = 7.74

S2 = 3636 - 3576.04 = 59.96

Al tomar 2 desviaciones estndar se tiene el intervalo: (X - 2s, X + 2s) = (60 - 2(7.74), 17 + 2(7.74)) = (44.52, 75.48) Si consideramos al intervalo (45, 75) sin tomar los extremos, por el Teorema de Chebyshev dentro de l cae al menos el 75% del total de datos, esto quiere decir que pueden caer 75% o ms. Al calcular el 75% de 50 que es el total de datos, se encuentra que en dicho intervalo deben caer aproximadamente 38 datos o ms, para verificar este porcentaje contemos los datos en la lista ordenada:
43 44 45 47 48 48 50 51 53 53 54 54 55 56 56 56 56 57 57 58 58 59 60 60 60 60 61 61 61 62 62 62 63 64 64 65 65 65 65 65 67 67 68 69 70 70 72 75 79 80 Los 44 valores en negrita son los que se encuentran dentro del intervalo (45, 75) y son ms del 75% del total.

147

_ Conociendo la media X = 60 y la desviacin estndar S=7.74, considera 3 desviaciones estndar y encuentra: a) Intervalo que contiene al menos el 88% del total de datos ________________________________________________ b) El 88% de 50 ________________________________________________ c) En la lista ordenada destaca subrayando en color los datos que caen en el intervalo:
43 44 45 47 48 48 50 51 53 53 54 54 55 56 56 56 56 57 57 58 58 59 60 60 60 60 61 61 61 62 62 62 63 64 64 65 65 65 65 65 67 67 68 69 70 70 72 75 79 80

Despus de calcular lo que se te pide, indica si se cumple o no el Teorema de Chebyshev. ________________________________________________

LECTURA 4 Como un refuerzo a lo que acabas de aprender, te recomiendo leer el libro Fundamentos de la Estadstica en la Investigacin Social escrito por Jack Levin de la pgina 55 a la 70, incluido al final de esta gua, despus de la lectura escribe el resumen correspondiente.

148

Estadstica Descriptiva

Elabora el Resumen de la Unidad 4 identificando y completando el siguiente mapa conceptual, al final de la gua lo encontrars resuelto, de ser posible, confronta tus respuestas y corrgelas en caso de ser errneas.
DESCRIPCIN DE LOS DATOS A TRAVS DE LAS MEDIDAS DE:

__________________________________ Valores centrales de una distribucin que representan a todos los datos. __________________.-Suma de valores de todas las observaciones divida entre el nmero de observaciones realizadas DATOS NO AGRUPADOS: Muestra Poblacin _ X X X =-------- = ----------n N DATOS AGRUPADOS: _ _______ _______ X =--------------- = ----------n N ___________ es el valor (o valores) de la(s) variable(s) que ocupa (n) el (los) lugar(es) central(es) de los datos ordenados por magnitud: DATOS NO AGRUPADOS: a) Nmero par de datos es el promedio de valores centrales b) Nmero impar de datos es ___________ ______________________________ DATOS AGRUPADOS: n/2 -F Md = Li + ( ---------- ) A f __________valor (o valores) de la variable que se presenta(n) con mayor frecuencia. DATOS NO AGRUPADOS: a) Ordenar en forma ascendente y realizar conteo DATOS AGRUPADOS: d1 Md = Li + ( ---------- ) A d1+d1 Contina Resumen de la Unidad 4:

__________________________________ Evalan la variabilidad o dispersin de los datos. RANGO___________________________ ____________________________ R = Valor mximo - Valor mnimo RANGO ______________ diferencia entre los valores del primero y tercer cuartil: Q = Q3 - Q1 ______________________: n/4 - F1 Q1= Li + ( --------------- ) A f1 Para Q2 se toma 2n/4 y para Q2, 3n/4 ___________________es el promedio de las desviaciones a partir de la media: DATOS NO AGRUPADOS: _ xi -X DM = -----------n DATOS AGRUPADOS: _ fMc-X DM=-------------n __________________ es la raz cuadrada del promedio de las desviaciones con respecto a la media elevadas al cuadrado. DATOS NO AGRUPADOS: _ (xi - X)2 S = ----------------- muestral n-1 fMc2 S = ----------------- muestral n-1

149

DESCRIPCIN DE LOS DATOS A TRAVS DE LAS MEDIDAS DE:

__________________________________ Valores centrales de una distribucin que representan a todos los datos.

__________________________________ Evalan la variabilidad o dispersin de los datos. ______________________es el promedio de las desviaciones con respecto a la media elevadas al cuadrado. DATOS NO AGRUPADOS: _ (xi - X)2 S2 = ----------------- muestral n-1 fMc2 S2 = ----------------- muestral n-1

___________________________________ ________________, si X es la media y S la desviacin estndar de una muestra, su frmula es: CV = --------(100)

Permite comparar la homogeneidad de los datos en dos conjuntos.

______________________ utiliza la desviacin tpica de un conjunto de observaciones para medir las variaciones de los datos con respecto a la media de tal forma que mientras ms pequea sea la desviacin, es ms probable obtener un valor cercano a la media y por el contrario, mientras mayor sea la desviacin es ms probable obtener un valor alejado de la media. Si se consideran 2 desviaciones estndar: en el intervalo (X - 2S, X + 2S) cae al menos el _____% de los datos. Si se consideran 3 desviaciones estndar: en el intervalo (X -3S, X + 3S) cae como mnimo el _____% de los datos.

150

Estadstica Descriptiva

EVALUACIN
1) Completa la siguiente tabla, calcula las Medidas de Tendencia Central de la distribucin obtenida al evaluar a 50 alumnos en la asignatura de Investigacin de Campo I y contesta lo que se te pregunta en los incisos:

CALIFICACIN NMERO DE X ALUMNOS f 5 6 6 5 7 11 8 12 9 14 10 2 50

fX

fa

a) Como la media es ________ entonces los 50 alumnos tienen esta calificacin como representativa del grupo. b)La _________ indica que el nmero ms numeroso de estudiantes tiene calificacin de _______ c) El valor central de la distribucin es la ____________ que tiene el valor de __________ e indica que el 50% de los alumnos (25 alumnos) obtuvieron calificaciones entre ________ y _____________.

151

2) En un Archivo Histrico, al tomar una muestra representativa de 142 expedientes en forma arbitraria y contar el nmero de hojas se obtuvo la siguiente informacin:
CLASES (HOJAS) X 5 -19 20-34 35-49 50-64 65-79 NMERO DE EXPEDIENTES f 26 18 14 36 48 142

Calcula las medidas de tendencia central y escrbelas anotando una conclusin en cada caso: a) Media: _______________________________________________________ Conclusin: _____________________________________________________ b) Moda: ________________________________________________________ Conclusin: _____________________________________________________ c) Mediana: ______________________________________________________ Conclusin: _____________________________________________________ d) Calcula la desviacin media e interprtala: El Jefe del Archivo desea modificar la cubierta de cada expediente y tiene la opcin de comprar carpetas de un slo tipo que puede ser: - Con capacidad para 50 hojas - Con capacidad para 70 hojas Tomando en consideracin los resultados de las medidas de tendencia central que obtuviste cul de los dos tipos de carpetas le sugeriras a tu jefe que comprara y por qu?________________________________________________________ ___
152

Estadstica Descriptiva

153

3) La siguiente grfica simtrica tiene un nombre especial por su forma, se le denomina normal, une con una recta el lugar en donde consideras que se encuentran las medidas de tendencia central:
CURVA SIMTRICA MESOCRTICA (NORMAL) 10 8 6 4 2 0

Media Moda Mediana

C A LIF IC A C I N

a) Qu valor crees que tenga la Media? _____ __________________________________ ____

ENVA A TU ASESOR

FELICIDADES! Ahora que has finalizado la materia, espero que contines con mpetu el resto de la carrera. Bien por t

154

Estadstica Descriptiva

RESUMEN DE LA UNIDAD I
ESTADSTICA
Ciencia de la recopilacin, clasificacin, presentacin e interpretacin de datos. OBJETO Inferir el comportamiento de una poblacin a travs del anlisis de una muestra.

SE CLASIFICA EN DESCRIPTIVA Incluye obtencin, organizacin y presentacin de datos, as como la descripcin numrica que muestra el comportamiento de una poblacin o muestra. TIENEN COMO BASE UNA POBLACIN QUE ES: Un conjunto de individuos u objetos de inters bien definidos. Su tamao es N y sus caractersticas son descritas por parmetros como el porcentaje. PUEDE SER: 1) FINITA Tiene primer y ltimo elemento 2) INFINITA Tiene primer elemento pero no ltimo INFERENCIAL Est integrada por mtodos descriptivos que permiten la generalizacin del comportamiento de una poblacin a partir de los resultados obtenidos de una muestra que la represente. MUESTRA REPRESENTATIVA Parte de la poblacin que la representa, su tamao se indica con n. Los estadsticos o O UNA PARTE estadgrafos son nmeros que describen sus caractersticas, un ejemplo es el promedio.

SUS CARACTERSTICAS SE DENOMINAN VARIABLES Y SON: NOMINAL CUALITATIVA ORDINAL DISCRETA CUANTITATIVA CONTINUA CLASIFICNDOSE SEGN LAS SIGUIENTES ESCALAS DE MEDICIN:* - NOMINAL - ORDINAL - INTERVALO - ABSOLUTA

*Escalas de medicin: a) Nominal.- Se utiliza como medida de identificacin con variables nominales. b) Ordinal.- Permite la manipulacin de variables ordinales. c) Intervalo o Absoluta:- Maneja variables cuantitativas.

155

RESUMEN DE LA UNIDAD 2
TIPOS DE DATOS

CATEGRICOS Permiten agrupar por categoras

ORDENADOS POR RANGO Establecen un orden entre categoras para compararlas

MTRICOS Introducen medidas que facilitan la comparacin

DISTRIBUCIONES DE FRECUENCIA

POBLACIN O MUESTRA PEQUEA SIMPLE CUYA ESTRUCTURA ES: a) TITULO b) PERODO DE TIEMPO c) d)
CATEGORAS FRECUENCIA

POBLACIN O MUESTRA GRANDE PARA DATOS AGRUPADOS CUYA ESTRUCTURA ES: CLASES f Mc fr fa far a) b) c) d) e) f) donde: a)Clases o intervalos formados por lmite inferior y lmite superior b) Frecuencia absoluta de cada clase c) Marca de clase o punto medio del intervalo d) Frecuencia relativa proporcin de la frecuencia de cada intervalo con respecto a la suma de frecuencias absolutas e)Frecuencia acumulada que indica el intervalo donde se encuentra un dato especfico f)Frecuencia acumulada relativa proporcin de la frecuencia acumulada de cada intervalo con respecto a la suma de frecuencias absolutas.

A B

TO T A L e) f) FUENTE donde: a) Ttulo que explique brevemente el contenido de la tabla b) Fecha o perodo de tiempo en que se efectu la investigacin c) Encabezados de cada columna d) Cuerpo que contiene la informacin de las categoras e) Final o total de las columnas f) Fuente de la informacin g) Observaciones importantes

f f SUMA DE f g) PIE

a) b) c) d)

ORDINALES NOMINALES CONTINUAS DISCRETAS

TIPO DE VARIABLES QUE UTILIZAN D a) CONTINUAS b) DISCRETAS

156

Estadstica Descriptiva

RESUMEN DE LA UNIDAD 3
TIPOS DE GRFICAS GRFICA DE SECTORES: Caractersticas: a)Es una circunferencia en el primer cuadrante del plano cartesiano donde a la frecuencia de cada categora le corresponde un sector b) Representacin grfica de una tabla de distribucin de frecuencias simple c) El nmero de categoras a considerar debe ser menor que en el de barras HISTOGRAMA Caractersticas: a) Son barras unidas que se trazan en el primer cuadrante del plano cartesiano b) Representacin grfica de una distribucin de frecuencias para datos agrupados c) En el eje de las X se marcan los puntos medios de cada intervalo d) En el eje de las Y se consideran las frecuencias correspondientes a cada intervalo OJIVA PORCENTUAL: Caractersticas: a) Grfica lineal trazada en el primer cuadrante del plano cartesiano que tiene forma de S b) Representacin grfica de una distribucin de frecuencias acumuladas para datos agrupados c) En el eje de las X se marcan los lmites reales superiores de cada intervalo d) En el eje de las Y se marcan las frecuencias acumuladas correspondientes a cada intervalo e) Permite hacer estimaciones del comportamiento de los datos considerando uno en particular DIAGRAMA DE BARRAS Caractersticas: a) Son barras del mismo ancho trazadas en el primer cuadrante del plano cartesiano b) Las barras deben estar separadas por espacios en blanco d) Representacin grfica de una tabla de distribucin de frecuencias simple e) Pocas categoras

VARIABLES CONSIDERADAS a) Nominal b) Ordinal

VARIABLES CONSIDERADAS a) Continuas b) Discretas

VARIABLES CONSIDERADAS a) Continuas b) Discretas

VARIABLES CONSIDERADAS a) Nominal b) Ordinal

157

RESUMEN DE LA UNIDAD 3

TIPOS DE GRFICAS

POLGONO DE FRECUENCIAS: Caractersticas: a) Grfica lineal trazada en el primer cuadrante del plano cartesiano que une los puntos medios de cada clase a la altura de su frecuencia correspondiente b) Representacin grfica de una distribucin de frecuencias para datos agrupados c) En el eje de las X se marcan los puntos medios de cada intervalo, agregndose uno al inicio y otro al final de los que se estn considerando d) En el eje de las Y las frecuencias correspondientes a cada intervalo, agregndose dos en cero que corresponden a las marcas de clase indicadas en el inciso anterior.

VARIABLES CONSIDERADAS a) Continuas b) Discretas

NOTA: Es recomendable que todas las grficas tengan un ttulo que describa brevemente la informacin que est siendo representada, as como la fuente de informacin, ya que stas deben ser autoexplicativas; con excepcin de la grfica de sectores, todas deben contener un ttulo en cada uno de los ejes que indique el tipo de datos que se estn representando.

158

Estadstica Descriptiva

RESUMEN DE LA UNIDAD 4
DESCRIPCIN DE LOS DATOS A TRAVS DE LAS MEDIDAS DE:

TENDENCIA CENTRAL Valores centrales de una distribucin que representan a todos los datos. MEDIA ARITMTICA.-Suma de valores de todas las observaciones divida entre el nmero de observaciones realizadas DATOS NO AGRUPADOS: Muestra Poblacin _ X X X =-------- = ----------n N DATOS AGRUPADOS: _ fMc fMc X =---------- = ----------n N MEDIANA es el valor (o valores) de la(s) variable(s) que ocupa (n) el (los) lugar(es) central(es) de los datos ordenados por magnitud: DATOS NO AGRUPADOS: a) Nmero par de datos es el promedio de valores centrales b) Nmero impar de datos es el dato central DATOS AGRUPADOS: n/2 -F Md = Li + ( ---------- ) A f

DISPERSIN Evalan la variabilidad o dispersin de los datos. RANGO o amplitud total considera valores extremos: R = Valor mximo - Valor mnimo RANGO INTERCUARTIL diferencia entre los valores del primero y tercer cuartil: Q = Q3 - Q1 CUARTILES: n/4 - F1 Q1= Li + ( --------------- ) A f1 Para Q2 se toma 2n/4 y para Q2, 3n/4

DESVIACIN MEDIA es el promedio de las desviaciones a partir de la media: DATOS NO AGRUPADOS: _ xi -X DM = -----------n DATOS AGRUPADOS: _ fMc-X DM=-------------n DESVIACIN TPICA O ESTNDAR es la raz cuadrada del promedio de las desviaciones con respecto a la media elevadas al cuadrado. DATOS NO AGRUPADOS: _ (xi - X)2 S = ----------------- muestral n-1 fMc2 S = ----------------- muestral n-1

MODA valor (o valores) de la variable que se presenta(n) con mayor frecuencia. DATOS NO AGRUPADOS: a) Ordenar en forma ascendente y realizar conteo DATOS AGRUPADOS: d1 Md = Li + ( ---------- ) A d1+d1 RESUMEN DE LA UNIDAD 4

DESCRIPCIN DE LOS DATOS A TRAVS DE LAS MEDIDAS DE:

159

TENDENCIA CENTRAL Valores centrales de una distribucin que representan a todos los datos.

DISPERSIN Evalan la variabilidad o dispersin de los datos VARIANZA O VARIANCIA es el promedio de las desviaciones con respecto a la media elevadas al cuadrado. DATOS NO AGRUPADOS: _ (xi - X)2 S2 = ----------------- muestral n-1 fMc2 S2 = ----------------- muestral n-1 :

COEFICIENTE DE VARIACIN O DISPERSIN RELATIVA, si X es la media y S la desviacin estndar de una muestra, su frmula es: S CV = --------(100) X Permite comparar la homogeneidad de los datos en dos conjuntos.

TEOREMA DE CHEBYSHEV utiliza la desviacin tpica de un conjunto de observaciones para medir las variaciones de los datos con respecto a la media de tal forma que mientras ms pequea sea la desviacin, es ms probable obtener un valor cercano a la media y por el contrario, mientras mayor sea la desviacin es ms probable obtener un valor alejado de la media. Si se consideran 2 desviaciones estndar: en el intervalo (X - 2S, X + 2S) cae al menos el 75% de los datos Si se consideran 3 desviaciones estndar: en el intervalo (X -3S, X + 3S) cae como mnimo el 88% de los datos

160

Estadstica Descriptiva Lecturas

LECTURAS

LECTURA 1 Mtodos Estadsticos para Bibliotecarios. Carpenter, Ray L. Estadsticas Resumidas.............................................................................................161 Fundamentos de Estadstica en la Investigacin Social. Jack Levin. LECTURA 2 Grficas............................................................................................................ .........169 LECTURA 4 Medidas de Dispersin Variabilidad......................................................................177 LECTURA 3 Estadstica Paso a Paso. Christensen, Howard B. Medidas de Posicin: media, moda.........................................................193 o

mediana

159

160

Estadstica Descriptiva Lecturas

CARPENTER, Ray L. Mtodos Estadsticos para Bibliotecarios. Mxico, UNAM, 1980, p. 25-30

161

162

Estadstica Descriptiva Lecturas

163

164

Estadstica Descriptiva Lecturas

165

166

Estadstica Descriptiva Lecturas

167

168

Anda mungkin juga menyukai