Anda di halaman 1dari 44

UNIDAD I:

CONCEPTOS BSICOS

1.1. Introduccin

1.2. Qu es la estadstica

1.3. Importancia de la estadstica

1.4. Aplicacin y campos de aplicacin de la Estadstica

1.5. Divisin de la estadstica

1.6. La Estadstica como ciencia y mtodo de la investigacin cientfica

1.7. Poblacin y Muestra

1.8. Escalas de Medicin

1.9. Tipos de variables

1.10. Ejercicios

1.11. Glosario

1.12. Presentacin de Datos

1.13. Distribucin de Frecuencias

1.14. Distribucin de Frecuencias Absolutas y Relativas

1.15. Distribucin de Frecuencias Acumuladas

1.16. Grficas

1.17. Histograma y Polgono de Frecuencias

1.18. Polgono de Frecuencia

1.19. Polgono de Frecuencia Acumulada

1.20. Grficas circulares, Diagramas de Barras, Pictogramas y Grfico de lneas.


Bioestadstica Unidad I: Introduccin a la Bioestadstica

1.1. Introduccin

La estadstica es una de las herramientas ms ampliamente utilizadas en la investigacin


cientfica. Su aplicacin en instituciones gubernamentales y educativas, en los negocios
y en la industria, en la banca y en otros quehaceres diarios hace de la estadstica una
herramienta indispensable.

Actualmente, son de uso cotidiano las diferentes tcnicas estadsticas que partiendo de
observaciones muestrales o histricas, crean modelos lgico-matemticos que permiten
describir o pronosticar un determinado fenmeno con cierto grado de incertidumbre.

El avance tecnolgico en la informtica ha contribuido enormemente al desarrollo de la


estadstica, sobre todo en la manipulacin de la informacin, pues en el mercado existen
paquetes estadsticos de excelente calidad, como por ejemplo el SAS, SPSS, SCA,
STATGRAPHICS, G-STAT STUDENTS, que corren en un ordenador sin mayores
exigencias tcnicas, permitiendo el manejo de grandes volmenes de informacin y de
variables.

La estadstica, es una herramienta imprescindible en todas las ciencias, de donde


proviene la desconcertante des-uniformidad en las definiciones de los diferentes autores,
ya que cada estudioso la define de acuerdo con lo que utiliza de ella.

La estadstica hace inferencias sobre una poblacin, partiendo de una muestra


representativa de ella. Es a partir del proceso del diseo y toma de la muestra desde
donde comienzan a definirse las bondades y confiabilidad de nuestras aseveraciones,
hechas, preferentemente, con un mnimo costo y mnimo error posible.

1.2. Qu es la Estadstica?

Son muchas las definiciones que se han dado de la Estadstica, considerada por algunos
como ciencia y por otros como un mtodo cientfico utilizado por diversas ciencias.
Entre estas tenemos:

1. Es una ciencia que estudia los fenmenos colectivos, mediante la observacin


numrica, el anlisis matemtico y la interpretacin lgica, investigando
especialmente sus causas y sus leyes.

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 7


Bioestadstica Unidad I: Introduccin a la Bioestadstica

2. Conjunto de mtodos destinados a medir y analizar los hechos por medio de


nmeros investigando las relaciones existentes entre los mismos.
3. Es un mtodo que permite no solo describir el hecho o fenmeno, sino deducir y
evaluar conclusiones acerca de una poblacin, utilizando resultados
proporcionados por una muestra.
4. Rama de las matemticas que se ocupa de reunir, organizar y analizar datos
numricos y que ayuda a resolver problemas como el diseo de experimentos y
la toma de decisiones.
5. Es un conjunto de tcnicas que se han desarrollado para la recoleccin,
organizacin, anlisis e interpretacin de datos numricos y el uso de tales datos
para la toma de decisiones racionales.

1.3. Importancia de la estadstica

Su importancia radica en que hace una simbiosis (unin, fusin) con la vida
contempornea, porque esta requiere de la Estadstica para indicar en trminos
cuantitativos el comportamiento y tendencia de casi todos los fenmenos colectivos,
sean estos: econmicos, sociales, educativos, polticos, meteorolgicos, fsicos,
qumicos, mdicos, religiosos y demogrficos, y por el lado de la Estadstica, este uso
frecuente y necesario coadyuva a su desarrollo y a la bsqueda de su perfeccin como
disciplina cientfica.

1.4. Aplicacin y campos de aplicacin de la estadstica

La aplicacin puede darse en varios niveles, desde lo que requieren tcnicas muy
elaboradas hasta los que solo necesitan la organizacin de un conjunto de datos en
tablas, la construccin de algunas graficas o el clculo de ciertos promedios.

La compresin y uso de la Estadstica nos permite comunicar ms exactamente los


descubrimientos de las investigaciones estadsticas; es tambin un instrumento, que
utilizado con cuidado y precisin, no permite describir nuestros resultados y adoptar
decisiones respecto a lo que nos dicen.

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 8


Bioestadstica Unidad I: Introduccin a la Bioestadstica

La teora general de la Estadstica es aplicable a cualquier tamao cientfico en el cual


se hacen observaciones. Las primeras aplicaciones se dieron en los asuntos de
gobierno, luego se utilizaron las compaas de seguros y los empresarios de juegos de
azar, despus los comerciantes, los industriales, los educadores, etc. Actualmente es
difcil indicar profesiones que no utilicen la Estadstica. Esta puede utilizarse en varios
niveles, desde los que requieren tcnicas muy elaboradas hasta los que solo necesitan la
organizacin de un conjunto de datos en tablas, la construccin de algunas graficas o el
clculo de ciertos promedios.

La Estadstica en los negocios:

a) Es el medio que utilizan los comerciantes para conocer y prever el crecimiento


de sus negocios.
b) Sirve para preparar la campaa de propaganda, conocer las ventas, controlar los
procesos de produccin, fluctuaciones de precios, necesidad de compras.
Porque es necesario seguir el movimiento de las mercaderas, la marcha de las
importaciones y de las exportaciones. Todo esto se hace actualmente utilizando
las computadoras.

Investigacin descriptiva

a) Los estudios descriptivos son diseados para describir algo, por ejemplo: las
caractersticas de los usuarios de un producto dado; el grado en que el uso del
producto vara con el ingreso, la edad, el sexo u otras caractersticas; o el
nmero de personas que vio un anuncio especifico en televisin. La mayora de
los estudios de investigacin de mercados son de este tipo.

1.5. Divisin de la estadstica

En base a lo que se ha dicho se concluye, que la Estadstica como disciplina o rea de


estudio comprende tcnicas descriptivas como inferenciales. Incluye la observacin y
tratamiento de datos numricos y el empleo de los datos estadsticos con fines
inferenciales. Para su estudio se clasifica de la siguiente forma:

Estadstica descriptiva y
Estadstica Inferencial

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 9


Bioestadstica Unidad I: Introduccin a la Bioestadstica

1.5.1. Estadstica descriptiva

El origen de la Estadstica descriptiva puede relacionarse con el inters por mantener


registros gubernamentales hacia fines de la Edad Media. Cuando los estados
nacionalistas empezaron a surgir durante ese perodo, se volvi necesario obtener
informacin acerca de los territorios bajo la jurisdiccin de cada nacin. Esta necesidad
de informacin numrica acerca de los ciudadanos y recursos lleva al desarrollo de
tcnicos para obtener y organizar datos numricos.

Hacia fines del siglo XVII, ya existan investigaciones semejantes a nuestros censos
modernos. Al mismo tiempo, las compaas de seguros empezaban a recopilar tablas de
mortalidad para determinar las primas de seguros de vida.

En las primeras etapas de desarrollo, la estadstica inclua poco ms que la obtencin,


clasificacin y presentacin de datos numricos. An hoy en da, estas actividades
siguen siendo una parte importante de la Estadstica.

A continuacin se da una definicin de Estadstica Descriptiva.

La Estadstica Descriptiva es el estudio que incluye la obtencin, organizacin,


presentacin y descripcin de informacin numrica

Ejemplo 1.- Un director de escuela desea conocer las aptitudes de cinco secretarias que
trabajan en dicha institucin. Se aplica una prueba de aptitudes a las cinco secretarias y
las calificaciones son 82, 85, 95, 92 y 91. La medida estadstica que emplea el Director
es la aptitud promedio o media aritmtica, la cual es la suma de los valores obtenidos
dividida por el nmero de observaciones. Entonces, la calificacin promedio es:

82 + 85 + 95 + 92 + 91 445
= = 89
5 5

El clculo de la media aritmtica, es una parte importante de la estadstica descriptiva.


El resultado se limita a los datos obtenidos en este caso particular y no implica ninguna
inferencia o generalizacin acerca de las aptitudes de otras secretarias.

La descripcin de los datos tambin puede hacerse usando representaciones grficas


como veremos posteriormente.

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 10


Bioestadstica Unidad I: Introduccin a la Bioestadstica

1.5.1. Estadstica Inferencial

Si el inters del Director de la escuela va ms all de la informacin obtenida, necesitar


otras tcnicas distintas a loa mtodos descriptivos. Por ejemplo; podra desear conocer
la aptitud promedio de las dems secretarias, pero carece del tiempo o de los recursos
para aplicar una prueba a todas ellas. Podra utilizar la calificacin promedio de las
cinco secretarias como base para realizar una inferencia o estimacin acerca de la
aptitud promedio de todas las secretarias. Con ese fin, necesitar conocer otra rama de
la Estadstica conocida como Estadstica Inferencial o Inferencia Estadstica.

La inferencia estadstica es una tcnica mediante la cual se obtienen generalizaciones


o se toman decisiones en base a una informacin parcial o completa obtenida
mediante tcnicas descriptivas

Para concluir diremos que existe otra gran divisin de las tcnicas estadsticas:

a) Estadstica Paramtrica.
b) Estadstica No Paramtrica.

La Estadstica Paramtrica es un conjunto de tcnicas desarrolladas para niveles altos de


medicin como el de intervalos. Los mtodos paramtricos permiten hacer inferencias
acerca de parmetros poblacionales de las distribuciones. Estos mtodos fueron los
primeros en ser desarrollados por los investigadores de la Estadstica.

La Estadstica no paramtrica es un conjunto de tcnicas diseadas para niveles de


mediciones menores, por ejemplo, el nominal y ordinal, para efectuar estimaciones no
habr parmetros en estricto sentido. A los procedimientos estadsticos que no
dependen para su validez de la forma funcional de la distribucin original de la
poblacin se les denomina procedimientos no paramtricos o libres de distribucin.

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 11


Bioestadstica Unidad I: Introduccin a la Bioestadstica

1.6. La estadstica como ciencia y mtodo de la investigacin cientfica

1.6.1. La estadstica como ciencia

CIENCIA ESTADSTICA

Tienen su propio de estudio: los


Tienen su propio objeto de estudio. Por
fenmenos colectivos de diversa
ejemplo: la Matemtica, los nmeros y
naturaleza
las magnitudes; las Ciencias Naturales,
los fenmenos fsicos Posee su mtodo de investigacin, que se
denomina precisamente mtodo
Poseen su mtodo de investigacin:
estadstico
inductivo, deductivo, experimental, etc
Es un conjunto de conocimientos
Es un conjunto de conocimiento
ordenados sistemticamente que contiene:
ordenados sistemticamente que
hiptesis, teoras, principios, leyes,
contiene: hiptesis, teoras, principios,
etc(ley de probabilidades)
leyes, etc
Tiene investigadores estadsticos que
Tienen investigadores que contribuyen al
contribuyen a su desarrollo
desarrollo de las ciencias

1.6.2. La estadstica como mtodo de investigacin cientfica

MTODO DE INVESTIGACIN MTODO ESTADSTICO

Es un conjunto de tcnicas y
Conjunto de tcnicas y procedimientos
procedimientos ordenados
ordenados sistemticamente
sistemticamente
Siguen una serie de pasos lgicos y
Planificacin, programacin, recopilacin
naturales: planificacin, programacin,
de datos, procesamiento, anlisis e
realizacin del experimento, observacin,
interpretacin de los resultados obtenidos
anlisis y obtencin de resultados
Tratar de establecer la relacin entre causa
Orientados a establecer la relacin entre
y efecto
causa y efecto
Establecer un camino para tratar de llegar
Establecer un camino para tratar de llegar
a la verdad
a la verdad

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 12


Bioestadstica Unidad I: Introduccin a la Bioestadstica

1.7. Poblacin y muestra

Poblacin ( universo): es la totalidad de elementos sujetos a un estudio, a partir del


cual se podrn sacar conclusiones.

Muestra: es una porcin de la poblacin que es seleccionada para su anlisis. Si el


objetivo es aplicar la estadstica inferencial, la muestra debe ser representativa de la
poblacin para que las inferencias obtenidas de sta, sean aplicables a toda la poblacin,
para que sea considerada representativa se debe seguir alguna tcnica de muestreo

Existen dos mtodos para seleccionar muestras:

Muestreo Aleatorio: en este tipo de muestreo todos los elementos de la poblacin tienen
la misma probabilidad de ser seleccionados. Los mtodos de muestreo aleatorio son:

Muestreo Simple: La forma ms fcil de escoger a los elementos que


conformarn la muestra es mediante el uso de nmeros aleatorios, lo ms simple
es generarlos en la calculadora o en la computadora, stos determinarn la
posicin del elemento del listado de la poblacin que ha de ser seleccionado.
Muestreo Sistemtico: los elementos son seleccionados dentro de un intervalo
uniforme que se mide con respecto al tiempo, al orden o al espacio. Por ejemplo,
cada 15 min seleccionar a un estudiante, seleccionar a cada dcimo estudiante
que entra a la universidad, etc.
Muestreo Estratificado: se divide a la poblacin en grupos relativamente
homogneos, llamados estratos, y seleccionamos proporcionalmente de cada
estrato los elementos para formar la muestra.
Muestreo por Conglomerado: se divide la poblacin en grupos, donde
suponemos que cada uno de ellos son representativos de la poblacin como un
todo, es decir los elementos de los grupos son heterogneos entre s.

Tanto en el muestreo estratificado como en el de por conglomerado, la poblacin de


divide en grupos bien definidos. Usamos el muestreo estratificado cuando cada grupo
tiene una pequea variacin dentro de s mismo, pero hay una amplia variacin entre los
grupos. Usamos el muestreo por conglomerado en el caso opuesto, cuando hay una
considerable variacin dentro de cada grupo, pero los grupos son esencialmente
similares entre s.

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 13


Bioestadstica Unidad I: Introduccin a la Bioestadstica

Muestreo No Aleatorio o de Juicio: en este tipo de muestreo el criterio que se toma es


el conocimiento y la opinin personal, basada en la experiencia de alguien con la
poblacin, para identificar aquellos elementos de sta que deben incluirse en la muestra.

1.8. Escalas de medicin

Existen cuatro tipos de escalas: nominal, ordinal, de intervalos y de razones.

Las escalas nominales.- se utilizan como medidas de identidad. Los nmeros sirven
de indicativos para identificar objetos o clases. Ejemplo: las personas que puede
clasificar segn el sexo, por su religin, el color de los ojos, etc

La escala ordinal.- es donde los nmeros reflejan el orden o la jerarqua de individuos u


objetos. Estas medidas se disponen desde la ms alta a la ms baja o viceversa. Las
medidas ordinales revelan que persona u objeto es de mayor o menor talla, o si un
objeto es ms duro o ms suave que otro, etc

La escala de intervalos.- Proporciona nmeros que reflejan diferencias entre individuos


u objetos. En este tipo las unidades de medicin son iguales. Ejemplo: las escalas de los
termmetros Celsius y Fahrenheit, la del tiempo y las puntuaciones obtenidas en
pruebas o test de inteligencia. Los valores estadsticos que utilizan esta escala son: la
media aritmtica, la desviacin estndar y el coeficiente de correlacin.

La escala de razones.- Son nmeros que indican razones o cocientes entre ciertas
magnitudes de los objetos y los datos obtenidos con estas escalas pueden ser sometidos
a tratamientos estadsticos ms elaborados. La escala de razones ms comunes
corresponde a medidas de longitud, peso, capacidad, sonido, etc. Ejemplo: un peso de
80 libras es 4 veces mayor que uno de 20 libras.

1.9. Tipos de variables

Una variable es una caracterstica que puede tener diferentes valores en los distintos
elementos o individuos de un conjunto. Ejemplos: el nmero de jornadas de trabajo con

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 14


Bioestadstica Unidad I: Introduccin a la Bioestadstica

que puede funcionar una fabrica, es el que puede ser de 1, 2, o 3; el precio de un


producto, etc.

Los smbolos que se utilizan en las variables son las ultimas letras del alfabeto: , , .
Segn el tipo de valores que puede tomar una variable se clasifican en cualitativas y
cuantitativas.

Variables cualitativas.- Son las variables cuyos valores posibles son cualidades o
atributos. Ejemplos: la estatura de un persona que puede ser baja, mediana o alta; el
sexo de una persona, la residencia, el color de los ojos, etc

Variables cuantitativas.- Son las variables cuyos valores pueden tomar una expresin
numrica. Ejemplos: el precio de un producto, el salario, etc

Una variable cuantitativa puede ser: continua y discreta.

Variables cuantitativa continua.- Se da cuando los valores numricos que forman la


variable en un intervalo cualquiera son infinitos. Ejemplos:

Se necesita contratar a una persona para laborar como guardin; un requisito


podra ser que sea con una estatura mnima de 1.65 metros. y una estatura
mxima de 1.70 metros,
El volumen de un cilindro.
La velocidad de un caballo pura sangre.
El tiempo.

Variables cuantitativa discreta.- Es la variable cuyos valores numricos se pueden


contar o son finitos en un intervalo cualquiera. Ejemplos:

El nmero de hijos que puede tener una pareja.


El numero de personas que pueden morir al accidentarse un bus que
lleva adentro 45 personas.

Variables dependientes e independientes

Una variable es dependiente si es el efecto de otra y es independiente si es la causa del


valor de otra.

Variable por atributos

Es la cuantificacin de elementos con cualidades.

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 15


Bioestadstica Unidad I: Introduccin a la Bioestadstica

1.10. Ejercicios

I. Identifica el tipo de variable y su escala de medicin en cada uno de los siguientes


casos:

a) El salario de los trabajadores de una empresa

b) El nmero de personas que votan por un partido poltico

c) La calidad del servicio de una telefonista

d) El recorrido diario de los autobuses de Macas

e) El nmero de familias que asisten al da a un centro de diversiones

f) Estado civil de un grupo de trabajadores

II. Contesta las preguntas de los siguientes casos prcticos:

1. Se quiere saber el gasto que un estudiante realiza al mes. Uno de los gastos que hace
un estudiante es su alimentacin y transporte. Se toma una muestra de 30 alumnos para
realizar el estudio. Sea "x" el gasto mensual en alimentacin y transporte que realiza un
estudiante de cierta Universidad. Describa cuidadosamente:

a) La poblacin.

b) La muestra

c) La variable y de qu tipo es

d) Escala de medicin empleada

2. En un estudio realizado a jvenes de la Ciudad de Quito, se determin que el 30% del


grupo estudiado realiza un deporte fuera de su actividad escolar. Describe:

a) La poblacin

b) La muestra

c) La variable y de qu tipo es

d) Escala de medicin empleada

e) Es observacin experimento

f) Es un estadstico parmetro

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 16


Bioestadstica Unidad I: Introduccin a la Bioestadstica

3. Indica a que escala de medicin se refiere cada enunciado:

a) Calificacin de los alumnos de un grupo de probabilidad

b) Clasificacin de los empleados de una universidad (administrativos, de


servicios, docentes).

c) Edades de mujeres que trabajan en el sector productivo.

d) La temperatura en C en los ltimos das de cierta ciudad

e) Servicio de la cajera de una tienda departamental

4. Suponga que se obtiene la siguiente informacin de Juan Domnguez, a su ingreso a


la enfermera de la escuela:

a) Sexo: Masculino

b) Residencia: Santiago

c) Clase: 2 ao

d) Temperatura: 37C

e) Pulso: 70 pulsaciones por minuto

f) Presin arterial: 130/80 mgs/mm

g) Tipo de sangre: B positiva

h) Alergias conocidas a medicamentos: no

i) Diagnstico preliminar: gripe

j) Permanencia estimada de reposo: 3 das

Clasifique cada una de las diez respuestas de acuerdo con el tipo de datos y con la
escala de medicin.

5. En una encuesta que realiza Banamex a sus cuenta- habientes, aparecen las siguientes
preguntas entre otras:

Cuenta con Tarjeta de crdito?

Cul es su lmite de crdito?

Cmo es el trato que recibe del ejecutivo de su sucursal?

Cuntos son los movimientos que realiza normalmente en el banco?

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 17


Bioestadstica Unidad I: Introduccin a la Bioestadstica

La intencin es realizar el estudio a un grupo de 50 clientes para tomar decisiones en


cuanto a la capacitacin que debe recibir el personal de las sucursales del estado de
Puebla. Responde las siguientes preguntas:

a) Describe cada una de las variables consideradas en el estudio y de qu tipo


son.

b) Que escala de medicin emplearas en cada una de las variable y porqu?

c) Describe la poblacin

d) Describe la muestra

e) Los resultados obtenidos del estudio seran estadsticos parmetros.

1.11. Glosario

Estadstica descriptiva: Consiste esencialmente en la recopilacin de datos, su


organizacin y presentacin ( en forma tabular y/o grfica ) as como el clculo de
medidas estadsticas representativas con el objeto de poder analizar en forma fcil y
rpida al conjunto de datos.

Estadstica inferencial: Consiste en la interpretacin y generalizacin de los resultados


obtenidos del estudio estadstico descriptivo de una muestra para su utilizacin en la
toma de decisiones de una poblacin.

Estadstica: Conjunto de tcnicas para la coleccin, organizacin, presentacin, manejo,


descripcin y anlisis de informacin, de manera que las conclusiones obtenidas de ella
tengan un grado de confiabilidad especificado.

Poblacin: Conjunto de todos los elementos (individuos u objetos) que se estn


estudiando, acerca de los cuales se intenta sacar conclusiones.

Muestra: Es un subconjunto de elementos de una poblacin, que es considerada como


representativa de la cual pueden obtenerse importantes inferencias de toda la poblacin.

Variable: Caracterstica de inters acerca de cada elemento de una poblacin o una


muestra.

Dato: Valor de la variable asociado a un elemento de una poblacin o una muestra.

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 18


Bioestadstica Unidad I: Introduccin a la Bioestadstica

Parmetro: Caracterstica que describe a una poblacin.

Estadstica: Caracterstica que describe a una muestra.

Dato cualitativo o atributo: Resultado de un proceso que categoriza o describe un


elemento de una poblacin.

Dato cuantitativo o numrico: Resultado de un proceso que cuantifica, que cuenta o


mide.

Datos numricos discretos: Aquellos que surgen de un conteo.

Datos numricos continuos: Aquellos que surgen de una medicin.

Observacin: Observar y Medir caractersticas especificas, sin manipular ni modificar a


los sujetos estudiados

Experimento: Aplicacin de un tratamiento a los sujetos de estudio, observacin y


medicin de su efecto sobre los sujetos

Escala de medicin nominal: Slo categoras. Los datos no pueden acomodarse en un


esquema de ordenamiento. No existe una relacin de magnitud entre las categoras

Escala de medicin ordinal: Las categoras estn ordenadas, pero no es posible


determinar diferencias, o stas carecen de significado. Ordenan los elementos de
acuerdo si poseen ms, menos o igual cantidad de la variable medida

Escala de medicin intervalo: Se pueden calcular diferencias entre valores, pero no


existe un punto de partida inherente. Los cocientes no tienen significado

Escala de medicin de razn o proporcin: Con un punto de partida inherente. Los


cocientes tienen significado.

1.12. Presentacin de datos

Una vez que se han obtenido los datos y que se ha hecho el estudio de los valores que
pueden tomar las variables, la primera tarea de la Estadstica es la de ordenar y presentar
los datos en tablas que permitan ver la tendencia de los mismos. Ordenados los datos se
facilita su representacin en diagramas y grficas de diferentes tipos.

En esta unidad se ver la forma de describir, presentar, ordenar, resumir la informacin

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 19


Bioestadstica Unidad I: Introduccin a la Bioestadstica

en tablas y su presentacin en diferentes tipos de grficas.

1.13. Distribucin de frecuencias

Los datos agrupados en tablas, nos permiten ver con facilidad el nmero de
observaciones iguales o comprendidos en un intervalo, a este nmero de repeticiones
iguales de la variable se llama frecuencia y se denota por . Otros valores relacionados
con la frecuencia son:

La frecuencia relativa que se denota por .

La frecuencia acumulada que se denota por .

La frecuencia relativa acumulada que se denota .

En esta unidad analizaremos, ejemplificaremos y graficaremos los datos de estos


conceptos.

Escalas de Medicin.

La clasificacin que hemos hecho de las variables, depende del nivel de medicin de la
caracterstica deseada. El nivel de medicin tambin denominados escalas de medicin,
lo podemos clasificar en:

1. Nominal.
2. Ordinal.
3. Por intervalo.

De acuerdo con esta clasificacin podrs notar que dependen del tipo de variable que se
analiza y por lo tanto reciben el mismo nombre de stas.

Ejemplo 1.1. En una carrera de caballos realizada en el hipdromo de la ciudad de


Quito en septiembre del ao 2010 corrieron 10 caballos, los cuales se numeraron de la
siguiente forma:

10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 20


Bioestadstica Unidad I: Introduccin a la Bioestadstica

Al finalizar la carrera, el primer lugar lo obtuvo el 13, el segundo lugar el 19, y el tercer
lugar el 16. El primer lugar hizo un tiempo de 15.3 minutos, el segundo lugar 15.5 y el
tercer lugar 15.8 minutos.

Definicin de variables:

a) Nmero de caballo (variable cualitativa nominal).


b) Lugar que ocup (variable cualitativa ordinal).
c) Tiempo que hizo (variable cuantitativa continua).

Definicin de escalas de medicin:

a) Nominal (numeracin de los caballos).


b) Ordinal (lugar ocupado en la carrera).
c) Por intervalos (tiempo durante el recorrido).

A partir de este ejemplo podemos establecer las siguientes definiciones:

Escala nominal es la que se usa para asignarle una etiqueta a las categoras que se
construyen de la variable con el nico fin de distinguir unas de otras.

Escala ordinal es la que permite ordenar o jerarquizar las categoras que se construyen
de la variable que se evala.

Escala de medicin por intervalos es la que permite clasificar, ordenar y cuantificar las
categoras que se establecen de la variable.

La escala de medicin por intervalos es la de mayor nivel de medicin e incluye las dos
anteriores; para poder usarse con la precisin deseada es necesario fijar un patrn de
medida que cuantifique a la variable con la misma exactitud, cuantas veces sea medida.

Algunos de los patrones que se usan son: Aos, kilos, litros, pesos, etctera.

1.14. Distribucin de frecuencias absolutas y relativas

Las primeras tareas de la Estadstica descriptiva son ordenar, clasificar y resumir los
datos obtenidos en la investigacin de campo, para ello se concentran en tablas de

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 21


Bioestadstica Unidad I: Introduccin a la Bioestadstica

frecuencia y stas pueden ser:

a) Absoluta.
b) Relativa.
c) Acumulada.

Con el anlisis de las frecuencias podemos determinar la tendencia de la variable en


estudio que como ya se dijo, sta puede ser nominal, ordinal o cuantitativa y sus
respectivas escalas de medicin: nominal, ordinal o por intervalos, respectivamente.

Definicin 1.1. Frecuencia es el nmero de veces que se repite la misma observacin.


Se simboliza con

Ejemplo 1.2. Un docente de la ESPOCH, extensin Morona Santiago dio una


conferencia a un grupo de estudiantes de nivel medio de la ciudad de Macas sobre las
caractersticas y bondades de las carreras de Ecoturismo (E), Sistemas (S), Minas (M) y
Zootecnia (Z). Al final de la conferencia pidi que llenaran un cuestionario donde
especificaron adems de los datos personales, la carrera de preferencia. Se obtuvieron
los siguientes resultados:

E, Z, M, S, S, M, Z, E, M, S, Z, S, E, S, M, S, M, M, Z, S, E, S, M, E, E, S, M, M, Z, E,
M, Z, Z, S, E, M, S, S, Z, M, Z, S, M, Z, S,

Con estos datos, se elabora la siguiente tabla de frecuencias:

Carreras que prefieren los estudiantes de nivel medio de la ciudad de Macas


Carreras Nmero de estudiantes Frecuencia
Ecoturismo 8
Sistemas 14

Minas 13
Zootecnia 10
Total 45
El nmero de columnas de una tabla es variable y depende de la informacin que se
quiera registrar. En nuestro ejemplo podemos suprimir la columna 2 que representa el
conteo de la variable el cual se puede realizar en otras hojas de trabajo. Mientras que en

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 22


Bioestadstica Unidad I: Introduccin a la Bioestadstica

la tercera columna se registra la frecuencia.

Del ejemplo se deduce la siguiente informacin:

a) Variable: Carrera de preferencia.


b) Tipo de variable: Cualitativa nominal.
c) Tipo de escala: Nominal.
d) Carrera de mayor aceptacin: Sistemas.
e) Carrera de menor aceptacin: Zootecnia.

Considerando la tabla del ejemplo 1.2 podemos notar que las partes de una tabla de
frecuencias deben contener las siguientes partes:

1. Ttulo. Describe la informacin ms importante del problema como es:


a) La variable.
b) La muestra o poblacin.
c) A quin corresponde la muestra.
2. Encabezado. Describe el tipo de informacin que se describe en cada columna.
3. Cuerpo. Agrupa el contenido de la informacin.
4. Final. En el final se registran los totales.
5. Fuente. En esta parte se debe especificar: cmo, quin, en dnde y cundo se
tomaron los datos.

Estas partes son comunes a todas las tablas que se elaboren en un estudio, para que el
que las analice tenga toda la informacin y pueda hacer deducciones de los resultados.

Ejemplo 1.3. El gerente de una Empresa, Kimberly preocupado por el pago de energa
consumida solicito al jefe de planta, un estudio del consumo diario durante el mes de
agosto. Los resultados obtenidos. / (Kilowatios por hora) son los siguientes:

Consumo ( /)

5 2
6 3
7 4
8 5
9 6
10 5

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 23


Bioestadstica Unidad I: Introduccin a la Bioestadstica

11 3
12 2
Total 30
Contestar las siguientes preguntas:

a) Definir la variable del problema R. Consumo en /


b) Qu tipo de variable es? R. Cuantitativa
c) Qu valores toma la variable? R. rango de 5 a 12 /
d) Qu tipo de escala define la variable? R. Por intervalos
e) Cul es la mayor frecuencia de la variable? R. 6
f) Qu frecuencia tiene la variable cuya categora es 10? R. 5

Ya qued establecido que el nmero de veces que se repite la misma observacin se


llama frecuencia absoluta ( ) y el conocimiento de esta variable nos permite inferir
otro conocimiento. En el ejemplo 3.3 podemos ver en cuntos das hubo el mismo
consumo, en cuntos das hubo el menor consumo o en cuntos das hubo el mayor
consumo. Tambin podemos inferir hacia dnde se carga el mayor o menor consumo.

Otro parmetro importante es la frecuencia relativa que simbolizaremos con , sta se


obtiene dividiendo la frecuencia absoluta ( ) entre el nmero de elementos de la
muestra que simbolizaremos con ( ). La definicin matemtica es:

= (ec. 1)

De la ecuacin (1) se puede observar que la frecuencia relativa se expresa como una
razn, como una proporcin o como un porcentaje (%).

Ejemplo 1.4. La puntuacin obtenida en un examen que se aplic a 100 obreros de la


fbrica de vidrio el Fanal, es la que se muestra en la siguiente tabla de frecuencias:

Frecuencia relativa
Puntuacin razn
proporcin porcentaje

0 1 1/100 0.01 1%
1 2 2/100 0.02 2%
2 3 3/100 0.03 3%

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 24


Bioestadstica Unidad I: Introduccin a la Bioestadstica

3 5 5/100 0.05 5%
4 6 6/100 0.06 6%
5 8 8/100 0.08 8%
6 20 20/100 0.20 20 %
7 25 25/100 0.25 25 %
8 15 15/100 0.15 15 %
9 10 10/100 0.10 10 %
10 5 5/100 0.05 5%
Total 100 100/100 1.00 100 %

Analizar la tabla anterior y contestar las siguientes preguntas:

a) Cul es la variable del problema?


b) Qu escala define a la variable?
c) Qu puntuacin tiene la mayor frecuencia?
d) Qu porcentaje de obreros reprob el examen si la calificacin aprobatoria es
de 6 a 10?
e) De este resultado, qu puede inferir el jefe del departamento de capacitacin?

Definicin 1.2. La frecuencia relativa es la proporcin de elementos que pertenecen a


una categora y sta se obtiene dividiendo su frecuencia absoluta entre el nmero total
de elementos de la muestra.

Hasta el momento, en los problemas que se han analizado las muestras son pequeas (
es pequeo). Sin embargo cuando la muestra o poblacin se compone de un
considerable nmero de elementos, la tabla de frecuencias se elabora agrupando los
datos en clases y ahora la tabla se llama Tabla de frecuencias con datos agrupados.

La formacin de clases o intervalos de clase que se simboliza con ( ) es muy variado y


depende generalmente del tamao del rango de la poblacin o muestra.

Definicin 1.3. El rango ( ) es el intervalo en que se distribuyen los datos en


observaciones de una muestra y se determina restndole al mayor valor el menor valor.

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 25


Bioestadstica Unidad I: Introduccin a la Bioestadstica

La definicin matemtica del rango es:

= (ec. 2)

Donde: es el valor mayor y es el valor menor.

No existe alguna ley que defina cmo obtener el nmero de clases; pero la experiencia
recomienda que no sea menor que 5 ni mayor de 20, esto es:

5 20 (ec. 3)

Donde corresponde al nmero de clases. Una vez definido el nmero de clases ( ),


para obtener la amplitud de clase ( ) se aplica la siguiente ecuacin:

= (ec. 4)

Otra forma de determinar el nmero de intervalos de clase ( ) es mediante la ecuacin


de Sturges y sta es:

= 1 + 3.322 ( ) (ec. 5)

Donde: es el nmero de intervalos, el tamao de la muestra y corresponde a un


logaritmo en base 10.

Ejemplo 1.5. El gerente de una compaa de ventas al mayoreo de diferentes tipos de


mercancas desea conocer el comportamiento de las llamadas telefnicas durante los
meses de marzo y abril del ao en curso; por lo que le encomienda a su secretaria que
realice esa investigacin. La secretaria obtuvo los siguientes datos, en nmero de
llamadas por da:

30, 38, 36, 35, 29, 28, 30, 35, 40, 48, 50, 20, 25, 56, 30

27, 29, 46, 41, 31, 31, 31, 39, 28, 36, 37, 52, 44, 49, 52

56, 58, 40, 39, 38, 40, 27, 24, 30, 32, 35, 38, 26, 25, 24

60, 55, 48, 37, 31, 30, 22, 20, 24, 26, 23, 22, 28, 27, 48

Realizar las siguientes operaciones:

1. Ordenar la informacin en sentido creciente.

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 26


Bioestadstica Unidad I: Introduccin a la Bioestadstica

20, 20, 22, 22, 23, 24, 24, 24, 25, 25, 26, 26, 27, 27, 27, 28

28, 29, 29, 30, 30, 30, 30, 30, 31, 31, 31, 32, 35, 35, 35, 36

36, 37, 37, 38, 38, 38, 38, 39, 39, 40, 40, 40, 41, 44, 46, 48

48, 48, 49, 50, 52 ,52, 55, 56, 56, 57, 58, 60

2. Determinar y
= 20 y = 60
3. Calcular el rango .
= = 60 20 = 40
4. Calcular mediante la ecuacin de Sturges.
= 1 + 3.322 ( ) = 1 + 3.322 ( 60) = 6.9 7
5. Determinar la amplitud de la clase .
= = = 5.7

6. Elaboramos la tabla de frecuencias con datos agrupados; para ello colocamos el


primer intervalo en el primer rengln y formamos los siguientes de acuerdo con
la amplitud.

Cada uno de los intervalos de clase debe contener 6 valores en total.

Frecuencia relativa
Clases ( ) Razn
proporcin porcentaje

20 - 25 10 10/60 0.17 17 %
26 31 17 17/60 0.28 28 %
32 37 8 8/60 0.13 13 %
38 43 10 10/60 0.17 17 %
44 49 6 6/60 0.10 10 %
50 55 4 4/60 0.07 7%
56 61 5 5/60 0.08 8%
Total 60 60/60 1.00 100 %

El uso de los intervalos de clase es con la finalidad de condensar la informacin para


facilitar su manejo. Los valores extremos de cada clase se conocen como lmites de
clase. El valor menor se llama lmite inferior de la clase y el mayor se llama lmite
superior de clase.

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 27


Bioestadstica Unidad I: Introduccin a la Bioestadstica

Si analizamos los intervalos de clase del ejemplo anterior podemos notar lo siguiente:
De un intervalo a otro hay un salto por ejemplo:

1er. Intervalo 20 25

2do. Intervalo 26 31

Veamos en la siguiente grfica lineal.

En la grfica podemos ver que al formar los intervalos de clase hay un valor entre clase
y clase que se pierde. Como la variable es discreta sabemos que entre estos valores no
hay ninguna informacin que se pierda; pero qu pasa si la variable es continua?, en
estos casos si hay la posibilidad que entre el 25 y 26 se pierdan los valores
comprendidos como es 25.1, 25.3, 25.6, etctera.

Para evitar este error, si la variable es continua, entonces despus de haber determinado
los lmites de clase, se fijan otros lmites que inician medio punto antes y medio punto
despus; de esta forma no hay posibilidad de perder informacin. A cada uno de estos
nuevos lmites se le llama lmite real de clase. Consideremos el mismo ejemplo
anterior.

Clases ( ) Lmites reales

20 - 25 19.5 25.5
26 31 25.5 31.5
32 37 31.5 37.5
38 43 37.5 43.5
44 49 43.5 49.5
50 55 49.5 55.5
56 61 55.5 61.5
Si representamos los lmites reales de clase en una grfica lineal podemos observar que
ya no hay saltos entre cada clase:

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 28


Bioestadstica Unidad I: Introduccin a la Bioestadstica

Al cambiar los lmites reales de clase, el valor del intervalo de clase (A) no cambia y
para determinarlo aplicamos la siguiente ecuacin:

= (ec. 6)

Donde: es el lmite superior de cualquier clase y es el lmite inferior de la misma


clase considerada. Por ejemplo para la 4ta. Clase del ejemplo anterior, tendremos:
= 43.5 y = 37.5, que sustituyendo en (6) obtenemos = 43.5 37.5 = 6.

Apliquemos ahora la misma ecuacin para la misma clase si la variable es discreta:


= 43 y = 38, entonces = 43 38 = 5. De este resultado se infiere que para la
variable discreta debe aplicarse la siguiente ecuacin:

= +1 (ec. 7)

Otra caracterstica importante del intervalo de clase o marca de clase es el punto medio
de clase o marca de clase ( )

Definicin 1.4. La marca de clase es el valor del punto que se localiza a la mitad del
intervalo de cada clase o intervalo real de clase.

Su definicin matemtica es:

= (ec. 8)

Determinemos los puntos medios o marcas de clase para el ejemplo 1.5 anterior en los
dos tipos de intervalos.

Lmite de Clases Lmites reales de clase


(variable discreta) (variable continua)

clases clases
20 - 25 22.5 19.5 25.5 22.5
26 31 28.5 25.5 31.5 28.5
32 37 34.5 31.5 37.5 34.5
38 43 40.5 37.5 43.5 40.5

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 29


Bioestadstica Unidad I: Introduccin a la Bioestadstica

44 49 46.5 43.5 49.5 46.5


50 55 52.5 49.5 55.5 52.5
56 61 58.5 55.5 61.5 58.5
De la tabla se deduce que el punto medio de clase ( ) o marca de clase es el mismo en
cada clase para ambas variables (discreta o continua).

Hasta el problema anterior hemos mostrado cmo organizar los datos en una tabla de
frecuencia de datos agrupados en clases y tambin hemos incluido la fraccin o
porcentaje de cada clase ( ). Esta informacin nos ha permitido hacer algunas
inferencias.

A continuacin veremos otra caracterstica de la muestra que nos permitir un anlisis


ms amplio de los resultados.

1.15. Distribucin de frecuencias acumuladas

La frecuencia acumulada ( ) es otra caracterstica de la muestra que nos permitir


determinar la posicin de un caso particular que nos interese en comparacin con el
total de los elementos.

Definicin 1.5. Frecuencia acumulada ( ) de una clase es la que se obtiene sumando


las frecuencias de las clases anteriores con la frecuencia de sta.

Su definicin matemtica es:

= + +

= + + + (ec. 9)

Al calcular la frecuencia acumulada ( ) podemos determinar su frecuencia relativa


acumulada ( ) en la forma ya explicada mediante la ecuacin (1), esto es:

= (ec. 10)

Regresemos al problema de las llamadas telefnicas en el ejemplo 3.5 y calculemos la

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 30


Bioestadstica Unidad I: Introduccin a la Bioestadstica

frecuencia acumulada ( ) y la frecuencia relativa acumulada ( ).

Frecuencia acumulada
Clases Lmites reales Marca de Clase ( )

20 - 25 19.5 25.5 22.5 10 0.17 10 0.17


26 31 25.5 31.5 28.5 17 0.28 27 0.45
32 37 31.5 37.5 34.5 8 0.13 35 0.58
38 43 37.5 43.5 40.5 10 0.17 45 0.75
44 49 43.5 49.5 46.5 6 0.10 51 0.85
50 55 49.5 55.5 52.5 4 0.07 55 0.92
56 61 55.5 61.5 58.5 5 0.08 60 1.00
Total 60 1.00

La frecuencia acumulada para la 4ta. Clase es = 45; de este valor se infiere que hasta
esta clase corresponden 45 de las 60 observaciones realizadas. Tambin se infiere que a
esta clase corresponden un nmero menor o igual a 43 llamadas telefnicas.

La frecuencia relativa de esta clase es F = 0.75. este valor significa que hasta esta clase
corresponde el 75% de todas las llamadas.

Cmo se puede observar en la tabla anterior, la frecuencia acumulada nos permite


determinar el nmero de llamadas menor o igual que el lmite superior de la clase
correspondiente, por lo tanto a esta columna la podemos significar con el trmino menor
que.

Si queremos determinar el nmero de llamadas mayor que, lo que tenemos que hacer es
des acumular la frecuencia y para ello en lugar de sumar restamos al nmero de
observaciones ( ) la frecuencia de la clase ( ) correspondiente. Esto es:

Marca de Clase acumulada relativa


Clases
( ) menos que ms que menos ms

20 - 25 22.5 10 0.17 10 50 0.17 0.83


26 31 28.5 17 0.28 27 33 0.45 0.55
32 37 34.5 8 0.13 35 25 0.58 0.42
38 43 40.5 10 0.17 45 15 0.75 0.25
44 49 46.5 6 0.10 51 9 0.85 0.15

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 31


Bioestadstica Unidad I: Introduccin a la Bioestadstica

50 55 52.5 4 0.07 55 5 0.92 0.08


56 61 58.5 5 0.08 60 0 1.00 0.00
Total 60 1.00

La columna 6 correspondiente a ms que se interpreta de la siguiente forma: para =


15 significa que 15 de los 60 das que se analizan, tuvieron un nmero de llamadas
mayor o igual a 44 y a este nmero de llamadas equivale al 25% del total.

Con los ejemplos anteriores se puede considerar que la tabla de frecuencias nos permite
inferir ciertos conocimientos de la variable que se analiza. Otra forma de analizar la
informacin e inferir ciertos conocimientos, es mediante la representacin grfica de los
mismos.

1.16. Grficos

Al representar en una grfica la informacin concentrada en la tabla de frecuencias, sta


es un recurso visual que nos permite tener una idea clara, precisa, global y rpida acerca
de las observaciones de una muestra o poblacin.

Existen muchos tipos de grficas en las que se pueden representar la frecuencia absoluta
( ), relativa ( ) y acumulada ( ) y con ellas podemos estimar algunos valores con la
simple observacin.

Los diferentes tipos de grfica que podemos usar para representar las observaciones de
un determinado problema y la seleccin de este tipo, dependen de la variable en estudio.

Si la variable en estudio es del tipo cualitativo, los grficos pueden ser:

a) De barras; horizontales o verticales.


b) Circulares.
c) Pictogramas, etctera.

Si la variable en estudio es de tipo cuantitativo, los grficos que podemos usar para su
representacin grfica son:

a) Histogramas.
b) Polgonos de frecuencias que a continuacin analizaremos.

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 32


Bioestadstica Unidad I: Introduccin a la Bioestadstica

1.17. Histograma y polgono de frecuencia

El histograma es la forma ms usual para analizar las caractersticas observables de una


variable continua.

Definicin 1.6. Histograma es la representacin grfica en el plano coordenado de las


caractersticas concentradas en la tabla de frecuencias de una variable continua.

Para trazar el histograma, la secuencia de operaciones es:

1. En los ejes coordenados del plano cartesiano representamos los datos de la


siguiente forma:
a) En el eje de las abscisas (horizontal) se representan las clases con sus lmites
reales de clase y las marcas de clase (Mi) de cada intervalo.
b) En el eje de las ordenadas (vertical) representamos las frecuencias absolutas
en que ocurre la variable.
2. Por los lmites reales superior e inferior de cada clase se trazan barras verticales
que se cortan mediante una horizontal que se traza a la altura del punto
correspondiente a la frecuencia de cada clase.
3. Por la naturaleza continua de la variable, los rectngulos se trazan adyacentes,
toda vez que en esta forma se debe dividir el eje horizontal.
4. El rea representada por cada barra es equivalente a la proporcin de la
frecuencia del intervalo de clase correspondiente con respecto al total.

Ejemplo 1.6. Al gerente general de la empresa Conductores Monterrey le interesa


conocer la antigedad de sus trabajadores, por lo que le indica al gerente de personal
que realice un anlisis del problema. El gerente de personal recab de los expedientes
la siguiente informacin sobre los aos de antigedad:

13, 19, 22, 14, 13, 16, 19, 21, 23, 11, 27, 25, 17, 17, 13, 20

23, 17, 26, 20, 24, 15, 20, 21, 23, 17, 29, 17, 19, 14, 20, 20

10, 22, 18, 25, 16, 23, 19, 20, 21, 17, 18, 24, 21, 20, 19, 26

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 33


Bioestadstica Unidad I: Introduccin a la Bioestadstica

Con esta informacin hacer una grfica (histograma).

Para graficar la informacin en un histograma, consideremos la siguiente secuencia de


operaciones:

1. Ordenamos los datos en sentido creciente:

10, 11, 13, 13, 13, 14, 14, 15, 16, 16, 17, 17, 17, 17, 17, 17, 18,

18, 19, 19, 19, 19, 19, 20, 20, 20, 20, 20, 20, 20, 21, 21, 21, 21,

22, 22, 23, 23, 23, 23, 24, 24, 25, 25, 26, 26, 27, 29.

2. Calculamos el rango , para ello determinamos los valores mayor y menor de las
puntuaciones.

= 29 y = 10

3. Calculamos = = 29 10 = 19 = 19
4. Calculamos el nmero de clases ( ), para ello determinamos ( )

= 48; = 1 + 3.322 48 = 1 + 5.58 = 6.58 ~ 7

5. Determinamos la amplitud de cada clase ( )

= = = 2.7 ~ 3

Se han redondeado los valores de y porque el nmero de clases y la amplitud


de la clase nunca sern fraccionarios.
6. Determinamos cada intervalo de clase y para ello calculamos los lmites de clase y
los registramos en la primera columna de la tabla. Luego se construye la misma.

Punto medio Frecuencia acumulada


Clases Lmites reales
de la clase menor que mayor que

10-12 9.5-12.5 11 2 0.042 2 46 0.042


13-15 12.5-15.5 14 6 0.125 8 40 0.167
16-18 15.5-18.5 17 10 0.208 18 30 0.375
19-21 18.5-21.5 20 16 0.333 34 14 0.708
22-24 21.5-24.5 23 8 0.167 42 6 0.875
25-27 24.5-27.5 26 5 0.104 47 1 0.979
28-30 27.5-30.5 29 1 0.021 48 0 1.00
Total 48 1.000

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 34


Bioestadstica Unidad I: Introduccin a la Bioestadstica

7. Trazamos los ejes del plano coordenado, fijamos una escala para cada eje y
representamos en el eje vertical las frecuencias y en el eje horizontal las clases. La
mayor frecuencia es = 16 por lo que con la escala establecida en . Marcamos
16 divisiones en el eje vertical. En el eje horizontal no es necesario iniciar por el
cero, en nuestro ejemplo podemos iniciar a partir de 9, indicando que se trunca una
parte del eje horizontal.

Figura 3.1.- Grfica del histograma que representa la informacin planteada en el ejemplo 3.6.
Las lneas verticales punteadas corresponden al punto medio o marca de clase, el cual
indica el promedio de las puntuaciones en cada clase. En el ejemplo 3.6 para la tercera
barra, el promedio en aos cumplidos de los obreros de la empresa ubicados en esa clase
es de = 17 aos y como la frecuencia es = 10 obreros con la misma antigedad.

Otra grfica que permite describir los datos de una distribucin de frecuencias es el
polgono de frecuencias.

1.18. Polgono de frecuencia

El polgono de frecuencia se construye a partir de los datos de la tabla de frecuencias.


Sobre el eje horizontal se levanta por el punto medio segmentos verticales punteados
que terminan a la altura de su frecuencia de clase, se unen los puntos superiores con un
segmento de recta que empieza medio punto antes del lmite superior de la ltima clase.

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 35


Bioestadstica Unidad I: Introduccin a la Bioestadstica

Del ejemplo 1.6 obtenemos:

Figura 1.2.- Grfica del polgono de frecuencia que representa la informacin planteada en el ejemplo
1.6.

Otra forma de trazar el polgono de frecuencias es:

a) Sobre el histograma se trazan segmentos punteados que inician en el punto


medio de clase y terminan a la altura del rectngulo.
b) Se unen los puntos finales de stos segmentos con una lnea continua que inicia
medio punto antes del lmite inferior de la primera clase y termina medio punto
despus del lmite superior de la ltima clase (ver figura 1.1).

Si en la escala vertical en lugar de representar las frecuencias absolutas, representamos


la frecuencia relativa, obtenemos un polgono de frecuencia acumulada.

Para el ejemplo 1.6 tendremos:

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 36


Bioestadstica Unidad I: Introduccin a la Bioestadstica

Figura 1.3.- Grfica del polgono de frecuencia acumulada que representa la informacin planteada en
el ejemplo 1.6.

Si observamos las grficas 1.2 y 1.3 se nota que son muy parecidas y que su tamao
depende, nicamente de la escala que se utilice.

Si los intervalos de clase se toman cada vez ms pequeos, entonces los puntos se unen
con segmentos curvos que van suavizando la forma del polgono de frecuencias.

1.19. Polgono de frecuencia acumulada

La grfica de la frecuencia acumulada es muy til porque en ella se determina cuntas


observaciones hay por arriba o por debajo de algn valor que nos interese. La grfica
que se obtiene de la frecuencia acumulada tambin se conoce con el nombre de ojiva.

Para trazar dicha grfica se procede como en los grficos anteriores, es decir, en el eje
horizontal se trazan los intervalos de clase y marcas de clase y en el vertical las
frecuencias acumuladas.

Del ejemplo 1.6 tomando los datos de las columnas 6 y 7 de la tabla, obtenemos:

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 37


Bioestadstica Unidad I: Introduccin a la Bioestadstica

Figura 1.4.- Grfica del polgono de frecuencia acumulada u ojiva menos que, que representa la
informacin planteada en el ejemplo 1.6.

Figura 1.5.- Grfica del polgono de frecuencia acumulada u ojiva menos que, que representa la
informacin planteada en el ejemplo 3.6.

La variable del problema analizado es de tipo cuantitativa continua, si la variable en


anlisis es cuantitativa discreta, se da el mismo tratamiento para el trazo de las grficas
o a su vez se puede prescindir de la columna nmero 2 y trazar el histograma con los
saltos que da la variable de un intervalo a otro.

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 38


Bioestadstica Unidad I: Introduccin a la Bioestadstica

1.20. Grficas circulares, Diagramas de Barras, Pictogramas y Grfico de lneas.

1.20.1. Grficas Circulares.

Una forma de representar datos u observaciones de una variable cualitativa es mediante


un diagrama circular. Para trazar la grfica, se hace una distribucin proporcional de las
frecuencias del problema con respecto a la circunferencia determinando sectores
circulares para cada categora.

Ejemplo 1.7. El gobierno municipal de Riobamba promocion cursos dominicales para


todas las personas que quieran aprender alguna habilidad artesanal o artstica; los cursos
se realizarn de 8:00 a 12:00 . Las inscripciones quedan abiertas todo el mes de
marzo. Al final del mes, la inscripcin fue la que se muestra en la siguiente tabla:

Cursos Nmero de participantes

Msica 250
Pintura 350
Danza 200
Tejido 400
Bordado 100
Ajedrez 500
Total 1800
Para distribuir cada clase en la circunferencia se aplica una regla de tres simple
relacionando el total de inscritos (1800) a 360 que tiene la circunferencia y de esta
relacin determinamos la parte que le corresponde a cada curso.

El planteamiento de cada distribucin es: 1800 es a 360 como 250 es a para el caso
de msica. Es decir:

= = 50

Se debe hacer lo mismo en todos los casos. Los resultados que se obtienen son los
siguientes:

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 39


Bioestadstica Unidad I: Introduccin a la Bioestadstica

Cursos Nmero de participantes grados

Msica 250 50
Pintura 350 70
Danza 200 40
Tejido 400 80
Bordado 100 20
Ajedrez 500 100
Total 1800 360
Para representarlos en el crculo, medimos los sectores con un transportador y trazamos
las divisiones. La grfica que se obtiene es:

Figura 1.6.- Grfica circular en grados, que representa la informacin planteada en el ejemplo 1.7.

Una forma ms til de representar las regiones de cada categora es distribuyndolos en


un porcentaje y para ello la regla de tres que se plantea, se relaciona 360 representa el
100% y en base a sta se determina el porcentaje que le corresponde a los grados de
cada categora.

Los resultados que se obtienen al realizar este planteamiento son los siguientes:

Cursos Nmero de participantes grados Porcentaje %

Msica 250 50 13.9

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 40


Bioestadstica Unidad I: Introduccin a la Bioestadstica

Pintura 350 70 19.4


Danza 200 40 11.1
Tejido 400 80 22.2
Bordado 100 20 5.6
Ajedrez 500 100 27.8
Total 1800 360 100.0
Para la representacin grfica se divide el crculo con un transportador de acuerdo a los
grados que le corresponde a cada categora, pero ahora se registra el porcentaje. La
grfica que se obtiene es la siguiente:

Figura 1.7.- Grfica circular en porcentaje, que representa la informacin planteada en el ejemplo 1.7.

1.20.2. Grficas de Barras

Para construir la grfica de barras se trazan ejes coordenados; en el eje horizontal se


representan los valores de la variable y se traza un segmento perpendicular por cada
valor. Si se usan barras, stas debern tener el mismo ancho de la base. En el eje
vertical se representa la frecuencia de cada clase usando una escala conveniente para
cada puntuacin. La frecuencia marca la altura de cada segmento perpendicular o barra.

Ejemplo 1.8. El docente de estadstica en la carrera de Biotecnologa Ambiental de la


ESPOCH utiliza una escala de clasificacin del 5 al 10, aprobatoria a partir de 6.
Cualquier calificacin reprobatoria se refleja en un 5.

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 41


Bioestadstica Unidad I: Introduccin a la Bioestadstica

Las calificaciones obtenidas por el grupo son las que se muestran en la tabla siguiente:

Calificacin 5 6 7 8 9 10
Nmero de estudiantes 3 8 12 8 5 4
Representamos la informacin en una grfica de segmentos y barras. Es decir:

Figura 1.8.- Diagrama de segmentos verticales, que representa la informacin planteada en el ejemplo
1.8.

Figura 1.9.- Diagrama de barras, que representa la informacin planteada en el ejemplo 1.8.

Otra forma de representar la informacin es mediante barras horizontales, en este caso


se invierten las escalas, es decir, en el eje horizontal se representan las frecuencias y en
el vertical los valores de la variable. Es decir:

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 42


Bioestadstica Unidad I: Introduccin a la Bioestadstica

Figura 1.10.- Diagrama de barras horizontales, que representa la informacin planteada en el ejemplo
1.8.

1.20.3. Pictograma

Es otra forma de representacin grfica de la informacin de un determinado problema.


En este tipo de grfica se usa la imagen de la variable, por ejemplo:

a) rboles: si la variable representa rboles.


b) Libros: si la variable representa libros.
c) Casas: si la variable representa casas.
d) Figuras de personas: si la variable son personas, etctera.

Ejemplo 1.9. El delegado de la subsecretara de turismo en la ciudad de Macas envi a


5 delegaciones el siguiente nmero de rboles para reforestar su zona: Suca 5000
rboles, Huamboya 3000 rboles, Proao 4000 rboles, Sevilla 6000 rboles y Zuac
7000 rboles.

La representacin grfica de la variable mediante un pictograma es la que se muestra a


continuacin:

Nmero de rboles
Delegacin
(en miles)

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 43


Bioestadstica Unidad I: Introduccin a la Bioestadstica

Suca

Huamboya

Proao

Sevilla

Zuac

Para poder determinar la cantidad de elementos que representa el pictograma, se le


asigna un valor a la figura representativa. En nuestro ejemplo cada rbol representa a
mil de stos.

1.20.4. Grfico de Lneas

Una forma de representar grficamente los valores de la variable de un problema en


estudio, es mediante un grfico de lneas. Para trazar la grfica de lneas se usa el plano
coordenado; en el eje horizontal se representa a la variable y en el eje vertical la
frecuencia. Se determinan los puntos de corte del valor de la variable con su frecuencia
y se unen estos puntos obtenindose la grfica de lnea que nos muestra con claridad los
cambios que experiment la variable.

Ejemplo 1.10. La produccin en la segunda semana de febrero de 2011 obtenida por un


obrero calificado que opera un torno revlver, con el que produce tornillos de cuerda
milimtrica, es la siguiente:

Da Cantidad

Lunes (L) 4000


Martes (Ma) 5500
Mircoles (M) 6000
Jueves (J) 6500
Viernes (V) 5500
El grfico de lneas que corresponde a los datos de la tabla es el siguiente:

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 44


Bioestadstica Unidad I: Introduccin a la Bioestadstica

Figura 1.11.- Grfico de lneas, que representa la informacin planteada en el ejemplo 1.10.

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 45


Bioestadstica Unidad I: Introduccin a la Bioestadstica

1.21. Ejercicios.

1. Se tiene una urna con 50 esferas numeradas progresivamente. El experimento


consiste en sacar una esfera, anotar su nmero y devolverla a la urna.
a) Cul es la variable? ______________________________________
b) La variable es cualitativa o cuantitativa? ____________________
c) Si podemos sacar una esfera por tiempo indefinido, entonces cmo es la
poblacin?
___________________________________________________________
d) Si nicamente podemos hacer 100 extracciones, entonces, cmo es la
poblacin?
____________________________________________________________
2. En la ESPOCH ingresaron 8000 estudiantes. De estos se seleccionaron 500 para
estudiar las caractersticas que indican. Escribe en la lnea si la variable asociada
est definida por una expresin o un nmero; determina si es cualitativa o
cuantitativa e indica el tipo de escala.
a) Estado de salud de cada estudiante. _________________________
b) Estatura de cada uno _________________________
c) Nmero de estudiantes que ingresan _________________________
d) Sexo de cada estudiante _________________________
e) Cul es y cmo es la poblacin? _________________________
f) Cul es la muestra? _________________________
3. Analiza el siguiente problema y establece todas las variables que consideres
importantes, clasifcalas y determina el tipo de escala que se usara en cada una.

Problema: El 23 de diciembre del ao pasado, se llev a cabo el maratn de la


libertad; en l participaron 15 mil maratonistas, quienes por su esfuerzo todos
recibieron una medalla de participacin y los premios que se repartieron fueron
los siguientes: 1er lugar: $ 100 000, 2do lugar: una casa, 3er lugar: una camioneta,
4to lugar: un automvil, 5to lugar: una motocicleta

4. En el siguiente problema, elabora una tabla de frecuencia de datos agrupados con


5 columnas con el siguiente encabezado:
1. Clases
2. Lmites reales de clase

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 46


Bioestadstica Unidad I: Introduccin a la Bioestadstica

3. Punto medio de clase o marca de clase.


4. Frecuencia absoluta ( )
5. Frecuencia relativa ( ).

Problema: En una cadena de tiendas, la venta de lquido anticongelante para


automviles, (en nmero de litros) en un determinado da de diciembre fue el que
se indica:

216, 269, 235, 235, 224, 249, 244, 240, 252, 210, 256

228, 233, 239, 253, 237, 221, 273, 229, 236, 215, 260

230, 228, 230, 255, 245, 244, 230, 231, 240, 222, 223

5. En el siguiente problema elaborar la tabla de frecuencias y explicar lo que se


deduce de las clases 3 y 5.

Problema: En la caseta de cobro de la autopista a Riobamba ingresaron durante


las 48 horas del 19 de septiembre, despus del puente, el nmero de vehculos por
hora que a continuacin se indica:

13 19 22 14 13 16 19 21 23 11 27 25 17 17 13 20

23 17 26 20 24 15 20 21 10 22 18 25 16 23 19 20

21 17 18 24 21 20 19 26

6. En la Fuerza Area Ecuatoriana, los aviadores toman un examen mdico general


en cada 150 horas de vuelo, por lo que se analizan los expedientes de cada piloto
para citarlos a su examen. Los resultados obtenidos se muestran en la siguiente
tabla correspondiente a las horas de vuelo.
222, 220, 199, 212, 201, 217, 214, 213, 212, 215, 214,
196, 192, 208, 207, 212, 214, 209, 202, 206, 196, 202,
219, 194, 206, 204, 194, 211, 216, 209, 212, 216, 206,
201, 201, 210, 200, 206, 201, 205, 217, 219, 212, 207,
211, 204, 212, 212, 205, 207, 214, 211, 220, 205, 201,
218, 193, 199, 206, 209, 205, 205, 221, 216, 211, 204,
215, 203, 213, 207, 209, 197, 197, 199, 208, 209, 218,
204, 207, 202, 209, 195, 207, 209, 205, 210, 197, 209,
211, 208, 211, 198, 217, 209, 199, 192, 218, 193, 208,
209, 194, 211,

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 47


Bioestadstica Unidad I: Introduccin a la Bioestadstica

a) Ordena los datos en una tabla de frecuencias.


b) Calcula el rango de los datos.
c) Calcula el nmero de clase mediante la aplicacin de la frmula de Sturges
d) Calcula la amplitud del intervalo
e) Determina los lmites de clase.
f) Determina los lmites reales de clase.
g) Determina los puntos medios de clase
h) Determina la frecuencia
i) Determina la frecuencia relativa
j) Determina la frecuencia acumulada
k) Determina la frecuencia acumulada relativa
l) Traza el histograma y el polgono de frecuencia.
m) Traza el polgono de frecuencia acumulada relativa (ojiva).
n) Traza el polgono de frecuencia acumulada menos que.
o) Traza el polgono de frecuencia acumulada ms que.
p) Traza un grfico circular.
7. En el siguiente problema representa los datos de la variable mediante un
pictograma.
Problema: Se hizo una investigacin del crecimiento poblacional del municipio
de Puyo, la informacin obtenida de los archivos son:

Ao Nmero de habitantes

2001 8000
2002 9000
2003 10000
2004 11000
2005 12000
2006 13000
8. El consumo en miles de litros de agua de una industria durante los primeros 10
meses del ao 2009 son los que se muestran en la siguiente tabla.

Mes Ene Feb mar Abr May Jun Jul ago sep oct
Nmero de litros (en miles) 50 58 62 70 80 85 80 70 65 60
Representa los datos de la tabla en un diagrama lineal.

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 48


Bioestadstica Unidad I: Introduccin a la Bioestadstica

RESUMEN

ESPOCH-Ingeniera en Biotecnologa Ambiental Pgina 49

Anda mungkin juga menyukai