Anda di halaman 1dari 15

Estadstica

Es el conjunto de mtodos y procedimientos que implican recopilacin, presentacin, ordenacin


y anlisis de datos, con el fin que a partir de ellos puedan inferirse conclusiones.
Pueden distinguirse dos ramas diferentes en Estadstica:
Estadstica Descriptiva, la cual es la que se utiliza en la descripcin y anlisis de conjuntos de
datos o poblacin.
Inferencia Estadstica, la cual hace posible la estimacin de una caracterstica de una

poblacin, o la toma de una decisin con respecto a una poblacin, con base nicamente en resultados
muestrales.

Conceptos de elementos utilizados en el anlisis estadstico


1) Poblacin o Universo: Conjunto completo de individuos, objetos, o medidas los cuales poseen
una caracterstica comn observable y que sern considerados en un estudio.
2) Muestra: Es un subconjunto o una porcin de la poblacin.
3) Variable: Caracterstica o fenmeno de una poblacin o muestra que ser estudiada, la cual
puede tomar diferentes valores.
4) Datos: Nmeros o medidas que han sido recopiladas como resultado de la observacin.
5) Estadstico: Es una medida, un valor que se calcula para describir una caracterstica a partir de
una sola muestra.
6) Parmetro: Es una caracterstica cuantificable de una poblacin.
5

Recopilacin de Informacin
La Estadstica Descriptiva tiene como funcin el manejo de los datos recopilados en cuanto se
refiere a su ordenacin y presentacin, para poner en evidencia ciertas caractersticas en la forma que sea
ms objetiva y til.
Una poblacin o universo objeto de una investigacin estadstica puede ser finita si sus
elementos se pueden contar. Por ejemplo, nmero de alumnos de un curso.
Una poblacin o universo es infinita cuando no es finita. En Estadstica, el sentido del trmino
poblacin infinita se refiere a una poblacin con un nmero tan grande de elementos que no le es posible al
investigador someter a medida cada uno de ellos.
Cuando se miden cualitativamente las caractersticas de una poblacin, resultan categoras que
deben ser exhaustivas, es decir, que se pueda clasificar a toda la poblacin, y tambin deben ser
mutuamente excluyentes, es decir, un mismo elemento no puede pertenecer simultneamente a dos o ms
categoras. Por ejemplo, sexo de una persona: masculino o femenino.
Una muestra debe cumplir ciertas condiciones, de aqu surge el concepto de muestra aleatoria
que es aquella obtenida de modo que cada elemento de la poblacin tiene una oportunidad igual e
independiente de ser elegido.
La investigacin estadstica es toda operacin orientada a la recopilacin de informacin sobre
una poblacin.
La investigacin puede ser tan simple como la recopilacin de datos estadsticos obtenidos de
informaciones provenientes de fuentes oficiales a nivel institucional o de publicaciones de organismos
altamente especializados en estas materias, o tan complejas que requiera de la colaboracin de especialistas
en diferentes materias, como ocurre en los censos de poblacin de un pas.
Se denomina variable a fenmenos o caractersticas que son medidas en algn tipo de
investigacin estadstica.
6

Variables
Es muy probable que un especialista en Estadstica que realiza una encuesta desee desarrollar un
instrumento que le permita hacer varias preguntas y manejar diversos fenmenos o caractersticas. A estos
fenmenos o caractersticas se les denomina variables aleatorias.
Segn la forma en que se expresen las variables, se dividen en:
1) Variables Cualitativas: son aquellas que pueden expresarse slo en forma de atributo.
Ejemplo:
1) Estado civil :
soltero
casado
viudo
separado
2) Satisfaccin con un producto:
muy insatisfecho
regularmente insatisfecho
neutral
satisfecho

muy satisfecho
3) Tamao de un tablero :
grande
mediano
pequeo
2) Variables Cuantitativas, son aquellas variables que pueden expresarse en forma numrica Se
dividen en discretas y continuas.
2.1) Variables Cuantitativas Discretas, son respuestas numricas que surgen de un proceso de
conteo, siendo siempre un nmero entero.
Ejemplos :
1) Nmero de asignaturas inscritas en el primer semeste.
2) Nmero de integrantes del grupo familiar.
3) Nmero de salas de clases del IPVG.
2.2) Variables Cuantitativas Continuas, son respuestas numricas que surgen de un proceso de
medicin, las cuales pueden tomar valores entre dos nmeros enteros.
Ejemplo :
1) Estatura
2) Temperatura
3) Peso
7

Tabulacin de los datos


En los experimentos estadsticos los datos recolectados pueden corresponder a una poblacin o
muestra. En ambos casos los procedimientos de resumen de datos son anlogos y designaremos por:
Tamao de la poblacin estudiada
Tamao de la muestra (parte de la poblacin)
Con el objeto de realizar un mejor estudio de los datos es necesario organizar stos, mediante el
uso de distribuciones de frecuencia.
Una distribucin de frecuencia es una tabla resumen en la que se disponen los datos divididos en
grupos ordenados numricamente y que se denominan clases o categoras.

A) Tabulacin de datos cualitativos


La construccin de una distribucin de frecuencia de atributos o distribucin de frecuencia de
variable cualitativa es simple, basta enumerar los diversos atributos con su respectiva frecuencia de
ocurrencia.
Frecuencia absoluta : indica el nmero de veces que se repite un atributo.
Ejemplo:
Considrese una muestra trabajadores de una cierta empresa de la regin los cuales han sido
encuestados sobre su actual estado civil. La informacin es tabulada de la siguiente manera:
Estado Civil
Soltero
Casado
Viudo
Separado
Total

(tamao de la muestra)
(nmero de clases)
8

B) Tabulacin de variable cuantitativa


Distinguiremos dos casos:

B.1) Tabulacin de variable discreta (que toma un conjunto pequeo de

datos distintos)
Las tablas de frecuencia de variable discreta llevan cinco columnas donde los elementos que
participan son los siguientes:
a) Frecuencia absoluta : indica el nmero de veces que se repite una variable.
b) Tamao de la muestra : indica la cantidad de elementos que conforman la muestra, se
obtiene sumando todas las frecuencias absolutas.
nmero de clases distintas

c) Frecuencia relativa : es la proporcin de datos que se encuentra en una clase, se obtiene


dividiendo la frecuencia absoluta de la clase por el tamao de la muestra.
a)


Obs:
b)
d) Frecuencia absoluta acumulada : indica la cantidad de datos que se encuentran hasta
cierta clase.


e) Frecuencia relativa acumulada : es la proporcin de datos acumulados que se
encuentran hasta cierta clase.
a)

Obs:
b)
Ejercicio
Una empresa que tiene trabajadores se propone reestructurar las remuneraciones, se estudia los
aos de servicio de los trabajadores determinndose los siguientes resultados:

9
(tamao de la poblacin)
Se pide:
Tabular la informacin.
Qu cantidad de trabajadores tiene aos de servicio ?.
Qu porcentaje de trabajadores tiene aos de servicio ?.
Si aquellos trabajadores que tengan a lo menos siete aos de servicio reciben un aumento del
% . Qu porcentaje de los trabajadores recibi dicho aumento?.
Si todos los trabajadores que tengan a lo ms cinco aos de servicio reciben una bonificacin
de $ . Qu cantidad de trabajadores recibi dicha bonificacin?.
Si la empresa decide otorgar una bonificacin especial de $ por cada ao de servicio.
Cunto ser el dinero necesario para cumplir dicha bonificacin?.
Solucin

Aos de servicio
Total

10

Ocho trabajadores tienen aos de servicio


El % de los trabajadores tiene aos de servicio.
El % de los trabajadores recibi el aumento de sueldo.
trabajadores recibieron la bonificacin.
$ se necesitan para la bonificacin por ao de servicio.

B.2) Tabulacin de variable continua o discreta


Para tabular una variable continua o discreta (que tome un gran nmero de datos distintos) se
necesitan los siguientes elementos:
a) Rango o recorrido : Es la diferencia entre el valor mximo y valor mnimo que toma la
variable.
mx mn
b) Nmero de intervalos o clases () : Es el nmero de grupos en que es posible dividir los
valores de la variable.
El nmero de clases no debe ser ni muy grande ni muy pequeo, un nmero pequeo de clases
puede ocultar la naturaleza general de los datos y un nmero muy grande puede ser demasiado detallado
como para revelar alguna informacin til. Como regla general se recomienda que el nmero de clases est
entre cinco y veinte. Hay una regla llamada Regla de Sturges que puede dar una aproximacin razonable
para el nmero de clases, ella es:
donde es el nmero de datos de la muestra.
c) Amplitud del intervalo o amplitud de la clase () :
Recorrido
N de clases

d) Lmites de un intervalo : Son los valores extremos de una clase. El menor valor es considerado
como el lmite inferior y el valor que se obtiene sumando al lmite inferior la amplitud del intervalo es el
lmite inferior de la segunda clase.
e) Lmites reales de un intervalo : Se obtienen calculando el promedio entre el lmite superior de
una clase y el lmite inferior de la clase siguiente.
f) Marca de clase : Es el punto medio de un intervalo.
g) Frecuencia absoluta : indica el nmero de observaciones que pertenece a un intervalo
dado.
Observacin: tamao de la muestra

11
h) Frecuencia relativa : es la proporcin de datos que se encuentra en un intervalo, se
determina dividiendo la frecuencia absoluta del intervalo por el tamao de la muestra.

i) Frecuencia absoluta acumulada : indica el nmero de datos de la muestra menores o


iguales al lmite real superior del intervalo .

Obs:

j) Frecuencia relativa acumulada : indica la proporcin de datos de la muestra menores o


iguales al lmite real superior del intervalo .


Observacin: Existe ms de un mtodo para construir una tabla de distribucin de frecuencias, a
continuacin se presentan dos formas de construirla:
Ejemplo
Los siguientes datos corresponden a las notas obtenidas por alumnos en un curso de
Estadstica










Construya la correspondiente distribucin de frecuencia.
En qu clase se concentra el mayor nmero de notas?
Cul es la frecuencia absoluta del cuarto intervalo?. Interprete el resultado .
Qu porcentaje de los alumnos tienen una nota inferior a ?
12
Cuntos alumnos tienen una nota superior a ?
Interprete la frecuencia acumulada del sexto intervalo.
Interprete la frecuencia relativa acumulada del quinto intervalo.
Solucin:



Notas Lmites reales











Total
El mayor nmero de notas se concentra en el quinto intervalo, que coresponde al intervalo
entre .
La frecuencia absoluta del cuarto intervalo es . Esto nos indica que son los alumnos que
tienen una nota entre .
El % de los alumnos tiene una nota inferior a .
El % de los alumnos tiene una nota superior a .
Existen alumnos con nota inferior a .

El % de los alumnos tiene una nota inferior a .


13
Ejercicios
1) Los siguientes datos corresponden al sueldo (en miles de pesos) de trabajadores de una
empresa





a) Construya la tabla de frecuencia con todos sus elementos.
b) En qu clase se encuentra el mayor nmero de trabajadores?.
c) Qu porcentaje de trabajadores gana entre $ 139.000 y $ 168.000 ?.
d) Cuntos trabajadores ganan a lo menos $ 159.000 ?.
e) Cuntos trabajadores ganan a lo ms $ 148.000 ?.
2) En una industria es necesario realizar un estudio respecto al peso de engranajes de gran tamao.
Los siguientes datos corresponden al peso, en kilgramos, de de estas piezas, que poseen las mismas
dimensiones, pero distinta aleacin.



a) Construir una tabla de frecuencias de amplitud comenzando desde
b) Cuntos engranajes pesan entre y Kg.?.
c) Qu porcentaje representa a aquellos engranajes cuyo peso es inferior a 1 Kg.?.
d) Cul es la frecuencia relativa para aquel intervalo cuya marca de clase es ?.
e) Qu porcentaje representa a aquellas piezas que pesan ms de Kg. ? .
3) En una industria automotriz es necesario realizar un estudio debido a una partida defectuosa de
discos de embrague. Para ello se ha recopilado la siguiente informacin referente a la duracin en horas de
de ellos.





a) Construir una tabla de frecuencia de amplitud cinco comenzando desde
b) Cuntos discos duraron entre y horas?.
c) Cuntos discos no alcanzaron a durar horas?.
d) Qu porcentaje representan los discos que duraron entre y horas?.
e) Qu porcentaje representan los discos que duraron menos de horas?.
f) Cuntos discos duraron ms de horas?.
g) Cuntos discos duraron menos de horas?.
h) Qu porcentaje representan los discos que duraron entre y horas?.
i) Cul es el intervalo de mayor frecuencia absoluta?.
14
4) En un conjunto habitacional se pretende hacer un estudio del nmero de personas que
consumen productos enlatados. Los datos que han sido obtenidos de 50 bloques del conjunto habitacional
son





a) Construir una tabla de fecuencia de amplitud partiendo desde
b) Cuntas personas consumen entre y productos enlatados ?.
c) Qu porcentaje representa a las personas que consumen menos de productos enlatados?.
d) Qu cantidad de personas consumen ms de productos enlatados?.

5) Las ganancias por accin de 40 compaas de la industria de la construccin son:







a) Construya una distribucin de frecuencias que comience en y tenga una amplitud de
b) Cul es la frecuencia absoluta del tercer intervalo?. Interprete el resultado .
c) Qu porcentaje de las compaas tienen a lo ms una ganancia de ?
d) Cuntas compaas tienen una ganancia a lo menos de ?
e) Interprete la frecuencia acumulada del segundo intervalo.
f) Interprete la frecuencia relativa acumulada del cuarto intervalo.
15
Solucin
1)a)


Sueldo Lmites reales








Total
b) En la tercera clase se encuentra el mayor nmero de trabajadores.
c) 67,5 % de los trabajadores gana entre $139.000 y $ 168.000
d) 7 trabajadores ganan a lo menos $ 159.000
e) 24 trabajadores ganan a lo ms $ 148.000
2) a) Peso Lmites reales





Total
b) 11 engranajes pesan entre 46 y 55 kilos.
c) El 77 % de las piezas pesan menos de 51 kilos.
d) La frecuencia relativa es 0,17
e) El 23 % de las piezas pesa ms de 50 kilos.
16
3) a) Duracin Lmites reales





Total
b) 13 discos duraron entre 290 y 299 horas.
c) 22 discos no alcanzaron a durar 300 horas.
d) El 6 % de los engranajes duraron entre 300 y 314 horas.
e) El 58 % de los engranajes duraron menos de 305 horas.
f) 16 engranajes duraron ms de 309 horas.
g) 29 engranajes duraron menos de 305 horas.
h) El 16 % de los engranajes duraron entre 285 y 294 horas.
i) El primer intervalo.
4) a) N de personas







Total
b) 18 personas consumen entre 100 y 129 productos enlatados.
c) El 28 % de las personas consume menos de 90 productos enlatados.
d) 41 personas consume ms de 79 productos enlatados.
5) a) Ganancias Lmites Reales





Total
b) La frecuencia absoluta del tercer intervalo es , es decir, existen compaas cuyas ganancias
estn entre y por accin.
c) El % de las compaas tienen a lo ms una ganancia de por accin.
d) compaas tienen a lo menos una ganancia de por accin.
e) compaas tienen una ganancia igual o menor a por accin.
f) El % de las compaas tienen una ganancia por accin de a lo ms .
17

Representacin Grfica
Su objetivo es captar la informacin obtenida en los datos en forma rpida por cualquier persona,
as cada representacin debe llevar un ttulo adecuado.
Las normas en la construccin de un grfico estadstico son similares a los de grficos de
funciones, las variables independientes, se ubican en las abscisas y las dependientes en las ordenadas.

Tipos de grficos

a) Grfico circular: se usan para mostrar el comportamiento de las frecuencias relativas,


absolutas o porcentuales de las variables. Dichas frecuencias son representadas por medio de sectores
circulares, proporcionales a las frecuencias.
Departamento %
A (1)
B (2)
C (3)

D (4)
E (5)
Total

Pe rso n al p o r De p ar tame n to
1
15%
2
28%
3
33%
4
15%
5
9%
1
2
3
4
5

18
b) Pictograma: es un grfico cuyo uso es similar al de sector circular, pero la frecuencia es
representada por medio de una figura o dibujo que identifique a la variable en estudio. Este grfico se
utiliza para mostrar producciones en una serie cronolgica.
Por ejemplo, Alumnos del Instituto Profesional Dr. Virginio Gmez:
alumnos
1996:
1997:
1998:
1999:
2000:
2001:
19
c) Grfico lineal: se utiliza para mostrar las frecuencias absolutas o relativas de una variable
discreta, son representadas mediante lneas verticales proporcionales a dichas frecuencias.
Total

20
d) Grfico de barra: Se utiliza para representar tablas de frecuencia con atributos o con
variables discretas y pocos valores. Sobre un eje horizontal se construyen bases de rectngulo del mismo
ancho cada uno correspondiente a una modalidad del atributo, sobre estas bases se levantan rectngulos
cuya altura es proporcional a la frecuencia absoluta de la modalidad. El espacio entre ellas debe ser

uniforme.
Departamento
ABC
DE
Total

Personal por Departamento


0
20
40
60
80
100
120
140
ABCDE
Departamento
Frecuencia

21
e) Histograma: es el grfico adecuado cuando los datos estn ordenados en tablas con intervalos,
es decir, para datos de variables continuas. Tambin el histograma es una conformacin de rectngulos,
pero uno al lado de otro cuya rea es proporcional a la frecuencia de cada intervalo. Los extremos de la
base de cada rectngulo son los lmites reales del intervalo.
Lmites Reales
Total

HISTOGRAMA
0
2
4
6
8
10
12
8,5 12,5 16,5 20,5 24,5 28,5
4,5 8,5 12,5 16,5 20,5 24,5
Lmites Re a les

Frecuencia Absoluta

22
f) Polgono de frecuencia: este grfico sirve para mostrar la tendencia de la variable, se puede
determinar a partir de un histograma uniendo los puntos medios superiores de cada rectngulo del
histograma. Tambin, se determina el polgono uniendo los puntos formado por la marca de clase con la
frecuencia absoluta del intervalo respectivo.
Lmites reales
Total

Polgono de F recuencias
0
2
4
6
8
10
12
2,5 6,5 10,5 14,5 18,5 22,5 26,5 30,5
M arcas de Clase s
Fre cue ncia Absoluta

23
Observacin: El polgono de frecuencias se convierte en polgono de frecuencias relativas,
cambiando la frecuencia absoluta por la frecuencia relativa, en este caso, el rea bajo el polgono de
frecuencias relativas es igual a .
Histograma y Polgono de Frecuencias
Histograma y Polgono de Frecuencias
0
2
4
6
8
10
12
Lmites Reales

Frecuencia Absoluta

24
e) Ojiva: es un grfico que se usa para mostrar como se acumulan las frecuencias absolutas,
relativas o porcentuales. Se obtiene al unir los puntos formados por los lmites superiores de cada intervalo
con la frecuencia absoluta o relativas acumuladas del intervalo respectivo. Si se consideran las frecuencias
porcentuales acumuladas se llama ojiva porcentual.
Lmites reales
Total

Ojiva
0
4
8
12
16
20
24
28
32
36
40
4 8 12 16 20 24 28
Lmites Super iore s
Frecuencia Acum ulada

25
Ejercicios
1) Dada la informacin referente a la ubicacin de personas dentro de cuatro departamentos de
una empresa, se pide
a) Tabular la informacin.
b) Realizar grfico circular.
c) Indique frecuencias relativas porcentuales en cada grupo.
M A P CC A CC M P P M
P CC M A M CC P P M P
APAM M AM APM
M A CC A A M P M M P
donde A abastecimiento ; CC control de calidad ; M mantencin ; P produccin.
2) Se realiz un nmero determinado de compras de materia prima. El volumen de la materia
prima viene dado en m3.Parte de la informacin se registra en la siguiente tabla
Volumen Lmites reales
Total

a) Complete la tabla dada.


b) En un slo grfico, dibuje un histograma y un polgono de frecuencia.
c) Cuntas compras se realizaron entre y m3?.
d) Cuntas compras se realizaron entre y m3?.
e) Qu porcentaje de compras se realizaron entre y m3?.
f) Cuntas compras se realizaron en total?.
26
3) Los siguientes datos corresponden a la duracin, en horas, de vlvulas que fueron sometidas
a un cierto control.
Tiempo Lmites reales
Total

a) Complete la tabla dada.


b) Grafique la ojiva
c) Qu porcentaje de las vlvulas duraron, en promedio horas?.
d) Qu porcentaje de las vlvulas duraron entre y horas?.
e) Cuntas vlvulas duraron menos de horas?.
f) Qu porcentaje de las vlvulas duraron ms de horas?
4) Se realizaron dos experimentos referente al peso, en Kg., aplicado sobre una cierta cantidad de
tableros.
Peso(Kg.) A B
Total






a) Grafique el histograma del experimento A.
b) Grafique la ojiva porcentual del experimento B.
c) Realice, en un mismo grfico, los polgonos de frecuencia.
d) Realice, en un mismo grfico, las ojivas.
27
5) Dado el siguiente Polgono de Frecuencias:
Pesos de los Alumnos de C . C ivil
0
1
2
3
4
5
6
7
8
9
10
35,5 45,5 55,5 65,5 75,5 85,5 95,5
Pe so (Kg.)

N Alumnos

a)Cules son los lmites reales del cuarto intervalo?.


b) Interprete la frecuencia del cuarto intervalo.
c) Interprete el porcentaje de datos que hay en el quinto intervalo.
d) Qu porcentaje de pesos es igual o menor que Kg.?.
e) Cuntos pesos son iguales o mayores que Kg.?.
28
Solucin
1) a) Departamento
A
CC
MP
Total

b) Grfico Circular
Personal por Departamento

A
25%
CC
13%
M
34%
P
28%
A
CC
M
P

c) Departamento %
A

CC
MP
Total





__