CONCEPTOS BSICOS
1.1. Introduccin
1.2. Qu es la estadstica
1.10. Ejercicios
1.11. Glosario
1.16. Grficas
1.1. Introduccin
Actualmente, son de uso cotidiano las diferentes tcnicas estadsticas que partiendo de
observaciones muestrales o histricas, crean modelos lgico-matemticos que permiten
describir o pronosticar un determinado fenmeno con cierto grado de incertidumbre.
1.2. Qu es la Estadstica?
Son muchas las definiciones que se han dado de la Estadstica, considerada por algunos
como ciencia y por otros como un mtodo cientfico utilizado por diversas ciencias.
Entre estas tenemos:
Su importancia radica en que hace una simbiosis (unin, fusin) con la vida
contempornea, porque esta requiere de la Estadstica para indicar en trminos
cuantitativos el comportamiento y tendencia de casi todos los fenmenos colectivos,
sean estos: econmicos, sociales, educativos, polticos, meteorolgicos, fsicos,
qumicos, mdicos, religiosos y demogrficos, y por el lado de la Estadstica, este uso
frecuente y necesario coadyuva a su desarrollo y a la bsqueda de su perfeccin como
disciplina cientfica.
La aplicacin puede darse en varios niveles, desde lo que requieren tcnicas muy
elaboradas hasta los que solo necesitan la organizacin de un conjunto de datos en
tablas, la construccin de algunas graficas o el clculo de ciertos promedios.
Investigacin descriptiva
a) Los estudios descriptivos son diseados para describir algo, por ejemplo: las
caractersticas de los usuarios de un producto dado; el grado en que el uso del
producto vara con el ingreso, la edad, el sexo u otras caractersticas; o el
nmero de personas que vio un anuncio especifico en televisin. La mayora de
los estudios de investigacin de mercados son de este tipo.
Estadstica descriptiva y
Estadstica Inferencial
Hacia fines del siglo XVII, ya existan investigaciones semejantes a nuestros censos
modernos. Al mismo tiempo, las compaas de seguros empezaban a recopilar tablas de
mortalidad para determinar las primas de seguros de vida.
Ejemplo 1.- Un director de escuela desea conocer las aptitudes de cinco secretarias que
trabajan en dicha institucin. Se aplica una prueba de aptitudes a las cinco secretarias y
las calificaciones son 82, 85, 95, 92 y 91. La medida estadstica que emplea el Director
es la aptitud promedio o media aritmtica, la cual es la suma de los valores obtenidos
dividida por el nmero de observaciones. Entonces, la calificacin promedio es:
82 + 85 + 95 + 92 + 91 445
= = 89
5 5
Para concluir diremos que existe otra gran divisin de las tcnicas estadsticas:
a) Estadstica Paramtrica.
b) Estadstica No Paramtrica.
CIENCIA ESTADSTICA
Es un conjunto de tcnicas y
Conjunto de tcnicas y procedimientos
procedimientos ordenados
ordenados sistemticamente
sistemticamente
Siguen una serie de pasos lgicos y
Planificacin, programacin, recopilacin
naturales: planificacin, programacin,
de datos, procesamiento, anlisis e
realizacin del experimento, observacin,
interpretacin de los resultados obtenidos
anlisis y obtencin de resultados
Tratar de establecer la relacin entre causa
Orientados a establecer la relacin entre
y efecto
causa y efecto
Establecer un camino para tratar de llegar
Establecer un camino para tratar de llegar
a la verdad
a la verdad
Muestreo Aleatorio: en este tipo de muestreo todos los elementos de la poblacin tienen
la misma probabilidad de ser seleccionados. Los mtodos de muestreo aleatorio son:
Las escalas nominales.- se utilizan como medidas de identidad. Los nmeros sirven
de indicativos para identificar objetos o clases. Ejemplo: las personas que puede
clasificar segn el sexo, por su religin, el color de los ojos, etc
La escala de razones.- Son nmeros que indican razones o cocientes entre ciertas
magnitudes de los objetos y los datos obtenidos con estas escalas pueden ser sometidos
a tratamientos estadsticos ms elaborados. La escala de razones ms comunes
corresponde a medidas de longitud, peso, capacidad, sonido, etc. Ejemplo: un peso de
80 libras es 4 veces mayor que uno de 20 libras.
Una variable es una caracterstica que puede tener diferentes valores en los distintos
elementos o individuos de un conjunto. Ejemplos: el nmero de jornadas de trabajo con
Los smbolos que se utilizan en las variables son las ultimas letras del alfabeto: , , .
Segn el tipo de valores que puede tomar una variable se clasifican en cualitativas y
cuantitativas.
Variables cualitativas.- Son las variables cuyos valores posibles son cualidades o
atributos. Ejemplos: la estatura de un persona que puede ser baja, mediana o alta; el
sexo de una persona, la residencia, el color de los ojos, etc
Variables cuantitativas.- Son las variables cuyos valores pueden tomar una expresin
numrica. Ejemplos: el precio de un producto, el salario, etc
1.10. Ejercicios
1. Se quiere saber el gasto que un estudiante realiza al mes. Uno de los gastos que hace
un estudiante es su alimentacin y transporte. Se toma una muestra de 30 alumnos para
realizar el estudio. Sea "x" el gasto mensual en alimentacin y transporte que realiza un
estudiante de cierta Universidad. Describa cuidadosamente:
a) La poblacin.
b) La muestra
c) La variable y de qu tipo es
a) La poblacin
b) La muestra
c) La variable y de qu tipo es
e) Es observacin experimento
f) Es un estadstico parmetro
a) Sexo: Masculino
b) Residencia: Santiago
c) Clase: 2 ao
d) Temperatura: 37C
Clasifique cada una de las diez respuestas de acuerdo con el tipo de datos y con la
escala de medicin.
5. En una encuesta que realiza Banamex a sus cuenta- habientes, aparecen las siguientes
preguntas entre otras:
c) Describe la poblacin
d) Describe la muestra
1.11. Glosario
Una vez que se han obtenido los datos y que se ha hecho el estudio de los valores que
pueden tomar las variables, la primera tarea de la Estadstica es la de ordenar y presentar
los datos en tablas que permitan ver la tendencia de los mismos. Ordenados los datos se
facilita su representacin en diagramas y grficas de diferentes tipos.
Los datos agrupados en tablas, nos permiten ver con facilidad el nmero de
observaciones iguales o comprendidos en un intervalo, a este nmero de repeticiones
iguales de la variable se llama frecuencia y se denota por . Otros valores relacionados
con la frecuencia son:
Escalas de Medicin.
La clasificacin que hemos hecho de las variables, depende del nivel de medicin de la
caracterstica deseada. El nivel de medicin tambin denominados escalas de medicin,
lo podemos clasificar en:
1. Nominal.
2. Ordinal.
3. Por intervalo.
De acuerdo con esta clasificacin podrs notar que dependen del tipo de variable que se
analiza y por lo tanto reciben el mismo nombre de stas.
10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20
Al finalizar la carrera, el primer lugar lo obtuvo el 13, el segundo lugar el 19, y el tercer
lugar el 16. El primer lugar hizo un tiempo de 15.3 minutos, el segundo lugar 15.5 y el
tercer lugar 15.8 minutos.
Definicin de variables:
Escala nominal es la que se usa para asignarle una etiqueta a las categoras que se
construyen de la variable con el nico fin de distinguir unas de otras.
Escala ordinal es la que permite ordenar o jerarquizar las categoras que se construyen
de la variable que se evala.
Escala de medicin por intervalos es la que permite clasificar, ordenar y cuantificar las
categoras que se establecen de la variable.
La escala de medicin por intervalos es la de mayor nivel de medicin e incluye las dos
anteriores; para poder usarse con la precisin deseada es necesario fijar un patrn de
medida que cuantifique a la variable con la misma exactitud, cuantas veces sea medida.
Algunos de los patrones que se usan son: Aos, kilos, litros, pesos, etctera.
Las primeras tareas de la Estadstica descriptiva son ordenar, clasificar y resumir los
datos obtenidos en la investigacin de campo, para ello se concentran en tablas de
a) Absoluta.
b) Relativa.
c) Acumulada.
E, Z, M, S, S, M, Z, E, M, S, Z, S, E, S, M, S, M, M, Z, S, E, S, M, E, E, S, M, M, Z, E,
M, Z, Z, S, E, M, S, S, Z, M, Z, S, M, Z, S,
Minas 13
Zootecnia 10
Total 45
El nmero de columnas de una tabla es variable y depende de la informacin que se
quiera registrar. En nuestro ejemplo podemos suprimir la columna 2 que representa el
conteo de la variable el cual se puede realizar en otras hojas de trabajo. Mientras que en
Considerando la tabla del ejemplo 1.2 podemos notar que las partes de una tabla de
frecuencias deben contener las siguientes partes:
Estas partes son comunes a todas las tablas que se elaboren en un estudio, para que el
que las analice tenga toda la informacin y pueda hacer deducciones de los resultados.
Ejemplo 1.3. El gerente de una Empresa, Kimberly preocupado por el pago de energa
consumida solicito al jefe de planta, un estudio del consumo diario durante el mes de
agosto. Los resultados obtenidos. / (Kilowatios por hora) son los siguientes:
Consumo ( /)
5 2
6 3
7 4
8 5
9 6
10 5
11 3
12 2
Total 30
Contestar las siguientes preguntas:
= (ec. 1)
De la ecuacin (1) se puede observar que la frecuencia relativa se expresa como una
razn, como una proporcin o como un porcentaje (%).
Frecuencia relativa
Puntuacin razn
proporcin porcentaje
0 1 1/100 0.01 1%
1 2 2/100 0.02 2%
2 3 3/100 0.03 3%
3 5 5/100 0.05 5%
4 6 6/100 0.06 6%
5 8 8/100 0.08 8%
6 20 20/100 0.20 20 %
7 25 25/100 0.25 25 %
8 15 15/100 0.15 15 %
9 10 10/100 0.10 10 %
10 5 5/100 0.05 5%
Total 100 100/100 1.00 100 %
Hasta el momento, en los problemas que se han analizado las muestras son pequeas (
es pequeo). Sin embargo cuando la muestra o poblacin se compone de un
considerable nmero de elementos, la tabla de frecuencias se elabora agrupando los
datos en clases y ahora la tabla se llama Tabla de frecuencias con datos agrupados.
= (ec. 2)
No existe alguna ley que defina cmo obtener el nmero de clases; pero la experiencia
recomienda que no sea menor que 5 ni mayor de 20, esto es:
5 20 (ec. 3)
= (ec. 4)
= 1 + 3.322 ( ) (ec. 5)
30, 38, 36, 35, 29, 28, 30, 35, 40, 48, 50, 20, 25, 56, 30
27, 29, 46, 41, 31, 31, 31, 39, 28, 36, 37, 52, 44, 49, 52
56, 58, 40, 39, 38, 40, 27, 24, 30, 32, 35, 38, 26, 25, 24
60, 55, 48, 37, 31, 30, 22, 20, 24, 26, 23, 22, 28, 27, 48
20, 20, 22, 22, 23, 24, 24, 24, 25, 25, 26, 26, 27, 27, 27, 28
28, 29, 29, 30, 30, 30, 30, 30, 31, 31, 31, 32, 35, 35, 35, 36
36, 37, 37, 38, 38, 38, 38, 39, 39, 40, 40, 40, 41, 44, 46, 48
48, 48, 49, 50, 52 ,52, 55, 56, 56, 57, 58, 60
2. Determinar y
= 20 y = 60
3. Calcular el rango .
= = 60 20 = 40
4. Calcular mediante la ecuacin de Sturges.
= 1 + 3.322 ( ) = 1 + 3.322 ( 60) = 6.9 7
5. Determinar la amplitud de la clase .
= = = 5.7
Frecuencia relativa
Clases ( ) Razn
proporcin porcentaje
20 - 25 10 10/60 0.17 17 %
26 31 17 17/60 0.28 28 %
32 37 8 8/60 0.13 13 %
38 43 10 10/60 0.17 17 %
44 49 6 6/60 0.10 10 %
50 55 4 4/60 0.07 7%
56 61 5 5/60 0.08 8%
Total 60 60/60 1.00 100 %
Si analizamos los intervalos de clase del ejemplo anterior podemos notar lo siguiente:
De un intervalo a otro hay un salto por ejemplo:
1er. Intervalo 20 25
2do. Intervalo 26 31
En la grfica podemos ver que al formar los intervalos de clase hay un valor entre clase
y clase que se pierde. Como la variable es discreta sabemos que entre estos valores no
hay ninguna informacin que se pierda; pero qu pasa si la variable es continua?, en
estos casos si hay la posibilidad que entre el 25 y 26 se pierdan los valores
comprendidos como es 25.1, 25.3, 25.6, etctera.
Para evitar este error, si la variable es continua, entonces despus de haber determinado
los lmites de clase, se fijan otros lmites que inician medio punto antes y medio punto
despus; de esta forma no hay posibilidad de perder informacin. A cada uno de estos
nuevos lmites se le llama lmite real de clase. Consideremos el mismo ejemplo
anterior.
20 - 25 19.5 25.5
26 31 25.5 31.5
32 37 31.5 37.5
38 43 37.5 43.5
44 49 43.5 49.5
50 55 49.5 55.5
56 61 55.5 61.5
Si representamos los lmites reales de clase en una grfica lineal podemos observar que
ya no hay saltos entre cada clase:
Al cambiar los lmites reales de clase, el valor del intervalo de clase (A) no cambia y
para determinarlo aplicamos la siguiente ecuacin:
= (ec. 6)
= +1 (ec. 7)
Otra caracterstica importante del intervalo de clase o marca de clase es el punto medio
de clase o marca de clase ( )
Definicin 1.4. La marca de clase es el valor del punto que se localiza a la mitad del
intervalo de cada clase o intervalo real de clase.
= (ec. 8)
Determinemos los puntos medios o marcas de clase para el ejemplo 1.5 anterior en los
dos tipos de intervalos.
clases clases
20 - 25 22.5 19.5 25.5 22.5
26 31 28.5 25.5 31.5 28.5
32 37 34.5 31.5 37.5 34.5
38 43 40.5 37.5 43.5 40.5
Hasta el problema anterior hemos mostrado cmo organizar los datos en una tabla de
frecuencia de datos agrupados en clases y tambin hemos incluido la fraccin o
porcentaje de cada clase ( ). Esta informacin nos ha permitido hacer algunas
inferencias.
= + +
= + + + (ec. 9)
= (ec. 10)
Frecuencia acumulada
Clases Lmites reales Marca de Clase ( )
La frecuencia acumulada para la 4ta. Clase es = 45; de este valor se infiere que hasta
esta clase corresponden 45 de las 60 observaciones realizadas. Tambin se infiere que a
esta clase corresponden un nmero menor o igual a 43 llamadas telefnicas.
La frecuencia relativa de esta clase es F = 0.75. este valor significa que hasta esta clase
corresponde el 75% de todas las llamadas.
Si queremos determinar el nmero de llamadas mayor que, lo que tenemos que hacer es
des acumular la frecuencia y para ello en lugar de sumar restamos al nmero de
observaciones ( ) la frecuencia de la clase ( ) correspondiente. Esto es:
Con los ejemplos anteriores se puede considerar que la tabla de frecuencias nos permite
inferir ciertos conocimientos de la variable que se analiza. Otra forma de analizar la
informacin e inferir ciertos conocimientos, es mediante la representacin grfica de los
mismos.
1.16. Grficos
Existen muchos tipos de grficas en las que se pueden representar la frecuencia absoluta
( ), relativa ( ) y acumulada ( ) y con ellas podemos estimar algunos valores con la
simple observacin.
Los diferentes tipos de grfica que podemos usar para representar las observaciones de
un determinado problema y la seleccin de este tipo, dependen de la variable en estudio.
Si la variable en estudio es de tipo cuantitativo, los grficos que podemos usar para su
representacin grfica son:
a) Histogramas.
b) Polgonos de frecuencias que a continuacin analizaremos.
13, 19, 22, 14, 13, 16, 19, 21, 23, 11, 27, 25, 17, 17, 13, 20
23, 17, 26, 20, 24, 15, 20, 21, 23, 17, 29, 17, 19, 14, 20, 20
10, 22, 18, 25, 16, 23, 19, 20, 21, 17, 18, 24, 21, 20, 19, 26
10, 11, 13, 13, 13, 14, 14, 15, 16, 16, 17, 17, 17, 17, 17, 17, 18,
18, 19, 19, 19, 19, 19, 20, 20, 20, 20, 20, 20, 20, 21, 21, 21, 21,
22, 22, 23, 23, 23, 23, 24, 24, 25, 25, 26, 26, 27, 29.
2. Calculamos el rango , para ello determinamos los valores mayor y menor de las
puntuaciones.
= 29 y = 10
3. Calculamos = = 29 10 = 19 = 19
4. Calculamos el nmero de clases ( ), para ello determinamos ( )
= = = 2.7 ~ 3
7. Trazamos los ejes del plano coordenado, fijamos una escala para cada eje y
representamos en el eje vertical las frecuencias y en el eje horizontal las clases. La
mayor frecuencia es = 16 por lo que con la escala establecida en . Marcamos
16 divisiones en el eje vertical. En el eje horizontal no es necesario iniciar por el
cero, en nuestro ejemplo podemos iniciar a partir de 9, indicando que se trunca una
parte del eje horizontal.
Figura 3.1.- Grfica del histograma que representa la informacin planteada en el ejemplo 3.6.
Las lneas verticales punteadas corresponden al punto medio o marca de clase, el cual
indica el promedio de las puntuaciones en cada clase. En el ejemplo 3.6 para la tercera
barra, el promedio en aos cumplidos de los obreros de la empresa ubicados en esa clase
es de = 17 aos y como la frecuencia es = 10 obreros con la misma antigedad.
Otra grfica que permite describir los datos de una distribucin de frecuencias es el
polgono de frecuencias.
Figura 1.2.- Grfica del polgono de frecuencia que representa la informacin planteada en el ejemplo
1.6.
Figura 1.3.- Grfica del polgono de frecuencia acumulada que representa la informacin planteada en
el ejemplo 1.6.
Si observamos las grficas 1.2 y 1.3 se nota que son muy parecidas y que su tamao
depende, nicamente de la escala que se utilice.
Si los intervalos de clase se toman cada vez ms pequeos, entonces los puntos se unen
con segmentos curvos que van suavizando la forma del polgono de frecuencias.
Para trazar dicha grfica se procede como en los grficos anteriores, es decir, en el eje
horizontal se trazan los intervalos de clase y marcas de clase y en el vertical las
frecuencias acumuladas.
Del ejemplo 1.6 tomando los datos de las columnas 6 y 7 de la tabla, obtenemos:
Figura 1.4.- Grfica del polgono de frecuencia acumulada u ojiva menos que, que representa la
informacin planteada en el ejemplo 1.6.
Figura 1.5.- Grfica del polgono de frecuencia acumulada u ojiva menos que, que representa la
informacin planteada en el ejemplo 3.6.
Msica 250
Pintura 350
Danza 200
Tejido 400
Bordado 100
Ajedrez 500
Total 1800
Para distribuir cada clase en la circunferencia se aplica una regla de tres simple
relacionando el total de inscritos (1800) a 360 que tiene la circunferencia y de esta
relacin determinamos la parte que le corresponde a cada curso.
El planteamiento de cada distribucin es: 1800 es a 360 como 250 es a para el caso
de msica. Es decir:
= = 50
Se debe hacer lo mismo en todos los casos. Los resultados que se obtienen son los
siguientes:
Msica 250 50
Pintura 350 70
Danza 200 40
Tejido 400 80
Bordado 100 20
Ajedrez 500 100
Total 1800 360
Para representarlos en el crculo, medimos los sectores con un transportador y trazamos
las divisiones. La grfica que se obtiene es:
Figura 1.6.- Grfica circular en grados, que representa la informacin planteada en el ejemplo 1.7.
Los resultados que se obtienen al realizar este planteamiento son los siguientes:
Figura 1.7.- Grfica circular en porcentaje, que representa la informacin planteada en el ejemplo 1.7.
Las calificaciones obtenidas por el grupo son las que se muestran en la tabla siguiente:
Calificacin 5 6 7 8 9 10
Nmero de estudiantes 3 8 12 8 5 4
Representamos la informacin en una grfica de segmentos y barras. Es decir:
Figura 1.8.- Diagrama de segmentos verticales, que representa la informacin planteada en el ejemplo
1.8.
Figura 1.9.- Diagrama de barras, que representa la informacin planteada en el ejemplo 1.8.
Figura 1.10.- Diagrama de barras horizontales, que representa la informacin planteada en el ejemplo
1.8.
1.20.3. Pictograma
Nmero de rboles
Delegacin
(en miles)
Suca
Huamboya
Proao
Sevilla
Zuac
Da Cantidad
Figura 1.11.- Grfico de lneas, que representa la informacin planteada en el ejemplo 1.10.
1.21. Ejercicios.
216, 269, 235, 235, 224, 249, 244, 240, 252, 210, 256
228, 233, 239, 253, 237, 221, 273, 229, 236, 215, 260
230, 228, 230, 255, 245, 244, 230, 231, 240, 222, 223
13 19 22 14 13 16 19 21 23 11 27 25 17 17 13 20
23 17 26 20 24 15 20 21 10 22 18 25 16 23 19 20
21 17 18 24 21 20 19 26
Ao Nmero de habitantes
2001 8000
2002 9000
2003 10000
2004 11000
2005 12000
2006 13000
8. El consumo en miles de litros de agua de una industria durante los primeros 10
meses del ao 2009 son los que se muestran en la siguiente tabla.
Mes Ene Feb mar Abr May Jun Jul ago sep oct
Nmero de litros (en miles) 50 58 62 70 80 85 80 70 65 60
Representa los datos de la tabla en un diagrama lineal.
RESUMEN