Anda di halaman 1dari 54

Unidad I

Introduccin a la Estadstica Descriptiva


Estadstica I
Ing. Waldo Urribarr
Objetivo:
Interpretar los trminos bsicos y aplicar las escalas de medicin de acuerdo a
los tipos de variables previamente establecidas.
Objetivos Especficos:
Conceptuar al estudiante con los trminos propios e identificar la
terminologa bsica de estadstica, su clasificacin y la relacin entre
probabilidad y estadstica.
Evaluar la habilidad del alumno para el tratamiento de datos e identificar la
distribucin de frecuencia.
Evaluar la habilidad del alumno para el clculo de las medidas de tendencia
central y las de dispersin.
Evaluar la habilidad del alumno para la elaboracin de las diferentes tablas y
graficas.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Contenido
Sntesis Histrica / Origen de la actividad estadstica
Definiciones de la estadstica.
Tipos de estadsticas: descriptiva e inferencial. Tipos de estadsticas: descriptiva e inferencial.
Tratamiento de datos.
Tabla de Frecuencias o Distribucin de frecuencias.
Tabulacin de datos, histograma, polgono y ojiva.
Medidas de tendencia central: media, mediana y moda.
Medidas de dispersin: rango, varianza y desviacin estndar.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Sntesis Histrica / Origen de la actividad estadstica
La Estadstica, como todas las ciencias, no surgi de improviso, sino
mediante un proceso largo de desarrollo y evolucin. Su origen empieza
posiblemente en la isla de Cerdea, donde existen monumentos posiblemente en la isla de Cerdea, donde existen monumentos
prehistricos pertenecientes a los Nuragas, las primeros habitantes de la
isla, y se han encontrado pruebas de su utilizacin por los egipcios, judos,
chinos, griegos y romanos. A mediados del siglo XVII, gracias a Vito
Seckendorff, y sobre todo de German Conring al que se le atribuye como
fundador de la Estadstica era la descripcin de los hechos notables de un
estado. Conring perfeccion y mejor notablemente la tendencia nueva,
sistematizando los conocimientos y los datos.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Sntesis Histrica / Origen de la actividad estadstica (cont.)
El mejor de sus seguidores fue Godofredo Achenwall, quien consolid
definitivamente los postulados de esta nueva ciencia y tambin de haberle
dado el nombre de "Estadstica"; palabra que etimolgicamente deriva de dado el nombre de "Estadstica"; palabra que etimolgicamente deriva de
la palabra "status", que significa estado o situacin; este nombre ya antes
haba sido usado en Italia, pero su definicin todava no estaba bien dada.
La Estadstica pas as a ser la descripcin cuantitativa de las cosas notables
de un estado. Von Scholer separ la teora de la estadstica de la aplicacin
prctica de la misma. Todos ellos formaron parte de la tendencia de la
Estadstica Universitaria Alemana, conocida como la Estadstica Descriptiva.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Sntesis Histrica / Origen de la actividad estadstica (cont.)
John Graunt encabeza una tendencia opuesta, nacida en Inglaterra, la de
los aritmticos polticos; conocida tambin como Estadstica Investigadora.
Ellos buscaban fijar en nmeros los fenmenos sociales y polticos cuyas Ellos buscaban fijar en nmeros los fenmenos sociales y polticos cuyas
leyes empricas buscaban. Para su tiempo esto fue atrevido, casi imposible;
pero el mrito de ellos es de ser los primeros en buscar las leyes
cuantitativas que rigen la sociedad.
Gustavo Romelin separ a la Estadstica Descriptiva en parte tcnico-
metodolgica y parte aplicada.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Sntesis Histrica / Origen de la actividad estadstica (cont.)
La estadstica se presenta as como un poderoso auxiliar de las distintas
ciencias y tcnicas; al provocar en stas la investigacin de las leyes de
comportamiento de ciertas variables que intervienen en un fenmeno cuyo comportamiento de ciertas variables que intervienen en un fenmeno cuyo
valor, gracias a la Estadstica se ponen de manifiesto.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Definiciones de la estadstica
La estadstica es una ciencia con base matemtica que se encarga de
recopilar, organizar, analizar, presentar e interpretar datos para ayudar a
tomar decisiones. tomar decisiones.
Datos
Los datos son colecciones de cualquier cantidad de observaciones
relacionadas. Una coleccin de datos se conoce como conjunto de datos;
una sola observacin es un dato puntual, "data-tem" o elemento de dato.
Cuando los datos se ordenan de manera compacta y til, los responsables
de tomar decisiones pueden obtener informacin confiable sobre el
entorno y usarla para tomar decisiones inteligentes, a hacer suposiciones
razonas acerca de las causas y, por tanto, de los efectos probables de
ciertas caractersticas en situaciones dadas.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Definiciones de la estadstica (cont.)
Informacin
La informacin no es un conjunto de datos cualquiera. Es ms bien una
coleccin de hechos significativos y pertinentes, para el organismo u coleccin de hechos significativos y pertinentes, para el organismo u
organizacin que los percibe. De esta manera, informacin es un conjunto
de datos significativos y pertinentes que describen sucesos o entidades.
Poblacin
Conjunto de todos los individuos, medidas u objetos de inters o estudio.
Tambin se le denomina universo.
Muestra
Una porcin o parte representativa de la poblacin de inters.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Definiciones de la estadstica (cont.)
Muestra
Es una coleccin de algunos elementos de la poblacin, no de todos. Una
muestra representativa es una porcin o parte representativa de la muestra representativa es una porcin o parte representativa de la
poblacin de inters. Esto significa que la muestra representativa contiene
las caractersticas relevantes de la poblacin en las mismas proporciones en
que estn incluidas en la poblacin.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Definiciones de la estadstica (cont.)
Parmetro
Es una medida descriptiva de la poblacin total de todas las observaciones
de inters para el investigador. de inters para el investigador.
Estadstico
Elemento que describe una muestra y sirve como una estimacin del
parmetro de la poblacin correspondiente.
Variable
Es una caracterstica de la muestra o poblacin que se est analizando en
un estudio estadstico.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Definiciones de la estadstica (cont.)
Variable
Una variable puede ser cuantitativa o cualitativa. Si la observacin puede
expresarse numricamente, entonces es una variable cuantitativa. Una expresarse numricamente, entonces es una variable cuantitativa. Una
variable cualitativa se mide de manera no numrica.
Las variables cuantitativas pueden ser continuas o discretas. Son continuas
si la variable puede tomar cualquier valor de un nmero real y son
discretas si est limitada a ciertos valores, generalmente nmeros enteros.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Tipos de Estadstica
Descriptiva: Conjunto de mtodos para organizar, resumir y presentar los
datos de manera informativa.
Inferencial: Conjunto de mtodos utilizados para determinar algn atributo
medible acerca de una poblacin con base en una muestra.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Concentracin o agrupacin de los datos de grandes poblaciones o
muestras.
Se pueden utilizar varias herramientas bsicas para describir y resumir un
conjunto grande de datos. La manera ms simple, pero quizs la ms conjunto grande de datos. La manera ms simple, pero quizs la ms
significativa, es la serie ordena. La serie ordenada simplemente enumera
las observaciones en orden ascendente o descendente. Ejm. Sean los
siguiente valores las edades de un grupo de estudiante nuevo a una
materia de procesos probabilsticos: 26 25 27 35 32. Una serie ordenada
de estos valores podra ser: 25 26 27 32 35. Se puede ver de inmediato que
los valores extremos son 25 y 35. Sin embargo, hay otras tcnicas para
describir un conjunto de datos y que nos aportan mayor informacin.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Agrupacin de los datos mediante lmites de clase.
Las clases o intervalos de clase son los limites a los extremos a los que
llega una funcin. Son utilizados a modo de resumen cuando la cantidad
de datos es muy grande. A los lmites extremos de cada clase se les llaman de datos es muy grande. A los lmites extremos de cada clase se les llaman
Lmite Inferior y Superior de clase, respectivamente. Los lmites de las
clases deben ser mutuamente excluyentes, esto es, no debe haber duda
en cuanto a la clase a que pertenece un dato determinado. La elaboracin
de una distribucin de frecuencias tiene mucho de subjetivo, pero al
mismo tiempo mucho de complejidad. Esto ltimo por la determinacin
de los lmites de las clases. Los llamados lmites indicados (aparentes,
nominales o convencionales) y su conversin en lmites reales (exactos), es
una tarea muy delicada y tediosa para el alumno que apenas se inicia con
la estadstica descriptiva.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Agrupacin de los datos mediante lmites de clase (cont.)
Hay que hacer notar que los lmites convencionales y reales generalmente
coinciden o no tiene sentido su diferenciacin cuando se trata de variables
discretas por lo que su aplicacin y dificultad se presenta principalmente discretas por lo que su aplicacin y dificultad se presenta principalmente
cuando se trata de variables continuas, por lo que tomaremos como caso
de estudio solo el caso de estas variables por ser las que presentan mayor
dificultad en su confeccin.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Agrupacin de datos mediante lmites (Convencionales y Reales)
Ejemplo en la distribucin de frecuencias:
Clase Frecuencia
2400 2599 7
2600 2799 20
Observen que cada clase tiene un lmite inferior y un lmite superior. Los
valores exactos de estos lmites son muy importantes. Si los datos en una
tabla de frecuencia son continuos, es necesario permitir valores
fraccionarios. Si los datos son nmeros de personas (variable discreta),
stas no se pueden fraccionar, por lo tanto la tabla puede permanecer
inalterable.
2600 2799 20
2800 2999 33
3000 3199 25
3200 3399 11
3400 3599 4
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Agrupacin de datos mediante lmites (Convencionales y Reales)
Si los datos son pesos de carga, pueden ocurrir valores fraccionados, como
2599,5, en este caso no est claro en cual de las clases entra este valor, y
como recordamos debe ser solo una de las clases. Qu hacemos en este como recordamos debe ser solo una de las clases. Qu hacemos en este
caso?
Recomendacin: usar la notacin de intervalo de nmeros reales para
determinar los lmites exactos o lmites reales de una clase
Clase Frecuencia
2400 menos de 2600 7
2600 menos de 2800 20
2800 menos de 3000 33
3000 menos de 3200 25
3200 menos de 3400 11
3400 menos de 3600 4
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Agrupacin de datos mediante lmites (Convencionales y Reales)
Otro mtodo utilizado para determinar los lmites reales es determinar el
promedio entre el lmite superior de una clase y el lmite inferior de la
clase subsiguiente. Pero en lo personal no recomiendo este mtodo. clase subsiguiente. Pero en lo personal no recomiendo este mtodo.
Un aspecto importante a considerar es lo relativo al tamao o nmero de
clase. Aunque esto depende mucho del criterio del investigador y de las
caractersticas de la investigacin, se recomienda que la tabla debera
tener entre 5 y 20 clases, ya que muy pocas clases no revelaran suficiente
informacin o detalle y muchas clases sera tan confuso como la lista
original de datos.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Estructuracin del cuadro tabular de frecuencias
Sea la siguiente tabla de datos el nmero de pasajeros que diariamente
solicita viajar en una aerolnea:
68 71 77 83 79
Estructurar un cuadro de frecuencias acorde a la naturaleza de la misma.
68 71 77 83 79
72 74 57 67 69
54 60 70 66 76
70 84 59 75 94
65 72 85 79 71
83 84 74 82 97
77 73 78 93 95
78 81 79 90 83
80 84 91 101 86
93 92 108 80 69
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Estructuracin del cuadro tabular de frecuencias (cont.)
El primer paso es la seleccin de las clases. Por haber demasiados datos
diferentes es conveniente elegir un nmero de clases ms pequeo. Por
ejemplo si nosotros tuviramos una encuesta cuyos valores varen entre ejemplo si nosotros tuviramos una encuesta cuyos valores varen entre
en 1 y 9, no importa el nmero de datos, el nmero de clases sera
mximo 9.
De regreso a nuestro caso, para la seleccin de las clases debemos ver cual
es el dato ms pequeo y el ms grande para determinar el lmite inferior
y superior de la tabla completa. Revisando la tabla anterior vemos que el
valor ms bajo es 54 y el ms alto es 108. Tambin podemos intuir que la
variable nmero de personas es una variable discreta, por lo cual no es
necesario utilizar Intervalos de nmeros reales.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Estructuracin del cuadro tabular de frecuencias (cont.)
Ahora determinamos el intervalo de la clase para una tabla de frecuencia.
Lo definiremos como el rango de valores encontrados dentro de una clase
(ancho de la clase), puede determinarse como: (ancho de la clase), puede determinarse como:
Tomemos como valor inicial de nmero de clases el valor de 5.
Sustituyendo en la ecuacin nos queda:
IC =
Valor ms grande - valor ms pequeo
Nmero deseado de clases
IC =
108 - 54
= 10,8
5
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Estructuracin del cuadro tabular de frecuencias (cont.)
Como el nmero de clases es fraccin lo aumentos o disminuimos al valor
entero ms cercano. Tomemos el valor de 11.
De esta forma las clases nos quedaran: De esta forma las clases nos quedaran:
Como ven los valores de las clases no son muy elegantes, por lo que
podramos hacer algunas mejoras.
54 - 64
65 - 75
76 - 86
87 - 97
98 - 108
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Estructuracin del cuadro tabular de frecuencias (cont.)
Es conveniente, por su elegancia, que los lmites inferior y superior, para
cada clase, el ltimo digito sea el mismo. Por lo tanto, podramos
considerar que el lmite inferior de cada clase sea 50, 60, 70, 80, 90 y 100 o considerar que el lmite inferior de cada clase sea 50, 60, 70, 80, 90 y 100 o
podran ser 51, 61, 71, 81, 91 y 101. Consideremos el primer caso, de esta
forma los lmites superiores para cada clase seran: 59, 69, 79, 89, 99 y
109, quedando:
Tendran que ser 6 clases para que todos los datos quedaran dentro de la
tabla
50 - 59
60 - 69
70 - 79
80 - 89
90 - 99
100 - 109
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Estructuracin del cuadro tabular de frecuencias (cont.)
El intervalo de clase para una clase en particular se determina restando al
lmite superior (o inferior) de una clase del lmite superior (o inferior) de la
clase siguiente. En el ejemplo siguiente podemos calcular el intervalo de clase siguiente. En el ejemplo siguiente podemos calcular el intervalo de
clase:
60 50 = 10. Es deseable que todos los intervalos de clase sean de igual
tamao, ya que facilita las interpretaciones estadsticas.
50 - 59
60 - 69
70 - 79
80 - 89
90 - 99
100 - 109
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Estructuracin del cuadro tabular de frecuencias (cont.)
El prximo paso es buscar las frecuencias, para ello, podemos ordenar la tabla
en forma ascendente, lo que facilitara la cuenta o simplemente contar desde
la tabla anterior. De esta forma nos queda: la tabla anterior. De esta forma nos queda:
El punto medio (M) se calcula sumando el lmite inferior y superior de
cada clase y dividiendo el resultado entre 2.
Clase (pasajeros) Cuenta
Frecuencia (n
i
)
(das)
Punto medio
(M)
50 - 59 ||| 3 54,5
60 - 69 ||||| || 7 64,5
70 - 79 ||||| ||||| ||||| ||| 18 74,5
80 - 89 ||||| ||||| || 12 84,5
90 - 99 ||||| ||| 8 94,5
100 - 109 || 2 104,5
50
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Estructuracin del cuadro tabular de frecuencias (cont.)
Ahora podemos estimar varios parmetros que utilizamos normalmente en la
construccin de una tabla de frecuencias, como son: frecuencia relativa,
frecuencia acumulada, tanto absoluta como relativa, frecuencia relativa (%),
etc. etc.
Clase
(pasajeros)
Cuenta
Frecuencia
(n
i
) (das)
Frecuencia
absoluta
acumulada (F)
Frecuencia
(f
i
)
Frecuenci
a relativa
acumulad
a
Frecuenci
a relativa
(%)
Frecuencia
relativa
acumulada
(%)
Punto
medio
(M)
50 - 59 ||| 3 3 0,06 0,06 6 6 54,5
60 - 69 ||||| || 7 10 0,14 0,2 14 20 64,5
70 - 79
||||| |||||
||||| ||| 18 28 0,36 0,56 36 56 74,5
80 - 89
||||| |||||
|| 12 40 0,24 0,8 24 80 84,5
90 - 99 ||||| ||| 8 48 0,16 0,96 16 96 94,5
100 - 109 || 2 50 0,04 1 4 100 104,5
50 1 100
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Anlisis descriptivo de la informacin
Los grficos tambin son mtodos tiles para describir conjuntos de datos,
as tenemos los siguiente tipos de diagramas:
a) Trazo e interpretacin de histogramas y polgonos a) Trazo e interpretacin de histogramas y polgonos
Un histograma es una representacin grfica de una variable en forma
de barras, donde la superficie de cada barra es proporcional a la
frecuencia de los valores representados. En el eje vertical se
representan las frecuencias, y en el eje horizontal los valores de las
variables, normalmente sealando las marcas de clase, es decir, la
mitad del intervalo en el que estn agrupados los datos.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Anlisis descriptivo de la informacin
Ejemplo de histograma:
20
Histograma
El histograma revela detalles y patrones que no se pueden discernir
fcilmente de los datos originales.
0
5
10
15
20
50 - 59 60 - 69 70 - 79 80 - 89 90 - 99 100 - 109
F
r
e
c
u
e
n
c
i
a
Clase
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Anlisis descriptivo de la informacin (cont.)
Ejemplo de polgono de frecuencias:
Un polgono de frecuencia es una grfica trazada sobre las marcas de clase
y tambin se puede obtener uniendo los puntos medios de los techos de
los rectngulos de un histograma.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Anlisis descriptivo de la informacin (cont.)
b) Trazo y aplicacin de las ojivas
Una grfica similar al polgono de frecuencias es la ojiva, pero sta se
obtiene al aplicar la misma tcnica a una frecuencia acumulativa y de obtiene al aplicar la misma tcnica a una frecuencia acumulativa y de
igual manera que stas.
Caractersticas de las ojivas
Muestran frecuencias acumuladas.
Se prefiere para el tratamiento de datos cuantitativos.
El punto de inicio equivale a una frecuencia de 0.
El punto final equivale al 100% de los datos.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Anlisis descriptivo de la informacin (cont.)
120
F
r
e
c
u
e
n
c
i
a

r
e
l
a
t
i
v
a

a
c
u
m
u
l
a
d
a

(
%
)
Grfico de Ojiva
0
20
40
60
80
100
120
0 54,5 64,5 74,5 84,5 94,5 104,5
F
r
e
c
u
e
n
c
i
a

r
e
l
a
t
i
v
a

a
c
u
m
u
l
a
d
a

(
%
)
Punto medio de clase
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Medidas de tendencia central.
Al describir grupos de observaciones o datos, con frecuencia se desea
describir el grupo con un solo nmero. Para tal fin, desde luego, no se
usar el valor mas elevado ni el valor mas pequeo como nico usar el valor mas elevado ni el valor mas pequeo como nico
representante, ya que solo representan los extremos, mas bien que
valores tpicos. Entonces sera mas adecuado buscar un valor central. Las
medidas de tendencia central son indicadores estadsticos que muestran
hacia que valor (o valores) se agrupan los datos. En otras palabras, las
medidas que describen un valor tpico en un grupo de observaciones
suelen llamarse medidas de tendencia central. Es importante tener en
cuenta que estas medidas o indicadores estadsticos se aplican a grupos
mas bien que a individuos. Un promedio es una caracterstica de grupo,
no individual.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Medidas de tendencia central (cont.)
Existen varias medidas, indicadores o mtodos comunes para identificar el
centro de un conjunto de datos no agrupados: entre ellos podemos citar:
la media, la mediana, la moda, la media ponderada, la media geomtrica y la media, la mediana, la moda, la media ponderada, la media geomtrica y
la media armnica. Su clculo e interpretacin depender de la definicin
de centro. En todo caso, se ubican en el punto alrededor del cual se
aglomeran los datos.
Para el caso de datos agrupados, los indicadores de tendencia central ms
comnmente utilizados son: la media, la mediana y la moda.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Definiciones y procedimientos para calcular los principales indicadores de
tendencia central
a) Medidas o indicadores de datos no agrupados
La media: La media o media aritmtica, es la medida de la tendencia La media: La media o media aritmtica, es la medida de la tendencia
central que usualmente se le llamaba promedio. Si los datos que
tenemos pertenecen a la poblacin, a la media se le denomina media
poblacional y la describiremos con el parmetro miu (). Se calcula de
la siguiente forma:
Miu se define como la sumatoria de todas
las observaciones individuales (X
i
) dividida
entre el nmero total de observaciones (N)
para una poblacin.

N
N
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Definiciones y procedimientos para calcular los principales indicadores de
tendencia central (cont.)
a) Medidas o indicadores de datos no agrupados
Si los datos que tenemos pertenecen a una muestra, a la media se le Si los datos que tenemos pertenecen a una muestra, a la media se le
denomina media muestral y la describiremos con el parmetro x
barra . Se calcula de la siguiente forma:
X barra se define como la sumatoria de
todas las observaciones individuales (X
i
)
dividida entre el nmero total de
observaciones (n) para una muestra.
(X)
_
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Definiciones y procedimientos para calcular los principales indicadores de
tendencia central (cont.)
a) Medidas o indicadores de datos no agrupados
La mediana: Usualmente llamada media posicional, porque queda La mediana: Usualmente llamada media posicional, porque queda
exactamente en la mitad del conjunto de datos despus que las
observaciones se han colocado en serie ordenada. Se calcula de la
siguiente forma:
En caso de una serie impar, la mediana es el nmero que se encuentra
en medio de la serie y si la serie es par, la mediana es el promedio de
los dos nmeros del centro.
Posicin de la mediana = (n + 1) / 2
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Definiciones y procedimientos para calcular los principales indicadores de
tendencia central (cont.)
a) Medidas o indicadores de datos no agrupados
La moda: Es la observacin que ocurre con mayor frecuencia. Si existen La moda: Es la observacin que ocurre con mayor frecuencia. Si existen
en la serie dos valores diferentes que tienen la misma frecuencia, se
dice que la serie sera bimodal. Si todos los datos de la serie tienen la
misma frecuencia, entonces la serie no tendra moda. Ejemplo: en la
serie ordenada 35, 45, 52, 56, 67, 67, identifique la moda. Como vemos
el valor de 67 se repite dos veces (frecuencia 2) y los otros valores solo
tienen frecuencia de 1, por lo tanto la moda es 67.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Definiciones y procedimientos para calcular los principales indicadores de
tendencia central (cont.)
b) Medida o indicadores de datos agrupados
Al trabajar con datos que han sido agrupados en una distribucin de Al trabajar con datos que han sido agrupados en una distribucin de
frecuencias, no se conoce cules han sido las observaciones
individuales, por lo tanto deben encontrarse mtodos alternativos para
determinar los indicadores de tendencia central, pero estos clculos
con datos agrupados son solo aproximaciones, por lo que, en lo
posible, deben utilizarse las observaciones no agrupadas.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Definiciones y procedimientos para calcular los principales indicadores de
tendencia central (cont.)
b) Medida o indicadores de datos agrupados
La media: La media de una muestra de datos organizados en una La media: La media de una muestra de datos organizados en una
distribucin de frecuencias se calcula mediante la siguiente frmula:
Donde:
f, es la frecuencia de cada clase
M, es el punto medio de cada clase (si son datos agrupados en clases)
X
i
, si son datos agrupados en forma individual
n, es el tamao de la muestra y es igual a la suma de las frecuencias de
todas las clases
fX
i
=
n
fM
=
n
fX
i
=
f
X
g
_
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Definiciones y procedimientos para calcular los principales indicadores de
tendencia central (cont.)
b) Medida o indicadores de datos agrupados
La mediana: La mediana de una muestra de datos agrupados: La mediana: La mediana de una muestra de datos agrupados:
Donde: L
m
, lmite inferior de la clase que contiene a la mediana (clase
mediana)
n, nmero total de observaciones
Fa, frecuencia acumulada que precede a la clase de la mediana
fa , frecuencia de clase de la mediana
w, ancho del intervalo de clase
(n+1)
2
- (Fa+1)
fa
w Mediana = L
m
+
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Definiciones y procedimientos para calcular los principales indicadores
de tendencia central (cont.)
b) Medida o indicadores de datos agrupados
La clase mediana es la primera clase cuya frecuencia acumulada es La clase mediana es la primera clase cuya frecuencia acumulada es
mayor o igual a (n+1)/2, donde n es el total de observaciones.
En este ejemplo el nmero total de
observaciones (n) es igual a 50, por
lo que (n+1)/2 dar como resultado
25,5. La clase mediana para este
caso de datos agrupados ser la
primera clase cuya frecuencia
acumulada sea igual o mayor a
25,5, o sea, la clase cuyos valores
estn entre 80 y 89.
Clase
(pasajeros)
Frecuencia (n
i
)
(das)
Frecuencia
absoluta
acumulada (F)
50 - 59 3 3
60 - 69 7 10
70 - 79 15 25
80 - 89 12 37
90 - 99 8 45
100 - 109 5 50
50
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Definiciones y procedimientos para calcular los principales indicadores de
tendencia central (cont.)
b) Medida o indicadores de datos agrupados
La moda: La moda de los datos agrupados se aproxima por el punto La moda: La moda de los datos agrupados se aproxima por el punto
medio de la clase que contiene la mayor frecuencia (clase modal) y
para su estimacin se utiliza la siguiente formula:
Donde:
L
mo
, lmite inferior de la clase modal
D
a
, diferencia entre la frecuencia de la clase modal y la clase que antecede
D
b
, diferencia entre la frecuencia de la clase modal y la clase que sigue
w, ancho del intervalo de clase
+
D
b
+ D
a
D
a
Moda = L
mo
w
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Comparacin entre media, mediana y moda
La media es la medida ms comn de tendencia central. Se presta para
mayor manipulacin e interpretacin algebraica. Desafortunadamente la
media se ve afectada por valores extremos o valores atpicos, y a media se ve afectada por valores extremos o valores atpicos, y a
diferencia de la mediana, puede ser sesgada por las observaciones que
estn muy por encima o muy por debajo de sta.
Por ejemplo, para los datos 4, 5, 6, 6, 7, 8 la media y la mediana son ambas
6 y representa una excelente medida de punto central de los datos, si la
ltima observacin fuera 80 en lugar de 8, la media sera 18, pero la
mediana todava sera 6. Debido a que la mediana no se ve afectada por
este valor extremo, representa mejor las seis observaciones.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Comparacin entre media, mediana y moda (cont.)
La moda tambin es menos afectada por unas pocas observaciones
atpicas y sigue siendo 6 aun cuando el ltimo valor sea 80. Sin embargo, si
no hay moda, o si el conjunto de datos es bimodal, su uso puede ser no hay moda, o si el conjunto de datos es bimodal, su uso puede ser
confuso.
Esto no implica que una medida sea necesariamente mejor que las otras.
La medida a seleccionar depende de la naturaleza de los datos, de la forma
como se utilicen estos y de la naturaleza de la investigacin.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Medidas de dispersin
La descripcin de un conjunto de datos utilizando indicadores de
tendencia central, rara vez es suficiente. Una descripcin ms completa del
conjunto de datos puede obtenerse si se mide que tan dispersos estn los conjunto de datos puede obtenerse si se mide que tan dispersos estn los
datos alrededor de dicho punto central. Esto es lo que hacen precisamente
las medidas de dispersin. Indican cuanto se desvan las observaciones
alrededor de su media.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Definiciones y procedimientos para calcular los principales indicadores de
dispersin
El rango: Es la medida de dispersin ms simple, pero lamentablemente la
de menor utilidad. El rango es simplemente la diferencia entre la de menor utilidad. El rango es simplemente la diferencia entre la
observacin ms alta y la ms baja. Su ventaja es que es fcil de calcular.
Su desventaja es que considera slo dos de los cientos de observaciones
que hay en un conjunto de datos.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Definiciones y procedimientos para calcular los principales indicadores de
dispersin (cont.)
La varianza y la desviacin estndar son otros dos indicadores de
dispersin y los podemos subdividir dependiendo del origen de los datos dispersin y los podemos subdividir dependiendo del origen de los datos
en poblacional o muestral.
En general, podemos definir la varianza como el promedio de las
observaciones respecto a su media elevadas al cuadrado.
La desviacin estndar es la raz cuadrada de la varianza y es la ms
importante medida de dispersin.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Definiciones y procedimientos para calcular los principales indicadores de
dispersin (cont.)
Para una poblacin de datos no agrupados definiremos la varianza de la
siguiente forma: siguiente forma:
Donde:
X
1
, X
2
, X
3
,.X
N
son las observaciones individuales
es la media poblacional
N es el nmero de observaciones

2
(X
1
- )
2
+ (X
2
- )
2
+ (X
3
- )
2
+ + (X
N
- )
2
=
N
=
(X
i
- )
2
N
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Definiciones y procedimientos para calcular los principales indicadores de
dispersin (cont.)

2
=
(X
i
- )
2
X
i
2
= -
2
La desviacin estndar () es:
=
2

2
=
(X
i
- )
N
X
i
N
= -
2
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Definiciones y procedimientos para calcular los principales indicadores de
dispersin (cont.)
Para una muestra de datos no agrupados definiremos la varianza de la
siguiente forma:
_ _
siguiente forma:
Donde:
X
i
, son las observaciones individuales
X barra, es la media muestral
n, es el nmero de observaciones de una muestra
La desviacin estndar (S) es:
S = S
2
S
2
=
(X
i
- )
2
n - 1
X
_
=
X
i
2
n - 1
X
_
n
2
-
n - 1
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Definiciones y procedimientos para calcular los principales indicadores de
dispersin (cont.)
Ejemplo: A manera de ilustracin, tngase que una firma de seguros tiene
un portafolio de seguros con diferentes primas mensuales, a saber: 110, un portafolio de seguros con diferentes primas mensuales, a saber: 110,
145, 125, 95 y 150 dlares americanos. Determine la varianza y la
desviacin estndar.
Como es una poblacin, determinamos la media poblacional ()
= (110 + 145 + 125 + 95 + 150) / 5 = US$ 125
La varianza la calculamos como:

2
= [(110- 125)
2
+ (145125)
2
+ (125 125)
2
+ (95 125)
2
+ (150- 125)
2
] /5=
430
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Definiciones y procedimientos para calcular los principales indicadores de
dispersin (cont.)
A pesar de lo comn de la varianza, como podemos observar su valor es
extremadamente grande con respecto a los valores originales, an el valor extremadamente grande con respecto a los valores originales, an el valor
ms grande. En la mayora de los casos la varianza se expresa en trminos
que no tienen significado o interpretacin lgica. Esto se resuelve
calculando la desviacin estndar ().
= 430 = US$ 20,74
El concepto de desviacin estndar es muy importante en los negocios y
en la economa. Por ejemplo, en finanzas la desviacin estndar se utiliza
como medida de riesgo relacionada con varias oportunidades de inversin.
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Definiciones y procedimientos para calcular los principales indicadores de
dispersin (cont.)
Para una poblacin de datos agrupados definiremos la varianza de la
siguiente forma: siguiente forma:
Donde:
M
i
es el punto medio del intervalo (si est agrupado en clases)
X
i
si son datos agrupados en forma individual
f
i
es la frecuencia absoluta
es la media poblacional
N es el nmero de observaciones

2
=
f
i
(M
i
- )
2
N
f
i
M
i
2
N
= -
2
f
i
X
i
2
N
= -
2
Unidad I
Introduccin a la Estadstica Descriptiva
Estadstica I
Ing. Waldo Urribarr
Definiciones y procedimientos para calcular los principales indicadores de
dispersin (cont.)
Para una muestra de datos agrupados definiremos la varianza de la
siguiente forma:
_
siguiente forma:
Donde:
M
i
es el punto medio del intervalo (si est agrupado en clases)
X
i
si son datos agrupados en forma individual
X barra es la media muestral
n es el nmero de observaciones
La desviacin estndar (S) es: S = S
2
S
2
=
n - 1
=
f
i
M
i
2
n - 1 n - 1
_
f
i
(M
i
X)
2
_
n X
2
- =
f
i
X
i
2
n - 1 n - 1
_
n X
2
-