Anda di halaman 1dari 72

ESTADÍSTICA

DESCRIPTIVA
Estadística Descriptiva: Es la parte de la estadística que trata solamente de
describir y analizar un grupo dado sin sacar conclusiones o inferencias de un
grupo mayor, a partir de ella. La estadística descriptiva incluye las técnicas que
se relacionan con el resumen y la descripción de datos numéricos. Estos datos
pueden ser gráficos o pueden incluir análisis computacional.

Estadística Inferencial: Cuando una muestra es representativa de una


población se pueden deducir importantes conclusiones acerca de esta, a
partir de su análisis. La inferencia estadística comprende aquellas técnicas por
medio de las cuales se toma decisiones sobre una población estadística
basadas solo en la muestra observada. Debido a que dichas decisiones se
toman en condiciones de incertidumbre, entonces estas serán confiables con
cierto grado de probabilidad. Considerando que las características medidas de
una muestra se denominan estadísticas de la muestra, las características
medidas de una población estadística, o universo se llaman parámetros de la
población.
ESTADÍSTICA DESCRIPTIVA
• Para poder comprender mejor este tipo de
estudio es importante los siguientes términos
básicos:
Población: Es un conjunto de
personas, eventos o cosas de
las cuales se desea hacer un
estudio, y tienen una
característica en común.
ESTADÍSTICA DESCRIPTIVA
Muestra: Es un subconjunto cualquiera
de la población; es importante escoger la
muestra en forma aleatoria (al azar),
pues así se logra que sea representativa
y se puedan obtener conclusiones más a
fines acerca de las características de la
población.

Parámetro y estadístico
Un parámetro es una característica específica de una
población.
Un estadístico es una característica específica de
una muestra.
CARACTERISTICAS VENTAJAS INCONVENIENTES
Sencillo y de fácil
Requiere que se posea de
comprensión.
antemano un listado
Se selecciona una muestra de Cálculo rápido de medias y completo de toda la
tamaño n de una población de N varianzas. población. Cuando se
Aleatorio simple unidades, cada elemento tiene trabaja con muestras
Se basa en la teoría
una probabilidad de inclusión pequeñas es posible que
estadística, y por tanto
igual y conocida de n/N. no represente a la
existen paquetes
población
informáticos para analizar
adecuadamente.
los datos

Conseguir un listado de los N Fácil de aplicar.


elementos de la población
No siempre es necesario
Si la constante de
Determinar tamaño muestral n. tener un listado de toda la
muestreo está asociada
población.
Definir un intervalo k= N/n. con el fenómeno de
Sistemático Cuando la población está interés, las estimaciones
Elegir un número aleatorio, r,
ordenada siguiendo una obtenidas a partir de la
entre 1 y k (r= arranque
tendencia conocida, muestra pueden contener
aleatorio).
asegura una cobertura de sesgo de selección
Seleccionar los elementos de la unidades de todos los
lista. tipos.
Estratificado En ciertas ocasiones resultará Tiende a asegurar que la Se ha de conocer la
conveniente estratificar la muestra represente distribución en la
muestra según ciertas variables adecuadamente a la población de las
de interés. Para ello debemos población en función de variables utilizadas para
conocer la composición unas variables la estratificación.
estratificada de la población seleccionadas.
objetivo a hacer un muestreo.
Se obtienen estimaciones
Una vez calculado el tamaño
más precisa
muestral apropiado, este se
reparte de manera proporcional Su objetivo es conseguir
entre los distintos estratos una muestra lo más
definidos en la población usando semejante posible a la
una simple regla de tres. población en lo que a la o
las variables estratificadoras
se refiere.

Conglomerados Se realizan varias fases de Es muy eficiente cuando la El error estándar es


muestreo sucesivas (polietápico) población es muy grande y mayor que en el
dispersa. muestreo aleatorio
La necesidad de listados de las
simple o estratificado.
unidades de una etapa se limita a No es preciso tener un
aquellas unidades de muestreo listado de toda la población, El cálculo del error
seleccionadas en la etapa sólo de las unidades estándar es complejo.
anterior. primarias de muestreo.
CÁLCULO DE LA MUESTRA POR FÓRMULA

Es la manera más conveniente de obtener la muestra de una


población mayor a 100.

Donde:
N = Población
n= muestra
p= nivel de confianza

Ejemplo: Calcular el tamaño de la muestra, con un nivel de


confianza del 96%, el cual deberá seleccionarse de una
población de 4600 maestros lectores
EJERCICIO
Su universidad ha encuestado a sus estudiantes para averiguar el tiempo
semanal medio que dedican a navegar por Internet.

a) ¿Cuál es la población?
b) ¿Cuál es la muestra?
c) ¿Cuál es el estadístico?
d) ¿Es el valor de 6,1 horas un parámetro o un estadístico?
ESTADÍSTICA DESCRIPTIVA
Todo estudio estadístico debe considerar
diferentes tipos de variables:

Variables

Variables cualitativas
Variables Cuantitativas
ESTADÍSTICA DESCRIPTIVA
Variables cualitativas:
Relacionadas con
características no numéricas
de un individuo (por ejemplo:
atributos de una persona,
nacionalidad, color de la piel,
sexo).
ESTADÍSTICA DESCRIPTIVA
Variables Cuantitativas: Relacionadas
con características numéricas del
individuo por ejemplo: edad, precio
de un producto, ingresos anuales.
Las variables cuantitativas se dividen
en discretas (aquellas que pueden
tomar solo algunos valores en un
intervalo y no valores intermedio,
ejemplo: edad, número de hermanos
que puede ser 1, 2, 3....,etc, pero,
por ejemplo, nunca podrá ser 3,45) o
continuas (aquellas que pueden
tomar cualquier valor en un intervalo
real, ejemplo: alturas, la velocidad
de un vehículo puede ser 80,3 km/h,
94,57 km/h...etc.).
ESTADÍSTICA DESCRIPTIVA
ESCALA DE MEDICIÓN DE VARIABLES
ESCALA DEFINICIÓN EJEMPLO

Nominal Se clasifican en categorías. Género: Masculino /


Nombran pero no miden la Femenino
variable.
Ordinal Se puede establecer Nivel socio económico
relaciones de orden, Alto 7 medio7 bajo.
contiene a la escala
nominal.
De intervalo Ordenan las medidas y Temperatura:
permiten realizar 10oC, 12oF
comparaciones entre dos
medidas. Usan un cero
relativo.
De Razón Se puede establecer Peso, Estatura
razones entre los datos.
Posee cero absoluto.
Ejercicio de Aplicación.
El producto que se desea lanzar en las tres regiones del
Ecuador, es una nueva bebida para deportistas, se desea
que cada deportista pruebe este nuevo producto para conocer
si esta bebida es aceptada o rechazada.
El problema es que resulta muy costoso hacer que todos los
deportistas de las tres regiones prueben la nueva bebida.
Aplique los conceptos Básicos, encuentre NS, NC, NO,
n= 10% Valor =$1.45 Total de N y n

TOTALES DE DEPORTISTAS EN ECUADOR


Número de Número de
Regiones deportistas Deportistas
Hombres Mujeres
Sierra 1266 1522
Costa 2225 1221
Oriente 966 560
Total 4457 3303
Considere el conjunto de datos de la muestra de los 10
minicomponentes que se muestra en la tabla 1.7.
a. ¿Cuántas variables hay en este conjunto de datos?
b. De estas variables, ¿cuáles son cualitativas y cuáles son
cuantitativas?
c. ¿Cuál es la capacidad promedio de CD en la muestra?
d. ¿Qué porcentaje de los minicomponentes tienen una sintonización
de FM buena o excelente?
e. ¿Qué porcentaje de los minicomponentes tienen dos caseteras?
La empresa Gallup realizó una encuesta telefónica empleando una
muestra aleatoria nacional compuesta de 1005 adultos de 18 años o
más. En la encuesta se les preguntó a los participantes

“Cómo considera que es su salud física en este momento”

(www.gallup.com, 7 de febrero de (2002)”. Las respuestas podían ser


Excelente, Buena, Regular o Ninguna opinión.

a. ¿Cuál es el tamaño de la muestra de esta investigación?

b. ¿Son estos datos cualitativos o cuantitativos?

c. ¿Sería conveniente usar promedios o porcentajes para resumir los


datos de estas preguntas?

d. De las personas que respondieron, 29% dijo que su salud era


excelente. ¿Cuántos fueron los individuos que dieron esta respuesta?
a. ¿Estos son datos cualitativos o cuantitativos?

b. ¿Son datos de series de tiempo o datos de sección transversal?

c. ¿Cuál es la variable de interés?

d. Comente la tendencia en las ganancias de Volkswagen a lo largo del tiempo.

e. ¿Qué advertencia sugiere esta gráfica acerca de la proyección de datos como


los de las ganancias de Volkswagen hacia el futuro?
es menor que 5 se le deprecia. En el caso de que la última cifra
sea 5, si la anterior es impar se la aproxima, si es par no se hace
la aproximación.
Ejemplo.- Se obtienen los siguientes datos en relación con
relación a la estatura.

Redondeando:

Alumnos Peso Alumnos Peso


x1 50,23 x1 50
x2 50,67 x2 51
x3 49,85 x3 49,8
x4 49,75 x4 49,8
x5 49,6 x5 50
Sumatoria: Es una operación matemática muy útil en la
estadística, ayuda a simplificar expresiones se simboliza
( ∑ ).

Para cualquier par de enteros no negativos a y n, donde a ≤ n


Se lee: La sumatoria de x desde i igual a hasta n.
Ejemplo: Calcular las ganancias de las telefónicas Claro, Movistar
durante un mes de servicio a 10 clientes que están en plan de
post pago y determine que compañía tiene mayores ingresos.
Individuo Claro Clientes Movistar Clientes
1 $30 X1 $32 Y1
2 $28 X2 $20 Y2
3 $20 X3 $30 Y3
4 $35 X4 $26 Y4
5 $22 X5 $29 Y5
6 $30 X6 $32 Y6
7 $28 X7 $20 Y7
8 $20 X8 $30 Y8
9 $35 X9 $26 Y9
10 $22 X10 $29 Y10
TABULACIÓN DE DATOS

Tipo I.- El tamaño de la población o muestra es pequeño. Por ejemplo,


las edades de 6 personas: 15,18,19,21,24,28. Solo se ordena de manera
creciente o decreciente.
Tipo II.- El tamaño de la población o muestra es grande y el rango de la
variable es pequeño, se debe tabular los datos de la siguiente manera:
Ejemplo:
El número de calificaciones sobre 5 de los estudiantes de Estadística
obtenidas durante el presente módulo son las siguientes:

2 4 1 3 2 5
3 1 3 4 1 1
1 5 3 1 2 3
2 1 5 3 4 2
3 4 1 2 5 5
Tipo III.- Se crea una tabla de intervalos ya que el tamaño de la
población o muestra es grande y el rango de la variable también.

Ejemplo:
Consideremos los siguientes datos, expresados en
metros, correspondientes a las estaturas de 50
estudiantes de Cuarto año de Educación Media.

67 72 81 72 74 83 84
88 92 75 84 86 73 84
87 83 81 77 73 75 78
77 67 83 83 72 71 85
93 82 69 70 81 66 76
75 80 79 84 86 80 77
80 76 88 75 79 87 79
77
ESTADÍSTICA DESCRIPTIVA
Ordenando la Información
Al ordenar datos muy numerosos, es
usual agruparlos en clases o categorías.
Al determinar cuántos pertenecen a
cada clase, establecemos la frecuencia.
Construimos así una tabla de datos
llamada tabla de frecuencias.
Es el tercer proceso es la distribución de datos ó de frecuencias la cual
es la presentación de cuadros o tablas estadísticas. El objetivo principal
de una distribución de frecuencias consiste en presentar los datos de un
modo que facilite su comprensión e interpretación.

Algunos tipos de distribución

Frecuencia Absoluta.
Frecuencia Absoluta Acumulada
Frecuencia Relativa.
Frecuencia relativa Acumulada
Frecuencia Porcentual.
Frecuencia Acumulada.

Marca de Clase
VARIABLE FRECUENCIA
ABSOLUTA
La frecuencia absoluta, es el número de
AHORRO F
veces que se repite un determinado valor
09-12 18 o una determinado atributo de la variable.
13-15 26 Está influida por el tamaño de la muestra,
16-18 7 al aumentar el tamaño de la muestra
19-21 4 aumentará también el tamaño de la
22-24 1
frecuencia absoluta y la suma de las
frecuencias absolutas debe ser igual al
25-27 4 . número total de los datos en estudio.
Total 60
Tabla de Datos de la encuesta
del ahorro mensual de acuerdo
al salario que perciben los
trabajadores.
La frecuencia relativa consiste en la proporción del número total de
datos que aparece en cada intervalo, la suma de la frecuencia es
siempre la unidad (1).
Se obtiene al dividir la frecuencia absoluta de cada intervalo entre el
número total de datos o elementos del conjunto.
La frecuencia relativa también se expresa, en ocasiones, en tanto por
ciento

F Frecuencia del intervalo


SE OBTIENE FR =
N Suma de frecuencias
La frecuencia porcentual, consiste en calcular el
porcentaje de la relación que se establece entre La palabra porcentaje
una de las partes con respecto al todo
significa por cien.
multiplicándolas por 100, que pertenece a cada
intervalo o categoría.
La frecuencia porcentual también se expresa,
en ocasiones en frecuencia relativa.

PORCENTAJE = ( F / N ) X 100
Ó
PORCENTAJE = FR X 100
FRECUENCIA FRECUENCIA
VARIABLE
ABSOLUTA ACUMULADA La frecuencia acumulada, indica cómo se
AHORRO F FA van concentrando los datos de un valor de
09-10 18 18 cada intervalo o una determinada modalidad
13-15 26 44 del atributo. Puede incluir a cualquiera de las
frecuencias: absoluta, relativa o porcentual;
16-18 7 51
sugiriendo se calcule sólo la que sea
19-21 4 55 necesaria para los fines de la investigación.
22-24 1 56
25-27 4 60

Total 60
Tabla de Datos de la encuesta
del ahorro mensual de acuerdo
al salario que perciben los
trabajadores.
Ejemplo de Tablas de tipo II (Variable cuantitativa continua)

Frecuencia Frecuencia
Frecuencia Frecuencia
absoluta Relativa
Variables Absoluta Relativa
acumulada Acumulada
(fi) (hi)
(Fi) (Hi)

X1 f1 F1 = f1 hi = H1=h1

X2 f2 F2 = f1 + f2 hi = H2 = h1 + h2
… … … … …
Xi fi Fi = hi = Hi =
… … … … …
Xk fk Fk = Hk = Hk =
Total N 1
La marca de clase, solo es aplicable a datos agrupados y es:

Es el punto medio de cada intervalo de clase.


Es el valor que representa a todos los datos que
puedan estar integrados en éste.

Marca de clase = ( Límite inferior + Límite superior ) / 2

9 - 12 10.5
Marca
Intervalos de clase
de Clase
Con clasificación continua
X
Ejemplo de Tablas de tipo III (Variable Cuantitativa Discreta)

Marca de
clase Frecuenc Frecuencia Frecuencia
Frecuenci
Variable X ia absoluta Relativa
MC a Relativa
s Absoluta acumulada Acumulada
(hi)
(fi) (Fi) (Hi)

X1 =
[a0, a1 ) f1 F1 = f1 hi = H1=h1

X2 =
[a1, a2 ) f2 F2 = f1 + f2 hi = H2 = h1 + h2

… … … … … …
Xi =
[ai-0, ai) fi Fi = hi = Hi =

… … … … …
[ak-1, ak) Xk= fk Fk = Hk = Hk =
Total N 1
FRECUEN FRECUEN FRECUEN FRECUEN FRECUEN
MARCA CIA CIA CIA CIA CIA
VARIABLE DE REL.
CLASE ABSOLUT ABS.ACU PORCENT
RELATIVA ACUMULA
A MULADA UAL
DA

AHOR
MC fi Fi hi Hi %
RO
9-12 10,5 18 18 0,3 0.3 30
13-15 14 26 44 0,43 0.73 42
16-18 17 7 51 0,12 0.85 12
19-21 20 4 55 0,07 0.92 7
22-24 23 1 56 0,02 0.94 2
25-27 26 4 60 0,07 1 7
Se ha realizado
MARCAuna encuesta a 60 personas a las que se les
haTotal DE
preguntado 60 1 100
CLASE cuanto dinero ahorran mensualmente de
acuerdo al salario que perciben, obteniéndose los siguientes
resultados
Ejercicios: Con las siguientes tablas Completar la Distribución de
Frecuencias.
1.- El número de calificaciones sobre 5 de los estudiantes de Estadística
obtenidas durante el presente módulo son las siguientes:
Realice la tabla de distribución de frecuencias.
2 4 1 3 2 5
3 1 3 4 1 1
1 5 3 1 2 3
2 1 5 3 4 2
3 4 1 2 5 5

Frecuencia Frecuencia
Frecuencia Frecuencia
absoluta Relativa
Variables Absoluta Relativa
acumulada Acumulada
(fi) (hi)
(Fi) (Hi)

Total 1
2.- Las notas obtenidas por los estudiantes de la carrera de Educación Básica
de la Universidad Indoamérica son las siguientes:
2 3 4 1 8 4 10 8
5 3 8 7 4 1 3 1
8 2 5 10 8 7 8 3
5 7 4 6 10 6 7 4
5 7 2 10 7 6 9 5

Marca de Frecuencia Frecuencia


Frecuencia Frecuencia
clase absoluta Relativa
Variables Absoluta Relativa
XMC acumulada Acumulada
(fi) (hi)
(Fi) (Hi)

Total 1
Las gráficas se basa por completo en una tabla de datos y sirve
para visualizar la forma de distribución de los datos, porque
permite mostrar, explicar, interpretar y describir de manera
sencilla, clara y efectiva, los datos estadísticos mediante formas
geométricas tales como líneas, áreas, volúmenes.

Para la descripción gráfica, podrá disponer de una amplia galería


de grafícas entre las más utilizadas son:

POLIGONOS DE
HISTOGRAMA FRECUENCIA

DIAGRAMA DE OJIVA
BARRAS SECTORIAL
Se considera uno de las más sencillas y útiles de representar
los datos cuantitativos (numéricas)
Representa a los niveles de medición ordinal, de intervalo o
de razón
Se puede graficar con la frecuencia: absoluta, porcentual ó
relativa, según los objetivos de la investigación
F
Fig. No. 1 Histograma Ahorro (pesos mexicanos)
r
e 30

c 20

u 10 Cuantitativa
e 0
n 1

c 9-12 13-15 16-18 19-21 22-24 25-27

i
a
Intervalo
Es una gráfica más utilizada por su sencillez, para representar las
características cuantitativas (numérica) y cualitativas (no numérica)
Representa a los niveles de medición nominal u ordinal
Se puede graficar con la frecuencia: absoluta, porcentual o relativa

30
25
Fig. No. 2 Diagrama de
20
15 Barras Percepción del ahorro
10 (pesos mexicanos)
5
0
Baja Muy Regular Alta Muy alta
baja
Cualitativa

Categor ia
Se utilizada para representar principalmente variables
cualitativas (no numéricas)
Representa al nivel de medición nominal
Se puede graficar con la frecuencia: porcentual o relativa
Resultan adecuado cuando hay pocos valores

Para ello se utiliza la siguiente expresión aritmética:


Total de grados = ( porcentaje ) ( 360 )

MUY BAJO
Fig. No. 3 Gráfica sectorial
BAJO
Ahorro (pesos mexicanos)
REGULAR
ALTO
MUY ALTO Cualitativas
Porcentajes
Se utiliza para representar principalmente variables
cuantitativas (numéricas)
Representa al nivel de medición de intervalo o de razón
Se puede graficar con la frecuencia: marca de clase

F
r
0,50
e
0,40
c Fig. No. 4 Polígono de
0,30
u Frecuencia
0,20
e Ahorro (pesos mexicanos)
0,10
n 0,00
c 9-12 13-15 16-18 19-21
i 22-24 25-27
a
Los polígonos de frecuencia pueden emplearse
asimismo para representar frecuencia acumulada
que en tal caso resulta designar como ojiva.
Es aplicable a variables ordinales.
Representa a la distribución de frecuencias
acumuladas, sean absolutas, porcentuales o relativas.
Es una gráfica ascendente.

70
60
50 Fig. No. 5 Ojiva
40
Ahorro (pesos mexicanos)
30
20
10
0
9 * 12 13 * 15 16 * 18 19 * 21 22 * 24 25 - 27
Nivel de colesterol en la sangre de una muestra de hombres
estadounidenses que tienen entre 25 y 34 años de edad , que fueron
atendidos en centros médicos de New York y sufren de hipertensión
arterial , en el año 2001

Nivel de Colesterol ¿Cuál es la variable de


(mg/100 ml) Cantidad de hombres interés?
80-120 13
120-160 15

¿Qué se mide?
160-200 44
200-240 29
240-280 9

Observa: El rango de cada intervalo es de 40.


ESTADÍSTICA DESCRIPTIVA
Ejercicios:

1) Construya una tabla de frecuencia de los siguientes gráficos.


ESTADÍSTICA DESCRIPTIVA

Días N° Artículos Frecuencia Frecuencia


Relativa relativa
porcentual
Lunes 3 0,129 12,9
Martes 5,2 0,224 22,4
Miércoles 4,8 0,206 20,6
Jueves 6 0,258 25,8
Viernes 4,2 0,181 18,1
Total 23,2 0,998 99,8
ESTADÍSTICA DESCRIPTIVA

Edad Frecuencia Frecuencia Frecuencia


Absoluta Relativa Relativa %
20-24 6
24-28 5
28-32 3
32-36 2
Total 16
MEDIDAS DE RESUMEN
Entre las medidas que permiten
resumir información proveniente de
una población, podemos
considerar las medidas de
posición, medidas de dispersión y
medidas de forma.
Medidas de Posición
Tienen por objeto, obtener un valor
que resuma en sí todas las
mediciones. La mayoría de ellas trata
de ubicar el centro de la distribución,
razón por la cual, se llaman
MEDIDAS DE TENDENCIA
CENTRAL; estas son: Media,
Mediana y Moda.
MEDIDAS DE TENDENCIA CENTRAL

Media aritmética o promedio: Es una de


las medidas de tendencia central de
mayor uso. La media muestral se
simboliza por X y la media poblacional
de denota por .
PROMEDIO PARA DATOS NO TABULADOS

Sea X una variable cuantitativa y x1, x2,…, xn una muestra


de tamaño "n" de valores de la variable, se define la media
aritmética de X como: n
x1  x2  x3  .....  xn x
X
i
X  i 1
n n
PROMEDIO PARA DATOS TABULADOS

Para calcular la media aritmética de un conjunto de datos, se suma cada uno de los
valores y se divide entre el total de casos.
Sea X una variable estadística que toma los valores , con frecuencias absolutas ,
respectivamente, la media viene dada por:
n

x1 f 1  x 2 f 2  ...  x n f n
x
i 1
i  fi
x 
f 1  f 2  ...  f n n

f
i 1
i
Propiedades de la Media aritmética

-La suma de diferencias (de todos los valores) respecto a la


media es siempre 0

-Si sumamos una constante a cada uno de los valores, la nueva


media aritmética resultante será la original más la constante.

-Si multiplicamos cada uno de los valores por una constante, la


nueva media aritmética será la original por la constante.

-Minimiza la suma de diferencias en términos cuadráticos.


Ejemplo N°1

Consideremos la edad en años de ocho personas

10 18 25 32 12 5 7 7

En este ejemplo el promedio , media o media aritmética de la edad de


estas personas está dada por:

10  18  25  32  12  5  7  7
x
8

Es decir la edad promedio de estas personas es de 14,5 años.


Datos tabulados sin intervalos de clase.
El número de calificaciones sobre 5 de los estudiantes de Estadística obtenidas durante el presente módulo son las siguientes:

CALIFICACIÓN FRECUENCIA
Xi . f i
Xi fi
1 8 8
2 6 12
3 7 21
4 4 16
5 5 25
TOTAL 30 82

 Xifi
X  i 1

= 2.73

Esto significa que la calificación promedio de un total de 30 estudiantes es de


2.73 sobre cinco.
Datos tabulados con intervalo de clase.
La edad de 30 personas que se encuentran en una conferencia organizada por la Universidad Indoamérica.

EDADES XMC fi XMC . fi


[ 5, 13) 9 4 36
[ 13, 21 ) 17 5 85
[ 21, 29 ) 25 9 225
[ 29, 37 ) 33 3 99
[ 37, 45 ) 41 5 205
[ 45,53 ) 49 3 147
[ 53, 61) 57 1 57
TOTAL 30 854

 Xmci. fi
i 1
X 
n

= 28.5

Significa que el promedio de la edad de las personas que asistieron a la conferencia es de 28


años y medio.
Mediana (Me)

Sea X una variable por lo menos ordinal y sea x1, x2,…xn una muestra de
tamaño n de observaciones de la variable, se define como Mediana "Me" un
valor tal que supera a no más del 50% de las observaciones y es superado
por no más del 50% de las observaciones, cuando estas han sido
ordenadas según magnitud.

MEDIANA PARA DATOS NO TABULADOS

Ejemplo: Consideremos la edad en años de ocho personas


10 18 25 32 12 5 7 7

Para calcular la mediana , previamente se deben ordenar las


observaciones. En este caso lo haremos en forma creciente:

5 7 7 10 12 18 25 32
Como la cantidad de datos es par, entonces la mediana
corresponde al promedio de los datos centrales, por lo tanto la
mediana es 11.
Propiedades de la mediana
-No utiliza todos los elementos
-Se puede calcular con datos ordinales
-Se ve menos afectada por datos atípicos que la media
aritmética.
-Minimiza la suma de diferencias en valor absoluto
(recordad que la media aritmética minimizaba la suma de
diferencias en términos cuadráticos)
Ejemplo uso de la mediana
Los 9 empleados de una nueva empresa viven al
lado de la Nacional 340 en diferentes kilómetros:
Núm. Emp. 3 2 1 2 1

Km 1 4 5 6 26

Dado que todos viajan en coche, y sabiendo que quieres minimizar el coste
en gasolina, ¿en qué lugar pondrías la empresa para minimizar tal coste?
MEDIANA PARA DATOS TABULADOS

En casos de datos agrupado es un poco más complejo


y requiere de la utilización de la siguiente fórmula
N
 Fi 1
M  Li  2 .Tlm
Fim  Fib
Li  límite inferior de la clase mediana
Tlm tamaño del intervalo
N  número total de datos
Fim  frecuencia absoluta acumulada de la clase anterior a la mediana
Fib frecuencia absoluta de la clase mediana
La edad de 30 personas que se encuentran en una conferencia organizada por la
Universidad Indoamérica.
EDADES XMC fi Fi
[ 5, 13) 9 4 4
[ 13, 21 ) 17 5 9
[ 21, 29 ) 25 9 18
[ 29, 37 ) 33 3 21
[ 37, 45 ) 41 5 26
[ 45,53 ) 49 3 29
[ 53, 61) 57 1 30
TOTAL 30

P= n/2 TIm = 29 - 21
P = 30/2 TIm = 8
P= 15

X = Lmin +

X = 21 +

X = 26.333
Moda o Modo (Mo) para datos no tabulados
La moda se identifica al observar el valor que se presenta con más
frecuencia en la distribución.
Si consideramos el ejemplo del peso de una muestra de
personas:
65 76 48 48 68 78 90 87 67 72 78
Mo = 48 kilos
Mo = 78 kilos.
Esto significa que la mayoría de estas personas pesa 48 kilos y 78 kilos.
Esta distribución es bimodal.

Moda o Modo (Mo) para datos tabulados

Ahora bien, en el caso de datos agrupados en intervalos, es fácil determinar la


clase modal esta se calcula mediante la marca de clase que tiene mayor número
de frecuencia.
PERCENTIL

Un percentil nos provee información de como se distribuyen


los valores de los datos desde el menor hasta el mayor. El
percentil divide los datos en dos partes, más o menos el (p)
por ciento de los datos tienen valores menores que el
percentil y aproximadamente (100-p) por ciento de los datos
tienen valores mayores que el percentil.

Para calcular el percentil debe seguir los siguientes


pasos:
Paso 1. Ordene los datos de manera ascendente.
Paso 2. Calcule un índice (i)
 P 
i  n
 100 

en donde (p) es el percentil de interés y (n) es el número


de datos u observaciones.
Paso 3.a) Si (i) no es entero, utilizando las reglas de
redondeo, se lleva al próximo numero entero.

El valor entero inmediato mayor que (i) indica la


posición donde se encuentra el percentil.

Esto significa que si (i) = 3.5, el percentil se encuentra


en la posición 4 de los datos.

b) Si (i) es entero, el percentil es el promedio de los


valores de los datos ubicados en los lugares i e (i + 1).

Veamos como se aplica


Como ejemplo de este procedimiento, determina el
percentil 75 de los datos sobre las edades del siguiente
un grupo de ciudadanos: 25, 20, 26, 21, 19, 23, 22, 30,
28, 27.
Paso 1. Ordene los datos en orden ascendente:
19 20 21 22 23 25 26 27 28 30
Paso 2. Calcule el índice (i):
Paso 3. Como (i) no es entero, redondeamos al
próximo entero mayor que 7.5, o sea, el
lugar 8. Al referirnos a los datos del
ejemplo, vemos que el percentil 75 es el
valor del dato ubicado en la posición
número 8, que en este caso es 27.
19 20 21 22 23 25 26 27 28 30
Nota. Recuerda que (i) nos indica el lugar
del dato donde se encuentra el percentil
que estamos buscando.

Significa que el 75% de las edades son menores de 27


años y el 25% restante (100-p) es mayor de 27 años.
Los cuartiles dividen los datos en cuatro partes. Cada una
de las partes representa una cuarta parte, o el 25% de las
observaciones. Los cuartiles son percentiles específicos;
por consiguiente, los pasos para calcular los percentiles los
podemos emplear para calcular los cuartiles.

Los cuartiles se definen de la siguiente manera


Q1 = primer cuartil, o percentil 25
Q2 = segundo cuartil, o percentil 50
(también la mediana)
Q3 = tercer cuartil, o percentil 75

A continuación se presenta un conjunto de datos con los siguientes


valores; 10, 5, 12, 8, 14, 11, 15, 20, 18, 30 y 25.
¿ Cómo identificamos los cuartiles en este ejemplo?
Utilizarás los mismos pasos para identificar los percentiles:
Primero, ordenamos los datos
5 8 11 12 14 15 18 20 25 30
Segundo, determinamos (i) para cada cuartil:
Q1 = primer cuartil, o percentil 25
Q2 = segundo cuartil, o percentil 50
(también la mediana)
Q3 = tercer cuartil, o percentil 75
Cuartiles:
Q1 = primer cuartil, o percentil 25
 25 
i 10 = 2.5
 100 
Como(i) no es un número entero, se redondea al próximo
entero mayor que 2.5, o sea 3. Al referirnos a los datos vemos
que el primer cuartil está ubicado en la posición 3 de los datos
que este caso es 11. El primer cuartil en los datos se divide de
la siguiente forma: 5 8 11 12 14 15 18 20 25 30
Q1=1
Segundo cuartil:
Q2 = segundo cuartil, o percentil 50
(también la mediana)
=5

Como (i) es un número entero, el segundo cuartil es el


promedio de los valores de los datos que están en las
posiciones i e (i+1), que en este caso es, (14+15)÷2=14.5,
entonces, el segundo cuartil en los datos se divide así:
5 8 11 12 14 15 18 20 25 30
Q1=11 Q2=14.5
Cuantiles

La mediana divide a la distribución en dos partes iguales, los cuantiles son


parámetros que dividen los datos de la distribución en partes iguales.

Los más usados son:

Cuartiles:
Se llaman cuartiles a tres valores que dividen a la serie de datos en cuatro partes
iguales.
( cuartil primero, cuartil segundo y cuartil tercero )

Quintiles:
Se llaman quintiles a cuatro valores que dividen a la serie en cinco partes iguales.
( quintil primero,... )

Deciles:
Nueve valores iguales que dividen la distribución en 10 partes iguales.
( decil primero,...)

Percentiles:
Noventa y nueve valores que dividen la serie en 100 partes iguales.
( percentil primero,... )

i = np / 100
MEDIDAS DE TENDENCIA CENTRAL

• Relaciones: Media, Mediana y Moda


Si la distribución de
frecuencias es Si la distribución es
simétrica: asimétrica cola a la
derecha :

Si la distribución es
asimétrica cola a la
izquierda :
MEDIDAS DE VARIABILIDAD

• LA VARIANZA
Es una medida del grado de dispersión o
variación de los valores de una variable con
respecto a su media aritmética.
MEDIDAS DE VARIABILIDAD

• Varianza de Datos No n
 _ 2

agrupados   xi  x 
i 1  
s 
2

n 1

• Varianza de Datos _ 2
k
 
Agrupados  ni  X i  x 
s 2  i 1  
n
MEDIDAS DE VARIABILIDAD

• LA DESVIACION ESTANDAR

Se define como la raíz cuadrada positiva de la


Varianza.
MEDIDAS DE VARIABILIDAD

• Desviación Estándar de 2
n
 _

Datos No agrupados   i
x  x 
s  i 1  
n 1

• Desviación Estándar de
Datos Agrupados 2
k
 _

 ni i
x  x 
s  i 1  
n
MEDIDAS DE VARIABILIDAD
• COEFICIENTE DE VARIACION
Proporciona una estimación de la magnitud de
las desviaciones con respecto a la media
Es útil para comparar la variabilidad de dos o
mas series de datos que tengan distintas
unidades de medida y/o distintas medias
aritméticas.
MEDIDAS DE VARIABILIDAD

• COEFICIENTE DE VARIACION

S S
C.V.  o C.V.    x100%
X X

Anda mungkin juga menyukai