Anda di halaman 1dari 16

Calculo de los diferentes indicadores de Tendencia Central y Dispersión, cuando se tiene 30 o

menos datos.

Ejemplo.
UE: Curso semestral que se dictó en el periodo académico 1997 – I, en la EAPE de la FCM de la
UNMSM.
Conjunto de unidades de Observación: Todos los cursos semestrales, dictados en el Periodo
Académico 1997 - I
Variable: Porcentaje de avance del curso(X).
Tipo de variable: cuantitativa continua.
Conjunto de datos: Constituyen los datos poblacionales

{ 45 40 50 50 55 45 40 48 48 45 50 48 50 40 45 48 48 45}

Cómo estos datos, son datos poblacionales y N < 30, entonces las fórmulas a utilizar para hallar los
indicadores son los siguientes:

Indicadores Tendencia Central


1. Media Aritmética

18

x
i1
i

  46.6% ( Observación: el símbolo porcentaje es la unidad de la variable)


18
2. Mediana.
- Ordenamos los datos de menor a mayor
40 40 40 45 45 45 45 45 48  48 48 48 48 50 50 50 50 55
- Cómo el número de datos es par, entonces el valor de la mediana estará dado por la
semisuma de los datos centrales.
Luego. Me = 48%
3. Moda.
Existen varias modas, porque varios de los datos diferentes se repiten, por lo tanto no tiene
sentido considerar este indicador.

Indicadores de dispersión.

1. Longitud de recorrido.
LoR = 55 - 40 = 15%

2. Desviación Media.

18

x i 
DeM  i 1
= 3.15 %
18

LIC. MARÍA A. ZACARÍAS DÍAZ 30


xi xi  
40 6.6
40 6.6
40 6.6
45 1.6
45 1.6
45 1.6
45 1.6
u = 46.6 % 45 1.6 10 datos
48 1.4
48 1.4
48 1.4
48 1.4
48 1.4
50 3.4
50 3.4
50 3.4
50 3.4
55 8.4
56.8

Interpretación.
Observando la columna de las desviaciones, xi   , tenemos que 10 datos se alejan de la media en
menos de 3.15 o lo que es equivalente a que el 55% de los datos se aleja de la media en menos de
3.15 lo que podríamos interpretar como que los datos no están muy dispersos.

3. Varianza.

 x  X 
N

i
i1
X 2
(a)
N

Esta fórmula es equivalente a:

N N
x 2 X  xi
2

N X
i

 X 2  i1  i 1

N N N

x
2
i

X2   X
2
(b)
N

Por lo tanto, el valor de la varianza puede ser obtenido a partir de las fórmulas (a) o (b).
Para el ejemplo utilizaremos las dos fórmulas.
Cálculos según (a) Cálculos según (b)
LIC. MARÍA A. ZACARÍAS DÍAZ 31
xi ( xi   ) ( xi   )2 xi xi2
40 -6.6 43.56 40 1600
40 -6.6 43.56 40 1600
40 -6.6 43.56 40 1600
45 -1.6 2.56 45 2025
45 -1.6 2.56 45 2025
45 -1.6 2.56 45 2025
45 -1.6 2.56 45 2025
45 -1.6 2.56 45 2025
48 1.4 1.96 48 2304
48 1.4 1.96 48 2304
48 1.4 1.96 48 2304
48 1.4 1.96 48 2304
48 1.4 1.96 48 2304
50 3.4 11.56 50 2500
50 3.4 11.56 50 2500
50 3.4 11.56 50 2500
50 3.4 11.56 50 2500
55 8.4 70.56 55 3025
840 270.08 840 39470

  840 /18  46.6%   840 /18  46.6%

270.08 39470
 X2   15.004 % 2  X2   (46.6) 2  21.217 % 2
18 18

El valor de la varianza calculada a partir de la fórmula (b) proporciona un valor aproximado de ella.

4. Desviación estándar.

 X  3.874 %  X  4.6 %

Los indicadores de dispersión: longitud de recorrido, desviación media, varianza y desviación


estándar son llamados indicadores de dispersión absoluta ya que están expresados en términos de
las unidades de la variable en estudio.

5. Coeficiente de Variación.

CoV = 0.083

Al coeficiente de variación se le considera como un indicador de dispersión relativa.(No tiene


unidades)
Uso del coeficiente de variación

LIC. MARÍA A. ZACARÍAS DÍAZ 32


Aunque fundamentalmente el coeficiente de variación se utiliza en la "comparación" de dos o más
conjuntos de datos (para saber cuál es más disperso o menos disperso), en el caso de analizar un solo
grupo de datos y dado que la dispersión es un factor importante para elegir que promedio usar (y
teniendo cuidado que la media no este cercana a 0), podemos tomar en consideración lo siguiente:

Sí el 0<CoV<15% los datos presentan poca dispersión

15%<CoV<25% los datos presentan regular dispersión

25%<CoV los datos presentan bastante dispersión

Nota. Si tuviera que compararse dos o más conjuntos de datos, puede hacerse en términos de los
indicadores de dispersión absoluta (si los conjuntos de datos están expresados en las mismas
unidades)

CUADRO RESUMEN

Tendencia Central Dispersión


 Me Mo LoR DeM 2  CoV
46.6% 48% - 15% 3.15 % 21.21% 4.61%. 0.099

Interpretación.
El CoV = 0.099 nos dice que la dispersión de los datos es baja, ahora observamos los indicadores de
tendencia central, como no existe mucha diferencia entre el valor de la media y el valor de la
mediana, se elige la media aritmética como indicador de tendencia central, luego concluimos que la
mayoría de los datos están en torno a la medía, es decir, en la mayoría de los cursos el avance del
Silabo está en torno al 46.6 % a mitad del periodo académico, es decir hay un ligero atraso.

Calculo de los diferentes indicadores de Tendencia Central y Dispersión, cuando se tiene más de 30
datos.

Ejemplo
La profesora del curso de estadística I, grupo 4 Sem. 2003 – I, de la EAP de Estadística, FCM,
generalmente, al finalizar el semestre obtiene el porcentaje de asistencia de cada uno de sus
alumnos, para posteriormente ver si hubo o no relación con la nota que obtuvieron. Los datos se
dan a continuación:

0.48 0.35 0.42 0 0.26 0.13 0.06 0.16 0.84 0.55 0.74 0.26
0.1 0.71 0.74 0.74 0.45 0.39 0.81 0.68 0.06 0.19 0.23 0.71
0.61 0.1 0.32 0.61 0.71 0.55 0.65 0.65 0.77 0.74 0.61 0.55

Cómo estos datos, son datos poblacionales y N > 30, entonces las fórmulas a utilizar para hallar los
indicadores son los siguientes:

1. Cálculo de la media aritmética, la varianza y la desviación estándar y el coeficiente de


variación.
UE: El alumno del curso de Estadística I del grupo 4 del Período Académico 2003-I, de la EAPE de la
FCM.
Conjunto de individuos: todos los alumnos del grupo 4, constituyen la población de individuos.

LIC. MARÍA A. ZACARÍAS DÍAZ 33


Variable: Porcentaje de asistencia a clases (X).
Tipo de variable cuantitativa continua.
Conjunto de datos, constituyen los datos poblacionales.

Previo al cálculo de los indicadores de tendencia central y dispersión, se construye la tabla de


frecuencias y el polígono de frecuencias, dado qué, el observar el comportamiento de la variable
ayuda a visualizar la tendencia central

Distribución de los alumnos de acuerdo al


X i 1  X 'i
' Xi fi Porcentaje de asistencia
0.06 - 0.19 0.125 6
12
0.19 - 0.32 0.255 4 10
0.32 - 0.45 0.385 4 8
6
0.45 - 0.58 0.515 5 4
2
0.58 - 0.71 0.645 6 0
0.71 - 0.84 0.775 10 0.00 0.06 0.19 - 0.32 0.45 - 0.58 - 0.71 - 0.84
- - 0.19 0.32 - 0.45 0.58 0.71 0.84 - 0.97
0.06
Po r cent aje d e asist encia

Las fórmulas a utilizar para el cálculo de la media y la varianza son:


m

m
2 X 2
f
i i
   X i    fi
1 1
X  X   i 1
 2
2 2
i fi 0 X
N i 1 N N

X i 1  X 'i
' Xi fi Xif i X i f 2i
0.07 - 0.19 0.125 6 0.75 0.09375
0.20 - 0.32 0.255 4 1.02 0.2601
0.33 - 0.45 0.385 4 1.54 0.5929
0.46 - 0.58 0.515 5 2.575 1.326125
0.59 - 0.71 0.645 6 3.87 2.49615
0.71 - 0.84 0.775 10 7.75 6.00625
35 17.505 10.775275

Luego:  = 0.5%  2 = 0.0577222 %2  = 0.2403 % CoV = 0.48037

2. Cálculo de la mediana.
Procedimiento.
a. Se construye la tabla de frecuencias acumuladas ( absolutas o relativas)

X i 1  X i Fi
' '

0.06 - 0.19 6
0.19 - 0.32 10
0.32 - 0.45 14
0.45 - 0.58 19
0.58 - 0.71 25
0.71 - 0.84 35
LIC. MARÍA A. ZACARÍAS DÍAZ 34
b. Se halla N/2 = 17.5
c. Se busca en la tabla de frecuencias construida, la menor frecuencia absoluta acumulada
que supere a N/2, para el ejemplo es:
F4 = 19 > 17.5, a esta cuarta frecuencia acumulada le corresponde el cuarto intervalo,
es decir [ 0.45 - 0.58), en este intervalo se encontrara el valor de la mediana.

d. Utilizando la fórmula, Me  X 3`  A4
 0.5N  F3  , obtenemos el valor de la mediana,
 F4  F3 
Me = 0.45 + 0.13( 17.5 – 14)/ (19 – 14) = 0.541 %

3. Cálculo de la moda.
El comportamiento de la variable nos muestra la presencia de dos valores más frecuentes es decir
dos Modas.
Mo1 = 0.125 % Mo2 = 0.775%

Cuadro de las medidas resumen


Tendencia central Dispersión
 Me Mo1 Mo2 LoR 2  CoV
0.5 % 0.541% 0.125% 0.775% 0.78% 0.0577%2 0.24% 0.48

Interpretación.
El coeficiente de Variación, CoV, como es superior a 0.25 nos dice que los datos están muy dispersos,
y al ver los valores de tendencia central la media y la mediana estos son diferentes, aparentemente
están cerca el uno del otro, pero al observar la tabla de frecuencias y el polígono de frecuencias
vemos que hay dos valores frecuentes, 0125 y 0.775 en torno a los cuales se acumulan los datos es
decir existen 2 modas, por lo que la media aritmética ni la mediana no son los adecuados para
representar a los datos.

Del análisis hecho al problema anterior concluimos, que no basta contar con los indicadores, siempre
es conveniente complementar el análisis con la representación gráfica de la distribución de los datos
o comportamiento de la variable.

PROPIEDADES DE LA MEDIA ARITMÉTICA Y LA VARIANZA

1. Si los datos asociados a una variable son todos iguales, entonces:


La media aritmética es igual al valor que toma la variable, y la varianza es igual a cero.
2. Sean la media,  X , y la varianza,  X2 , de la variable X, si se define una nueva variable, digamos
Y, donde Y = k + X, entonces:
La media aritmética de Y es : Y   X  k y la varianza es  Y2   X2
3. Sean la media,  X , y la varianza,  X2 , de la variable X, si se define una nueva variable, digamos Y,
donde Y = k ( X) entonces:
La media aritmética de Y es : Y  k  X , y la varianza es:  Y2  k 2  X2

Ejemplo
Se tiene información respecto al peso de los alumnos ingresantes a la facultad de Medicina de la
Universidad AAA.

LIC. MARÍA A. ZACARÍAS DÍAZ 35


Medidas Resumen Alumnas Alumnos
X 45 kg. 70 Kg.
3 kg. 6 kg.
X

Posteriormente se supo que la balanza estaba malograda y que daba en exceso un peso adicional de
3 kg. Al obtener los indicadores correctos, las autoridades concluyeron que el peso de las alumnas
es muy bajo. ¿Es cierto lo que dicen las autoridades?

Solución.
Sea la variable X: peso de la alumna.
Donde  X = 45 kg. y  X2 = 9 kg2
Sea la variable Y: peso correcto de la alumna, que está definida como:
Y = X - 3
Por propiedades de la media y la varianza, tenemos que:

Y   X  3 = 45 - 3 = 42 kg.

 Y2   X2 = 9  Y  3 kg

CoV = 3/42 = 0.071

Como el CV = 0.071 < 0.15, es decir la variabilidad de los pesos de las alumnas es bajo, entonces el
peso medio de las alumnas es de 42 kg. Luego la conclusión de las autoridades es cierta.
Es deseo de las autoridades que los alumnos tengan un buen rendimiento académico, y como para
ello los alumnos deben tener un buen estado físico, las autoridades deciden mejorar el peso de las
alumnas sometiéndolas a una dieta durante un mes, esta dieta da lugar a un incremento del 10% en
el peso mensualmente. ¿Cuál es el peso medio y la variabilidad de los pesos de las alumnas al
finalizar el mes?

Solución.
Sea la variable X : Peso de la alumna
Donde:  X = 42 kg. y  X2 = 9 kg2

Sea la variable Y : Peso incrementado de la alumna, que está definido como: Y = 1.1X
Por propiedades de la media y la varianza, tenemos que:
Y  k  X = 1.1 (42) ó 46.2 kg.

 Y2  k 2  X2 = 50.82 kg2  Y = 7.13 kg

C0V = 0.1154

Si bien las alumnas han incrementado su peso pero la variabilidad de los pesos también se a
incrementado, ya que el CoV = 0.11 > 0.071

4. Si el conjunto de datos poblacionales, se subdividen en k grupos y de cada grupo se conoce su


media y la cantidad de datos de cada grupo, es decir 1 , 2 ,. . . , k y
N1 , N 2 ,. . . , N k respectivamente, entonces la media de todo el conjunto de datos es:

LIC. MARÍA A. ZACARÍAS DÍAZ 36


1 N1  2 N 2  . . .  k N k

N
5. Si el conjunto de datos poblacionales, se subdividen en k grupos y de cada grupo se conoce su
varianza y la cantidad de datos de cada grupo, es decir 12 ,  22 ,... ,  k2 y
N1 , N 2 ,. . . , N k respectivamente, entonces la Varianza de todo el conjunto de datos es:

N 1  12  N 2  22  . . .N k  k2 N1 ( 1   ) 2  N k ( k   ) 2  ...  N k ( k   ) 2
 
2

N N
Intra var ianza Inter var ianza
Esta propiedad nos dice que la variabilidad total de los datos, es decir,  X2 puede deberse tanto a la
variabilidad dentro de cada grupo, intravarianza, como a la variabilidad entre los diferentes grupos,
intervarianza.

Ejemplo.
La siguiente tabla contiene la media aritmética y desviación estándar del promedio ponderado de los
alumnos por Escuelas Académicos Profesionales de la Facultad de Ciencias Matemáticas, del periodo
académico 2002 – I que cursaron. (No incluye a los ingresantes 2002).

ESCUELAS Media Desviación Numero de


Aritmética Estándar Alumnos

Matemática 9.66 ptos. 1.97 ptos 328


Estadística 10.33 ptos 1.82 ptos 208
Investigación 11.11ptos 1.8 ptos. 286
Operativa

a. Halle la media aritmética del promedio ponderado de los alumnos de la facueltad.


b. Halle la variabilidad del promedio ponderado de los alumnos de la facultad
c. La variabilidad del promedio ponderado se debe principalmente, ¿A la intervarianza o
intravarianza?

Solución.
Unidad Estadística: El alumno de la FCM que cursaron el periodo académico 2002 – I (No incluye
ingresantes)
Conjunto de UE: Todos los alumnos de la FCM que cursaron el periodo académico 2002 –I.
Constituyen la población.
Sea la variable X: Promedio Ponderado.
Tipo de variable: Cuantitativa continua.
Conjunto de datos: Vienen a ser datos poblacionales.

a. Hallamos la media aritmética del Promedio Ponderado de todos los alumnos de la facultad.

328(9.66 )  208(10.33)  286(11.11)


X  10.334 puntos.
328  208  286

b. Para determinar la variabilidad del promedio ponderado, se debe hallar la intervarianza y la


intravarianza.
Calculo de la Intravarianza.

LIC. MARÍA A. ZACARÍAS DÍAZ 37


328(1.97) 2  208(1.82)2  286(1.8)2
 int2 ra   3.514
822
Calculo de la Intervarianza
328(9.66  10.334) 2  208(10.33  10.334) 2  286(11.11  10.334) 2
 int2 er   0.391
822
Donde 10.334 es la media de todo el grupo, es decir 
Luego:
 2  3.514  0.391  3.905 puntos 2

c. La variabilidad del promedio ponderado se debe principalmente a la variabilidad del


promedio ponderado que se da en cada escuela académico profesional.

DESVIACIÓN TIPICA O ESTANDAR.

La varianza se expresa en unidades que son el cuadrado de la unidad de la variable, que no tiene
significado real, por ello es preferible utilizar otra medida de dispersión y esta es la desviación típica
o estándar que se define como la raíz cuadrada positiva de la varianza.
  2

Cuando el polígono de frecuencias es simétrico o casi simétrico, la desviación estándar permite


clasificar a las unidades estadísticas en cinco categorías e indicar el porcentaje de individuos de cada
categoría.

Las categorías y el porcentaje son las siguientes:

Valores de la Nombre de la Porcentaje de


variable categoría Unid. Estad.
  3   2 Muy malo 2.5
  2   Malo 13.5
    Regular 68
    2 Bueno 13.5
  2   3 Muy bueno 2.5

Ejemplo.
El siguiente cuadro estadístico y gráfica muestran

LIC. MARÍA A. ZACARÍAS DÍAZ 38


Distribución de los cursos
de acuerdo al porcentaje de
avance

Porcentaje Cursos
de avance
40 - 43 3
43 - 46 5
46 - 49 5
49 - 52 4
52 - 55 1
Total 18

Que, la distribución de los datos es casi simétrica, por lo tanto, podemos aplicar las propiedades de la
desviación estándar.
En este caso la variable es: Porcentaje de avance de los cursos, donde μ = 46.6 % y σ = 4.61 %

Porcentaje de avance Nombre de la Porcentaje de


Categoría cursos
32.77 - 37.38 Avance muy bajo Ningún curso
37.38 - 41.99 Avance bajo 16.6
41.99 - 51.21 Avance regular 77.7
51.21 - 55.82 Avance Alto 5.5
55.82 - 60.43 Avance muy alto Ningún curso

Podemos observar que no hay ningún curso cuyo avance sea calificado como muy bajo o muy alto, y
en cuanto al porcentaje de cursos dentro de cada categoría, difiere en cuanto a lo establecido,
debido a que el polígono es casi simétrico no es simétrico y porque son pocos los datos.

VARIABLES ESTANDARIZADAS O TIPIFICADAS

Los datos de una variable pueden tomar varias apariencias numéricas, dependiendo de la unidad en
la cual es medida. Por ejemplo si se registra el ingreso de los trabajadores en soles o dólares, lo que
da lugar a que, la media aritmética y la varianza con cada una de las unidades sea diferente, pero si
se da en su forma estandarizada, las medias y las varianzas serán iguales en una u otra unidad.
Una variable estandarizada se denota con Z y su definición es:
X  X
Z
X
Donde:  X es la media y  X es la desviación estándar de X
x  X
Esta definición indica que un dato, zi  i , mide, en cuánto, un dato xi se aleja de su media
X
en términos de su desviación estándar.

La media y varianza de Z son:


X  X
Media de Z es: Z  0
X

LIC. MARÍA A. ZACARÍAS DÍAZ 39


 X2
Varianza de Z es:  Z2  1
 X2

Ejemplo
La nota media y la varianza del primer examen parcial del curso de cálculo I de un grupo de
estudiantes es:
 X = 10 puntos  X2 = 4 puntos2
Donde X: Nota de cálculo I.

Un alumno obtuvo 11 de nota ¿En unidades estándar a cuanto equivale su nota?


Rpta.
Nota x = 11 puntos

En unidades estándar:

x  X 11  10
z   0.5
X 2

Ejemplo.
La siguiente tabla muestra información estadística, respecto a las notas del primer examen parcial
del curso de Estadística, de todos los alumnos del curso, los cuales están divididos en dos grupos

Grupo Nota media Varianza

1 13 9
2 13 4

El alumno Juan obtuvo 12 puntos y pertenece al grupo 1, y la alumna Rosa también obtuvo 12
puntos y pertenece al grupo 2. ¿Quién esta en mejor posición?

Rpta.
Nota estandarizada de Juan: z J = (12 - 13) / 3 = - 0.33

Nota estandarizada de Rosa: z R = (12 - 13) / 2 = - 0.5

Comparando estas notas estandarizadas, que la nota de Rosa es menor que la nota de Juan, entonces
Juan esta en mejor posición.

Definición de Conceptos Básicos.

PARÁMETRO.
A las medidas resumen obtenidas a partir de todos los datos poblacionales se les llama parámetros,
es el caso de las medidas resumen obtenidas para los problemas dados líneas arriba.

ESTADÍGRAFO.
A las medidas resumen obtenidas a partir de los datos muestrales se les llama estadígrafos.

LIC. MARÍA A. ZACARÍAS DÍAZ 40


ESTADÍSTICA.

Definición: Estadística es la ciencia que proporciona métodos por medio de los cuales podemos
recolectar, clasificar, presentar, resumir y analizar datos numéricos relativos a un conjunto de
individuos u objetos, también nos permite extraer conclusiones válidas y efectuar decisiones lógicas
basadas en dichos análisis.

Dentro de la estadística se puede considerar:

A. Estadística Descriptiva.
Esta relacionada con la recolección, tabulación, presentación de datos y el cálculo de medidas
resumen que permiten obtener información estadística, a partir de ésta se obtendrá conclusiones
sea a nivel de la población o la muestra. Se ha aplicado estadística descriptiva.

B. Estadística Inferencial
Relacionada con el proceso de generalizar conclusiones respecto de la población total, sí la
información con la que se cuenta ha sido obtenida de una parte o muestra de la población. Esta
generalización podrá hacerse, sí el tamaño de muestra y la selección de los individuos integrantes de
la muestra han sido seleccionados utilizando métodos estadísticos.

Ejemplo.
1. El propietario de una fabrica de corbatas, desde hace 2 años cuenta con 50 trabajadores. Posee
información respecto de la producción diaria de ellos, esta algo satisfecho, sin embargo cree que
sí introduce algunas modificaciones, la producción podría mejorar. Es así que divide el grupo de
trabajadores en dos, en el salón A ubica a 25 trabajadores, quienes trabajan en las mismas
condiciones de siempre, en el salón B ubica a los otros 25 trabajadores, en este ambiente
establece nuevas condiciones de trabajo: Música de ambiente, alfombra y mejor iluminación. Al
día siguiente, después de un mes de esta modificación, registro la producción de cada trabajador
y los resultados son los siguientes:

Salón A Salón B

12 21 13 16 18 36 41 40 44 47
24 32 16 18 20 45 45 44 42 48
28 25 33 26 30 46 48 49 50 49
26 29 35 45 59 51 51 53 54 54
32 31 30 40 30 56 52 55 52 59

a. Observe los datos, ¿A que conclusión llega?


b. Estadísticamente, ¿A que conclusión llega?
c. ¿Qué le diría al propietario?
d. Las medidas resumen que ha utilizado que nombre tienen?
e. Utilizó estadística descriptiva o inferencial?

2. Al día siguiente después de un mes de la modificación, se selecciono una muestra de 10


trabajadores de cada salón y se registro la producción de cada uno de ellos, siendo los datos
los siguientes:

LIC. MARÍA A. ZACARÍAS DÍAZ 41


Salón A Salón B
12 21 13 16 18 36 41 40 44 47
24 32 16 18 20 45 45 44 42 48

a. Observe los datos, ¿A qué conclusión llega?


b. Estadísticamente, ¿A qué conclusión llega?
c. ¿Que le diría al propietario?
d. Las medidas resumen que ha obtenido, ¿qué nombre tienen?
e. ¿La información estadística que ha obtenido, en cuanto a su ocurrencia en qué situación se
encuentra?
f. ¿Utilizó estadística descriptiva o inferencial?

Solución.
Considerando los datos poblacionales

1.a. En el salón A la producción más baja es de 12 corbatas y la producción más alta es de 59


corbatas, pero este último dato es el único, en realidad la producción esta oscilando entre 12 y
45 corbatas.
En el salón B, la producción de corbatas oscila entre 36 y 59 corbatas.
De la información anterior podríamos concluir, que los trabajadores del salón B tienen una
producción más homogénea y es mayor que la de los trabajadores del salón A.

1.b. Obtenemos las medidas resumen.

Tendencia Central Dispersión


Salón X Med LoR  2
X X CoV
27.56 28 47 105.29 10.26
A Corb. Corb. Corb. Corb2. Corb. 0.370
48.44 49 23 5.404
B Corb. Corb. Corb. 29.21 Corb2. Corb. 0.112

El coeficiente de variación, nos indica que la producción de corbatas en el salón A es disperso y


esto se debe a la presencia de unos pocos valores altos, por lo que, elegimos a la mediana
como medida resumen de los datos, por otro lado el coeficiente de variación de la producción
de corbatas del salón B es poco disperso, por lo que elegimos a la media, como medida
resumen de los datos, pero para comparar la producción de corbatas de ambos salones
debemos utilizar la mediana, y como el valor de la mediana del salón B, 49 corbatas, es mayor
que el valor de la mediana del salón A, 28 corbatas, por lo tanto concluimos que la producción
de corbatas de los trabajadores del salón B es mucho mayor que la de los trabajadores del
salón A.

1.c. Al propietario le diría, que del análisis anterior, vemos que la producción de corbatas de los
trabajadores del salón B es más pareja, además la producción promedio de este grupo de
trabajadores es mucho mayor que los trabajadores del grupo A, por lo que concluimos que las
condiciones de ambiente han influido en la producción y se debe implementar las mismas
condiciones en el salón A.

1.d. Las medidas resumen que se ha obtenido se llaman parámetros, porque se han calculado a
partir de todos los datos poblacionales.

LIC. MARÍA A. ZACARÍAS DÍAZ 42


1.e. Las medidas resumen obtenidas proporcionan información respecto a la dispersión y la
tendencia central de la producción de corbatas de todos los trabajadores de la fábrica, por lo
que se ha utilizado la Estadística Descriptiva.

2. Considerando los datos de la muestra.

2.a. La producción de la muestra de los trabajadores del salón B es más pareja y oscila entre 36 y 48
corbatas, mientras que la producción de la muestra de los trabajadores del salón A es más
dispersa y oscila entre 12 y 32 corbatas, a partir de estas cantidades podemos deducir que la
muestra de trabajadores del salón B produce más que la muestra de trabajadores del salón A.

2.b. Las medidas resumen para estos datos muestrales son:

Long. Desv. Coef.


Salón Media Mediana Moda Recorrido Varianza Estandar Variación
A 19 18 20 33.77 5.81 0.31
B 43.2 44 12 12.62 3.56 0.082

El coeficiente de variación indica que la muestra de datos de la producción del salón A están
dispersos, en cambio la muestra de datos de la producción de los trabajadores del salón B
están poco dispersos, y el indicador de tendencia central, después de observar la muestra de
datos originales de la producción del salón A, vemos que no hay datos extremos, entonces la
media es el indicador de tendencia central adecuado, es decir la producción media de los
trabajadores de la muestra es de 19 corbatas, y la de los trabajadores de la muestra del salón
B es de 43.2 corbatas, por lo que concluimos que los trabajadores de la muestra del salón B
producen mucho más que los trabajadores de la muestra del salón A.
2.c. Que a nivel de muestras los trabajadores del salón B producen mucho más que los del salón A.
2.d. Las medidas resumen obtenidas tienen el nombre de Estadígrafos.
2.e. Las medidas resumen obtenidas están en situación de incertidumbre, ya que se han obtenido a
partir de una parte de la población.
2.f. Se utilizó estadística descriptiva, para utilizar la estadística inferencial se debe hacer uso de
probabilidades, dado que las medidas resumen están en situación de incertidumbre.

Ejemplo.
En los siguientes enunciados identifique si en su contenido se encuentra, un estadígrafo, un
parámetro o un dato e indique el nombre, justifique su respuesta. Asimismo diga si se esta utilizando
Estadística descriptiva o inferencial. Interprete la información que proporciona cada enunciado.

a. De los 7 mil 108 docentes que obtuvieron nota aprobatoria en el último examen de la
Carrera Pública Magisterial (2012), 3 mil 122, es decir el 44%, recibió antes capacitación por
parte del Ministerio de Educación, lo que evidencia que las clases de actualización, que se
imparten de manera gratuita, han permitido una mejora en el conocimiento de los maestros
y la más alta nota fue de 19 puntos.
b. Siete de cada diez mujeres no denuncia el maltrato que recibe de su pareja debido a que
siente vergüenza, miedo a más agresión, temor al divorcio, culpa, o no sabe a dónde ir,
informó el director del Instituto Guestalt de Lima, Manuel Saravia Oliver, quien indicó que "la
violencia familiar es un grave problema de salud pública".

Solución “a”
➢ Subpoblación constituida por 7108 docentes que aprobaron el último examen de la Carrera
Pública Magisterial.

LIC. MARÍA A. ZACARÍAS DÍAZ 43


➢ U.E: profesor que aprobó el último examen de la carrera pública magisterial.
➢ Variable. X: Recibió o no recibió Capacitación antes del examen por parte del Ministerio de
educación.
➢ Datos: {1, 0, 0, 0, ……, 1, 0, 0, 0} son 7108 datos donde: 0 = No recibió capacitación y 1 = si
recibió capacitación.

Información obtenida.

Distribución de los profesores de acuerdo


A si recibió o no Capacitación.

Capacitación Profesores

Si 3122
No 3986

A partir de este cuadro obtenemos el porcentaje de profesores que recibieron capacitación,


P = 0.44 es decir 44%, estadísticamente este es un parámetro porque se ha obtenido a partir de
todos los datos poblacionales y su nombre es Proporción Poblacional.
SE ha utilizado estadística descriptiva, porque se recopila, procesa y se obtiene información, la cual
permite analizar y tomar decisiones, en este caso, de este grupo de profesores el 56 % no ha recibido
capacitación, y para ver el efecto de la capacitación se debiera contar con la distribución de las notas
de los profesores que recibieron capacitación y los que no recibieron asimismo con las notas
promedio.

Para este mismo conjunto de datos también se cuenta con la característica, Y: Nota Obtenida, pero
sólo proporcionan la nota más alta obtenida por uno de los profesores que es 19 puntos, en este
caso sólo se cuenta con un dato.

Solución “b”
Suponemos que el Instituto Guestalt ha llevado a cabo una encuesta por muestreo y no un censo
porque la población constituida por mujeres peruanas que tienen pareja es muy grande. La muestra
es de tamaño n.
U.E es la mujer peruana que tiene pareja.
De la muestra de tamaño n de mujeres que tienen pareja, se considera a la submuestra de mujeres
de tamaño n1 que son maltratadas y en estas se mide la variable, X: Si denuncia o no denuncia el
maltrato que recibe de su pareja.
Datos, {1, 0, 1, 0, ……0, 0} donde 0= No denuncia que recibe maltrato de su pareja, 1= si denuncia que
recibe maltrato.

Información obtenida.

Distribución de Mujeres Maltratadas por


su pareja de acuerdo a si denuncian o
no el maltrato.

Denuncia de Porcentaje de
Maltrato Mujeres

Si 30
No 70

LIC. MARÍA A. ZACARÍAS DÍAZ 44


A partir de este cuadro obtenemos la proporción de mujeres de la submuestra, que No denuncian
que reciben Maltrato, p = 70 %. Estadísticamente, tenemos que esta medida resumen es un
estadígrafo porque su valor se obtuvo a partir de datos muestrales su nombre es proporción
muestral.
Se hizo uso de la Estadística descriptiva, pero suponemos que el instituto recurrió a un Estadístico
para que determine el tamaño de muestra y la forma de selección de la muestra y un método
adecuado de Estimación del parámetro, lo que no incluyo es la medida de probabilidad con la que
hace la estimación, bajo estas consideraciones podemos decir que utilizó estadística inferencial.

LIC. MARÍA A. ZACARÍAS DÍAZ 45

Anda mungkin juga menyukai