Separata MI - MGGS PDF

Módulo I
ESTADÍSTICA DESCRIPTIVA
ÍNDICE
MÓDULO I: ESTADÍSTICA DESCRIPTIVA Pág.
I. ESTADÍSTICA E INVESTIGACIÓN CIENTÍFICA. DEFINICIÓN

DE TÉRMINOS ESTADÍSTICOS………………………………… 3
II. ORGANIZACIÓN Y PRESENTACIÓN DE DATOS………….. 9
III. DESCRIPCIÓN DE DATOS: MEDIDAS DE POSICIÓN…….. 13
IV. MEDIDAS DE DISPERSIÓN O DE VARIABILIDAD…………. 18

MÓDULO I
ESTADÍSTICA DESCRIPTIVA
I. ESTADÍSTICA E INVESTIGACIÓN CIENTÍFICA. DEFINICIÓN DE TÉRMINOS

ESTADÍSTICOS.
1.1. Introducción a la Estadística
¿Qué es estadística?
Definición preliminar: Es una herramienta estadística para trabajar con un conjunto

de datos, quizá una buena planificación económica, empresas, estado. Ejemplo: La
estadística como la natalidad o mortalidad de una población, crecimiento económico
de un país durante los últimos años.
¿En qué áreas se aplica la estadística?

Actualmente se aplica en todas las áreas del saber, por ejemplo en Sociología,
Educación, Psicología, Administración, Economía, Medicina, Ciencias Políticas,
Proyectos de tesis, Proyectos de Inversión, entre otras.
Ejemplos de su aplicación son:
A) En Administración de Empresas: la estadística se utiliza para evaluar un

producto antes de comercializarlo, estudio de mercados.
B) En Economía: para medir la evolución de los precios mediante números índice o
para estudiar los hábitos de los consumidores a través de encuestas de
presupuestos familiares. Ingresos y egresos.
C) En Ciencias Políticas: para conocer las preferencias de los electores antes de
una votación mediante sondeos y así orientar las estrategias de los candidatos.
D) En Sociología: para estudiar las opiniones de los colectivos sociales sobre
temas de actualidad, si el nivel de estudio influye en el número de hijos que
puede tener una persona.
3
E) En Psicología: para elaborar las escalas de los test y cuantificar aspectos del
comportamiento humano (por ejemplo los test que se aplican a los candidatos
para un cargo en una empresa), si el funcionamiento familiar influye en el riesgo
suicida.
F) En Medicina: determinar el estado de salud de la población, si un cierto tipo de
vacuna puede curar a un grupo de personas y poder inferir a la población.
Definición:
La estadística es una ciencia que nos proporciona métodos científicos

basados en la teoría de las probabilidades, que consiste como primer
paso, en procedimientos de recolección, organización, representación,
análisis e interpretación de datos en estudio y poder tomar de decisiones.
Segundo paso realizar inferencias y realizar predicciones en base a los
resultados de la muestra y realizar generalizaciones de estudio acerca de
las poblaciones.
1.2. Clasificación de la Estadística
Básicamente la Estadística se clasifica en:
1.2.1. ESTADÍSTICA DESCRIPTIVA. Es la rama de la estadística que estudia los

métodos de recolección, organización, clasificación resumen e interpretación
de los datos, usando tablas, gráficos y “mediante medidas de resumen“.
aquellas que representan las características esenciales de los datos en
términos fáciles de interpretar.
1.2.2. ESTADÍSTICA INFERENCIAL. Es un método científico que nos permite

generalizar los datos de una muestra a un número más grande de individuos
(población) haciendo uso de la Teoría de Probabilidades. Que nos permite
realizar predicciones (inferencia) y tomar de decisiones y poder generalizar
los resultados (muestra, población), también el análisis estadístico inferencial
4
se lleva a cabo para mostrar relaciones de causa y efecto, así como para
probar hipótesis y teorías científicas.
A. Población:
Es la totalidad de individuos o de elementos (empresas, personas, objetos etc.)
que cumplen o satisfacen la o las características en estudio. Por el número de
elementos que la componen la población se clasifica en finita e infinita.
a) La población es finita: es un número determinado de elementos en caso

contrario es infinita. En la práctica una población finita con un gran número
de elementos se considera como una población infinita,
b) La población infinita: es cuando no se conoce el tamaño de ala población,
por otro lado el tamaño de una población va a depender de objetivo trazado
por el investigador.
B. Muestra:
Está constituida por una parte de los individuos o elementos que componen la
población, seleccionada de acuerdo a cierta técnica con el fin de obtener
información acerca de la población, de la cual proviene. La muestra debe ser
seleccionada de manera que sea representativa, es decir tenga características
similares a las de su población.
C. Parámetro:
Es una medida descriptiva que resume una característica de la población, es
decir constituye el valor real, verdadero; su cálculo implica utilizar toda la
información contenida en la población; entre los más conocidos tenemos:
 La media poblacional (μ)
 La varianza poblacional (σ2)
 La proporción poblacional (P) etc.
D. Estadístico:
Es una medida que describe una característica de la muestra, se calcula a
partir de los datos observados en la muestra; es decir constituyen los
estimadores de cada uno de sus respectivos parámetros; entre estos tenemos:
5
 La media muestral (X)
 La varianza muestral (S2)
 La proporción muestral (p)
E. VARIABLE:
Es una característica definida en la población de acuerdo a cierto interés en
una investigación estadística, que puede tomar dos o más valores (cualidades
o números). Puede ser una característica medible (peso, precio, ingresos,
temperatura etc.) o una cualidad no medible (estado civil, calidad, color, sexo
etc.). Se puede representa con las letras X, Y, Z.
1.3. Clasificación de las Variables
1.3.1. Según la naturaleza de la variable
A. Variables Cualitativas o Categóricas: Son aquellas cuyos valores expresan

cualidades o atributos; estas a su vez pueden ser:
a) Variables Nominales: Son aquellas en donde no existe un orden

preestablecido entre las categorías de las variable. Ejemplos:
 Colores: Azul, rojo, blanco, verde, negro, amarillo etc.
 Distritos: Lima, La Victoria, Breña, Miraflores, San Isidro, Lince etc.
 Sexo: Masculino, femenino.
 Calidad de un producto: Buena, mala.
b) Variables Ordinales: Son aquellas en donde existe un orden preestablecido

entre las categorías de la variable. Ejemplos:
 Grado de Instrucción: Primaria, Secundaria, Superior
 Orden de Mérito: Primero, Segundo, Tercero etc.
 Estado Civil: Soltero, casado, conviviente, viudo, divorciado.
 Nivel Socioeconómico: Bajo, Medio, Alto etc.
También podemos considerar como variables ordinales por ejemplo grado de

satisfacción de un servicio (1 = Muy insatisfecho; 2 = Insatisfecho; 3 = Ni satisfecho
6
ni insatisfecho; 4 = Satisfecho; 5 = Muy satisfecho) o también el grado de
depresión, etc.
B. Variables Cuantitativas: Son aquellas que se obtienen como resultado de

mediciones o conteos numerables, estas a su vez se clasifican en:
a) Variables Discretas: Son aquellas cuyos valores resultan como

consecuencia de conteos, y por tanto solo pueden asumir valores enteros
positivos, incluido el cero. Y está asociado a un periodo. Ejemplos:
 Número de empresas, número de hospitales, número de trabajadores,
número de comprobantes de pago, número de máquinas, número de
conservas etc.
b) Variables Continuas: Son aquellas cuyos valores se obtienen por

medición, pueden asumir valores decimales, enteros y pertenecen a un
rango o intervalo. Ejemplos:
 Los sueldos, el precio, la temperatura, el volumen, el tiempo, el peso de las
personas, la estatura, la presión etc.
1.3.2. Según la funcionalidad que tienen en la investigación
C. Variable Dependiente: La variable dependiente es determinada por el

investigador para estudiarla en función de otras variables denominadas
independientes. Generalmente se simboliza esta variable con la letra Y.
D. VARIABLE INDEPENDIENTE: La variable independiente es aquella que será

controlada en un experimento por el investigador. Generalmente se simboliza
esta variable con la letra X. En la mayoría de los experimentos el investigador
está interesado en determinar el efecto que tiene la variable X, sobre la variable
Y; para esto el investigador controla los niveles de la variable X y mide el efecto
sobre la otra variable.
7
Ejemplo:
 La variación en los precios de un determinado artículo, motiva cambios en

las ventas. En este ejemplo las variables son:
Venta = Y Precio = X
 El costo de producción de un artículo, determina su precio de venta. En este

caso las variables son:
Precio de venta = Y Costo de producción = X
Podemos notar que el rol que asuma una determinada variable como
dependiente o independiente en una investigación, va a depender con qué
variable se asocie.
Niveles de medición:
A. Escala nominal
B. Escala Ordinal
C. Escala de Intervalos
D. Escala de Razón
8
II. ORGANIZACIÓN Y PRESENTACIÓN DE DATOS
2.1. Tabla de Distribución de Frecuencias:
Son artificios útiles para resumir datos que se puede usar para calcular
probabilidades. A partir de la tabla de frecuencias se puede construir una tabla de
probabilidades; cada valor de la tabla de frecuencias se divide por el número total de
observaciones para formar la tabla de probabilidades.
Una distribución de frecuencias es un arreglo de los valores observados X1, X2,

X3,..... Xn .de la variable X con sus respectivas frecuencias; en una tabla. Los datos
originales se clasifican en intervalos de clase por las siguientes razones:
 Es antieconómico y poco práctico tratar con un número grande de observaciones

distribuidos en muchos puntajes.
 Algunos de los valores observados tienen asociado una frecuencia tan baja que
no se justifica mantenerlos como entidades distintas y separadas.
Se ha de elegir el número de intervalos que equilibre estos dos aspectos y se evite el

detalle innecesario, pero que no conduzca a la pérdida de más información de la que
pueda ser convenientemente ignorada.
2.2. Procedimiento para construir una Tabla de Frecuencias de Distribución de una

variable agrupada en intervalos
A. Determinación del Rango:

 Intervalos traslapados: R = valor mayor – valor menor
 Intervalos no traslapados: R = [valor mayor – valor menor] + 1 unidad de
medida
B. Determinación del número de Intervalos de Clase: El intervalo es un

símbolo que define una clase, se fija una determinada amplitud para cada
intervalo, pueden ser:
9
 Semiabiertos (traslapado) [a,b>; contiene siempre al valor inferior pero no el
superior.
 Intervalos con límites reales de Clase: valores numéricos enteros, los
intervalos de clase no se traslapan. Para transformarlo al intervalo de clase
semiabierto se debe elegir adecuadamente sus límites de clase, sin modificar
sus frecuencias. Los limites reales de los intervalos de clase se obtendrán
restando y sumando 0.5 (mitad de la unidad de medida = 1) al límite inferior y
superior.
a) La determinación del número de intervalos de clase, se emplea uno de

los siguientes métodos:
 Es conveniente tener entre 5 y 20 intervalos de clase: Si n  25  k  5 ; Si
n  25  k  n
 Si k =2c  n el número de clases es la potencia c

 Fórmula de Sturges: K = 1 + 3.32 log n
Cuando los resultados para obtener K son números reales con decimales,
se redondean al entero inmediato mayor.
b) La determinación del Tamaño de clase (amplitud)

 Amplitud de Clase: Es la diferencia que hay entre el extremo superior y el
extremo inferior de cada intervalo de clase. Se recomienda que todas las
clases tengan la misma amplitud: c  R /K
Tabla de distribución de frecuencia
Valor de X
Porcentaj
Marca de fi Fi hi Hi
Clase e 100 hi
clase
[LI1 – LS1> (LI1+ LS1) / 2 F1 F1 h1 H1
[LI2 – LS2> (LI2+ LS2) / 2 F2 F2 h2 H2
. . . . . .
. . . . . .
[Lik – LSk> (Lik+ LSk) / 2 Fk Fk = n hk Hk = 1
10
k k
Total f
i 1
i n h
i 1
i n
2.3. Presentación de la Información mediante Gráficos.
Los gráficos dan una idea mucho más sintética que los cuadros estadísticos, unas
veces su finalidad es simplemente tratar de demostrar la evolución de un
determinado fenómeno, pues mientras que la interpretación de un cuadro estadístico
requiere ciertos conocimientos, cualquiera puede comprender fácilmente que una
línea ascendente indica un aumento del fenómeno estudiado.
 Gráficos de Barras: La diferencia reside en que no se necesita mostrar

frecuencias en el eje, sino que puede expresar los datos en cantidades
absolutas e incluso en porcentaje. En un gráfico de barras es posible mostrar
más de un valor a la vez.
 Diagrama del Pastel: Es una forma efectiva de desplegar los porcentajes en

que se dividen los datos, es particularmente útil si se quiere hacer hincapié en
los tamaños relativos de los componentes de los datos. Los presupuestos y la
información económica se describen con frecuencia mediante el diagrama del
pastel.
Un círculo completo de 360°, representa el número total de observaciones. El

tamaño de las porciones es proporcional a la frecuencia relativa de cada
categoría. Ejemplo. Si la frecuencia relativa de una categoría es 0.25, esa
porción será el 25 % de 360°, es decir 90° ( un cuarto de círculo ). El diagrama
de pastel puede representar de manera efectiva datos cuantitativos una vez
que han sido organizados en categorías.
 Histograma: Se parece a un diagrama de barras por lo que no hay espacio

entre las barras. Revela detalles y estructuras que los datos brutos no muestran
con claridad. Es fácil distinguir la frecuencia relativa de cada clase, al mismo
tiempo que su frecuencia absoluta, como no hay espacio entre las barras, que
es la razón por la que el histograma se usa con frecuencia para datos con
escala de intervalos o de razón: Las barras adyacentes indica que se está
11
resumiendo un intervalo numérico que muestra las frecuencias de clases
elegidas arbitrariamente.
 Polígono de Frecuencias: Proporciona claramente el perfil del patrón de los

datos. Expresa la distribución de los datos por medio de una sola línea que una
las marcas de clase. Es una práctica corriente de extender ambos extremos del
polígono de frecuencias hasta el eje horizontal en aquellos puntos que serán
las marcas de las clases adyacentes a cada extremo.
 Ojiva: La gráfica de una distribución de frecuencias acumuladas se llama ojiva

y se usa para determinar cuántas observaciones hay mayores o menores que
un valor determinado en una distribución.
 Escalas Usadas en el Trazado de un Gráfico: La mayoría de los gráficos se

presentan mediante los “Sistemas de coordenadas rectangulares” que son
aquellos formados por la intersección de dos rectas en ángulo recto. De estas
dos rectas la horizontal o la abscisa se destinará para las diferentes clases de
la variable que se utiliza y la vertical u ordenadas, para anotar la frecuencia.
Las escalas de medida que se usan deben ser de la misma longitud o algo
mayor la horizontal que la vertical. En general, las dos escalas deben guardar
una proporción 1 a 1 y 1 a 2, es decir que si la ordenada mide 10 cm, la abscisa
debe medir entre 10 y 20 cm. Esta exigencia se hace con el fin de no
distorsionar el fenómeno que se estudia.
12
III. DESCRIPCIÓN DE DATOS: MEDIDAS DE POSICIÓN.
Son medidas que permiten determinar el centro o punto central de un conjunto de datos, su
determinación precisa puede variar en función de cómo definimos el centro; se divide en
tres categorías:
A. Las que ayudan a encontrar el centro de la distribución de frecuencias relativa, se

denominan medidas de tendencia central, entre estas tenemos: media aritmética,
mediana y moda de datos agrupados y no agrupados.
B. Las que miden su dispersión: Se denominan medidas de variación: varianza y
desviación típica de datos agrupados y no agrupados.
C. Las que descubren la posición relativa de una observación dentro de un conjunto de
datos: Se denominan medidas de posición relativa: Cuartiles, deciles y percentiles de
datos agrupados y no agrupados.
3.1. Medidas de tendencia central
3.1.1. A partir de datos no agrupados
A. Media aritmética: De un conjunto de valores numéricos es la suma de estos

valores dividida entre el número de valores.
Media Poblacional Media Muestral

N  = media poblacional x = media nmuestral
 xi X = suma de todos los valores de los
 i 1 X = suma de  xitodos los valores de
datos de la población. i 1
N
N = tamaño de la población los datosX  n
n = tamaño de la muestra.
Características de la Media Muestral

 Todo conjunto de datos medidos en una escala tienen una media.
 Tiene propiedades matemáticas valiosas que permite usarla en otros cálculos.
 Es sensible a valores extremos.
 La suma de las desviaciones de la media de los números en el conjunto de datos
es cero:
 ∑ ( X - µ ) = 0 ; ∑ ( X -X ) = 0
13
 La suma de los cuadrados de las desviaciones de la media de los números en el
conjunto de datos es un valor mínimo: ∑ (X - µ)² es un valor mínimo y ∑ (X -X)²
es un valor mínimo.
B. Media Aritmética Ponderada: En la discusión sobre la media, se asume que

cada observación era de igual importancia. Sin embargo, en ciertos casos,
puede querer darse mayor peso a algunas de las observaciones. Toma en
cuenta la importancia relativa de las observaciones. Se utiliza la fórmula:
WX
Xw  X w = Media ponderada
W
X = Es la observación individual
W = Es el peso o ponderación asignadas a

C. La mediana: Es la observación cada
central una asignación
observación vez puestos los datos en serie
ordenada. En un conjunto de datos con un número impar de observaciones está
posición central es: Posiciónde la mediana ( N  1 ) / 2
Si hay un número par de observaciones, la mediana es la media aritmética de los dos

valores centrales.
Características de la Mediana:
 Todo conjunto de datos tiene una mediana
 La mediana no es sensible a los valores extremos
 No tienen ciertas propiedades matemáticas valiosos para poderla usar en otros
cálculos.
D. La moda: Es el valor que ocurre con más frecuencia. Si los datos ocurren con
una frecuencia de dos, más de una vez, los datos no tendrán moda.
Características de la Moda:
 Algunos conjuntos de datos no tienen una moda.
 Algunos conjuntos de datos tienen más de una moda.
 No tienen ciertas propiedades matemáticas valiosos para usarla en otros
cálculos.
14
3.1.2. A partir de datos agrupados: Al trabajar con datos que han sido agrupados
en una distribución de frecuencia, no se conoce cuales son las observaciones
individuales. Se supone que las observaciones en cada clase son iguales al
punto medio de la clase. Le compensa debido a que posiblemente algunas de
las observaciones superen al punto medio, mientras que otros queden por
debajo de él. Dada esta suposición; se debe de tener en cuenta la frecuencia
y los puntos medios de cada clase cuando se calcula la media utilizando
datos agrupados.
fM fM
A. Media aritmética: X ag  
n f
f = Frecuencia o números de observaciones de cada frase
M = Es el punto medio de cada clase (marca de clase)
n = tamaño de la muestra, igual a las frecuencias sumadas en todas las clases
B. La mediana: Es la observación de la mitad después que se han colocado

los datos en una serie ordenada.
 Primero se debe hallar la clase de la mediana de la distribución de

frecuencia. La clase mediana es la clase cuya frecuencia acumulada es
n 1
mayor que o igual a
2
n/2 F 
Mediana  Lmd   c
 fmd 
Lmd = Es el límite inferior de la clase mediana
F = frecuencia acumulada de la clase que antecede a la clase mediana
fmd = Es la frecuencia de la clase de la mediana
C = es el intervalo de clase de la clase de la mediana
Nota: La media y la mediana identifican el centro del conjunto de datos

alrededor del cual se encuentran las observaciones
15
C. Moda: Como por definición la moda es la observación que ocurre con mayor
frecuencia; se hallará en la clase que tenga la frecuencia más alta, llamada
la clase modal. Se utiliza la siguiente formula.
 Da 
Moda  Lmo   (c)
 Db  Da 
Relación entre la media, mediana y la moda: Las diferencias entre valores

de la media, la mediana y la moda permiten sabe la forma de la curva de
frecuencia en términos de asimetría. Para una distribución unimodal simétrica,
el valor de la media, la mediana y la moda es igual (Fig. a).
Para una distribución asimétrica positiva, la media es el mayor valor de los

tres y al mediana s mayor que la moda pero menor que la media (Fig. b)
Para una distribución asimétrica negativa, la media es el menor valor de los

tres y la mediana es inferior a la moda pero mayor que la media (Fig. c).
El coeficiente de asimetría de Pearson, es una medida conocida de asimetría

que utiliza la diferencia observada entre la media y al mediana de un grupo
de valores.
Si la  = 10.5, la mediana = 11.0 y moda = 11.0, nos indica que la

distribución tiene una ligera asimetría negativa (esta sesgada hacia la
izquierda).
16
3.2. Medidas de posición relativa
Una medida de posición de una observación específica es su rango percentil.
3.2.1. Percentiles: El primer percentil es el valor por debajo del cual se localizan no
más del 1 % de las observaciones, y el resto por encima. Por lo tanto, los
percentiles son valores que dividen la muestra ordenada en forma ascendente
o descendente en 100 partes iguales.
La localización del percentil P-esimo se determina así:
L p = Es el emplazamiento del percentil deseado en la serie ordenada.

L p = (n+1) P
n = Es el número de observaciones.
100
P = Es el percentil deseado.
Utilizaremos los percentiles solamente para datos agrupados en intervalos de

clases.
1% 2% 50% 98% 99% 100%
P1 P2 P50 P98 P99
er
P1 = 1 percentil, deja 1% de las observaciones menores o iguales a él y el
99% superiores a él.
avo
P99 = 99 percentil, deja 99% de las observaciones menores o iguales a él
y el 1% superiores a él.
17
IV. MEDIDAS DE DISPERSIÓN O DE VARIABILIDAD
Nos indica la dispersión de los datos en la escala de medición, responden a la pregunta

¿En dónde están diseminadas las puntuaciones o valores obtenidos?
Una medida de dispersión indica el grado en que las observaciones individuales se

dispersan o distribuyen en alrededor de su media.
Las medidas de tendencia central son valores en una distribución y las medidas de
variabilidad son intervalos, designan distancias o un número de unidades en la escala de
medición.
Debemos tener en consideración que una medida de dispersión se puede utilizar para
describir con más detalle un conjunto de datos y dar una idea sobre la naturaleza de las
observaciones que han sido recogidas para su análisis, entre estas tenemos:
4.1. El rango:
Es la diferencia entre la puntuación mayor y la menor en un conjunto de datos y nos

da al menos una impresión de la estructura del conjunto de datos. Indica el número
de unidades de la escala de medición necesaria para incluir los valores máximo y
mínimo. También se le denomina “recorrido”.
Cuanto más grande sea el rango, mayor será la dispersión de los datos de una
distribución. Siempre que la distribución contenga un valor extremo, el rango indicara
una variación excesiva.
4.2. Varianza y desviación estándar
4.2.1. Varianza: Es la media aritmética de los cuadrados de las desviaciones de las

observaciones respecto de su media aritmética. Hay que determinar:
 La cantidad que cada observación se desvía de su media aritmética
 Elevar al cuadrado 4estas desviaciones
18
 Hallar la media de estas desviaciones respecto de la media elevada al
cuadrado.
Varianza de la población Varianza de la muestra

( x i   ) 2 ( x i  x ) 2
2  S2 
N n 1
Problemas que plantea la varianza: Entre estas tenemos:
 Es un número bastante grande en relación con las propias observaciones;

es varias veces mayor incluso que la mayor de ellas. Por su tamaño, casi
siempre resulta difícil trabajar con la varianza.
 Por estar las desviaciones elevadas al cuadrado, la varianza se expresa

siempre en las unidades de los datos iniciales elevadas al cuadrado (soles,
años, personas elevadas al cuadrado).
En la mayoría de los casos la varianza se expresa en unidades que no tienen

margen sentido ni interpretación lógica.
La varianza de una muestra se divide por n – 1; porque tenemos n – 1 grados

de libertad, que es igual al número de observaciones menos, las restricciones
impuestas a dichas observaciones. Una restricción es cualquier valor que haya
de ser calculado a partir de las observaciones.
La varianza utiliza el valor de media x , que funciona como una restricción y

disminuye en 1 los grados de libertad.
Una muestra está algo menos dispersa que la población de la que se toma. Por
lo tanto hay una tendencia a que la desviación típica o estándar de la muestra
sea algo menor que la desviación estándar de la población.
Se ha intentado utilizar el valor de la desviación estándar de la muestra (S)

como una estimación de la desviación estándar de la población (), que será
menor siempre. Se ha de comprender esta condición mediante el aumento
19
artificial de S, y para ello dividimos por un número algo pequeño n –1, en lugar
de hacerlo por n.
4.2.2. Desviación Estándar: Es la cantidad típica en la que los valores de conjunto

de datos diferentes de la media. Describe el grado en que un conjunto de datos
se dispersa alrededor de su media. S  S2
Una desviación estándar pequeña significa que los valores tienden a estar
muy cerca de la media. Una desviación estándar grande indica que los valores
se encuentran ampliamente dispersos alrededor de su media.
La desviación estándar es de enorme importancia en los negocios:
En finanzas la desviación estándar se utiliza para medir el riesgo asociado a

varias oportunidades de inversión. Al medir la variabilidad de las tasas de
rendimiento que ofrecen distintas inversiones, el analista financiero puede
calibrar el nivel de riesgo que extraña cada activo. Por lo general, cuanto mayor
sea la desviación estándar de la tasa de rendimiento de una inversión
determinada, mayor será el grado de riesgo.
Método abreviado:
 2  N 2 2  nx 2
2    2 ; S2  S  S2
N n 1
 f M 2  nx 2
De datos agrupados: S2  S  S2
n 1
Nota
 La varianza mide el grado de dispersión de la observaciones individuales en
torno a su media
 El método abreviado reduce el cálculo aritmético, pero no informa sobre la
naturaleza de la varianza.
20
4.2.3. Desviación Media: Es la media aritmética de las desviaciones respecto a la
media aritmética, son tener en cuenta los signos; es decir, tomando el valor
absoluto, puede utilizarse otros promedios (ejemplo la mediana).
N i  X n i  X
DM   datos agrupados DM   fi
i 1 N i 1 N
Si la distribución de frecuencias es bastante grande y simétrica, se considera

que en el intervalo.
 
X  DM  X  DM ; X  DM , están concentrados el 58% de datos
4.2.4. El coeficiente de variación.- Sirve como medida relativa de dispersión. Mide

el grado de dispersión de un conjunto de datos en relación con su media.
S
CV  (100)
x
Es una dispersión relativa que mide el grado de homogeneidad de un conjunto
de datos. Le considera homogéneo cuando tiene una mayor concentración
alrededor de la media aritmética.
CV  6% datos homogéneos
En la práctica se acostumbra a considerar el CV superior al 50 % indica alto

grado de dispersión y pequeña representatividad de la media aritmética.
En cuanto a valores inferiores a 50%, la media será tanto más representativa,

cuanto menor será el CV.
Cuando las variables de dos distribuciones se expresan en unidades diferentes

(años, Centímetros) no tiene sentido comparar los estadísticos de dispersión de
diferentes unidades pues ellos quedan influenciados por dichas unidades, esto
puede superarse mediante el CV, ya que esta estadística no tiene unidad.
21
22

Separata MI - MGGS PDF

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Separata MI - MGGS PDF

Diunggah oleh

Hak Cipta:

Format Tersedia

Módulo I

MÓDULO I: ESTADÍSTICA DESCRIPTIVA Pág.

I. ESTADÍSTICA E INVESTIGACIÓN CIENTÍFICA. DEFINICIÓN

II. ORGANIZACIÓN Y PRESENTACIÓN DE DATOS………….. 9

III. DESCRIPCIÓN DE DATOS: MEDIDAS DE POSICIÓN…….. 13

IV. MEDIDAS DE DISPERSIÓN O DE VARIABILIDAD…………. 18

I. ESTADÍSTICA E INVESTIGACIÓN CIENTÍFICA. DEFINICIÓN DE TÉRMINOS

1.1. Introducción a la Estadística

Definición preliminar: Es una herramienta estadística para trabajar con un conjunto

¿En qué áreas se aplica la estadística?

Ejemplos de su aplicación son:

A) En Administración de Empresas: la estadística se utiliza para evaluar un

La estadística es una ciencia que nos proporciona métodos científicos

1.2. Clasificación de la Estadística

Básicamente la Estadística se clasifica en:

1.2.1. ESTADÍSTICA DESCRIPTIVA. Es la rama de la estadística que estudia los

1.2.2. ESTADÍSTICA INFERENCIAL. Es un método científico que nos permite

a) La población es finita: es un número determinado de elementos en caso

1.3. Clasificación de las Variables

1.3.1. Según la naturaleza de la variable

A. Variables Cualitativas o Categóricas: Son aquellas cuyos valores expresan

a) Variables Nominales: Son aquellas en donde no existe un orden

b) Variables Ordinales: Son aquellas en donde existe un orden preestablecido

También podemos considerar como variables ordinales por ejemplo grado de

B. Variables Cuantitativas: Son aquellas que se obtienen como resultado de

a) Variables Discretas: Son aquellas cuyos valores resultan como

b) Variables Continuas: Son aquellas cuyos valores se obtienen por

1.3.2. Según la funcionalidad que tienen en la investigación

C. Variable Dependiente: La variable dependiente es determinada por el

D. VARIABLE INDEPENDIENTE: La variable independiente es aquella que será

 La variación en los precios de un determinado artículo, motiva cambios en

 El costo de producción de un artículo, determina su precio de venta. En este

Precio de venta = Y Costo de producción = X

2.1. Tabla de Distribución de Frecuencias:

Una distribución de frecuencias es un arreglo de los valores observados X1, X2,

 Es antieconómico y poco práctico tratar con un número grande de observaciones

Se ha de elegir el número de intervalos que equilibre estos dos aspectos y se evite el

2.2. Procedimiento para construir una Tabla de Frecuencias de Distribución de una

A. Determinación del Rango:

B. Determinación del número de Intervalos de Clase: El intervalo es un

a) La determinación del número de intervalos de clase, se emplea uno de

 Si k =2c  n el número de clases es la potencia c

b) La determinación del Tamaño de clase (amplitud)

Tabla de distribución de frecuencia

[Lik – LSk> (Lik+ LSk) / 2 Fk Fk = n hk Hk = 1

2.3. Presentación de la Información mediante Gráficos.

 Gráficos de Barras: La diferencia reside en que no se necesita mostrar

 Diagrama del Pastel: Es una forma efectiva de desplegar los porcentajes en

Un círculo completo de 360°, representa el número total de observaciones. El

 Histograma: Se parece a un diagrama de barras por lo que no hay espacio

 Polígono de Frecuencias: Proporciona claramente el perfil del patrón de los

 Ojiva: La gráfica de una distribución de frecuencias acumuladas se llama ojiva

 Escalas Usadas en el Trazado de un Gráfico: La mayoría de los gráficos se

A. Las que ayudan a encontrar el centro de la distribución de frecuencias relativa, se

3.1. Medidas de tendencia central

3.1.1. A partir de datos no agrupados

A. Media aritmética: De un conjunto de valores numéricos es la suma de estos

Media Poblacional Media Muestral

Características de la Media Muestral

B. Media Aritmética Ponderada: En la discusión sobre la media, se asume que

W = Es el peso o ponderación asignadas a

Si hay un número par de observaciones, la mediana es la media aritmética de los dos