Anda di halaman 1dari 91

Conceptos Básicos y

Estadística Descriptiva
Concepto de Estadística

Se refiere a un conjunto de métodos


para manejar la obtención,
presentación y análisis de
observaciones numéricas.

Tema 1. Introducción
Concepto de Estadística

Sus fines son describir al conjunto de


datos obtenidos y tomar decisiones o
realizar generalizaciones acerca de las
características de todas las
observaciones bajo consideración.

Tema 1. Introducción
Áreas que conforman a la Estadística

Estadística Descriptiva (Deductiva):


es la encargada de la organización,
condensación, presentación de los
datos en tablas y gráficos y del
cálculo de medidas numéricas que

Tema 1. Introducción
permitan estudiar los aspectos más
importantes de los datos.

DESCRIBIR
Áreas que conforman a la Estadística

Estadística Inferencial: está definida


por un conjunto de técnicas,
mediante las cuales se hacen
generalizaciones o se toman
decisiones en base a información

Tema 1. Introducción
parcial obtenida mediante técnicas
descriptivas.

INFERIR
Áreas de Aplicación de la Estadística
 El uso de la Estadística es muy amplio.
Resulta difícil nombrar un área en la cual no
se emplee.
 Los métodos estadísticos han encontrado
aplicación en:
 Gobierno
 Negocios

Tema 1. Introducción
 Ciencias Sociales
 Ingeniería
 Ciencias Física y Naturales
 Control de Calidad
 Procesos de Manufactura
 Muchos otros campos de la actividad intelectual.
Áreas de Aplicación de la Estadística

 Esto se debe a la creciente facilidad con la cual se


pueden manejar grandes cantidades de datos
numéricos, debido al uso de …

Tema 1. Introducción
Conceptos de Población y Muestra
 Población: es la colección de todas las
posibles mediciones u observaciones que
pueden hacerse de una variable bajo
estudio.

Tema 1. Introducción
Conceptos de Población y Muestra

 Se clasifica en dos categorías:


 Finita: es aquella que incluye una cantidad limitada
contable de observaciones, individuos o medidas.
Siempre que sea posible alcanzar (contar) el número
total de todas las posibles mediciones, se considera
como finita la población.

Tema 1. Introducción
Conceptos de Población y Muestra
 Infinita: es aquella que incluye un gran conjunto
de observaciones o mediciones que no pueden
alcanzarse por conteo. Al menos,
hipotéticamente, no existe límite en cuanto al
número de observaciones que el experimento
puede generar.

Tema 1. Introducción
Conceptos de Población y Muestra

 Muestra:
 es un conjunto de mediciones u observaciones
tomadas a partir de una población.
 es un subconjunto de la población.

Tema 1. Introducción
Conceptos de Población y Muestra
 Muestra aleatoria: se considera aleatoria
siempre y cuando cada observación,
medición o individuo de la población tenga
la misma probabilidad de ser seleccionado.

Tema 1. Introducción
Tipos de datos y escalas de medida

 Variables:
 Son las características o lo que se estudia de
cada individuo de la muestra. Ejemplo: sexo,
edad, peso, estatura, color de ojos, estado civil,
temperatura, cantidad de nacimientos, presión,
grosor, diámetro, ...
 Datos:

Tema 1. Introducción
 Son los valores que toma la variable en cada
caso.
Tipos de datos
 Cualitativos: son datos que solo toman valores
asociados a las cualidades o atributos,
clasificándolos en una de varias categorías, es decir,
no son valores numéricos. Ejemplo:
 Sexo: f/m.
 Hábito de fumar: Fumador/No fumador
 Color de ojos: negro, azul, marrón, …

Tema 1. Introducción
 Religión: católica, evangélica, …
 Estado civil: soltero, casado, divorciado,…
Tipos de datos
 Cuantitativos: provienen de variables que pueden
medirse, cuantificarse o expresarse numéricamente.
Ejemplos:
 Peso
 Edad
 Estatura
 Presión

Tema 1. Introducción
 Humedad
 Intensidad de un sismo
 Cantidad de hermanos
Escalas de medida
 Tipos de variables cuantitativas:

 Discretas: es aquella que solo puede tomar un


número finito o infinito numerable de valores.
Ejemplo: cantidad de hermanos.
 Continuas: es la variable que puede tomar
cualquier valor en una escala continua. Ejemplo:

Tema 1. Introducción
cantidad de líquido contenido en un recipiente.
Escalas de medida

 Escala Nominal.
Variables Cualitativas
 Escala Ordinal.

 Escala de Intervalos.
Variables
 Escala de Razón o Proporción. Cuantitativas

Tema 1. Introducción
 Escala Absoluta.
Escalas de medida

 Escala nominal: los datos se pueden


agrupar en categorías que no mantienen
una relación de orden entre si, por lo
tanto no están definidas las operaciones
lógicas (>, <, , ) sino solo las de
igualdad o diferencia.

Tema 1. Introducción
Ejemplos: color de ojos, sexo, profesión,
estado civil, religión.
Escalas de medida
 Escala ordinal: existe un cierto orden o
jerarquía entre las categorías (>, <, , ).

Ejemplos: grados militares, organigrama de


una empresa, escalafón de los profesores
universitarios.

Tema 1. Introducción
Escalas de medida

 Escala de Intervalos: valores numéricos


de las variables y además de las
relaciones de orden (>, <, , ), se
pueden establecer distancias, es decir,
tienen sentido las operaciones de suma y
resta. Tiene dos propiedades:

Tema 1. Introducción
 Existe una unidad de medida que se mantiene
constante para todos los valores que toma la
variable.
 Existe un valor patrón u origen relativo que
no significa la ausencia de valor en la
variable.
Escalas de medida

 Ejemplo: temperatura, nivel de


ruido, movimientos sísmicos.

Tema 1. Introducción
Escalas de medida
 Escala de razón o proporción: es la más
completa y general de todas las escalas. Se
caracteriza porque los valores de la variable
son números entre los cuales, además de las
relaciones de orden (>, <, , ) y distancia
(+,-), se pueden establecer múltiplos y
proporciones.

Tema 1. Introducción
Ejemplos: peso, altura, volumen…
Escalas de medida
 Escala Absoluta: se caracteriza porque los valores
que toma la variable son el resultado de contar y
por lo tanto, está constituida por los enteros
positivos y el cero.

Ejemplos: número de hermanos, cantidad de autos


vendidos, cantidad de accidentes en una intersección,
cantidad de hijos,…

Tema 1. Introducción
Datos Univariantes y Multivariantes

 Univariantes o unidimensionales: sólo


recogen información sobre una
característica (Ejemplo: edad de los
alumnos de una clase).

 Bivariantes o bidimensionales: recogen


información sobre dos características de la

Tema 1. Introducción
población. (Ejemplo: edad y estatura de los
alumnos de una clase).
Datos Univariantes y Multivariantes

 Multivariantes o pluridimensionales:
recogen información sobre tres ó más
características. (Ejemplo: edad, estatura y
peso de los alumnos de una clase).

Tema 1. Introducción
Abusos que se pueden cometer con la
Estadística

 Conclusiones erróneas debido a que los datos


son numéricamente insuficientes.
 Representaciones gráficas engañosas
(escalas).
 Datos muestrales no representativos:
 Muestra que no incluye a elementos de toda la

Tema 1. Introducción
población.
 Ciertas categorías de personas no responden
correctamente.
 Respuestas voluntarias (sesgadas).
TEMA 2. ESTADÍSTICA DESCRIPTIVA
Organización de los datos

Una vez que se ha


realizado la recolección
de los datos, se obtienen

Tema 2. Estadística Descriptiva


datos en bruto, los cuales
rara vez son significativos
sin una organización y
tabulación.
Organización de los datos
 Formas de organizar los datos:
 Un arreglo: es la forma más sencilla de
organizar los datos en bruto, consiste en

Tema 2. Estadística Descriptiva


colocar las observaciones en orden según su
magnitud: ascendente o descendente.
 Poco práctica cuando se tiene una gran
cantidad de datos.
Organización de los datos
 Una distribución de frecuencias: es un
arreglo de los datos que permite expresar
la frecuencia de ocurrencias de las
observaciones en cada una de las clases,

Tema 2. Estadística Descriptiva


mostrando el patrón de la distribución de
manera más significativa.

Clase Pto. fi Fi fri FRi


Medio
Organización de los datos

 La Distribución de Frecuencias:
 Se recomienda su uso cuando se tienen
grandes cantidades de datos (n).

Tema 2. Estadística Descriptiva


 Su construcción requiere, en primer
lugar, la selección de los límites de los
intervalos de clase.
 Para definir la cantidad de intervalos de
clase (k), se puede usar:
 La regla de Sturges: k = 1 + 3.3log(n)
 k = n
Organización de los datos
 La cantidad de clases no puede ser tan
pequeño (menos de 5) o tan grande (más
de 20), que la verdadera naturaleza de la
distribución sea imposible de visualizar.

Tema 2. Estadística Descriptiva


 La amplitud de todas las clases deberá ser
la misma. Se recomienda que sea impar y
que los puntos medios tengan la misma
cantidad de cifras significativas que los
datos en bruto.
 Los límites de las clases deben tener una
cifra significativa más que los datos en
bruto.
Organización de los datos

 Determinar:
 Punto medio = (Li+Ls)/2.
Frecuencia absoluta de la clase (fi).

Tema 2. Estadística Descriptiva


 Frecuencia acumulada de la clase (Fi).


 Frecuencia relativa de la clase (fri):
 fri = fi/n
 Frecuencia relativa acumulada de la
clase (FRi).
Ejemplos de Distribución de
Frecuencias
A continuación se presentan las calificaciones
de 60 estudiantes

Tema 2. Estadística Descriptiva


Ejemplos de Distribución de Frecuencias

23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 98 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61

a) Construya una distribución de frecuencias.


b) Qué puede concluir de estos datos.
Representación gráfica de los datos

 Los gráficos permiten visualizar en forma


global y rápida el comportamiento de los
datos.

Tema 2. Estadística Descriptiva


 Para datos cuantitativos agrupados en clases,
comúnmente se utilizan tres gráficos:
 Histogramas.
 Polígono de frecuencias.
 Ojiva o Polígono de frecuencias acumuladas.
Representación gráfica de los datos

Histograma
Representación gráfica de los datos

Tema 2. Estadística Descriptiva


Histograma y Polígono de Frecuencias
Representación gráfica de los datos

Ojiva

Tema 2. Estadística Descriptiva


Representación gráfica de los datos

 Para datos cualitativos se usan:


 Curvas
Barras

Tema 2. Estadística Descriptiva


 Sectores
Representación gráfica de los datos

Barras

Barras
Representación gráfica de los datos

Curvas
Representación gráfica de los datos
Sectores, torta o circular

Tema 2. Estadística Descriptiva


Ejemplos de construcción
de gráficos

Tema 2. Estadística Descriptiva


Medidas de tendencia central o posición

 Corresponden a valores que generalmente se ubican


en la parte central de un conjunto de datos.

Forma como los datos pueden condensarse en un

Tema 2. Estadística Descriptiva



solo valor central alrededor del cual todos los datos
muestrales se distribuyen.
Medidas de tendencia central o
posición

 Las medidas de tendencia central más


importantes son:

Tema 2. Estadística Descriptiva


 Media: Aritmética y Aritmética ponderada.
 Mediana.
 Moda.
Media Aritmética
 Es la suma de todas las observaciones dividida entre
el número total de observaciones.
 Expresada de forma más intuitiva, podemos decir
que la media aritmética es la cantidad total de la

Tema 2. Estadística Descriptiva


variable distribuida a partes iguales entre cada
observación.
 Por ejemplo, si en una habitación hay tres personas,
la media de dinero que tienen en sus bolsillos sería
el resultado de tomar todo el dinero de los tres y
dividirlo a partes iguales entre cada uno de ellos. Es
decir, la media es una forma de resumir la
información de una distribución (dinero en el bolsillo)
suponiendo que cada observación (persona) tendría
la misma cantidad de la variable.
Cálculo de la media aritmética
 Para datos no agrupados:
n

x

Tema 2. Estadística Descriptiva


i
X i 1
n
 Para datos agrupados:
k

m f i i
X i 1
n
Donde: mi: punto medio de la clase i
fi: frecuencia absoluta de la clase i
k: cantidad de clases
Mediana
 Es el valor que ocupa la posición central de un
conjunto de observaciones, una vez que han sido
ordenados en forma ascendente o descendente.

Tema 2. Estadística Descriptiva


 Divide al conjunto de datos en dos partes iguales.
Cálculo de la mediana
 Para datos no agrupados:

 Si n es impar: posición donde se ubica la

Tema 2. Estadística Descriptiva


mediana es igual a (n+1)/2.

 Si n es par: (n+1)/2 no es entero, por lo tanto la


mediana será igual al promedio de las dos
posiciones centrales.
Cálculo de la mediana
 Datos agrupados: clase mediana es la
que contiene a la observación que
ocupa la posición n/2.

Tema 2. Estadística Descriptiva


n 1
 F ( xm1 )
Md  Lm  2 Cm
f ( xm )

Donde: Lm: límite inferior de la clase mediana.


F(xm-1): frecuencia acumulada de la clase
anterior a la clase mediana.
f(xm): frecuencia absoluta de la clase mediana.
Cm: amplitud de la clase mediana.
Moda
 Observación o clase que tiene la mayor frecuencia
en un conjunto de observaciones.

Un conjunto de datos puede ser unimodal, bimodal o

Tema 2. Estadística Descriptiva



multimodal.

 Es la única medida de tendencia central que se


puede determinar para datos de tipo cualitativo.
Cálculo de la moda
 Para datos no agrupados: es simplemente la
observación que más se repite.

Para datos agrupados:

Tema 2. Estadística Descriptiva


1
Mo  Lim  Cm
1   2
Donde: Lim: límite inferior de la clase modal.
1: diferencia entre fi de la clase modal y la
anterior.
2: diferencia entre fi de la clase modal y la
posterior.
Cm: amplitud de la clase modal (clase de mayor
frecuencia).
Relación entre la media, la mediana y
la moda

Tema 2. Estadística Descriptiva


Cuando los datos son sesgados es mejor emplear la Md
Propiedades, ventajas y desventajas
de la media
Propiedades:
 La suma de las diferencias entre las media muestral y el
valor de cada observación es cero.

Tema 2. Estadística Descriptiva


 La media de una constante es la constante.

 Si todas las observaciones xi se multiplican por una


constante a, la X también se debe multiplicar por ese
mismo valor constante.
Propiedades, ventajas y desventajas
de la media

 Si se somete a una variable estadística X a un


cambio de origen y escala, Y = a + bX, la media
aritmética de dicha variable X varía en la misma
proporción.

Tema 2. Estadística Descriptiva


 La media de la suma de dos variables es igual a la
suma de sus medias.
Propiedades, ventajas y desventajas
de la media
Ventajas:
 Emplea en su cálculo toda la información disponible.

 Se expresa en las mismas unidades que la variable

Tema 2. Estadística Descriptiva


en estudio.

 Es el centro de gravedad de toda la distribución,


representando a todos los valores observados.

 Es una valor único.


Propiedades, ventajas y desventajas
de la media

 Se trata de un concepto familiar para la mayoría de


las personas.

Es útil para llevar a cabo procedimientos estadísticos

Tema 2. Estadística Descriptiva



como la comparación de medias de varios conjuntos
de datos.
Propiedades, ventajas y desventajas
de la media
Desventajas:
 Se ve adversamente afectada por valores extremos,
perdiendo representatividad.

Tema 2. Estadística Descriptiva


 Si el conjunto de datos es muy grande puede ser
tedioso su cálculo manual.

 No se puede calcular para datos cualitativos.

 No se puede calcular para datos que tengan clases


de extremo abierto, tanto superior como inferior.
Ventajas y desventajas de la mediana

Ventajas:
 Fácil de calcular si el número de observaciones no es
muy grande.

Tema 2. Estadística Descriptiva


 No se ve influenciada por valores extremos, ya que
solo influyen los valores centrales.

 Fácil de entender.
Ventajas y desventajas de la mediana

 Se puede calcular para cualquier tipos de datos


cuantitativos, incluso los datos con clase de extremo
abierto.

Tema 2. Estadística Descriptiva


 Es la medida de tendencia central más
representativa en el caso de variables que solo
admiten la escala ordinal.
Ventajas y desventajas de la mediana

Desventajas:
 No utiliza en su “cálculo” toda la información
disponible.

Tema 2. Estadística Descriptiva


 No pondera cada valor por el número de veces que
se ha repetido.

 Hay que ordenar los datos antes de determinarla.


Ventajas y desventajas de la moda
Ventajas:
 No requiere cálculos.
 Puede usarse para datos tanto cuantitativos como
cualitativos.

Tema 2. Estadística Descriptiva


 Fácil de interpretar.
 No se ve influenciada por valores extremos.
 Se puede calcular en clases de extremo abierto.
Ventajas y desventajas de la moda
Desventajas:
 Para conjuntos pequeños de datos su valor no tiene
casi utilidad, si es que de hecho existe. Solo tiene
significado en el caso de una gran cantidad de datos.

Tema 2. Estadística Descriptiva


 No utiliza toda la información disponible.

 No siempre existe, si los datos no se repiten.


Ventajas y desventajas de la moda
 En ocasiones, el azar hace que una sola observación
se no representativa se el valor más frecuente del
conjunto de datos.
 Difícil de interpretar si los datos tiene 3 o más

Tema 2. Estadística Descriptiva


modas.
Medidas de dispersión, variación o
variabilidad.

 Son valores numéricos que indican o describen la


forma en que las observaciones están dispersas o
diseminadas, con respecto al valor central.

Tema 2. Estadística Descriptiva


Medidas de dispersión, variación o
variabilidad.

 Son importantes debido a que dos


muestras de observaciones con el mismo
valor central pueden tener una variabilidad

Tema 2. Estadística Descriptiva


muy distinta.
Medidas de dispersión, variación o
variabilidad.

 Rango.
 Varianza.
 Desviación Típica.

Tema 2. Estadística Descriptiva


 Coeficiente de variación.
Medidas de dispersión: Rango
Rango (amplitud o recorrido):

 Está determinado por los dos valores extremos de


los datos muestrales, es simplemente la diferencia

Tema 2. Estadística Descriptiva


entre la mayor y menor observación.

 Es una medida de dispersión absoluta, ya que


depende solamente de los datos y permite conocer
la máxima dispersión.
Medidas de dispersión: Rango
 Casi no se emplea debido a que depende
únicamente de dos valores.

No proporciona una medida de variabilidad de las

Tema 2. Estadística Descriptiva



observaciones con respecto al centro de la
distribución.

 Notación: R
Medidas de dispersión: Varianza
 Es un valor numérico que mide el grado de
dispersión relativa porque depende de la posición de
los datos x1,x2,…,xn con respecto a la media.

Tema 2. Estadística Descriptiva


 Es el promedio al cuadrado de las desviaciones de
cada observación con respecto a la media.

 Notación: s2, 2, var(X)


Medidas de dispersión: Varianza
 Si la varianza de un conjunto de observaciones es
grande se dice que los datos tiene una mayor
variabilidad que un conjunto de datos que tenga un
varianza menor.

Tema 2. Estadística Descriptiva


 x  x 
n
2
i
Para datos NO s2  i 1

agrupados: n
n

 i
x 2
2
s 
2 i 1
x
n
Medidas de dispersión: Varianza
Para datos agrupados en una distribución de
frecuencias:

k

 i
m  x 2
 fi
s2  i 1

n
k

 i  fi
m 2

s2  i 1
 x 
2

n
Medidas de dispersión: Desviación
Típica

 Es la raíz cuadrada de la varianza.


 Notación: s, .

Tema 2. Estadística Descriptiva


s s 2
Medidas de dispersión: Coeficiente de
Variación

 Es una medida de dispersión relativa que


permite comparar el nivel de dispersión
de dos muestras de variables estadísticas

Tema 2. Estadística Descriptiva


diferentes.
 No tiene dimensiones.
 Notación: CV

s
CV  100%
x
Ventajas y Desventajas del Rango
Ventajas:
 Útil cuando se quiere conocer la extensión de las
variaciones extremas (valor máximo de la
dispersión).

Tema 2. Estadística Descriptiva


 Fácil de calcular.
Ventajas y Desventajas del Rango
Desventajas:
 No es una MD con respecto al centro de la
distribución.
 Solo emplea dos valores en su cálculo.

Tema 2. Estadística Descriptiva


 No se puede calcular en distribuciones de límite de
clase abierto.
Propiedades, Ventajas y Desventajas
de la Varianza

Propiedades:
1. Siempre es mayor o igual a cero y menor
que infinito.

Tema 2. Estadística Descriptiva


2. La varianza de una constante es cero.
3. Si a una variable X la sometemos a
Y=a+bX, la varianza de Y será Var(Y) =
b2Var(X)
Propiedades, Ventajas y Desventajas
de la Varianza

Ventajas:
 Es útil cuando se compara la variabilidad
de dos o más conjuntos de datos.

Tema 2. Estadística Descriptiva


 Utiliza toda la información disponible.
Desventajas:
 No proporciona ayuda inmediata cuando
se estudia la dispersión de un solo
conjunto de datos.
 Difícil de interpretar por tener sus
unidades elevadas al cuadrado.
Ventajas y Desventajas de la
Desviación Típica

Ventajas:
 Esta expresada en las mismas unidades que la
variable en estudio.
 Utiliza todas las observaciones en su cálculo.

Tema 2. Estadística Descriptiva


 Fácil de interpretar.

Desventajas:
 No tiene.
Ventajas y Desventajas del Coeficiente
de Variación

Ventajas:
 Es la única MD que permite comparar el nivel de
dispersión de dos muestras de variables diferentes.
 Emplea toda la información disponible en su cálculo.

Tema 2. Estadística Descriptiva


 Fácil de calcular.
Ventajas y Desventajas del Coeficiente
de Variación

Desventaja:
 No es una MD con respecto al centro de la
distribución de los datos.

Tema 2. Estadística Descriptiva


Medidas de Forma
 Son medidas numéricas que permiten determinar la
forma que tiene la curva de los datos, por lo tanto,
sirven para corroborar lo que los gráficos muestran.

Tema 2. Estadística Descriptiva


Coeficiente de Pearson
-Asimetría
Medidas Coeficiente de Fisher
de forma
-Kurtosis o apuntamiento
Medidas de Forma: Asimetría
 Permiten estudiar la forma de la curva, dependiendo
de cómo se agrupan los datos.

Tema 2. Estadística Descriptiva


Medidas de Forma: Asimetría
Coeficiente de Asimetría de Pearson:
 Fácil de calcular e interpretar.

 Cálculo:
 

Tema 2. Estadística Descriptiva


3 X  Md
ASP 
s
o Interpretación:
= 0, X=Md Simétrica

ASP > 0, X>Md Asimétrica Positiva

< 0, X<Md Asimétrica Negativa


Medidas de Forma: Asimetría
Coeficiente de Asimetría de Fisher:
 No es de fácil cálculo, pero si su
interpretación.

Tema 2. Estadística Descriptiva


 x  X 
n
3
i
ASF  i 1
3
Datos NO agrupados
ns

 M 
k
3
i  x  fi
ASF  i 1 Datos Agrupados
ns 3
Medidas de Forma: Asimetría

o Interpretación:
= 0, Simétrica

Tema 2. Estadística Descriptiva


ASF > 0, Asimétrica Positiva

< 0, Asimétrica Negativa


Medidas de Forma: Kurtosis
 Miden si los valores de la distribución están más o
menos concentrados alrededor de los valores medios
de la muestra (zona central de la distribución).

Tema 2. Estadística Descriptiva


 Se definen tres tipos de distribución según su grado
de Kurtosis:
Medidas de Forma: Kurtosis

 Mesocúrtica: grado de concentración medio


alrededor de los valores centrales de la
variable.

Tema 2. Estadística Descriptiva


 Leptocúrtica: grado de concentración
elevado.
 Platicúrtica: grado de concentración
reducido.
Medidas de Forma: Kurtosis

 x  X 
n
4
i
CK  i 1
4
3 Datos No Agrupados
ns

Tema 2. Estadística Descriptiva


 M 
k
4
i  X  fi
CK  i 1
4
3 Datos Agrupados
ns
Interpretación:

=0 Mesocúrtica

CK >0 Leptocúrtica

<0 Platicúrtica
Referencias:

 Walpole y Myers. Probabilidad y


Estadística. Mc Graw-Hill.
 Triola, Mario F. Estadística. Pearson.

Anda mungkin juga menyukai