Conceptos Bsicos
de Estadstica
Clase No. 1
Alonso Bermdez M., MDE
Qu es la estadstica?
Mtodos y procedimientos destinados a recoger,
clasificar, resumir, hallar regularidades, analizar los
datos y realizar inferencias con el fin de ayudar a
la toma de decisiones y en su caso formular
predicciones.
CLASIFICACIN
ESTADSTICA
DESCRIPTIVA
ESTADSTICA
INFERENCIAL
Describe, analiza y
representa un grupo de
datos utilizando
mtodos numricos y
grficos que resumen y
presentan la
informacin contenida
en ellos.
Discretas
Variables cuantitativas
Continuas
Qu incluye un problema
estadstico?
Definicin clara del objetivo del experimento y de
la poblacin pertinente.
de
bondad
MUESTREO
Se utiliza cuando surgen preguntas de cmo
seleccionar la informacin y qu tan grande debe ser
el tamao de la muestra para que las conclusiones e
inferencias acerca de alguna caracterstica de una
poblacin sean representativas.
Poblacin pequea
Censo
Poblacin grande
Muestreo
CLASIFICACIN
Sin reposicin
TIPOS DE MUESTREO
Con reposicin
ESTADSTICA
DESCRIPTIVA
DATOS
CUALITATIVOS
ESTADSTICA DESCRIPTIVA
DATOS CUALITATIVOS
Se miden en
escala
Nominal
Ordinal
Se representan
en
Grficos
Diagramas de
Barras
Diagramas de Sectores
Tablas
Frecuencia
Contingencia
ANLISIS DE VARIABLES
CUALITATIVAS
Ejemplo:
Se recolectaron datos
sobre el nivel
acadmico de 120
empleados de una
empresa
REPRESENTACIN TABULAR
FRECUENCIA
FRECUENCIA
RELATIVA
Bachiller
40
0,33
40
0,33
Tcnico
27
0,23
67
0,56
Tecnlogo
27
0,23
94
0,78
Profesional
20
0,17
114
0,95
0,05
120
1,00
CLASE
Posgrado
DIAGRAMA DE BARRAS
45
40
35
30
25
20
15
10
5
0
Bachiller
Tcnico
Tecnlogo
Profesional
Posgrado
DIAGRAMA DE SECTORES
FRECUENCIAS RELATIVAS
0.05
0.17
0.33
0.23
0.23
Bachiller
Tcnico
Tecnlogo
Profesional
Posgrado
TABLAS DE CONTINGENCIA
La empresa del ejemplo anterior consta de tres plantas
y sus empleados estn distribuidos de la siguiente
forma:
Diagrama de Barras:
18
16
14
12
Bachiller
Tcnico
Tecnlogo
Profesional
Posgrado
10
8
6
4
2
0
Planta A
Planta B
Planta C
Diagrama de Barras:
45
40
35
Posgrado
Profesional
Tecnlogo
Tcnico
Bachiller
30
25
20
15
10
5
0
Planta A
Planta B
Planta C
DATOS
CUANTITATIVO
S
ESTADSTICA DESCRIPTIVA
DATOS CUANTITATIVOS
Se dividen en
Discretos
Continuos
Se miden en
escalas
Razn
Se representan
en
Intervalos
Se resumen en medidas
de
Grficos
Tablas
Centralidad
Histogramas
Frecuencia
Agrupada
Media
Varianza
Mediana
Rango
Moda
Coeficiente de
Variacin
Boxplot
Diagramas de
Dispersin
Frecuencia no
Agrupada
Variabilidad
A) ESTADSTICOS DESCRIPTIVOS
1. Medidas de Tendencia Central:
. Media Aritmtica
. Mediana: Es el valor que divide los datos en dos
partes
iguales cuando estos se presentan en orden
de magnitud creciente o decreciente.
. Moda: Valor que ocurre con mayor frecuencia.
A) ESTADSTICOS DESCRIPTIVOS
2. Medidas de Colocacin:
)
)
Percentiles
Cuartiles
3. Medidas de Dispersin:
)
Rango:
Varianza:
ESTADSTICA BSICA I
A) ESTADSTICOS DESCRIPTIVOS
3. Medidas de Dispersin:
Rango Semi-intercuartil:
Coeficiente de Variacin:
Desviacin Estndar :
B) REPRESENTACIN DE DATOS
Ejemplo:
Se recolectaron datos
sobre las notas
correspondientes a los
cursos de matemticas
de un grupo de 50
estudiantes.
TABLA DE FRECUENCIAS
Al resumir grandes cantidades de datos, es til
distribuir los datos en clases o categoras y
determinar el nmero de individuos que
pertenecen a cada clase, llamado frecuencia de
clase. Una disposicin tabular de los datos por
clases junto con las correspondientes frecuencias
de clase, se llama distribucin de frecuencias. Los
datos as organizados en clases como en la
anterior distribucin de frecuencias se llaman
datos agrupados.
TABLA DE FRECUENCIAS
Reglas Generales Para la Distribucin de Frecuencias:
TABLA DE FRECUENCIAS
Para nuestro ejemplo, la tabla de frecuencias
correspondiente a matemticas es:
GRFICOS
Histograma
Histograma - Matemticas
Frecuencia
18
16
14
12
10
8
6
4
2
0
Frecuencia
Clase
GRFICOS
Boxplot
Proporciona informacin
sobre
el
centro,
la
dispersin y la simetra
de
un
conjunto
de
observaciones. En l se
pueden ubicar valores
como los cuartiles, la
media, la mediana y los
valores
mximo
y
mnimo de los datos
tica en la estadstica
Usos ilegtimos de la estadstica
Comparar datos que no siempre son
comparables
Derivar conclusiones de datos no
representativos
Esconder parte de las evidencias
Manipular representaciones grficas
Confundir asociacin con causalidad
Derivar conclusiones que no pueden
sostenerse con la evidencia disponible
Medir cambio a partir de bases inadecuadas
Interpretaciones acomodaticias
tica en la estadstica
Continuacin de usos ilegtimos de la estadstica
Buenas matemticas y malas estadsticas
Grficas engaosas
Informacin insuficiente
Muestras pequeas
Confundir estimaciones con conjeturas
Uso de por cientos en forma distorsionada
Datos parciales
Distorsiones deliberadas
Preguntas predispuestas
Presin del encuestador
Definiciones
Estadstica
Ciencia que trata sobre la
recopilacin,
organizacin,
presentacin,
anlisis
e
interpretacin de informacin,
con apoyo matemtico, a travs
de
estudios
investigativos
cientficamente diseados y
realizados con el objetivo de
tomar decisiones respecto a un
problema.
Estadstica Inferencial
Es la rama de la estadstica que
utiliza informacin obtenida del
estudio de una muestra para hacer
inferencias sobre la poblacin.
Comprende la aplicacin de una serie
de tcnicas estadsticas
especializadas que permiten inferir
las caractersticas de la poblacin.
Poblacin
Es la totalidad de sujetos
(personas, animales, u objetos)
que comparten en comn la
caracterstica o variable bajo
estudio.
Representa el universo de donde
se extrae una muestra.
Muestra
La muestra es un subconjunto de la
poblacin
Muestra representativa- Tiene las
mismas caractersticas de la
poblacin en la misma proporcin.
En una muestra representativa
cada sujeto en la poblacin tiene la
misma oportunidad de ser
seleccionado.
Parmetro y Estadgrafo
ParmetroMedida que se obtiene por medio
del estudio de una poblacin.
Estadgrafo o estadsticaMedida que se obtiene por medio
del estudio de una muestra.
Tipos de Muestreo
Muestreo Aleatorio
Tipos de muestreo aleatorio:
Simple
Conglomerado o grupos intactos
Estratificado
Sistemtico
Muestreo Simple
Cada sujeto de la poblacin (N) tiene
la misma probabilidad de ser elegido.
Se tiene una lista de los n sujetos de
la muestra rotulados o identificados
con un nmero.
Se utilizan mtodos de seleccin tipo
urna o al azar. Puede ser con
reemplazo o sin reemplazo.
Muestreo Simple
Muestreo Simple
Muestreo Sistemtico
Se usa este muestreo cuando se tiene una
lista de los N miembros de la poblacin.
Se llama sistemtico porque se selecciona
sistemticamente cada k-simo miembro de
la lista de la poblacin.
O sea, si k es 50, se selecciona cada
50-simo sujeto de la lista
El primer sujeto de la muestra se halla al
azar.
Luego, se determina la fraccin que nos da
el nmero k.
Muestreo Sistemtico
Ejemplo: N es 15,000. Se desea
seleccionar una muestra que represente el
2% de la poblacin.
n
300
1
N 15,000 50
Observa que el
numerador de la
fraccin es 1.
Muestreo Sistemtico
Continuacin: N es 15,000, n es 300, k es 50.
Se selecciona al azar el primer sujeto de la
muestra entre 1 y k. Supn que
seleccionamos el sujeto nmero 37.
El segundo sujeto de la muestra ser el 50simo sujeto despus del primero, o sea:
37 + 50 = 87.
El tercer sujeto ser: 87 + 50 = 137.
Se contina seleccionando los dems sujetos
cada 50-simo sujeto despus de anterior
hasta completar los 300 sujetos de la muestra.
Muestreo Sistemtico
Muestras simples o sistemticas podran no
ser representativas de la poblacin.
Por qu?
Supn que la lista est por orden alfabtico,
qu probabilidad tiene de salir el primer y
el ltimo sujeto de la lista?, Si hay dos
hermanos en la lista, qu probabilidad hay
de que salgan ambos?
Recomendacin: La lista de la poblacin
debe estar organizada aleatoriamente.
Si se utiliza una lista alfabtica, se debe
asegurar que est libre de sesgo.
Muestreo Sistemtico
El muestreo sistemtico es ms
conveniente que el muestreo simple
cuando se tiene una lista de la poblacin.
No siempre es tan fcil de obtener como
este ejemplo.
A veces se torna compleja cuando en la
1
fraccin
, k es decimal.
k
Se usa muestreo sistemtico cuando el
proceso de seleccin es ms fcil que el
muestreo simple.
En caso de que k sea decimal, quizs
conviene mejor usar el muestreo simple.
Muestreo Estratificado
Los muestreos anteriores asumen que la
poblacin es homognea.
Sin embargo, la poblacin pudiera ser
heterognea y consistir de varias
subpoblaciones o estratos.
Ejemplo: Estudiantes de una universidad.
Posibles estratos: Ao de estudio, subgraduadograduado, Programa acadmico, Gnero,
Diurno-Nocturno, etc.
Muestreo Estratificado
Proceso para seleccionar la muestra estratificada:
Se dividen los N sujetos en subpoblaciones o
estratos de acuerdo a la caracterstica en comn
que se interesa estudiar.
Se realiza un muestreo aleatorio simple (o
estratificado) en cada estrato para sacar sujetos
dentro de cada uno.
Se unen todos los sujetos de las muestras
aleatorias separadas para formar la muestra.
La muestra seleccionada dentro de cada estrato
puede ser la misma para todos los estratos o
puede ser proporcional a cada subpoblacin.
Muestreo Estratificado
En algunos casos, el muestreo estratificado es ms
eficiente que los mtodos anteriores porque
garantiza representacin de la caracterstica que se
interesa estudiar, principalmente en la misma
proporcin que la subpoblacin estudiada.
Pero, esta no es la razn principal.
Muestreo simple tiende a distribuirse
proporcionalmente.
En el muestreo estratificado, si los estratos son
heterogneos, aumenta la precisin estadstica.
Esto es muy deseable cuando se va a determinar el
proceso de seleccin de la muestra.
Si se disminuye la variacin en la distribucin
muestral de la medida estadstica que se utilice, los
resultados sern ms precisos.
Muestreo No-Aleatorio
Tipos de muestreo no-aleatorio Juicio, opinin del investigador o
subjetivo
Voluntarios
Conveniencia
No hay tal cosa como muestreo casi
aletaorio. O la muestra es aleatoria
o no lo es.
Muestreo No-Aleatorio
Juicio de investigador o subjetivoEl investigador decide, de acuerdo a su
experiencia y su juicio, la muestra que mejor
podra usar.
VoluntariosEl investigador utiliza los sujetos que estn
disponibles voluntariamente para participar.
ConvenienciaEl investigador utiliza los sujetos que estn
disponibles de acuerdo a cierta conveniencia
pre-establecida. Ejemplo: sujetos que estn en
cierto lugar en el momento adecuado, etc.
Muestreo No-Aleatorio
Cuestionarios por correoCuando se envian cuestionarios por correo, an
si la muestra fue aleatoria, no representar
muestreo aleatorio. El que devuelve el
cuestionario contestado decide voluntariamente
participar.
Tipos de Datos
DatosCifras, nmeros, cantidades,
puntuaciones, ndices, cualidades o
atributos.
Datos
Categricos
Cuantitativos
Discretos
Contnuos
Tipos de Variables
Tipos de Escalas
NominalSe agrupan los datos solamente en
clases o categoras que son mutuamente
excluyentes y no tienen un orden en
particular.
Ej. Variables categricas tales como:
gnero, religin, partido poltico
Tipos de Escalas
OrdinalSe agrupan los datos en categoras que
tiene un orden especfico pero no se
puede diferenciar entre s la magnitud o
el alcance de los valores de las distintas
categoras.
Ej. Variables categricas tales como:
clase social, minerales de acuerdo a
tipo de resistencia (mucha, regular o
poca), grado de agresividad (mucha,
poca, ninguna)
Tipos de Escalas
IntervaloSe agrupan los datos en categoras que
representan un orden especfico y
adems ese orden implica un intervalo
especfico de diferencias entre las
distintas categoras que es igual para
todas las categoras. El valor 0 es un
valor ms, no implica ausencia de la
caracterstica.
Ej.- Variables cuantitativas tales como:
temperatura, cociente intelectual
Tipos de Escalas
RaznSe agrupan los datos en categoras que
representan un orden especfico en el
cual las diferencias entre las distintas
categoras son iguales para todas las
categoras y adems el 0 implica la
ausencia de la caracterstica.
Ej. Variables cuantitativas contnuaspeso, estatura, edad
Fin de la Leccin