1.1
Estadística es la ciencia que estudia las “regularidades” que se observan en una serie de
fenómenos que pueden expresarse a través de la información numérica.
Viene del Latín status
RAMAS: Estadística descriptiva = Recogida de datos históricos. Es un método deductivo
Calculo de probabilidades = Razonamiento matemático. Es un método deductivo
Inferencia estadística = Trabaja a partir del cálculo de probabilidades. Método
inductivo
ETAPAS DE LA INVESTIGACIÓN ESTADÍSTICA
Definición del objetivo
Encuesta censal = Toda la población
Recogida de datos poblacionales
Encuesta muestral =Parte de la
población
Descripción y estimación de los parámetros poblacionales
1
= Huygens recopila los trabajos de los anteriores y aparece la
sistematización del Cálculo de probabilidades (1669)
S. XVIII y XIX = Movidos por el intento de la contrastación empírica sobre
astronomía y Física, destacaron Jacobo y Damiel Bernouilli,
Abraham de Moivre, Laplace, Gauss, Poisson y Chebychev
S. XX = Autores clásicos de la escuela rusa son Markov, Liapounoff y Kolmogoroff
De la escuela francesa destacaron Borel, Levy, Lebesgue y Fréchet
1.4 LA INFERENCIA ESTADÍSTICA
Arranca EN el s. XVIII con Laplace y Gauss
Tres corrientes = La escuela Inglesa
Inferencia Bayesiana
Teoría de la decisión
La escuela Inglesa destaca por sus estudios biológicos = Pearson, Gosset, Fisher y
Neyman
Influencia Bayesiana = Nace a partir del sacerdote Thomas Bayes (Teorema de
Bayes)
Le siguen Ramsey, Bruno de Finetti y Savage con la
Probabilidad subjetiva
2
CAPITULO II – Estadística descriptiva – Distribución de frecuencias
CONCEPTOS FUNDAMENTALES:
Población
Muestra
Atributos
Escalas de medición
Variables estadísticas
TAREAS
Las investigación estadística tiene 3 fases: Selección de objetivo
Recogida de datos
Estimaciones
3
Muestra
Todo subconjunto representativo de la población
Lo válido para la muestra se convierte en general para la población
Censal = Todos los elementos de la población
Estudio muestral = Parte o subconjunto de la población
Atributo
Característica no medible numéricamente
Da lugar a modalidades
Escala nominal = Clasifica las modalidades del tributo
Escala ordinal = Clasifica por gradación u ordenación las modalidades del
atributo
Ejemplo: 1 = Muy malo
2 = Malo
3 = Regular
4 = Bueno 2 Malo (Bueno no es igual a 2 veces Malo)
5 = Muy bueno
Variables
Características de la muestra / población susceptibles de tomar valores
numéricos
Se les aplican las escalas de Intervalo
Razón o Proporción
Escala de intervalos
Permiten una unidad de medida y un origen (0) arbitrario
Podemos calcular la distancia entre 2 observaciones cualesquiera
No permiten operaciones matemáticas
De Razón o proporción
Además de las característica de la escala de intervalos, incorporan un origen no
arbitrario (0 absoluto)
4
Diseño del Material Auxiliar
Recogida de datos
Tratamiento de datos
3ª Etapa.- Estimación y Descripción
Análisis descriptivo primario
Estimación de errores (Muestrales y No muestrales)
Análisis especial multivariables
1ª ETAPA – No hay nada que decir está bien claro lo que hay que hacer
2ª ETAPA.- RECOGIDA DE DATOS ESTADÍSTICOS
Diseño del cuestionario
Claridad en el lenguaje = evitar términos técnicos, usar un lenguaje sencillo
Precisión en las preguntas = Concretas y cortas para obtener respuestas precisas
No influir en la respuesta = Evitar preguntas que contengan juicios de valor
Evitar preguntas indiscretas = Aquellas que impliquen la intimidad del entrevistado
Cuidar el orden = Primero, las sencillas, al final las delicadas y complejas
Tipos de preguntas
Abiertas = La respuesta es totalmente libre
Cerradas = la respuesta se especifica y el entrevistado debe escoger una opción
Dicotómicas = Dos alternativas de respuesta
Múltiples = Varias respuestas predefinidas
Directas e Indirectas
Diseño Muestral
Muestreo Aleatorio Simple (MAS)
De N elementos se seleccionan n de forma aleatoria (sin reemplazamiento)
Muestreo estratificado (Se emplea mucho en la práctica)
Consiste en dividir la población en grupos homogéneos internamente
Debe existir gran diferencia entre los estratos
Permite hacer estimaciones sobre cada estrato (subpoblación)
Muestreo por conglomerados
Agrupaciones de población de naturaleza heterogénea dentro de ellos
Muestreo sistemático
Sistemático por que lo único aleatorio es el arranque
El inconveniente es que hay que numerar toda la población
Ejemplo:
1º N = 100 n = 5 (estratos) N/n = 20
2º Se obtiene un número aleatorio entre 1 y 20 (supongamos 12 = n 1)
3º Se obtiene n sumando 20 + n1 (20 + n1 = 32 = n2)
n3 = 20 + n2 (20 + 32 = 52)
n4 = 20 + n3 (20 + 52 = 72)
n5 = 20 + n4 (20 + 72 = 92)
Muestreo polietápico (Se aplica en la práctica cuando se hacen estudios sociales)
Es básicamente una mezcla de distintos tipos de muestreo, principalmente el
MAS y el estratificado)
Ejemplo:
En una manzana de casas escoger N personas al azar pero necesariamente 50%
hombre y 50% mujeres (Muestreo por cuotas)
Abarata mucho la recogida de datos
No tiene rigor científico
No se pueden estimar errores muestrales ni establecer intervalos de confianza
5
Material auxiliar
Hojas de control de trabajo de campo
Partes de incidencias
Recogida de datos (Es la parte esencial)
Entrevistas personales
Entrevistas personales ayudadas por ordenador (Control de inconsistencias)
Entrevistas telefónicas ayudadas por ordenador
Tratamiento de los datos
Programa de validación
Listado de inconsistencias
6
DISTRIBUCIÓN DE FRECUENCIAS UNIDIMENSIONALES
Las llamamos unidimensionales por sólo observamos una característica
Tipos:
Datos no agrupados
Datos agrupados en intervalos de clase
DATOS NO AGRUPADOS
Se observan los valores de la característica (X) Tabulación
Si la variable admite ordenación éstos se ordenan de menor a mayor de datos
Si hay valores repetidos se agrupan (si x se repite n veces entonces n*x)
Tipos: Tabla X
Unitarios = Los que no tienen valores repetidos 150
175
Ejemplo: Las rentas anuales de 5 familias son 200
200 u.m.,150 u.m., 300 u.m., 250 u.m. y 175 u.m. 150
300
1, 3, 0, 1, 0, 2, 2, 1, 2, 0, 1, 1, 4, 1, 1, 1, 1, 1, 0, 2
Tabla X
x n
0 4
Veces que
1 Valores 10 se repite
2 posibles 4 cada Valor
3 1 de x
4 1
Frecuencia total N = n = 20
Frecuencia relativa f = n / N “ f0 = n0 / N = 4/20=0,2 “ f1 = n1 / N = 10/20 = 0,5
* La suma de las frecuencias relativas = 1
Frecuencia absoluta acumulada ascendente Ni un determinado valor ordenado de
menor a mayor xi al numero de datos que son menores o iguales a él
Se representa:
n
i = N nj
J=1
i R
F i = fj F i = f j
j=1 j = i+ 1
7
Ejemplo
xi ni fi Ni Ni Fi Fi
150 1 1/5 1 (sólo hay 1 valor igual o menor) 5 1/5** 4/5***
175 1 1/5 2 (hay 2 valores ig. o men. a él) 4 2/5** 3/5***
200 1 1/5 3 (hay 3 valores -------“ ------) 3 3/5** 2/5***
250 1 1/5 4 (hay 3 valores -------“ ------) 2 4/5** 1/5***
300 1 1/5 5 (hay 3 valores -------“ ------) 1 1** 0***
Otro ejemplo
xi ni fi Ni Ni Fi Fi
0 4 4/20 4* 16** 1/5*** 4/5****
1 10 10/20 14*
6** 2/5*** 3/5****
2 4 4/20 18 * 2** 3/5*** 2/5****
3 1 1/20 19 * 1** 4/5*** 1/5****
4 1 1/20 20* 0** 1*** 0****
N = 20
* y ** deben sumar siempre N
*** y *** deben sumar siempre 1
8
16500 10050 12320 10000 22540
7325 13800 18300 14600 25000
17085 19000 11900 13760 15075
20210 7280 21200 23090 24500
15800 5000 13050 21600 17700
Después ordenaríamos de menor a mayor con lo que xmin = 5000 y xmax = 25000
Rango R = xr – x1 = xmax – xmin = x25 – x1 = 25000 - 5000 = 20000
Suponiendo que desearamos 5 clases o agrupamientos k = 5, la amplitud c = R / k =
= 2000 / 5 = 4000
Luego L0 = x1 = 5000
L1 = L0 + c = 5000 + 4000 = 9000
L2 = L1 + c = 9000 + 4000 = 13000
L3 = L2 + c = 13000 + 4000 = 17000
L4 = L3 + c = 17000 + 4000 = 21000
L5 = L4 + c = 21000 + 4000 = 25000
Marcas de clase
x1 = (L0 + L1)/ 2 = (5000 + 9000) / 2 = 7000
x2 = (L1 + L2)/ 2 = (9000 + 13000) / 2 = 11000
x3 = (L2 + L3)/ 2 = (13000 + 17000) / 2 = 15000
.......... .......... ...........
9
10