Anda di halaman 1dari 10

CAPITULO I – Generalidades y antecedentes históricos

1.1
Estadística es la ciencia que estudia las “regularidades” que se observan en una serie de
fenómenos que pueden expresarse a través de la información numérica.
Viene del Latín status
RAMAS: Estadística descriptiva = Recogida de datos históricos. Es un método deductivo
Calculo de probabilidades = Razonamiento matemático. Es un método deductivo
Inferencia estadística = Trabaja a partir del cálculo de probabilidades. Método
inductivo
ETAPAS DE LA INVESTIGACIÓN ESTADÍSTICA
Definición del objetivo
Encuesta censal = Toda la población
Recogida de datos poblacionales
Encuesta muestral =Parte de la
población
Descripción y estimación de los parámetros poblacionales

1.2 ESTADÍSTICA DESCRIPTIVA - Historia


 Herodoto (485-425 a de JC) relata que ya en Egipto (3050 a de JC) se elaboró un
censo de población y riqueza
 Se tienen noticias de que lo mismo hicieron los chinos
 Grecia y Roma efectuaron recuentos periódicos sobre riqueza con fines tributarios
 Edad Media = No se tienen noticias sobre operaciones estadísticas mas que sobre los
bienes de la Iglesia
 s. XVI = Nace la escuela mercantilista francesa con Colbert, Bufón y Condorcet
 De ella nacen la escuela Inglesa con Graunt, Petty, Halley, Davenant y King y la
Alemana con Seckendorf, Coring y Achenwall
 s. XVII (mediados) = Graunt Destaca por sus estudios demográficos
 s XVII (finales) = Petty efectúa estudios sobre demografía, Renta y Tráfico
Mercantil
 s. XVIII y XIX = Se produce un gran crecimiento de la estadística descriptiva y se
elaboran los primeros censos oficiales (1790 USA)

1.3 EL CÁLCULO DE PROBABILIDADES


Es la rama de las matemáticas que se basa en el razonamiento deductivo
 S. XVI = Cardano (1501 – 1576) y Galileo (1564 – 1642) son pioneros en esta rama
 S. XVII = Pascal (1623 – 1622) y Pierre de FermaT (1601 – 1665) comienzan con la
formalización del cálculo de probabilidades sobre los juegos de azar
propuesto por un jugador (Meré)

1
= Huygens recopila los trabajos de los anteriores y aparece la
sistematización del Cálculo de probabilidades (1669)
 S. XVIII y XIX = Movidos por el intento de la contrastación empírica sobre
astronomía y Física, destacaron Jacobo y Damiel Bernouilli,
Abraham de Moivre, Laplace, Gauss, Poisson y Chebychev
 S. XX = Autores clásicos de la escuela rusa son Markov, Liapounoff y Kolmogoroff
De la escuela francesa destacaron Borel, Levy, Lebesgue y Fréchet
1.4 LA INFERENCIA ESTADÍSTICA
 Arranca EN el s. XVIII con Laplace y Gauss
 Tres corrientes = La escuela Inglesa
Inferencia Bayesiana
Teoría de la decisión
 La escuela Inglesa destaca por sus estudios biológicos = Pearson, Gosset, Fisher y
Neyman
 Influencia Bayesiana = Nace a partir del sacerdote Thomas Bayes (Teorema de
Bayes)
Le siguen Ramsey, Bruno de Finetti y Savage con la
Probabilidad subjetiva

 Teoría de la Decisión = De Wald, aprovecha la influencia Bayesiana y aporta el


concepto de Función de pérdida
 Sociedad de Econometría = Fundada por Irwing Fisher, junto con Roos y Frish en
1930 aplican los conocimientos de inferencia estadística
sobre física, astronomía y ciencias naturales a la
Economía.

2
CAPITULO II – Estadística descriptiva – Distribución de frecuencias

CONCEPTOS FUNDAMENTALES:
Población
Muestra
Atributos
Escalas de medición
Variables estadísticas

TAREAS
Las investigación estadística tiene 3 fases: Selección de objetivo
Recogida de datos
Estimaciones

DISTRIBUCIÓN DE FRECUENCIAS UNIDIMENSIONALES


 Medidas de Posición
 Media
 Mediana
 Moda
 Cuartiles
 Medidas de dispersión
 Recorrido Relativo
 Intervalos intercuartílicos Semi-intercuartílico
 Varianza y Desviación típica
 Coeficiente de apertura
 Coeficiente de variación
 Medidas de forma
 Asimetría
 Curtosis
 Medidas de concentración o de desigualdad
 Índice de Gini
 Curva de Lorentz
 Estudio de las distribuciones
 Momentos potenciales

2.- CONCEPTOS FUNDAMENTALES


 Población
 También Universo o colectivo
 El conjunto de entes en general portadoras de una serie de características que nos
interesa estudiar
 Son finitas o infinitas, según el número de elementos que la componen

3
 Muestra
 Todo subconjunto representativo de la población
 Lo válido para la muestra se convierte en general para la población
 Censal = Todos los elementos de la población
 Estudio muestral = Parte o subconjunto de la población
 Atributo
 Característica no medible numéricamente
 Da lugar a modalidades
 Escala nominal = Clasifica las modalidades del tributo
 Escala ordinal = Clasifica por gradación u ordenación las modalidades del
atributo
Ejemplo: 1 = Muy malo
2 = Malo
3 = Regular
4 = Bueno  2 Malo (Bueno no es igual a 2 veces Malo)
5 = Muy bueno
 Variables
 Características de la muestra / población susceptibles de tomar valores
numéricos
 Se les aplican las escalas de Intervalo
Razón o Proporción
 Escala de intervalos
Permiten una unidad de medida y un origen (0) arbitrario
Podemos calcular la distancia entre 2 observaciones cualesquiera
No permiten operaciones matemáticas
 De Razón o proporción
Además de las característica de la escala de intervalos, incorporan un origen no

arbitrario (0 absoluto)

Permiten las operaciones aritméticas


 Unidimensionales = Una única variable (Edad de un grupo de niños)
 Bidimensionales = Dos variables (Edad y Sexo)
 Pluridimensionales = Más de dos variables
 Discretas = Toman un número finito o infinito numerable de valores
 Continuas = Toman un número infinito no numerable de valores

ETAPAS DE LA INVESTIGACIÓN ESTADÍSTICA


1ª Etapa.- Definición de objetivos
 Identificación de las características cualitativas y cuantitativas del estudio
 Definición de la población
 Marco = Soporte de los datos y su accesibilidad
 Decisión sobre Censo o Muestra, su tamaño y el presupuesto
 Ámbito y forma de recogida de datos
2ª Etapa.- Recogida de datos estadísticos
 Diseño del cuestionario
 Diseño muestral según el marco disponible

4
 Diseño del Material Auxiliar
 Recogida de datos
 Tratamiento de datos
3ª Etapa.- Estimación y Descripción
 Análisis descriptivo primario
 Estimación de errores (Muestrales y No muestrales)
 Análisis especial multivariables
1ª ETAPA – No hay nada que decir está bien claro lo que hay que hacer
2ª ETAPA.- RECOGIDA DE DATOS ESTADÍSTICOS
Diseño del cuestionario
 Claridad en el lenguaje = evitar términos técnicos, usar un lenguaje sencillo
 Precisión en las preguntas = Concretas y cortas para obtener respuestas precisas
 No influir en la respuesta = Evitar preguntas que contengan juicios de valor
 Evitar preguntas indiscretas = Aquellas que impliquen la intimidad del entrevistado
 Cuidar el orden = Primero, las sencillas, al final las delicadas y complejas
 Tipos de preguntas
 Abiertas = La respuesta es totalmente libre
 Cerradas = la respuesta se especifica y el entrevistado debe escoger una opción
 Dicotómicas = Dos alternativas de respuesta
 Múltiples = Varias respuestas predefinidas
 Directas e Indirectas
Diseño Muestral
 Muestreo Aleatorio Simple (MAS)
 De N elementos se seleccionan n de forma aleatoria (sin reemplazamiento)
 Muestreo estratificado (Se emplea mucho en la práctica)
 Consiste en dividir la población en grupos homogéneos internamente
 Debe existir gran diferencia entre los estratos
 Permite hacer estimaciones sobre cada estrato (subpoblación)
 Muestreo por conglomerados
 Agrupaciones de población de naturaleza heterogénea dentro de ellos
 Muestreo sistemático
 Sistemático por que lo único aleatorio es el arranque
 El inconveniente es que hay que numerar toda la población
Ejemplo:
1º N = 100 n = 5 (estratos) N/n = 20
2º Se obtiene un número aleatorio entre 1 y 20 (supongamos 12 = n 1)
3º Se obtiene n sumando 20 + n1 (20 + n1 = 32 = n2)
n3 = 20 + n2 (20 + 32 = 52)
n4 = 20 + n3 (20 + 52 = 72)
n5 = 20 + n4 (20 + 72 = 92)
 Muestreo polietápico (Se aplica en la práctica cuando se hacen estudios sociales)
 Es básicamente una mezcla de distintos tipos de muestreo, principalmente el
MAS y el estratificado)
Ejemplo:
En una manzana de casas escoger N personas al azar pero necesariamente 50%
hombre y 50% mujeres (Muestreo por cuotas)
 Abarata mucho la recogida de datos
 No tiene rigor científico
 No se pueden estimar errores muestrales ni establecer intervalos de confianza

5
Material auxiliar
 Hojas de control de trabajo de campo
 Partes de incidencias
Recogida de datos (Es la parte esencial)
 Entrevistas personales
 Entrevistas personales ayudadas por ordenador (Control de inconsistencias)
 Entrevistas telefónicas ayudadas por ordenador
Tratamiento de los datos
 Programa de validación
 Listado de inconsistencias

3ª ETAPA.- ESTIMACIÓN Y DESCRIPCIÓN


Análisis descriptivo primario
 Distribución de frecuencias
 Su representación gráfica
 Medidas de posición = Media, Mediana, Moda, Cuartiles
 Medidas de dispersión = Recorrido, Varianza, Desviación típica, etc
 Medidas de forma = Asimetría y Curtosis
Estimación de errores
 De muestreo = a priori
 Se define el tamaño de la muestra para asegurar unos errores máximos para
determinado nivel de fiabilidad
 Ajenos al muestreo = a posteriori
 Proceden de cuestionarios mal diseñados
 Deficiencias en la grabación de datos
 Validaciones inadecuadas
Análisis especiales multivariables
 Modelos de reducción de la dimensión
 Análisis factoriales
 Componentes principales
 Correlaciones canónicas
 Modelos causales
 Regresiones
 Análisis de la varianza
 Modelos de agrupaciones y clasificaciones
 Análisis de grupos y Discriminante
 Modelos dinámicos o de series temporales
 Estocásticos
 No estocásticos
 Modelización estadística
 Postulado del modelo
 Contraste de las hipótesis iniciales del modelo
 Estimación de los parámetros del modelo
 Validación
 Resultados finales.

CONSTRUCCIÓN NUMÉRICA Y GRÁFICA

6
DISTRIBUCIÓN DE FRECUENCIAS UNIDIMENSIONALES
 Las llamamos unidimensionales por sólo observamos una característica
 Tipos:
 Datos no agrupados
 Datos agrupados en intervalos de clase

DATOS NO AGRUPADOS
 Se observan los valores de la característica (X) Tabulación
 Si la variable admite ordenación éstos se ordenan de menor a mayor de datos
 Si hay valores repetidos se agrupan (si x se repite n veces entonces n*x)
 Tipos: Tabla X
 Unitarios = Los que no tienen valores repetidos 150
175
Ejemplo: Las rentas anuales de 5 familias son 200
200 u.m.,150 u.m., 300 u.m., 250 u.m. y 175 u.m. 150
300

 No unitarios = Los que tienen valores repetidos


 El conjunto de R datos distintos ordenados de menor a mayor
acompañados de sus respectivas frecuencias absolutas
 La característica x toma pocos valores pero se repiten gran número de
veces.
Ejemplo: En una comunidad de vecinos hemos preguntado a 20 de ellos por el número de personas que trabaja en cada familia,
sus respuestas han sido:

1, 3, 0, 1, 0, 2, 2, 1, 2, 0, 1, 1, 4, 1, 1, 1, 1, 1, 0, 2

Tabla X
x n
0 4
Veces que
1 Valores 10 se repite
2 posibles 4 cada Valor
3 1 de x
4 1

 Frecuencia total N =  n = 20
 Frecuencia relativa f = n / N “ f0 = n0 / N = 4/20=0,2 “ f1 = n1 / N = 10/20 = 0,5
* La suma de las frecuencias relativas = 1
 Frecuencia absoluta acumulada ascendente Ni un determinado valor ordenado de
menor a mayor xi al numero de datos que son menores o iguales a él
Se representa:
n
i = N nj 
J=1

 Frecuencia absoluta acumulada descendente Ni un determinado valor ordenado de


menor a mayor xi al numero de datos que son mayores o iguales a él
Se representa N con la hacia abajo
 Frecuencias relativas ascendentes y descententes

i R
F i = fj F i = f j
j=1 j = i+ 1

7
Ejemplo
xi ni fi Ni Ni Fi Fi
150 1 1/5 1 (sólo hay 1 valor igual o menor) 5 1/5** 4/5***
175 1 1/5 2 (hay 2 valores ig. o men. a él) 4 2/5** 3/5***
200 1 1/5 3 (hay 3 valores -------“ ------) 3 3/5** 2/5***
250 1 1/5 4 (hay 3 valores -------“ ------) 2 4/5** 1/5***
300 1 1/5 5 (hay 3 valores -------“ ------) 1 1** 0***

* El contrario que N hay 5 valores mayores o iguales a él


** y *** deben sumar siempre 1

Otro ejemplo
xi ni fi Ni Ni Fi Fi
0 4 4/20 4* 16** 1/5*** 4/5****
1 10 10/20 14*
6** 2/5*** 3/5****
2 4 4/20 18 * 2** 3/5*** 2/5****
3 1 1/20 19 * 1** 4/5*** 1/5****
4 1 1/20 20* 0** 1*** 0****
N = 20
* y ** deben sumar siempre N
*** y *** deben sumar siempre 1

 Todo lo anterior si se trata de variables o características de naturaleza cuantitativa,


si se tratara de atributos que toman distintas modalidades cualitativas, no tiene
sentido calcular las frecuencias a cumuladas
Ejemplo: A 100 personas se les ha preguntado su estado civil (x = casado, viudo,
soltero, otro)
xi ni fi
Casado 50 50/100
Viudo 15 15/100 La F = N
Soltero 25 25/100
Otro 10 10/100
N = 100

DATOS AGRUPADOS EN INTERVALOS DE CLASE


 Se realiza cuando el número de valores que puede tomar la característica X es muy
elevado por lo que es necesario agruparlos en intervalos
 Sólo tienen sentido en el caso de variables cuantitativas
 Conceptos:
 Recorrido o Rango R = xr – xi = max xi - min xi
 Amplitud del intervalo
 Clases:
 Constante c = R / k siendo k el número de clase o
agrupamientos
 Variable
 Marcas de clase = El valor medio entre 2 datos
x1 = (L0 + L1)/2 “ siendo L0 = x1, L1 = L0 + c, c = R / k (amplitud)
Ejemplo:
La recaudación de 25 días del mes ha sido

8
16500 10050 12320 10000 22540
7325 13800 18300 14600 25000
17085 19000 11900 13760 15075
20210 7280 21200 23090 24500
15800 5000 13050 21600 17700
Después ordenaríamos de menor a mayor con lo que xmin = 5000 y xmax = 25000
Rango R = xr – x1 = xmax – xmin = x25 – x1 = 25000 - 5000 = 20000
Suponiendo que desearamos 5 clases o agrupamientos k = 5, la amplitud c = R / k =
= 2000 / 5 = 4000
Luego L0 = x1 = 5000
L1 = L0 + c = 5000 + 4000 = 9000
L2 = L1 + c = 9000 + 4000 = 13000
L3 = L2 + c = 13000 + 4000 = 17000
L4 = L3 + c = 17000 + 4000 = 21000
L5 = L4 + c = 21000 + 4000 = 25000
Marcas de clase
x1 = (L0 + L1)/ 2 = (5000 + 9000) / 2 = 7000
x2 = (L1 + L2)/ 2 = (9000 + 13000) / 2 = 11000
x3 = (L2 + L3)/ 2 = (13000 + 17000) / 2 = 15000
.......... .......... ...........

Tabla agrupada de frecuencias


Intervalos Marcas de clase Frecuencia Absoluta
[5000,9000] 7000 3 (5000,7280,7325)
[9000,13000] 11000 4 (10050,12320,11900,10000)
[13000,17000] 15000 7 (las buscais en los datos)
[17000,21000] 19000 5 (idem anterior)
[21000,25000] 23000 6 (idem anterior)

Tabla de frecuencias agrupadas en intervalos de clase


Intervalos xi ni fi Ni Ni Fi Fi
[5000,9000] 7000 3 3/25 3 22 3/25 22/25
[9000,13000] 11000 4 4/25 7 18 7/25 18/25
[13000,17000] 15000 7 7/25 14 11 14/25 11/25
[17000,21000] 19000 5 5/25 19 6 19/25 6/25
[21000,25000] 23000 6 6/25 25 0 1 0
* Nota del autor = Os recuerdo que N + N = n y F + F = 1

9
10

Anda mungkin juga menyukai