Anda di halaman 1dari 40

ANÁLISIS DE

DATOS

Sesiones 1-2

ANÁLISIS DE DATOS
Diapositiva 1 Oscar de Azambuja D.
ESTADÍSTICA
DESCRIPTIVA

Descripción y Organización de
Datos

ANÁLISIS DE DATOS
Diapositiva 2 Oscar de Azambuja D.
Ramas de la Estadística

Estadística
Reunir
Analizar
Presentar
Interpretar
Datos
Descriptiva Inferencial

Resumir Estimar
Presentar características
Datos de la Población
a través de
muestras

Diapositiva 3
Conceptos Básicos
 Datos
 Conjunto de hechos obtenidos de la observación
de diversos elementos que contienen una o más
variables o características.

Datos Información Conocimiento

Diapositiva 4
1-8

Clasificación de datos
 Datos cuantitativos o numéricos: la variable
se puede registrar numéricamente.
 EJEMPLO: saldo en una cuenta de cheques,
minutos que faltan para que termine la clase,
número de niños en una familia.

Diapositiva 5
1-9

Datos Cuantitativos Discretos


 Los datos cuantitativos se pueden clasificar
como discretos o continuos.
 Datos discretos: sólo pueden adquirir ciertos
valores y casi siempre hay “brechas” entre
esos valores.
 EJEMPLO: el número de habitaciones en una
casa (1,2,3,..., etc.). El número de hijos que
tiene un matrimonio (0, 1, 2, 3…., etc).
 Los datos discretos se “cuentan”.

Diapositiva 6
1-10

Datos Cuantitativos Continuos

Datos continuos: Son datos cuantitativos que


pueden tomar cualquier valor dentro de un
intervalo específico.
 EJEMPLO: El tiempo que toma viajar de
Lima a Ica. El peso de un artículo.
 Los datos continuos se “miden”

Diapositiva 7
1-7

Clasificación de datos
 Datos cualitativos o atributos: la
característica o variable que se estudia
no es numérica.
 EJEMPLOS: Genero, afiliación
religiosa, tipo de automóvil que se
posee, lugar de nacimiento, color de
los ojos.

Diapositiva 8
Población y Muestra

Población Muestra
• TODOS los posibles • PARTE “representativa”
•Individuos, objetos, de la Población.
mediciones y conteos • Un ESTADÍSTICO describe
• Un PARÁMETRO describe a una Muestra.
a una Población.
Diapositiva 9
Resumen de Datos
 Distribución de Frecuencia
 Establecimiento de clases de datos que definen una
característica exclusiva.
 Asignación de cada dato a la clase correspondiente
 Cualquier dato pertenece sólo a una clase (mutuamente exclusivas).
 Siempre debe haber una clase que contenga a un dato
(completamente inclusivas).
 La frecuencia de la clase es la cantidad de datos que
pertenecen a dicha clase. Puede ser absoluta, relativa y
porcentual.

Diapositiva 10
Tipo de Clases
 Cuantitativas
 Discretas
 Continuas
 Cualitativas
 Emplean etiquetas o nombres para determinar las
categorías.

Diapositiva 11
Resumen de datos cuantitativos
 Clases compuestas por datos discretos (conteo) y
datos continuos (medición).
 Clases para datos continuos
 Escoger el número de clases
 Entre 5 y 15
 Determinar el mismo ancho para cada clase
 (Dato mayor-Dato menor)/número de clases
 Definir los límites inferiores y superiores de cada clase.
 Asignar los datos a cada clase
 Contar los datos en cada clase

Diapositiva 12
Intervalos de Clase
Límite Límite Ancho del
Inferior Superior Intervalo
0 9 10
Ancho
10-0 10 19 10
20 29 Ancho 10
30 39 39-29 10
40 49 10
50 59 10

Diapositiva 13
Tabla de
Distribución de Frecuencias
Proceso de llenado de sacos de azúcar
Variable de interés: peso en Kg.

Datos sin 49.3 51.6 49.8 50.6 51.2 50.1 49.9 49.5 51.7 50.0
Procesar: 50.3 50.4 48.8 49.8 49.7 50.5 50.2 50.0 50.6 49.9
50.0 51.5 49.4 50.9 50.0 48.9 50.3 50.2 49.5 51.0

 Rango: 51.7 – 48.8 = 2.9


 Núm. Clases: 6
 Intervalo de Clase: 2.9 ≈ 0.5
6

Diapositiva 14
Tabla de
Distribución de Frecuencias
Datos sin 49.3 51.6 49.8 50.6 51.2 50.1 49.9 49.5 51.7 50.0
Procesar: 50.3 50.4 48.8 49.8 49.7 50.5 50.2 50.0 50.6 49.9
50.0 51.5 49.4 50.9 50.0 48.9 50.3 50.2 49.5 51.0

Distribución Clase Conteo


de
Frecuencias 48.8-49.2 //
49.3-49.7 ////
49.8-50.2 //// //// /
50.3-50.7 //// /
50.8-51.2 ///
51.3-51.7 ///

Diapositiva 15
Tabla de
Distribución de Frecuencias
Datos sin 49.3 51.6 49.8 50.6 51.2 50.1 49.9 49.5 51.7 50.0
Procesar: 50.3 50.4 48.8 49.8 49.7 50.5 50.2 50.0 50.6 49.9
50.0 51.5 49.4 50.9 50.0 48.9 50.3 50.2 49.5 51.0

Distribución Clase Conteo Frecuencia


de
Frecuencias 48.8-49.2 // 2
49.3-49.7 //// 5
49.8-50.2 //// //// / 11
50.3-50.7 //// / 6
50.8-51.2 /// 3
51.3-51.7 /// 3

Diapositiva 16
Tabla de
Distribución de Frecuencias
Punto Medio de Clase
(48.8 + 49.2)/2 = 49.0

Distribución Clase Frecuencia


de
Frecuencias 48.8-49.2 2
49.3-49.7 5
49.8-50.2 11
50.3-50.7 6
50.8-51.2 3
51.3-51.7 3

Límite Superior
Límite Inferior

Diapositiva 17
Distribución de
Frecuencias Relativas

Distribución
de Clase Frec. Absoluta Frec. Relativa
Frecuencias
Relativas 48.8-49.2 2 0.07
49.3-49.7 5 0.16
49.8-50.2 11 0.37
50.3-50.7 6 0.20
50.8-51.2 3 0.10
51.3-51.7 3 0.10

30 1.00

Diapositiva 18
Distribución de Frecuencias
Relativas Acumuladas

Distribución Frec. Relativa


de Clase Frec. Absoluta Frec. Relativa Acumulada
Frecuencias
Relativas 48.8-49.2 2 0.07 0.07
Acumuladas 49.3-49.7 5 0.16 0.23
49.8-50.2 11 0.37 0.60
50.3-50.7 6 0.20 0.80
50.8-51.2 3 0.10 0.90
51.3-51.7 3 0.10 1.00

30 1.00

Diapositiva 19
Histograma
Clase Frecuencia

48.8-49.2 2
12 49.3-49.7 5
49.8-50.2 11
10 50.3-50.7 6
Frecuencia

8 50.8-51.2 3
51.3-51.7 3
6
4
2
0 48.8 49.3 49.8 50.3 50.8 51.3
49.2 49.7 50.2 50.7 51.2 51.7

Diapositiva 20
Problema 1
 Se encuestó a 25 amas de casa para una investigación
de mercado. A continuación se lista la cantidad de
cajas de litro de leche que compraron durante una
semana en particular. Confeccione la tabla de
distribución de frecuencias que mida la variable
"número de cajas de litro de leche". Construya un
histograma de frecuencias absolutas y relativas.

Diapositiva 21
Problema 2
 Una compañía que fabrica piezas para
automóvil mide el diámetro en centímetros de
una muestra de 30 piezas. Confeccione una
tabla de distribución de frecuencias y
porcentajes. Construya sus respectivos
histograma considerando 8 clases.

Diapositiva 22
Polígono de Frecuencias
Clase Frecuencia

48.8-49.2 2
12 49.3-49.7 5
49.8-50.2 11
10 50.3-50.7 6
Frecuencia

8 50.8-51.2 3
51.3-51.7 3
6
4
2
0 48.8 49.3 49.8 50.3 50.8 51.3
49.2 49.7 50.2 50.7 51.2 51.7

Diapositiva 23
Polígono de Frecuencias
Clase Marca Frecuencia

48.8-49.2 49.0 2
12 49.3-49.7 49.5 5
49.8-50.2 50.0 11
10 50.3-50.7 50.5 6
Frecuencia

8 50.8-51.2 51.0 3
51.3-51.7 51.5 3
6
4
2
0 48.5 49.0 49.5 50.0 50.5 51.0 51.5 52.0

Diapositiva 24
Polígono de Frecuencias
Marca Frecuencia

48.5 0
12 49.0 2
49.5 5
10 50.0 11
Frecuencia

50.5 6
8 51.0 3
6 51.5 3
52.0 0
4
2
0 48.5 49.0 49.5 50.0 50.5 51.0 51.5 52.0

Diapositiva 25
Problema 3
 Una compañía que fabrica piezas para
automóvil mide el diámetro en centímetros de
una muestra de 30 piezas. Confeccione una
tabla de distribución de frecuencias absolutas y
relativas y construya un polígono de
frecuencias.

Diapositiva 26
Ojiva
30
27

24
Acumulada Relativa

Clase Frec. Menor Frec.


Abs. que Acum.
18
48.8-49.2 2 48.8 0
49.3-49.7 5 49.3 2
Frecuencia

49.8-50.2 11 49.8 7
50.3-50.7 6 50.3 18
50.8-51.2 3 50.8 24
7 51.3-51.7 3 51.3 27
51.8 30
2
0 48.8 49.3 49.8 50.3 50.8 51.3 51.8

Diapositiva 27
Problema 4
 Una compañía que fabrica piezas para
automóvil mide el diámetro en centímetros de
una muestra de 30 piezas. Confeccione una
tabla de distribución de frecuencias
acumuladas. Construya una ojiva.

Diapositiva 28
Resumen de datos cualitativos
 Clases compuestas por categorías o atributos
 La frecuencia es la cantidad de datos en cada
clase.
 Presentación gráfica
 Gráfica de barras
 Gráfica de pastel

Diapositiva 29
Gráfica de Barras

Diapositiva 30
Gráfica de Pastel

Diapositiva 31
Problema 5
 Se obtiene información de 50 personas sobre
el equipo de fútbol del cual simpatizan.
 Ordene los datos obtenidos en una distribución
de frecuencias absoluta, relativa y porcentual.
 Presente los datos usando una gráfica de barras
y una gráfica de pastel.

Diapositiva 32
Diagrama de Tallo y Hojas

3.1 4.9 2.8 3.6 2.5 4.5 3.5 3.7 4.1 4.9
2.9 2.1 3.5 4.0 3.7 2.7 4.0 4.4 3.7 4.2
3.8 6.2 2.5 2.9 2.8 5.1 1.8 5.6 2.2 3.4
2.5 3.6 5.1 4.8 1.6 3.6 6.1 4.7 3.9 3.9
4.3 5.7 3.7 4.6 4.0 5.6 4.9 4.2 3.1 3.9

Diapositiva 33
1 68
2 9518595872
3 1865767657791499
4 390860509472192
5 71166
6 21

Diapositiva 34
1 68
2 1255578899
3 1145566677778999
4 000122345678999
5 11667
6 12

Diapositiva 35
Relación entre dos variables
 Tabulación Cruzada
 Resumen tabular de los datos de dos variables
cualitativas o cuantitativas.

 Diagrama de Dispersión
 Representación gráfica de la relación entre dos
variables cuantitativas

Diapositiva 36
Tabulaciones Cruzadas

Clasificación de delitos cometidos en una ciudad

Diapositiva 37
Problema 6
 Las respuestas de 50 personas a la pregunta
¿Qué cerveza prefiere? Se presentan a
continuación. Construya una tabla de datos
cruzados por Genero y Gusto por la cerveza
y una tabla cruzada que clasifique a los
encuestados según su edad y gusto por la
cerveza.

Diapositiva 38
Diagrama de Dispersión
Relación Positiva Relación Negativa

Ninguna Relación

Diapositiva 39
Problema 7
 Represente gráficamente mediante un
diagrama de dispersión la relación existente
entre las variables Población Estudiantil y
Ventas Trimestrales, según los valores de la
tabla en el archivo Excel.

Diapositiva 40

Anda mungkin juga menyukai