Anda di halaman 1dari 41

ANLISIS DE DATOS

Introduccin a la Estadstica:
Descripcin de Datos

Toms Minauro La Torre


Sesin 1
tminauro@esan.edu.pe

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
2

Estadstica
Cuando se habla de ESTADISTICA, generalmente
nos referimos a nmeros tales como, promedios,
medianas, porcentajes, mximos, mnimos, entre
otros, que nos ayudan a entender una gran
variedad de situaciones econmicas y de negocios.

Tambin se refiere al ARTE Y CIENCIA de


recolectar, analizar, presentar e interpretar datos.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
3

Datos
Los datos son los hechos y los nmeros que se
renen, analizan y resumen para su presentacin e
interpretacin.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
4

Elementos, Variables, Observaciones


Los elementos son las entidades de las cuales recogemos los
datos.

Una variable es una caracterstica de inters de cada


elemento.

Al conjunto de medidas recogidas de un elemento en


particular se le llama observacin.

El nmero total de datos es igual al nmero de elementos


multiplicado por el de variables.
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
5

Escalas de Medicin
Las escalas de medicin son:
Nominal De intervalo
Ordinal De razn

La escala determina la cantidad de informacin que


debe contener el dato.

La escala indica adems qu tipos de resmenes de


datos y de anlisis estadsticos son los ms apropiados.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
6

Escalas de Medicin
Nominal
Los Datos son etiquetas o nombres usados para
Identificar un atributo de un elemento.

Se usan etiquetas no numricas o cdigos numricos.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
7

Escalas de Medicin
Ordinal
Los datos tienen las propiedades de una medicin
nominal y adicionalmente el orden o la posicin
relativa de cada categora tiene significado.

Se pueden usar una etiqueta no numrica o un cdigo


numrico.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
8

Escalas de Medicin
De Intervalo
Los datos tienen las propiedades de los ordinales y las
distancias que hay entre las observaciones se miden
en trminos de una unidad de medida fija.

Datos de Intervalo son siempre numricos.

Esta escala tiene el cero relativo que indica que para


esta variable el punto cero depende de quien evala.
En el cero, no siempre no hay nada.
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
9

Escalas de Medicin
De Razn
Los datos tienen todas las propiedades de los de
intervalo y en este caso el cociente de dos valores
tiene un significado.

Variables como son distancia, altura, peso, y tiempo


usan la escala de razn.

Esta escala tiene el cero absoluto que indica que


para esta variable no existe nada en el punto cero.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
10

Cada escala provee diferente informacin

Nominal

Tercero Segundo Ganador

Ordinal

Tercero Segundo Ganador

Intervalo
20 segundos 1 segundo

Razn 1 minuto 59 2/5 segundos para 11/4 millas

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
11

Escalas de Medicin
Dato

Cualitativo Cuantitativo

Numrico No Numrico Numrico

Nominal Ordinal Nominal Ordinal De Intervalo De razn

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
12

Estadstica Descriptiva

Datos resumidos y presentados


convenientemente. Dichos resmenes
pueden ser:
tabulares
grficos o
numricos

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
13

Ejemplo: Hudson Autos


Al gerente de Hudson Autos le gustara tener una . S
mejor comprensin de los costos de los repuestos utilizados en
los servicios realizados en su taller. Examina 50 facturas de
clientes atendidos en los ltimos meses. Anota el costo de las
piezas, redondeado al dlar ms cercano. Adems por
telfono se comunica con ellos y obtiene la edad del cliente, se
les pide que califiquen la calidad del servicio recibido
(1=excelente, 2=muy bueno, 3=bueno, 4=regular y
5=malo) y nos indiquen el servicio recibido
(1=mantenimiento, 2=diagnstico, 3=reparacin y
4=otro). Los datos se muestran en la hoja de Excel
adjunta

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
14

Ejemplo: Hudson Autos

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
15

Distribucin de frecuencias

Una distribucin de frecuencias es una tabla que


resume los datos mostrando la frecuencia o nmero de
elementos que hay dentro de cada una de sus clases,
que deben ser mutuamente excluyentes y colectiva-
mente exhaustivas.

El objetivo es proveer informacin acerca del conjunto


de datos que no podra obtenerse rpidamente por
simple observacin de los datos originales.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
16

Distribucin de frecuencias relativas


La frecuencia relativa de una clase es la fraccin o
proporcin del total de datos que pertenecen a una
determinada clase.

Una distribucin de frecuencias relativas es una tabla


que nos resume un conjunto de datos mostrando la
frecuencia relativa para cada clase.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
17

Grfico de Barras
Un grfico de barras es una herramienta grfica para
trabajar con datos cualitativos.
En un eje (normalmente el horizontal), colocamos las
etiquetas con los nombres de las categoras.
En el otro eje (normalmente el vertical), se puede usar la
frecuencia, la frecuencia relativa.
Usamos una barra de ancho fijo que dibujamos arriba
de cada etiqueta, con una altura de acuerdo con su
correspondiente frecuencia.
Las barras estn separadas para enfatizar que cada
clase es una categora diferente.
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
18

Grfico de Pie
El grfico de pie es una herramienta grfica usada
generalmente para presentar distribuciones de frecuencia
relativa de datos cualitativos.

Primero se traza un crculo; luego usando


las frecuencias relativas se subdivide
en sectores que corresponden a la
frecuencia relativa de cada clase.

Dado que hay 360 en un circulo, una clase con una


frecuencia relativa de .25 consumir .25(360) = 90 de ese
crculo.
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
19

Distribucin de Frecuencias
Para Datos Numricos
Guas para seleccionar el nmero de clases

Use entre 5 y 20 clases.

Conjuntos de datos con un nmero grande de


elementos, generalmente requieren un nmero
grande de clases.

Conjuntos de datos pequeos usualmente


requieren pocas clases

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
20

Distribucin de Frecuencias
Para Datos Numricos
Gua para seleccionar el Ancho de Clase

Use clases de igual ancho


Ancho aproximado de clase =

Dato ms grande - Dato ms pequeo


Nmero de Clases

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
21

Usando la funcin FRECUENCIA de Excel


para Construir una Distribucin de Frecuencias

La funcin FRECUENCIA no es una funcin simple de


Excel.
FRECUENCIA nos proporciona valores mltiples.
En Excel, la formula que dan como respuesta mltiples
valores se llaman frmula matricial.
Una frmula matricial tiene una forma especial de
ingresar.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
22

Usando la funcin FRECUENCIA de Excel


para Construir una Distribucin de Frecuencias

Pasos para ejecutar esta funcin:


Paso 1 Seleccionar la matriz donde deben aparecer
las frecuencias

Paso 2 Escribir la siguiente frmula:


{= FRECUENCIA (Datos,Grupos)}

Paso 3 Presionar CTRL + SHIFT + ENTER


(La frmula aparecer en toda la matriz
seleccionada)
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
23

Histograma
El histograma es una manera muy comn de presentar
grficamente datos cuantitativos.
La variable de inters se coloca en el eje horizontal.

Se dibuja un rectngulo arriba de cada intervalo de clase


con una altura correspondiente a su frecuencia,
frecuencia relativa, o frecuencia porcentual.

A diferencia del grfico de barras, un histograma


no tiene separaciones entre rectngulos de clases
adyacentes
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
24

Usando Excel para Construir un Histograma


Usando herramientas de Excel
Herramientas

Anlisis
de Datos

Histograma

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
25

Distribucin Acumulativa

Distribucin Acumulada de Frecuencias muestra el


nmero de observaciones con valores iguales o
menores que el lmite superior de cada clase.

Distribucin Acumulada de Frecuencias Relativas


muestra la proporcin de tems con valores menores o
iguales al el lmite superior de cada clase.

Distribucin Acumulada de Frecuencias Porcentuales


muestra el porcentaje de tems con valores menores o
iguales al el lmite superior de cada clase.
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
26

Anlisis Exploratorio de Datos

El Anlisis Exploratorio de Datos es un conjunto de


tcnicas que usan aritmtica simple y grficos fciles
de dibujar para resumir datos rpidamente.

Una de estas tcnicas es el diagrama de hoja y tallo.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
27

Diagrama de Hoja y Tallo


Un Diagrama de Hoja y Tallo nos muestra ambos el
orden y la forma de la distribucin de los datos.
Es muy parecido a un histograma, con la ventaja de que
este diagrama conserva los valores originales.
El primer dgito de cada dato se coloca a la izquierda de
una lnea vertical.
A la derecha de la lnea, registramos el ltimo dgito de
cada dato en orden.
Cada lnea en el diagrama se conoce como tallo.
Cada dgito en el tallo es una hoja.
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
28

Ejemplo: Hudson Autos

Muestra de 50 datos:

91 78 93 57 75 52 99 80 97 62
71 69 72 89 66 75 79 75 72 76
104 74 62 68 97 105 77 65 80 109
85 97 88 68 83 68 71 69 67 74
62 82 98 101 79 105 79 69 62 73

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
29

Ejemplo: Hudson Autos

5 2 7
6 2 2 2 2 5 6 7 8 8 8 9 9 9
7 1 1 2 2 3 4 4 5 5 5 6 7 8 9 9 9
8 0 0 2 3 5 8 9
9 1 3 7 7 7 8 9
10 1 4 5 5 9

tall hoja
o
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
30

Diagrama de Hoja y Tallo

Si se cree que un diagrama de hoja y tallo est


muy concentrado, podemos abrir el diagrama
usando dos tallos para cada dgito inicial.

Dado que tenemos el primer dgito repetido, el


primer valor corresponde a valores de la hoja de
0 - 4, y el segundo a valores de la hoja de 5 - 9.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
31

Ejemplo: Hudson Autos


5 2
5 7
6 2 2 2 2
6 5 6 7 8 8 8 9 9 9
7 1 1 2 2 3 4 4
7 5 5 5 6 7 8 9 9 9
8 0 0 2 3
8 5 8 9
9 1 3
9 7 7 7 8 9
10 1 4
10 5 5 9
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
32

Diagrama de Hoja y Tallo

Unidades de la Hoja
Cada hoja se define por un slo dgito.

En el ejemplo anterior, la unidad de la hoja fue 1.

Las unidades pueden ser 100, 10, 1, 0.1, y as.

Cuando no se muestran las unidades de la hoja, se


asume que es 1.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
33

Ejemplo: Unidad de hoja = 0.1


Si tenemos los siguientes datos
8.6 11.7 9.4 9.1 10.2 11.0 8.8

El diagrama de hoja y tallo para estos datos sera:

Unidad de hoja = 0.1


8 6 8
9 1 4
10 2
11 0 7
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
34

Ejemplo: Unidad de hoja = 10


Si tenemos los siguientes datos
1806 1717 1974 1791 1682 1910 1838

El diagrama de hoja y tallo sera:

Unidad de hoja = 10
16 8
El 82 de 1682
17 1 9 Se redondea a 80
18 0 3 y se representa
por un 8.
19 1 7
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
35

Tablas de Contingencia y
Diagramas de Dispersin
Hasta el momento hemos visto mtodos que resumen
datos pero una variable a la vez.

Los gerentes necesitan mtodos que les permitan


graficar y tabular datos de manera que se entiendan las
relaciones entre dos variables.

Tablas de Contingencia y Diagramas de Dispersin son


dos mtodos que permiten resumir los datos para dos
(o ms) variables simultneamente.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
36

Tablas de Contingencia

Tabla de contingencia es una forma de resumir en una


tabla datos de dos variables simultneamente.
Se puede usar si:
ambas variables son cualitativas, o
Si alguna es cuantitativa, para hacer la tabla debe
ser transformada en otra cualitativa.
Las filas y las columnas definen las clases para cada una
de las dos variables.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
37

Diagramas de Dispersin y
Lneas de Tendencia

Un diagrama de dispersin es una representacin


grfica de la relacin entre dos variables cuantitativas.

Una de las variables se muestra en el eje vertical y la


otra en el horizontal.

El patrn general que muestran los puntos sugieren la


relacin entre las variables.

Una lnea de tendencia es una aproximacin de la


relacin.
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
38

Diagrama de Dispersin
Una relacin positiva

X
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
39

Diagrama de Dispersin
Una relacin negativa

X
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
40

Diagrama de Dispersin
Ninguna relacin

X
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
41

Procedimientos Grficos y Tabulares


Dato
Cualitativo Cuantitativo

Mtodos Mtodos Mtodos Mtodos


Tabulares Grficos Tabulares Grficos

D.Frecuencias Grfico de Barras D.Frecuencias Histograma


D.Frecuencias Grfico de Pie D.Frecuencias Relativas Ojiva
Relativas D.Frecuencias Relativas Diagrama de
Tabla de Acumuladas Dispersin
Contingencia Diagrama de Hoja y
Tallo
Tabla de Contingencia
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.

Anda mungkin juga menyukai