Anda di halaman 1dari 55

Estadística

Ing. Lissethy Cevallos


TEMARIOS

 Profesor
 Objetivos
 Reglas
 Contenidos a desarrollar en el curso
 Políticas

Ing. Lissethy Cevallos


Objetivos :
CURSO
INSTITUCIONAL

Formar profesionales de EXCELENCIA, Analizar información aplicando


socialmente responsables, líderes, técnicas estadísticas con el objeto de
emprendedores, CON PRINCIPIOS Y elaborar conclusiones que faciliten la
VALORES MORALES y éticos, QUE toma de decisiones en situaciones
CONTRIBUYAN al desarrollo científico, complejas que se caracterizan por
tecnológico, social, económico, ambiental y
estar sometidas a distintos grados de
político del país; y, hacer investigación,
incertidumbre
innovación, transferencia de tecnología y
extensión de calidad PARA SERVIR A LA
SOCIEDAD

Ing. Lissethy Cevallos


Reglas

 Asistencia a clases y cumplimiento de trabajos


 Celular en silencio
 Comunicación en clase, consultoría
programadas y a través del SIDWEB

Ing. Lissethy Cevallos


Contenido a desarrollar en el curso

Syllabus ESTG1005

Ing. Lissethy Cevallos


Sistema de Calificación

TEORÍA PRÁCTICA
Primer Parcial Segundo Parcial Tercer Parcial Califiación Única
Actividades Examen Actividades Examen Examen Actividades

100% 100% 100% 100%

TEORÍA + PRÁCTICA =
CALIFICACIÓN

Ing. Lissethy Cevallos


Propuesta de la estructura en
Estadística 3 / 1 / 5
Componen Compone
te nte
Teórico Práctico

80% 20%
Actividades -
1er Parcial 2do Parcial Talleres 60%
Examen 50% 50% Proyecto
Control de 40%
lectura 10% 10%
Lecciones 30% 30%
Deberes 10% 10%
100% 100%
* Nota: Solo se ingresa la
nota una vez en el Ing. Lissethy Cevallos
segundo Parcial
Estadística

Ing. Lissethy Cevallos


Tipo de datos y Escalas
de medición

Ing. Lissethy Cevallos


1-11
Tipos de Datos

Dato

Cualitativo Cuantitativo
(Categórico) (Numérico)

Ejemplos:
 Estado civil Discreto Continuo
 Partido político
 Color de ojos
(Categorías definidas) Ejemplos: Ejemplos:
 Número de hijos  Peso
 Defectos por hora  Voltaje
(Valores contados) (Medidas de
carácterísticas)

Ing. Lissethy Cevallos


1-12
Tipos de Datos

 Datos de Serie de Tiempo


 Datos observados y ordenados en el tiempo

 Datos Transversales
 Datos observados en un solo punto del tiempo

Ing. Lissethy Cevallos


1-13
Tipos de Datos

Ventas (Miles de Dólares)


2003 2004 2005 2006 Datos de
Atlanta 435 460 475 490 Serie de
Boston 320 345 375 395 Tiempo

Cleveland 405 390 410 395


Denver 260 270 285 280

Datos Transversales

Ing. Lissethy Cevallos


1-14 Datos de Serie de Tiempo

Datos observados y ordenados en el tiempo

http://www.eluniverso.com/noticias/2015/11/01/nota/5215826/sales-carnes-procesadas-
pueden-generar-cancerigenos
Ing. Lissethy Cevallos
1-15
Escala de medión

Ing. Lissethy Cevallos


1-16
Niveles de Medición de Datos

ESCALA - NOMINAL

ESCALA - ORDINAL

Ing. Lissethy Cevallos


1-17
Niveles de Medición de Datos

ESCALA - INTERVALO

ESCALA - RAZÓN

Ing. Lissethy Cevallos


Población y muestra
 Población: Conjunto
bien definido de N-
entes, cuyas
*características nos
proponemos a
Muestra investigar
Población

 Muestra:
subconjunto de la
población

La información obtenida
de la muestra nos permite
Unidad de
inferir las propiedades o
investigación características de toda la
población, con errores
Observación
medibles y acotables

Ing. Lissethy Cevallos


Definiciones Claves

Una población es el conjunto completo de objetos en


consideración y referidos como el marco
 La unidad muestral es cada objeto o individuo en el marco
 Un parámetro es una medida de resumen que describe una
característica de la población

Una muestra es un subconjunto de la población, seleccionado


para ser analizado
 Un estadístico es una medida de resumen, calculada de la muestra
para describir una característica de la población

Ing. Lissethy Cevallos


1-19
Datos e información

Procesamiento
de la información

Dato Información
Tabulación
Mediciones no de datos
procesadas Gráficos
- Numéricas Medidas
- Categóricas

Ing. Lissethy Cevallos


Procesamiento de los datos
a) Ordenamiento de datos – Estadístico de Orden

𝑋 1 = min 𝑋1 ,𝑋2 , … . , 𝑋𝑛
𝑋 𝑛 = m𝑎𝑥 𝑋1 ,𝑋2 , … . , 𝑋𝑛

1-21

Ing. Lissethy Cevallos


Procesamiento de los datos
b) Tabulación de los datos

Ing. Lissethy Cevallos


Procesamiento de los datos
b) Tabulación de los datos

No. de Clase Marca de Frecuenci Frecuenci Frecuenci Frecuenci


Clase clase a a Relativa a a Relativa
Absoluta Absoluta Acumula
Acumula da
da

1 [𝑎1 , 𝑎2 ) (𝑎1 + 𝑎2 )/2 𝑓1 𝑓1 /n 𝐹1 𝐹1 /n


2 [𝑎2 , 𝑎3 ) (𝑎2 + 𝑎3 )/2 𝑓2 𝑓2 /n 𝐹2 = 𝑓1 +𝑓2 𝐹2 /n
3
,
k [𝑎𝑘 , 𝑎𝑘+1 ) (𝑎𝑘 + 𝑎𝑘+1 )/2 𝑓𝑘 𝑓𝑘 /n 𝐹𝑘 = 𝐹𝑘
=1
𝑓1 +𝑓2+…+𝑓𝑛 n
1-23

Ing. Lissethy Cevallos


Procesamiento de los datos
b) Tabulación de los datos

Como se definen las clases o intervalos

Condiciones
Exhaustivos
Mutuamente excluyentes
Igual longitud

1-24

Ing. Lissethy Cevallos


Procesamiento de los datos
b) Tabulación de los datos

No. de Clase Marca Frecuen Frecuen Frecuen Frecuen


Clase de clase cia cia cia cia
Absoluta Relativa Absoluta Relativa
Acumula Acumula
da da

Ing. Lissethy Cevallos


Procesamiento de los datos
c) Gráficos

Histogramas
Polígono de frecuencias

Ojiva: Distribución de
frecuencias acumulada

Ing. Lissethy Cevallos


Histogramas

Ing. Lissethy Cevallos


Polígono de frecuencias

Ing. Lissethy Cevallos


Ojiva: Distribución de
frecuencias acumulada

Ing. Lissethy Cevallos


Cuantiles y Medidas de
tendencia central y
dispersión
Datos sueltos

Ing. Lissethy Cevallos


Medidas de Resumen

Describiendo Numéricamente los Datos

Medidas de tendencia Central Medidas de Posición Variación/ Medidas de dispersión


Rango
Media
Percentiles
Rango
Mediana Intercuartílico
Cuartiles
Moda Varianza
Deciles
Media Ponderada Desviación
Estándar
Coeficiente de
Variación
Ing. Lissethy Cevallos
Medidas de tendencia Central

Media Mediana Moda Media Ponderada


Punto medio Punto de mayor frecuencia
w
n

 xi M W i
xi
i 1
x  Condicione s
n


N

xi
w i
1

  i 1 0  wi  1
N

**Media
Cortada Ing. Lissethy Cevallos
Medidas de tendencia Central
Para datos agrupados

Media Mediana Moda Media Ponderada

 w
n
M xi

W
xi i

i 1
x  Condicione s
n Punto medio Punto de mayor
N
frecuencia w 1

i
xi
  i 1 0  wi  1
N
Punto de
equilibrio

**Media
Acotada Ing. Lissethy Cevallos
Media Ponderada

 Usado cuando los valores son agrupados por frecuencia o


importancia relativa

Media Ponderada de Días para Culminar


Ejemplo: Muestra de 26
proyectos de reparación
Días para Frecuencia XW 
w x
i i

(4  5)  (12  6)  (8  7)  (2  8)
Culminar
w i
4  12  8  2
5 4
164
6 12   6.31 días
26
7 8
8 2
3-35

Ing. Lissethy Cevallos


Medidas de Posición - Cuantiles

Percentiles
Los cuartiles dividen a los datos ordenados en cuatro grupos iguales:

25% 25% 25% 25%


Cuartiles Q1 Q2 Q3
Notar que el segundo cuartil (el 50mo percentil), Q2, es la mediana
IQR (rango intercuartílico) = Q3 – Q1

Deciles

Ing. Lissethy Cevallos


Medidas de Posición - Cuantiles
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
% % % % % % % % % % % % % % % % % % % % % % % % % % %
Percentiles
P1 P2 P99

Los cuartiles dividen a los datos ordenados en cuatro grupos iguales:

25% 25% 25% 25%


Cuartiles
Q1 Q2 Q 3 que, no más del 25% por ciento
Primer Cuartil = es un valor Q1 de la muestra, tal
de las observaciones ordenadas toman valores menores o iguales a Q1

10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
Deciles
D1 D2 D3 D4 D5 D6 D7 D8 D9
Ing. Lissethy Cevallos
Diagrama de Caja

* *
Valores “Valor más pequeño” “Valor más grande”
Atípicos (Límite Inferior) Q1 Q2 Q3
(Límite Superior)

El límite inferior es El límite superior es


Q1 – 1.5 (Q3 – Q1) Q3 + 1.5 (Q3 – Q1)

 Dibujar una caja desde Q1 a Q3


 Trazar una línea vertical en la mediana
 Trazar líneas (bigotes) hacia el valor más pequeño y más grande (dentro de los
límites calculados)
3-39
 Identificar los valores atípicos fuera de los límites calculados
Ing. Lissethy Cevallos
Detención de valores atípicos o datos
aberrantes

 𝒔𝒊 𝒆𝒔 𝒖𝒏 𝒗𝒂𝒍𝒐𝒓 𝑴𝒆𝒏𝒐𝒓 𝑎𝑙 max 𝑋 1 , 𝑄1 − 1,5𝑅𝐼

 𝒔𝒊 𝒆𝒔 𝒖𝒏 𝒗𝒂𝒍𝒐𝒓 𝑴𝑨𝒀𝑶𝑹 𝑎𝑙 m𝑖𝑛 𝑋 𝑛 , 𝑄3 + 1,5𝑅𝐼

Ing. Lissethy Cevallos


Determinación de los cuantiles a través de la Ojiva

Ing. Lissethy Cevallos


Forma de una Distribución
Describir cómo los datos están distribuídos
Simetrica or asimétrica
A mayor diferencia entre la media y la mediana, mayor es la asimetría de la
distribución

Asimétrica a la Simétrica Asimétrica a la


Izquierda Derecha

Media < Mediana Media = Mediana Mediana < Media


(Cola larga hacia la izquierda) (Cola larga hacia la derecha)
3-42

Ing. Lissethy Cevallos


Forma de una Distribución y de su Gráfico de Caja
y Bigote
Asimétrica a Asimétrica a
la Izquierda Simétrica la Derecha

Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3

3-43

Ing. Lissethy Cevallos


Variaciones
Misma media pero diferentes
desviaciones estándar:
Datos A
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 3.338

Datos B
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 0.9258
Datos C
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 4.57
3-44

Ing. Lissethy Cevallos


Variación

Rango Varianza Desviación Coeficiente de


Estándar Variación
Varianza
Poblacional Desviación
Estándar
Poblacional
Rango
Intercuartílico

Varianza
Muestral Desviación
Estándar
Muestral

Ing. Lissethy Cevallos


Variación

Rango Varianza Desviación Coeficiente de


Estándar Variación
R  X  n   X 1  Varianza
Poblacional Desviación s
Estándar V  100
N
Poblacional x
 (x  μ)
2
Rango i
i1

2
Intercuartílico σ σ σ
2

N
RI  Q  3   Q 1 
Varianza
Muestral Desviación
Estándar
n Muestral
 (x i  x )
2

s
2
i 1 s
s 
2

n -1 Ing. Lissethy Cevallos


Variación

 Las medidas de variación dan información sobre la dispersión o variabilidad de los


datos

 Valor pequeño
 Menos variación
 Valor grande
 Más variación

Mismo centro,
diferente variación
3-47

Ing. Lissethy Cevallos


Medidas de Variación
El presidente de la corporación solicita al gerente de producción información sobre la
producción de los últimos 5 días de las plantas A y B. Se registran los siguientes
resultados:

A 15 25 35 20 30
B 23 26 25 24 27

El gerente de producción elabora un resumen el cual presenta al presidente:


En base a la información proporcionada, ¿Qué puede concluir el presidente?
¿Cuál es la realidad?

Media Mediana
A 3-48 25 25
B 25 25

Ing. Lissethy Cevallos


Cuantiles y Medidas de
tendencia central y
dispersión
Datos agrupados

Ing. Lissethy Cevallos


Medidas y desviación para datos agrupados

Y
K
Media fi Varianza
 (Y i  y ) f i
2
i
i 1
y  s 
2 i 1

n n -1

Yi = i-ésima marca de
clase Ing. Lissethy Cevallos
Coeficiente de Variación

 Muestra la variación relativa a la media.


 Expresado siempre en porcentaje (%).
 Especialmente relevante para comparar la variabilidad de dos
distribuciones con distintas medias.
 Usado para comparar dos o más conjuntos de datos medidos en
diferentes unidades o niveles
Población Muestra

σ   s 
CV  
 μ 
  100% CV   
 x   100%
   
3-51

Ing. Lissethy Cevallos


Comparación de Coeficientes de
Variación
 Acción A:
Precio promedio del año pasado = $50
Desviación estándar = $5
 s  $5

CVA    * 100%  * 100%  10%

 x  $50 Ambas acciones tienen
la misma desviación
estándar, pero la
 Acción B: Acción B es menos
variable relativo a su
Precio promedio del año pasado = $100 precio

Desviación estándar
s  = $5 $5

CVB    * 100%  * 100%  5%

 x  $100
3-52

Ing. Lissethy Cevallos


Valores centrados y
estandarizados

Ing. Lissethy Cevallos


Valores Estandarizados

 Un valor estandarizado se refiere al número de desviaciones


estándar en que el valor difiere de su media.

 Un valor estandarizado también es conocido como valor z.

 Pueden ser usados para comparar conjuntos de datos, al menos de


intervalo, incluso de escala distinta.

 Serán vistos en mayor detalle en los próximos capítulos.

3-55

Ing. Lissethy Cevallos


Valores Estandarizados Poblacionales

x μ
z 
σ
Donde:
 x = valor original del dato
 μ = media poblacional
 σ = desviación estándar poblacional
 z = valor estandarizado

(número de desviaciones estándar en que x difiere de μ)

3-56

Ing. Lissethy Cevallos


Valores Estandarizados Muestrales

x  x
z 
s
Donde:
 x = valor original del dato
 x = media muestral
 s = desviación estándar muestral
 z = valor estandarizado
(número de desviaciones estándar en que x difiere de x )

Ing. Lissethy Cevallos


Valor Estandarizado: Ejemplo

 Los puntajes de CI en una población tienen distribución en forma de campana con


media μ = 100 y desviación estándar σ = 15

Encontrar el valor estandarizado (z-score)


para una persona con un CI de 121.

Respuesta: x μ 121  100


z    1.4
σ 15

Alguien con CI de 121 está a 1.4 desviaciones


estándar sobre la media

3-58

Ing. Lissethy Cevallos


Deberes
1,-Ejercicios Propuestos
 1,1 primera muestra  1,53
 1,3,1,4 1,5, 1,6  1,54
 1,17  1,55
 1,24  1,56
 1,41

2,- Sea una muestra X, de Tamaño n, en la que se investiga una característica X,


definimos
𝒀𝒊 = 𝜶𝑿𝒊 + 𝜷 Calcule la media

Ing. Lissethy Cevallos

Anda mungkin juga menyukai