Anda di halaman 1dari 34

ÍNDICE

Prefacio
En el prefacio podemos integrar los temas de la unidad 3,
pertenecientes a la estadistica descriptiva. En el cual se
abordan los temas: medidas de tendencia central, medidas
de varianza, representaciones gráficas de los datos, datos
agrupados, y aplicaciones de estos, hacia los datos del
INEGI.
La idea fundamental del trabajo gira en torno a la educación
vial, allí yace el porqué de haber estudiado los accidentes de
tránsito en la via terrestre en donde estuvo involucrado el
aliento alcohólico. De aquí que nuestra variable aleatoria
sea la cantidad de accidentes de tránsito causados por la
ausencia o presencia de aliento alcohólico.
Por lo tanto, en esta exposición se verán reflejados dichos
parámetros aplicados a nuestros datos del INEGI.
Estadística
Estadística descriptiva.

La estadística es la ciencia que recopila,

organiza, resume, analiza e interpreta los

datos obtenidos, poro tener conocimiento

de los hechos pasados, preveer situaciones

futuras y tomar decisiones con base en la

experiencia.

Es la ciencia o arte de reunir y analizar

datos e inferir consecuencias a partir de

estos elementos.

La estadística esta dividida en 3:


*Inferencial

*Descriptiva
*Teoría del muestreo

Forma de los datos


*No agrupados

*Agrupados

DATO
Un dato es el valor que puede tomar una variable sea

cualitativa o cuantitativa. Surgen siempre que se toman

medidas o se registran observaciones.

Los datos nominales son numéricos sólo por Su nombre.

Población y muestra

Población: totalidad de

elementos que tienen

características comunes. En la

estadística son grupos

definidos arbitrariamente

acorde al propósito de la

investigación estadística. El

proceso para medir

características de todos los

miembros de la población se

llama censo.
Muestra: subconjunto de la

población Se usa cuando por

razones de tiempo o dinero no es

posible obtener datos de toda la

población. La muestra debe ser

representativa y tener un

tamaño adecuado. El proceso

para medir las características de

los elementos de una muestra se

llama muestreo.

Si un conjunto de datos consta de

todas las observaciones concebibles

posibles de un fenómeno

determinado, lo llamaremos

población; si un conjunto de datos

consiste sólo una parte de estas

observaciones, se le conoce como

una muestra.

Medidas de tendencia central.


Su propósito es centralizar toda

la información en torno a un

dato.
Las medidas estadísticas que describen como resumir los datos por

medio de un número único, un valor que describa en cierta forma el

centro o punto medio de los datos se conocen como medidas de

localización o de tendencia: entre estas las que describen el centro de

los datos se llaman medidas de localización central.

Media
Es el promedio de los datos (se ve afectada por la variación

alta de los datos, y en estos casos pierde valor como medida

descriptiva).

La media de "n" números, es la suma de los mismo dividida

entre “n”

Media de la muestra= x = ∑x/N

Media poblacional= µ = ∑X/N

Media
Asi mismo, para diferenciar entre las descripciones
de poblaciones y las descripciones de muestra, no

usamos símbolos distintos tales como (mu) y x, si no

que nos referimos a la descripcion de una poblacion

como un parámetro y a una descripcion de una


muestra como un valor estadistico. Gereralmente,

los parametros, se expresan por medio de letras

griegas.

Media: ejemplo
Si el salario anual medio pagado a los tres ejecutivos principales de

una empresa es de $156,000, ¿Es posible que uno de ellos reciba

$50,ooo?.

ejecutivos Salario por año


David X
Roger X
Fernando x
TOTAL 156,000 = 3x

Solución:

Dado que n es igual a 3 y el promedio es igual a $156,000, tenemos

Que ∑X=3*156000=$468000 y es imposible que cualquiera de los

ejecutivos gane mas de dicha cantidad.

Media ponderada
Cuando calculamos un promedio, podemos estar cometiendo un gran erros si
contemplamos el hecho de que no todas las cantidades tienen la misma
importancia en relacion con el fenomeno que se describe. Para dar
cantidades de las que se promedia su grado de importancia pertinente, es
necesario asignarle pesos o valores relativos( importancia relativa)
luego calcular una media ponderada.
Media ponderada
En general, la media ponderada, (Equis barra suíndice W) de

un conjunto de números, cuya importancia

relativa se expresa numericamente por medio de un conjunto

de numeros correspondiente, W1,W2,W3.. .Wn, se obtiene

mediante la fórmula:

Media ponderada: ejemplo

Calcula la media de las residencias habitadas por propietarios en

California en 1980.

La media de los tres porcentajes es 52.9 pero no podemos

indicar que esta sea la taza promedio de las residencias

habitadas. Las tres cifras no tienen la misma importancia

porqué hay diferecias de tamaño en las tres ciudades.


Media ponderada: ejemplo
Considerando que había 1,135,000 residencias en L.A.,

113,000 en Sacramento y 210,000 en San José ahora si

se puede obtener la taza de residencias habitadas.

Sustituyendo XI=40.3, X2=56.4, X3=62.1, W1=1135, W2=113 y W3=210


obtenemos:X(barra)w=((1,135)(40.3)+(113)(56.4)+(210)(62.1))/(1,135+113+21
0)=44.7

Mediana
La mediana es valor del artículo medio cuando n es non

y la media de dos artículos medios cuando n es par.

Es el dato central de un conjunto de datos ordenados.


si el numero de datos es par, entonces la media sera el
promedio de los 2 centrales

Media = n+1/2

Mediana: ejemplo
Halle la posición de la mediana para n=15.

Solución:

Con los datos ya ordenados:

(n+1)/2 = (15+1)/2 = 8, de modo que la mediana es el

valor octavo de los artículos

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Cuartiles
Cuando un conjunto de datos se divide en 4 partes iguales, las

marcas que quedan separando esas partes se llaman cuartiles. Las

propiedades de los cuartiles son estas:

Q1 es excedido 3 veces por tantos valores como excede y es otra

posibilidad para Q3.

Hay tantos valores menores que Q1 como los hay entre Q1 Y Q2 , entre

Q2 Y Q3 y mayores que Q3.

La mitad de los datos caben entre Q1 y Q3

MODA

Es el dato que mas se repite en un conjunto de datos.en algun caso

puede no haber moda(amodal) , una sola moda (unimodal), 2 modas

(bimodal) o mas de 3 modas(multimodal).

Sus 2 ventajas principales: no requiere calculos y se puede

determinar para datos cuantitativos y nominales.

Una dificultad es que se comporta erráticamente cuando se

redondean los valores de los datos.


MODA: EJEMPLO

A las 20 juntas de una academia de bailes

tradicionales asistieron 26, 25, 23, 28, 25, 24,

21, 24, 23, 26, 28, 26, 24, 32, 25, 27, 24, 23, 24 y

22 de sus miembros. Obtenga la moda.

Solución:

Entre los 20, 21, 22, 27 y 32 ocurren una vez

cada uno; 28 sucede dos veces; 23, 25 y 26

ocurren tres veces cada uno; y 24 ocurre 5

veces. Así, 24 es la asistencia modal.

Fechas Frecuencia fx
20 1
21 1
22 1
23 3
24 5
25 3
26 3
27 1
28 2
32 1

Medidas de dispersión
Su proposito es determinar cuán homogeneo o heterogeneo es un

conjunto de datos, midiendo sus diferencias o separación entre ellos. Son

un completo de las medidas de centralización den el análisis estadístico

de datos. La agrupación de los datos implica cierta pérdida de

información.
VARIANZA

Es el promedio de los cuadrados de las desviaciones de

los datos:

∑(x-promedio)/n = VAR

Desviación estándar
Es la raiz cuadrada de la varianza.

√ợ =D.E

Varianza /- Desviación estándar- : ejemplo

En 6 domingos consecutivos, un operador recibió 9, 7, 11, 13, 1O y 7

llamadas de servicio. Calcule ợ.

Solución:

Calcular la media:

Media = (9+7+11+10+13+7) / 6= 9.5


Los cálculos para llegar a ợ pueden ser acomodados en

La siguiente tabla.

Entonces, dividiendo entre (6-1)=5

y sacando raíz cuadradas, sale:

ợ=(27.5/5)=√5.5 = 2.3

Datos agrupados

Los datos agrupados son como lo indica su nombre, una

cantidad dada de datos que puede clasificarse, ya sea

por sus cualidades cualitativas o cuantitativas, y por tal

agruparse para su análisis.


Datos agrupados: ejemplo

Se muestran las calificaciones de una prueba de coordinacion fisica,

Aplicada a 20 estudiantes que habiendo ingerido una cantidad de

alcohol equivalente al 0.1% de su peso:

69, 84, 52, 93, 61, 74, 79, 65, 88, 63, 57, 64, 67, 72, 74, 55, 82, 61,
68, 77

Esta lista de números, sigue siendo una basta lista de información,

una tecnica màs eficaz brindarà una buena impresión total de los

datos, es decir la gràfica de tronco y hojas.

Ahora se divide cada numero en sus decenas y unidades,

disponiendo juntos los valores que comparten las decenas. Esto es,

pensaremos en el numero 69, como en 6 | 9 entonces, las decenas

se dispondrà en forma vertical con unidades dispuestas al lado.

Para el conjunto de las 20 calificaciones de coordinación fisica, la

grafica es esta:
Diagrama de árbol
A la tabla anterior se conoce como de tronco y hojas,

porque cada renglón representa una posición de tronco

y cada dígito a la derecha de la línea vertical se puede

considerar como una hoja.

Distribución de frecuencias

Cuando manejamos conjuntos

cuantificados de datos, a menudo

podemos obtener una buena imagen

general y toda la informacion que

necesitemos agrupando los datos en

un numero de clases, intervalos o

categorias.

Por ejemplo, los datos

correspondientes en 1983 de los

suscriptores de cable se representa

de la siguiente manera:
Distribución de frecuencias

Las distribuciones de la frecuencia representan los

datos en una forma relativamente compacta, dan buena

imagen en general y contienen información adecuada

para muchos propósitos.

Para elaborar una distribución de frecuencias hay 3 pasos:

1. Selección de clases (intervalos).

2. Clasificación de las clases.

3. Conteo de número de factores por clase.

Asegurarse siempre de que sendos factores pertenezcan

a una y sólo una clase.


DATOS ARGUPADOS EN INTERVALOS
Cuando tanto el rango de los datos es grande (mayor

igual que 15) como el numero de datos (mayor igual

que 30) , entonces es conveniente además de ordenar

los datos en una tabla de frecuencia , el agruparlos en

intervalos . Este numero de intervalos (k) depende del

total de datos (n) y puede obtenerse por la formula:

K=√n o bien por el indice de

Sturges k=1+3.3log n

DATOS ARGUPADOS EN INTERVALOS


Una clase o también denominada intervalo de clase,

son divisiones o categorías en las cuales se agrupa un

conjunto de datos ordenados con características

comunes. En otras palabras, son fraccionamientos del

rango o recorrido de la serie de valores para reunir los

datos que presentan valores comprendidos entre dos

límites.
DATOS ARGUPADOS EN INTERVALOS

Siempre que es posible, hacemos que las clases cubran rangos de

valores iguales.

Un numero sugerido de intervalos es entre 5 y IO:

Límite interior (Li): valor de "entrada" en un

intervalo.

Límite superior (Ls): valor de "salida" en un intervalo.

DATOS AGRUPADOS EN INTERVALOS:


EJEMPLO
Elabore una distribución de las siguientes cantidades de óxidos de

(en toneladas) emitidas en una planta industrial en 80 días:

15.8, 26.4, 17.3, 11.2, 23.9, 24.8, 18.7, 13.9, 9, 13.2, 22.7, 9.8, 6.2,
14.7, 17.5, 26.1, 12.8, 28.6, 17.6, 23.7, 26.8, 22.7, 18, 20.5, 11, 20.9,
15.5, 19.4, 16.7, 10.7, 19.1, 15.2, 22.9, 26.6, 20.4, 21.4, 19.2, 21.6,
16.9, 19, 18.5, 23, 24.6, 20.1, 16.2, 18, 7.7, 13.5, 23.5, 14.5, 14.4,
29.6, 19.4, 17, 20.8, 24.3, 22.5, 24.6, 18.4, 18.1, 8.3, 21.9, 12.3,
22.3, 13.3, 11.8, 19.3, 20, 25.7, 31.8, 25.9, 10.5, 15.9, 27.5, 18.1,
17.9, 9.4, 24.1, 20.1 y 28.5.
DATOS AGRUPADOS EN INTERVALOS:
EJEMPLO

Dado que tenemos 80 datos (n=80) , la cantidad de intervalos...

K será: √80 ᷉ 9. O sea, 9 intervalos.

En vista de que la observación mayor es 31.8, la inferior es 6.2 y los

intervalos son 9; el tamaño de la clase viene dado por:

(31.8-6.2)/9= 2.8᷉3

Intervalos:

5-7.9, 8-10.9, 11-13.9, 14-16.9, 17-19.9, 20-22.9, 23-25.99,

26-28.99 y 29-31.99.

DATOS AGRUPADOS EN INTERVALOS:


EJEMPLO
Tabla de frecuencia de los

intervalos
DATOS AGRUPADOS EN INTERVALOS
Las distribuciones numéricas igual tienen lo llamado Marca de el

clase (M.K.) que son simplemente el punto medio de la clase y se

obtienen sumando los límites inferiores y superiores de una clase y

dividiendo al resultado entre 2:

MK=Ls+Li/2

Los intervalos de clase de la distribución es la longitud

entre las marcas de clase, se obtiene sacando la

diferencia entre 2 marcas de clase sucesivas. Si las

diferencias son iguales, el intervalo es común a todas las

marcas.

DATOS AGRUPADOS EN INTERVALOS:

EJEMPLO 2
Calcula las marcas de clase y el intervalo de clase de la distribución

de los datos de emisión de óxidos de azufre:

Marcas de clase:

(5+79)/2 = 6.45, (8+10.9)/2 = 9.45, (11+13.9)/2 = 12.45, (14+16.9)/2=

15.45, (17+19.9)/2 = 18.45, (20+22.9)/2 = 21.45, (23+25.9)/2 = 24.45, (26

+28.9)/2 = 27.45, (29 + 31.9)/2 = 30.45

Las diferencias entre todas las M.K. es 3, por lo que el

intervalo es común a todas.


Media de datos agrupados
Una buena aproximación para determinar la media: asignar a cada

articulo un valor de marca de clase (MK.).

Para dar fórmula general a la media con una distribución de k clases,

se anotan las marcas de clase sucesivas M.K,1. M.K.2..„ y M.K.k y las

frecuencias de las clases correspondientes f1. f2„.. y fk:

M.K1*f1 + MK2 • f2 +… + M.K.k*fk= ∑ M.K*f

Entonces la media de datos agrupados es:

Media de datos agrupados

Calcula la media de los siguientes datos agrupados en la tabla.

MEDIANA PARA DATOS AGRUPADOS


La mediana de una distribución es tal

que la mitad del área total de los

rectángulos del histograma de la

distribución cae a su izquierda y la otra

cae a su derecha.

Mediante la interpolación, la fórmula

de la mediana para datos agrupados en


intervalos es:

Donde:

L es el límite inferior del intervalo

en donde está la mediana.

fa es la frecuencia acumulada anterior a la "clase

mediana".

fmed es la frecuencia absoluta de la "clase mediana".

C: amplitud de la clase (o intervalo) de la mediana.

MEDIANA PARA DATOS AGRUPADOS: EJEMPLO

Utilice la fórmula para hallar la mediana de la distribución de los

datos de la emisión de óxidos de azufre:

Dado que si se divide a 80 entre 2 da 40, y a la


FAA, se percibe que la mediana anda en el

intervalo 17 — 20.9.

L vendría siendo igual a 17

Se sabe que c= (32.9 — 5)/(k=7)=4

((80/2-17)/25)(4)+17=19.08

MEDIANA PARA DATOS AGRUPADOS: EJEMPLO

GRAFICA DE CAJA Y BIGOTES


La información

Proporcionada por la

mediana, los 2 cuartiles y los

valores inferiores y

superiores a veces se

presenta en una

"representación gráfica de

cuadro y sección", llamado

igual "gráfica del recuadro”

Se usan los 2 punto

esenciales en vez de los dos

cuartiles.

Otros cuartiles
Cuartil: cuando un conjunto de

datos se divide en 4 partes iguales,

las marcas que quedan separando

esas partes se llaman cuartiles (Q1,

Q2, Q3).
La fórmula para obtener los

cuartiles es:

Donde:

> L Q = límite real inferior de la "clase Q"

> faa Q = Frecuencia anterior a la "clase Q”

>fq = frecuencia absoluta de la "clase Q”

>C = tamaño o ancho de la "clase Q"

Percentiles

Los percentiles son los 99

valores que dividen la serie

de datos en 100 partes iguales.

Los percentiles dan los valores

correspondientes al 1%, al 2%... y al

99% de los datos.

P50 coincide con la mediana.

Percentiles
Donde:

L = Límite inferior de la clase donde cae el percentil

q = % de las obser.'aciones que se requiere a la izquierda de P Q

n = total de observaciones

N = frecuencia acumulada hasta la clase anterior donde se encuentra el


percentil

C = amplitud de la clase donde cae el percentil

nQ = frecuencia de la clase donde cae el percentil

Moda en datos agrupados

La moda es la medida que se relaciona

con la frecuencia con que se presenta

el dato o los datos con mayor

incidencia, con lo que se considera la

posibilidad de que exista más de una

moda para un conjunto de datos.

Moda en datos agrupados: ejemplo


Moda en datos agrupados: por gráfica

1 -Construir un histograma con los datos. El rectángulo más alto es la

clase modal.

3 -Se traza una línea esquina superior derecha del rectángulo

modal a la esquina superior derecha del rectángulo localizado

inmediatamente a su derecha.

4 -Se traza una segunda línea de la esquina superior izquierda del

rectángulo modal a la esquina superior izquierda del rectángulo

localizado inmediatamente a su derecha.

5 -Se traza una línea perpendicular al eje horizontal por el

punto de intersección de las líneas dibujadas en los pasos 3 y 4.


Moda en datos agrupados: por gráfica

Representaciones gráficas

Histograma

Un histograma es una representación gráfica de una variable en

forma de barras.

*Se utilizan para variables continuas o para variables discretas,

con un gran número de datos, y que se han agrupado en


clases.

*Sus marcas horizontales son los límites del intervalo, fronteras de

clase, marcas de clase o valores clave arbitrarios; y sus marcas

verticales son las frecuencias absolutas de cada intervalo.

*La superficie de cada barra es proporcional a la frecuencia de

los valores representados.


Histograma: ejemplo

GRÁFICA BARRAS

> Son parecidas a

los histogramas.

> Las alturas de los

Rectángulos las
representan las

frecuencias.

> No hay motivo

Para barras

Horizontales.

POLÍGONO DE FRECUENCIAS

> Las frecuencias están trazadas en las marcas de clase.

> Los puntos sucesivos están unidos por líneas.

> Para "sujetar" la gráfica a escala horizontal, la frecuencia

inicial y final son cero.

> Si se aplica la misma técnica a una

distribución acumulativa se obtendría

ojiva. Aunque en la ojiva, se marcan las

fronteras de clase en lugar de las marcas de

clase.
PICTOGRAMA

Una forma más dramática y usualmente efectiva

de representar: representaciones pictográficas, es el decir, el


pictograma.

DIAGRAMA DE SECTORES O CIRCULAR O GRÁFICA


CIRCULAR

Consiste en asociar a cada valor de la variable un sector circular

proporcional a su frecuencia relativa. Son adecuados para

variables cuantitativas sin orden.

Se divide un círculo en secciones que son proporcionales en

tamaño con las frecuencias o porcentajes correspondientes.

Ya con los porcentajes, a estos se les

multiplica por 3.6 y ese será su ángulo

correspondiente en el círculo.
DIAGRAMA DE FRECUENCIA DE PUNTOS

Un diagrama de puntos se asemeja a un histograma en el sentido de

que consiste en una representación gráfica de una distribución de los

valores de los datos. Sin embargo, se diferencia de éste en que los

valores se representan individualmente, en lugar de agruparse en

clases. Los diagramas de puntos se aplican preferentemente a

pequeños conjuntos de datos, en cuyo caso no se garantiza el agrupamiento

de valores en clases de una distribución de frecuencias.


Integrantes:

—David Josué Gutiérrez Balán

—Samuel Alejandro Martín Puga

—Anthony Abdiel Guerrero Fuentes

—María José Magaña Valencia

—Fernando Agustín Aguilar Cosgaya

-Roger Armando Herrera Casanova


Conclusión
En este trabajo, pudimos darnos cuenta de cómo la estadística descriptiva
repercute en la vida cotidiana, en este caso, en los accidentes viales. En
efecto, la estadística descriptiva abarca temas complejos que deben ser
comprendidos para poder aplicarlos de una forma correcta y adecuada. Para
la buena realización de este trabajo tuvimos que adentrarnos a cada uno de
los temas englobados para interpretarlos y aplicarlos a los datos del INEGI
que elegimos desde el primer tema de datos continuos y discretos.
También pudimos observar que al aplicar los conocimientos de estadística
descriptiva tuvimos ciertas complicaciones ya que en los datos del INEGI no
cuadraban los resultados, así que redondeamos y nos dio más exacto el
resultado.
En conclusión podemos deducir, que este trabajo nos ayudó a determinar las
medidas de tendencia central, los datos agrupados y aplicarlos en un caso de
la vida real sobre los accidentes de tránsito vial, con respecto a los datos del
INEGI.