Proba Semiterminado

ÍNDICE
Prefacio
En el prefacio podemos integrar los temas de la unidad 3,
pertenecientes a la estadistica descriptiva. En el cual se
abordan los temas: medidas de tendencia central, medidas
de varianza, representaciones gráficas de los datos, datos
agrupados, y aplicaciones de estos, hacia los datos del
INEGI.
La idea fundamental del trabajo gira en torno a la educación
vial, allí yace el porqué de haber estudiado los accidentes de
tránsito en la via terrestre en donde estuvo involucrado el
aliento alcohólico. De aquí que nuestra variable aleatoria
sea la cantidad de accidentes de tránsito causados por la
ausencia o presencia de aliento alcohólico.
Por lo tanto, en esta exposición se verán reflejados dichos
parámetros aplicados a nuestros datos del INEGI.
Estadística
Estadística descriptiva.
La estadística es la ciencia que recopila,
organiza, resume, analiza e interpreta los
datos obtenidos, poro tener conocimiento
de los hechos pasados, preveer situaciones
futuras y tomar decisiones con base en la
experiencia.
Es la ciencia o arte de reunir y analizar
datos e inferir consecuencias a partir de
estos elementos.
La estadística esta dividida en 3:

*Inferencial
*Descriptiva
*Teoría del muestreo
Forma de los datos

*No agrupados
*Agrupados
DATO
Un dato es el valor que puede tomar una variable sea
cualitativa o cuantitativa. Surgen siempre que se toman
medidas o se registran observaciones.
Los datos nominales son numéricos sólo por Su nombre.
Población y muestra
Población: totalidad de
elementos que tienen
características comunes. En la
estadística son grupos
definidos arbitrariamente
acorde al propósito de la
investigación estadística. El
proceso para medir
características de todos los
miembros de la población se
llama censo.
Muestra: subconjunto de la
población Se usa cuando por
razones de tiempo o dinero no es
posible obtener datos de toda la
población. La muestra debe ser
representativa y tener un
tamaño adecuado. El proceso
para medir las características de
los elementos de una muestra se
llama muestreo.
Si un conjunto de datos consta de
todas las observaciones concebibles
posibles de un fenómeno
determinado, lo llamaremos
población; si un conjunto de datos
consiste sólo una parte de estas
observaciones, se le conoce como
una muestra.
Medidas de tendencia central.

Su propósito es centralizar toda
la información en torno a un
dato.
Las medidas estadísticas que describen como resumir los datos por
medio de un número único, un valor que describa en cierta forma el
centro o punto medio de los datos se conocen como medidas de
localización o de tendencia: entre estas las que describen el centro de
los datos se llaman medidas de localización central.
Media
Es el promedio de los datos (se ve afectada por la variación
alta de los datos, y en estos casos pierde valor como medida
descriptiva).
La media de "n" números, es la suma de los mismo dividida
entre “n”
Media de la muestra= x = ∑x/N
Media poblacional= µ = ∑X/N
Media
Asi mismo, para diferenciar entre las descripciones
de poblaciones y las descripciones de muestra, no
usamos símbolos distintos tales como (mu) y x, si no
que nos referimos a la descripcion de una poblacion
como un parámetro y a una descripcion de una

muestra como un valor estadistico. Gereralmente,
los parametros, se expresan por medio de letras
griegas.
Media: ejemplo
Si el salario anual medio pagado a los tres ejecutivos principales de
una empresa es de $156,000, ¿Es posible que uno de ellos reciba
$50,ooo?.
ejecutivos Salario por año

David X
Roger X
Fernando x
TOTAL 156,000 = 3x
Solución:
Dado que n es igual a 3 y el promedio es igual a $156,000, tenemos
Que ∑X=3*156000=$468000 y es imposible que cualquiera de los
ejecutivos gane mas de dicha cantidad.
Media ponderada
Cuando calculamos un promedio, podemos estar cometiendo un gran erros si
contemplamos el hecho de que no todas las cantidades tienen la misma
importancia en relacion con el fenomeno que se describe. Para dar
cantidades de las que se promedia su grado de importancia pertinente, es
necesario asignarle pesos o valores relativos( importancia relativa)
luego calcular una media ponderada.
Media ponderada
En general, la media ponderada, (Equis barra suíndice W) de
un conjunto de números, cuya importancia
relativa se expresa numericamente por medio de un conjunto
de numeros correspondiente, W1,W2,W3.. .Wn, se obtiene
mediante la fórmula:
Media ponderada: ejemplo
Calcula la media de las residencias habitadas por propietarios en
California en 1980.
La media de los tres porcentajes es 52.9 pero no podemos
indicar que esta sea la taza promedio de las residencias
habitadas. Las tres cifras no tienen la misma importancia
porqué hay diferecias de tamaño en las tres ciudades.

Media ponderada: ejemplo
Considerando que había 1,135,000 residencias en L.A.,
113,000 en Sacramento y 210,000 en San José ahora si
se puede obtener la taza de residencias habitadas.
Sustituyendo XI=40.3, X2=56.4, X3=62.1, W1=1135, W2=113 y W3=210

obtenemos:X(barra)w=((1,135)(40.3)+(113)(56.4)+(210)(62.1))/(1,135+113+21
0)=44.7
Mediana
La mediana es valor del artículo medio cuando n es non
y la media de dos artículos medios cuando n es par.
Es el dato central de un conjunto de datos ordenados.

si el numero de datos es par, entonces la media sera el
promedio de los 2 centrales
Media = n+1/2
Mediana: ejemplo
Halle la posición de la mediana para n=15.
Solución:
Con los datos ya ordenados:
(n+1)/2 = (15+1)/2 = 8, de modo que la mediana es el
valor octavo de los artículos
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Cuartiles
Cuando un conjunto de datos se divide en 4 partes iguales, las
marcas que quedan separando esas partes se llaman cuartiles. Las
propiedades de los cuartiles son estas:
Q1 es excedido 3 veces por tantos valores como excede y es otra
posibilidad para Q3.
Hay tantos valores menores que Q1 como los hay entre Q1 Y Q2 , entre
Q2 Y Q3 y mayores que Q3.
La mitad de los datos caben entre Q1 y Q3
MODA
Es el dato que mas se repite en un conjunto de datos.en algun caso
puede no haber moda(amodal) , una sola moda (unimodal), 2 modas
(bimodal) o mas de 3 modas(multimodal).
Sus 2 ventajas principales: no requiere calculos y se puede
determinar para datos cuantitativos y nominales.
Una dificultad es que se comporta erráticamente cuando se
redondean los valores de los datos.

MODA: EJEMPLO
A las 20 juntas de una academia de bailes
tradicionales asistieron 26, 25, 23, 28, 25, 24,
21, 24, 23, 26, 28, 26, 24, 32, 25, 27, 24, 23, 24 y
22 de sus miembros. Obtenga la moda.
Solución:
Entre los 20, 21, 22, 27 y 32 ocurren una vez
cada uno; 28 sucede dos veces; 23, 25 y 26
ocurren tres veces cada uno; y 24 ocurre 5
veces. Así, 24 es la asistencia modal.
Fechas Frecuencia fx
20 1
21 1
22 1
23 3
24 5
25 3
26 3
27 1
28 2
32 1
Medidas de dispersión
Su proposito es determinar cuán homogeneo o heterogeneo es un
conjunto de datos, midiendo sus diferencias o separación entre ellos. Son
un completo de las medidas de centralización den el análisis estadístico
de datos. La agrupación de los datos implica cierta pérdida de
información.
VARIANZA
Es el promedio de los cuadrados de las desviaciones de
los datos:
∑(x-promedio)/n = VAR
Desviación estándar
Es la raiz cuadrada de la varianza.
√ợ =D.E
Varianza /- Desviación estándar- : ejemplo
En 6 domingos consecutivos, un operador recibió 9, 7, 11, 13, 1O y 7
llamadas de servicio. Calcule ợ.
Solución:
Calcular la media:
Media = (9+7+11+10+13+7) / 6= 9.5

Los cálculos para llegar a ợ pueden ser acomodados en
La siguiente tabla.
Entonces, dividiendo entre (6-1)=5
y sacando raíz cuadradas, sale:
ợ=(27.5/5)=√5.5 = 2.3
Datos agrupados
Los datos agrupados son como lo indica su nombre, una
cantidad dada de datos que puede clasificarse, ya sea
por sus cualidades cualitativas o cuantitativas, y por tal
agruparse para su análisis.

Datos agrupados: ejemplo
Se muestran las calificaciones de una prueba de coordinacion fisica,
Aplicada a 20 estudiantes que habiendo ingerido una cantidad de
alcohol equivalente al 0.1% de su peso:
69, 84, 52, 93, 61, 74, 79, 65, 88, 63, 57, 64, 67, 72, 74, 55, 82, 61,
68, 77
Esta lista de números, sigue siendo una basta lista de información,
una tecnica màs eficaz brindarà una buena impresión total de los
datos, es decir la gràfica de tronco y hojas.
Ahora se divide cada numero en sus decenas y unidades,
disponiendo juntos los valores que comparten las decenas. Esto es,
pensaremos en el numero 69, como en 6 | 9 entonces, las decenas
se dispondrà en forma vertical con unidades dispuestas al lado.
Para el conjunto de las 20 calificaciones de coordinación fisica, la
grafica es esta:
Diagrama de árbol
A la tabla anterior se conoce como de tronco y hojas,
porque cada renglón representa una posición de tronco
y cada dígito a la derecha de la línea vertical se puede
considerar como una hoja.
Distribución de frecuencias
Cuando manejamos conjuntos
cuantificados de datos, a menudo
podemos obtener una buena imagen
general y toda la informacion que
necesitemos agrupando los datos en
un numero de clases, intervalos o
categorias.
Por ejemplo, los datos
correspondientes en 1983 de los
suscriptores de cable se representa
de la siguiente manera:
Distribución de frecuencias
Las distribuciones de la frecuencia representan los
datos en una forma relativamente compacta, dan buena
imagen en general y contienen información adecuada
para muchos propósitos.
Para elaborar una distribución de frecuencias hay 3 pasos:
1. Selección de clases (intervalos).
2. Clasificación de las clases.
3. Conteo de número de factores por clase.
Asegurarse siempre de que sendos factores pertenezcan
a una y sólo una clase.

DATOS ARGUPADOS EN INTERVALOS
Cuando tanto el rango de los datos es grande (mayor
igual que 15) como el numero de datos (mayor igual
que 30) , entonces es conveniente además de ordenar
los datos en una tabla de frecuencia , el agruparlos en
intervalos . Este numero de intervalos (k) depende del
total de datos (n) y puede obtenerse por la formula:
K=√n o bien por el indice de
Sturges k=1+3.3log n

Una clase o también denominada intervalo de clase,
son divisiones o categorías en las cuales se agrupa un
conjunto de datos ordenados con características
comunes. En otras palabras, son fraccionamientos del
rango o recorrido de la serie de valores para reunir los
datos que presentan valores comprendidos entre dos
límites.
Siempre que es posible, hacemos que las clases cubran rangos de
valores iguales.
Un numero sugerido de intervalos es entre 5 y IO:
Límite interior (Li): valor de "entrada" en un
intervalo.
Límite superior (Ls): valor de "salida" en un intervalo.
DATOS AGRUPADOS EN INTERVALOS:

EJEMPLO
Elabore una distribución de las siguientes cantidades de óxidos de
(en toneladas) emitidas en una planta industrial en 80 días:
15.8, 26.4, 17.3, 11.2, 23.9, 24.8, 18.7, 13.9, 9, 13.2, 22.7, 9.8, 6.2,
14.7, 17.5, 26.1, 12.8, 28.6, 17.6, 23.7, 26.8, 22.7, 18, 20.5, 11, 20.9,
15.5, 19.4, 16.7, 10.7, 19.1, 15.2, 22.9, 26.6, 20.4, 21.4, 19.2, 21.6,
16.9, 19, 18.5, 23, 24.6, 20.1, 16.2, 18, 7.7, 13.5, 23.5, 14.5, 14.4,
29.6, 19.4, 17, 20.8, 24.3, 22.5, 24.6, 18.4, 18.1, 8.3, 21.9, 12.3,
22.3, 13.3, 11.8, 19.3, 20, 25.7, 31.8, 25.9, 10.5, 15.9, 27.5, 18.1,
17.9, 9.4, 24.1, 20.1 y 28.5.
EJEMPLO
Dado que tenemos 80 datos (n=80) , la cantidad de intervalos...
K será: √80 ᷉ 9. O sea, 9 intervalos.
En vista de que la observación mayor es 31.8, la inferior es 6.2 y los
intervalos son 9; el tamaño de la clase viene dado por:
(31.8-6.2)/9= 2.8᷉3
Intervalos:
5-7.9, 8-10.9, 11-13.9, 14-16.9, 17-19.9, 20-22.9, 23-25.99,
26-28.99 y 29-31.99.

EJEMPLO
Tabla de frecuencia de los
intervalos
DATOS AGRUPADOS EN INTERVALOS
Las distribuciones numéricas igual tienen lo llamado Marca de el
clase (M.K.) que son simplemente el punto medio de la clase y se
obtienen sumando los límites inferiores y superiores de una clase y
dividiendo al resultado entre 2:
MK=Ls+Li/2
Los intervalos de clase de la distribución es la longitud
entre las marcas de clase, se obtiene sacando la
diferencia entre 2 marcas de clase sucesivas. Si las
diferencias son iguales, el intervalo es común a todas las
marcas.
EJEMPLO 2
Calcula las marcas de clase y el intervalo de clase de la distribución
de los datos de emisión de óxidos de azufre:
Marcas de clase:
(5+79)/2 = 6.45, (8+10.9)/2 = 9.45, (11+13.9)/2 = 12.45, (14+16.9)/2=
15.45, (17+19.9)/2 = 18.45, (20+22.9)/2 = 21.45, (23+25.9)/2 = 24.45, (26
+28.9)/2 = 27.45, (29 + 31.9)/2 = 30.45
Las diferencias entre todas las M.K. es 3, por lo que el
intervalo es común a todas.

Media de datos agrupados
Una buena aproximación para determinar la media: asignar a cada
articulo un valor de marca de clase (MK.).
Para dar fórmula general a la media con una distribución de k clases,
se anotan las marcas de clase sucesivas M.K,1. M.K.2..„ y M.K.k y las
frecuencias de las clases correspondientes f1. f2„.. y fk:
M.K1*f1 + MK2 • f2 +… + M.K.k*fk= ∑ M.K*f
Entonces la media de datos agrupados es:
Media de datos agrupados
Calcula la media de los siguientes datos agrupados en la tabla.
MEDIANA PARA DATOS AGRUPADOS

La mediana de una distribución es tal
que la mitad del área total de los
rectángulos del histograma de la
distribución cae a su izquierda y la otra
cae a su derecha.
Mediante la interpolación, la fórmula
de la mediana para datos agrupados en

intervalos es:
Donde:
L es el límite inferior del intervalo
en donde está la mediana.
fa es la frecuencia acumulada anterior a la "clase
mediana".
fmed es la frecuencia absoluta de la "clase mediana".
C: amplitud de la clase (o intervalo) de la mediana.
MEDIANA PARA DATOS AGRUPADOS: EJEMPLO
Utilice la fórmula para hallar la mediana de la distribución de los
datos de la emisión de óxidos de azufre:
Dado que si se divide a 80 entre 2 da 40, y a la

FAA, se percibe que la mediana anda en el
intervalo 17 — 20.9.
L vendría siendo igual a 17
Se sabe que c= (32.9 — 5)/(k=7)=4
((80/2-17)/25)(4)+17=19.08
MEDIANA PARA DATOS AGRUPADOS: EJEMPLO
GRAFICA DE CAJA Y BIGOTES

La información
Proporcionada por la
mediana, los 2 cuartiles y los
valores inferiores y
superiores a veces se
presenta en una
"representación gráfica de
cuadro y sección", llamado
igual "gráfica del recuadro”
Se usan los 2 punto
esenciales en vez de los dos
cuartiles.
Otros cuartiles
Cuartil: cuando un conjunto de
datos se divide en 4 partes iguales,
las marcas que quedan separando
esas partes se llaman cuartiles (Q1,
Q2, Q3).
La fórmula para obtener los
cuartiles es:
Donde:
> L Q = límite real inferior de la "clase Q"
> faa Q = Frecuencia anterior a la "clase Q”
>fq = frecuencia absoluta de la "clase Q”
>C = tamaño o ancho de la "clase Q"
Percentiles
Los percentiles son los 99
valores que dividen la serie
de datos en 100 partes iguales.
Los percentiles dan los valores
correspondientes al 1%, al 2%... y al
99% de los datos.
P50 coincide con la mediana.
Percentiles
Donde:
L = Límite inferior de la clase donde cae el percentil
q = % de las obser.'aciones que se requiere a la izquierda de P Q
n = total de observaciones
N = frecuencia acumulada hasta la clase anterior donde se encuentra el

percentil
C = amplitud de la clase donde cae el percentil
nQ = frecuencia de la clase donde cae el percentil
Moda en datos agrupados
La moda es la medida que se relaciona
con la frecuencia con que se presenta
el dato o los datos con mayor
incidencia, con lo que se considera la
posibilidad de que exista más de una
moda para un conjunto de datos.
Moda en datos agrupados: ejemplo

Moda en datos agrupados: por gráfica
1 -Construir un histograma con los datos. El rectángulo más alto es la
clase modal.
3 -Se traza una línea esquina superior derecha del rectángulo
modal a la esquina superior derecha del rectángulo localizado
inmediatamente a su derecha.
4 -Se traza una segunda línea de la esquina superior izquierda del
rectángulo modal a la esquina superior izquierda del rectángulo
localizado inmediatamente a su derecha.
5 -Se traza una línea perpendicular al eje horizontal por el
punto de intersección de las líneas dibujadas en los pasos 3 y 4.

Moda en datos agrupados: por gráfica
Representaciones gráficas
Histograma
Un histograma es una representación gráfica de una variable en
forma de barras.
*Se utilizan para variables continuas o para variables discretas,
con un gran número de datos, y que se han agrupado en

clases.
*Sus marcas horizontales son los límites del intervalo, fronteras de
clase, marcas de clase o valores clave arbitrarios; y sus marcas
verticales son las frecuencias absolutas de cada intervalo.
*La superficie de cada barra es proporcional a la frecuencia de
los valores representados.

Histograma: ejemplo
GRÁFICA BARRAS
> Son parecidas a
los histogramas.
> Las alturas de los
Rectángulos las
representan las
frecuencias.
> No hay motivo
Para barras
Horizontales.
POLÍGONO DE FRECUENCIAS
> Las frecuencias están trazadas en las marcas de clase.
> Los puntos sucesivos están unidos por líneas.
> Para "sujetar" la gráfica a escala horizontal, la frecuencia
inicial y final son cero.
> Si se aplica la misma técnica a una
distribución acumulativa se obtendría
ojiva. Aunque en la ojiva, se marcan las
fronteras de clase en lugar de las marcas de
clase.
PICTOGRAMA
Una forma más dramática y usualmente efectiva
de representar: representaciones pictográficas, es el decir, el

pictograma.
DIAGRAMA DE SECTORES O CIRCULAR O GRÁFICA

CIRCULAR
Consiste en asociar a cada valor de la variable un sector circular
proporcional a su frecuencia relativa. Son adecuados para
variables cuantitativas sin orden.
Se divide un círculo en secciones que son proporcionales en
tamaño con las frecuencias o porcentajes correspondientes.
Ya con los porcentajes, a estos se les
multiplica por 3.6 y ese será su ángulo
correspondiente en el círculo.
DIAGRAMA DE FRECUENCIA DE PUNTOS
Un diagrama de puntos se asemeja a un histograma en el sentido de
que consiste en una representación gráfica de una distribución de los
valores de los datos. Sin embargo, se diferencia de éste en que los
valores se representan individualmente, en lugar de agruparse en
clases. Los diagramas de puntos se aplican preferentemente a
pequeños conjuntos de datos, en cuyo caso no se garantiza el agrupamiento
de valores en clases de una distribución de frecuencias.

Integrantes:
—David Josué Gutiérrez Balán
—Samuel Alejandro Martín Puga
—Anthony Abdiel Guerrero Fuentes
—María José Magaña Valencia
—Fernando Agustín Aguilar Cosgaya
-Roger Armando Herrera Casanova

Conclusión
En este trabajo, pudimos darnos cuenta de cómo la estadística descriptiva
repercute en la vida cotidiana, en este caso, en los accidentes viales. En
efecto, la estadística descriptiva abarca temas complejos que deben ser
comprendidos para poder aplicarlos de una forma correcta y adecuada. Para
la buena realización de este trabajo tuvimos que adentrarnos a cada uno de
los temas englobados para interpretarlos y aplicarlos a los datos del INEGI
que elegimos desde el primer tema de datos continuos y discretos.
También pudimos observar que al aplicar los conocimientos de estadística
descriptiva tuvimos ciertas complicaciones ya que en los datos del INEGI no
cuadraban los resultados, así que redondeamos y nos dio más exacto el
resultado.
En conclusión podemos deducir, que este trabajo nos ayudó a determinar las
medidas de tendencia central, los datos agrupados y aplicarlos en un caso de
la vida real sobre los accidentes de tránsito vial, con respecto a los datos del
INEGI.

Proba Semiterminado

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Proba Semiterminado

Diunggah oleh

Hak Cipta:

Format Tersedia

ÍNDICE

La estadística es la ciencia que recopila,

organiza, resume, analiza e interpreta los

datos obtenidos, poro tener conocimiento

de los hechos pasados, preveer situaciones

futuras y tomar decisiones con base en la

Es la ciencia o arte de reunir y analizar

datos e inferir consecuencias a partir de

La estadística esta dividida en 3:

Forma de los datos

cualitativa o cuantitativa. Surgen siempre que se toman

medidas o se registran observaciones.

Los datos nominales son numéricos sólo por Su nombre.

elementos que tienen

estadística son grupos

proceso para medir

características de todos los

población Se usa cuando por

razones de tiempo o dinero no es

posible obtener datos de toda la

población. La muestra debe ser

tamaño adecuado. El proceso

para medir las características de

los elementos de una muestra se

Si un conjunto de datos consta de

todas las observaciones concebibles

población; si un conjunto de datos

consiste sólo una parte de estas

observaciones, se le conoce como

Medidas de tendencia central.

medio de un número único, un valor que describa en cierta forma el

centro o punto medio de los datos se conocen como medidas de

localización o de tendencia: entre estas las que describen el centro de

los datos se llaman medidas de localización central.

alta de los datos, y en estos casos pierde valor como medida

La media de "n" números, es la suma de los mismo dividida

Media de la muestra= x = ∑x/N

Media poblacional= µ = ∑X/N

usamos símbolos distintos tales como (mu) y x, si no

que nos referimos a la descripcion de una poblacion

como un parámetro y a una descripcion de una

los parametros, se expresan por medio de letras

una empresa es de $156,000, ¿Es posible que uno de ellos reciba

ejecutivos Salario por año

Dado que n es igual a 3 y el promedio es igual a $156,000, tenemos

Que ∑X=3*156000=$468000 y es imposible que cualquiera de los

ejecutivos gane mas de dicha cantidad.

un conjunto de números, cuya importancia

relativa se expresa numericamente por medio de un conjunto

de numeros correspondiente, W1,W2,W3.. .Wn, se obtiene

Media ponderada: ejemplo

Calcula la media de las residencias habitadas por propietarios en

La media de los tres porcentajes es 52.9 pero no podemos

indicar que esta sea la taza promedio de las residencias

habitadas. Las tres cifras no tienen la misma importancia

porqué hay diferecias de tamaño en las tres ciudades.

113,000 en Sacramento y 210,000 en San José ahora si

se puede obtener la taza de residencias habitadas.

Sustituyendo XI=40.3, X2=56.4, X3=62.1, W1=1135, W2=113 y W3=210

y la media de dos artículos medios cuando n es par.

Es el dato central de un conjunto de datos ordenados.

Con los datos ya ordenados:

(n+1)/2 = (15+1)/2 = 8, de modo que la mediana es el

valor octavo de los artículos