Anda di halaman 1dari 25

INSTITUTO TECNOLÓGICO SUPERIOR

DE COATZACOALCOS

Ingeniería en Gestión Empresarial

Probabilidad y Estadística

Unidad 1. Distribuciones de frecuencia

Martínez García Arianeth

M.I. Nayelit Alcántara Medrano

Coatzacoalcos, Ver., a 30 de Septiembre del 2019


ÍNDICE

Contenido
1.1 Conceptos de estadística y su clasificación.......................................................................3

1.2 Recopilación de datos........................................................................................................3

1.3 Distribución de frecuencias................................................................................................7

1.3.1 Polígonos de frecuencia, histogramas y ojivas..............................................................11

1.4 Medidas de tendencia central para un conjunto de datos y datos agrupados..................14

1.4.1 Media, media ponderada..............................................................................................15

1.4.2 Mediana........................................................................................................................ 16

1.4.3 Moda............................................................................................................................. 17

1.4.4 Relación entre media, mediana y moda........................................................................17

1.5 Medidas de dispersión para un conjunto de datos y datos agrupados.............................18

1.5.1 Rango........................................................................................................................... 19

1.5.2 Desviación media.......................................................................................................... 19

1.5.3 Varianza........................................................................................................................ 20

1.5.4 Desviación estándar.....................................................................................................21


3

1.1 Conceptos de estadística y su clasificación

¿Qué es la Estadística?
La Estadística es la rama de las matemáticas que se encarga de recolectar, describir,
organizar e interpretar datos con el objeto de tomar decisiones.

Clasificación de la Estadística

ESTADÍSTICA

DESCRIPTIVA INFERENCIAL

Basada en hechos anteriores, Analiza información para tomar


recolecta y analiza los datos. decisiones, generalizar y pronosticar el
Describe el pasado. futuro.

1.2 Recopilación de datos

Al recoger datos relativos a las características de un grupo de individuos u objetos, sean


alturas y pesos de estudiantes de una universidad o tuercas defectuosas producidas en una
fábrica, suele ser imposible o nada práctico observar todo el grupo, en especial si es muy
grande. En vez de examinar el grupo entero, llamado población o universo, se examina una
pequeña parte del grupo, llamada muestra.
Una población puede ser finita o infinita.

“probabilidad y estadística. Murray R. Spiegel” “Gustavo Alejandro Galindo Rosales”


4

Población.- Agregado de unidades elementales, que poseen alguna característica o


propiedades comunes.
El estudio de toda la población constituye un CENSO.
Una población puede ser finita o infinita.
En relación al tamaño de la población, esta puede ser:
 Finita, como es el caso el número de personas que llegan al servicio de urgencias de
un hospital en un día; y se conoce como el tamaño N de la población.
 Infinita, si por ejemplo estudiamos el mecanismo aleatorio que describe la secuencia
de caras y cruces obtenida en el lanzamiento repetido de una moneda al aire.

Muestra.- Es una parte de la población. Se espera que la muestra sea representativa de la


población, es decir reproduzca las características más importantes. El proceso de obtener la
muestra se denomina MUESTREO.
Muestra aleatoria.- cuando la muestra a sido obtenida empleando algún procedimiento del
azar: sorteo, extracción al azar, números aleatorios, etc.

Técnicas para hallar datos

ENTREVISTAS
Las entrevistas se utilizan para recabar información en forma verbal, a través de preguntas
que propone el analista. Quienes responden pueden ser gerentes o empleados, los cuales
son usuarios actuales del sistema existente, usuarios potenciales del sistema propuesto o
aquellos que proporcionarán datos o serán afectados por la aplicación propuesta. El analista
puede entrevistar al personal en forma individual o en grupos.

“Gustavo Alejandro Galindo Rosales” “Luis Alberto Bautista Delgado”


5

Estructurada: cuando el entrevistador elabora una lista de preguntas las cuales plantea
siempre en igual orden (existe un formulario preparado).

Semiestructurada: en la que el entrevistador tiene libertad de hacer preguntas adicionales

OBSERVACIÓN
Con ella puede obtenerse información aun cuando no existía el deseo de proporcionarla y es
independiente de la capacidad y veracidad de las personas a estudiar; por otra parte, como
los hechos se estudian sin intermediarios, se evitan distorsiones de los mismos, sin
embargo, debe cuidarse el entrenamiento del observador, para que la observación tenga
validez científica.
La observación puede adoptar diferentes modalidades:
a. Observación Estructurada: Se observan los hechos estableciendo de antemano qué
aspectos se han de estudiar.
b. Observación no estructurada: Consiste en recoger y anotar todos los hechos que sucedan
en determinado momento sin poseer guía alguna de lo que se va a observar.

Según el papel o modo de la participación del observador


a. Observación participante: Consiste en la participación directa del observador con la
comunidad, el grupo o la situación determinada.
b. Observación no participante: El observador permanece ajeno a la situación que observa.

Según el número de observadores


a. Individual: es la que realiza una sola persona, es obvio que el investigador se centra en lo
que observa.
b. Colectiva: es una observación en equipo, puede realizarse de las siguientes maneras:
todos observan lo mismo o cada uno observa un aspecto diferente.

Según el lugar donde se realizar


a. Campo: los hechos se captan tal y como se van presentando en el mismo sitio donde
usualmente se encuentran o viven los sujetos estudiados. Allí se observa cómo actúa el
sujeto.

“Luis Alberto Bautista Delgado”


6

b. Laboratorio: tiene cierto carácter experimental y comprende la observación minuciosa y


detallada de un fenómeno en un sitio especialmente previsto para hacer la observación.

DIAGRAMA DE FLUJO
El resultado puede ser un producto, un servicio, información o una combinación de los tres.
Al examinar cómo los diferentes pasos es un proceso se relacionan entre sí, se puede
descubrir con frecuencia las fuentes de problemas potenciales. Los diagramas de flujo se
pueden aplicar a cualquier aspecto del proceso desde el flujo de materiales hasta los pasos
para hacer la venta u ofrecer un producto.

LA ENCUESTA
Una encuesta es un conjunto de preguntas normalizadas dirigidas a una muestra
representativa de la población o instituciones, con el fin de conocer estados de opinión o
hechos específicos.
1. Encuestas basadas en entrevistas cara a cara o de profundidad: Consisten en entrevistas
directas o personales con cada encuestado. Tienen la ventaja de ser controladas y guiadas
por el encuestador, además, se suele obtener más información que con otros medios (el
teléfono y el correo).
2. Encuestas telefónicas: Este tipo de encuesta consiste en una entrevista vía telefónica con
cada encuestado. Sus principales ventajas son:
 Se puede abarcar un gran número de personas en menos tiempo que la entrevista
personal
 Sus costos suelen ser bajos
 Es de fácil administración (hoy en día, existen software especializado para la gestión
de encuestas telefónicas).
3. Encuestas postales: Consiste en el envío de un "cuestionario" a los potenciales
encuestados, pedirles que lo llenen y hacer que lo remitan a la empresa o a una casilla de
correo. Para el envío del cuestionario existen dos medios:
 El correo tradicional
 El correo electrónico (que ha cobrado mayor vigencia en los últimos años).
4. Encuestas por Internet: Este tipo de encuesta consiste en "colocar" un cuestionario en
una página Web o en enviarlo a los correos electrónicos de un panel predefinido. Sus
principales ventajas son:

“Luis Alberto Bautista Delgado”


7

 La amplia cobertura a la que se puede llegar (incluso a miles de encuestados en


varios países y al mismo tiempo),
 El ahorro de tiempo (se puede obtener miles de encuestas respondidas en cuestión
de horas), los bajos costos (que son menores a las encuestas cara a cara, por
teléfono y postales) y la utilización de medios audiovisuales durante la encuesta.

SESIÓN DE GRUPO
En una sesión de grupo un pequeño número de individuos es reunido para conversar acerca
de algún tema de interés para alguna compañía, institución o persona. La reunión, que dura
aproximadamente una hora, es dirigida por un moderador el cual asegura que en la sesión
se discutan los temas deseados y que se formen discusiones acerca de las ideas planteadas
por los participantes.

Las principales aplicaciones de las sesiones de grupo son:

 Generación de hipótesis que más adelante se evaluarán de manera cuantitativa.


 Desarrollo de nuevas ideas para un producto o su introducción en el mercado.
 Generación de información para preparar estudios cuantitativos.
 Profundización en los motivos, razones y actitudes que determinan las acciones de
los consumidores.
 Evaluación de conceptos y evaluación publicitaria.

1.3 Distribución de frecuencias


Las tablas de distribución de frecuencias se utilizan cuando se recolectan datos, con ellas se
pueden representar los datos de manera que es más fácil analizarlos.
Se pueden elaborar tablas de distribución de frecuencias para datos no agrupados y para
datos agrupados. Estas últimas se utiliza cuando se tienen muchos datos.
Para elaborar tablas de distribuciones de frecuencia se debe tener en cuenta lo siguiente:

“Luis Alberto Bautista Delgado”


“Distribución de frecuencias”
8

Cuando hay muchos datos se agrupan en clases. Esto consiste en agrupar los datos en una
distribución de frecuencias, que puede definirse como una ordenación o arreglo de datos en
clases o categorías que muestran para cada una de ellas, el número de elementos que
contiene, denominada frecuencia.
Clase: es cada uno de los grupos en que se dividen los datos. Para determinar cuántas
clases crear, se puede utilizar la siguiente fórmula (fórmula de Sturges)

Número de clases = 1 + 3,322 log n donde n es el número total de datos.


Si al aplicar la fórmula se obtiene un número decimal, se aproxima al siguiente entero.

El intervalo de clase o el ancho de la clase (tamaño de la clase): es el espacio que hay entre
el límite superior y el límite inferior de la clase, los cuales corresponden a los valores
extremos de la clase. Para obtener el ancho de clase se utiliza la siguiente fórmula:

Ancho de clase = (dato superior – dato inferior)/ número de clases

La frecuencia absoluta: es el número de veces que se repite cada dato. Cuando se agrupan
los datos, es el número de datos que tiene cada clase. Se simboliza con fj.

La marca de clase: es el punto medio de la clase. Se obtiene dividiendo entre dos la suma de
los valores extremos de cada clase.

El rango: es la diferencia entre el valor mayor y el valor menor en estudio de una distribución
de datos.

La frecuencia absoluta acumulada: es la frecuencia total hasta el límite superior de cada


clase. Se simboliza con F i.

La frecuencia relativa de un dato da información sobre qué parte de la población o de la


muestra en estudio corresponde a la característica analizada. Se obtiene dividiendo la
frecuencia absoluta entre el número total de datos y se puede expresar como una fracción,

“Distribución de frecuencias”
9

como un decimal o como un porcentaje. Se simboliza con f i / n donde n es el número de


datos.
La frecuencia acumulada relativa: es la frecuencia relativa total hasta el límite superior de
cada clase. Se simboliza con F j / n donde n es el número total de datos.

Límites de clase
Los límites de clase son los valores que separan a una clase en particular de la anterior y de
la siguiente.

Las clases de la distribución pueden escribirse en forma de límites indicados o de límites


reales.
Así por ejemplo si se tiene la siguiente tabla referente a la estatura de 50 obreros en
pulgadas:
Clases Frecuencias

50,5 - 53,5 1
53,5 - 56,5 2
56,5 – 59,5 6
59,5 – 62,5 11
62,5 – 65,5 16
65,5 – 68,5 9
68,5 – 71,5 4
71,5 – 74,5 1

TOTAL 50

En el ejemplo anterior los límites indicados son 51 – 53, 54 – 56, etc. y los límites reales son:
50,5 – 53,5; 53,5 – 56,5; etc.
Es importante saber establecer los límites reales, pues con base en ellos se calcula el punto
medio, magnitud que se usará para cálculos posteriores

“Distribución de frecuencias”
10

Suponga que un investigador desea determinar cómo varía el peso de un grupo de


estudiantes de primer semestre de una universidad. Selecciona una muestra de 50
estudiantes y registra sus pesos en kilogramos. Los datos obtenidos fueron los siguientes:
65 63 65 63 69 67 53 58 60 61

64 65 64 72 68 66 55 57 60 62

64 65 64 71 68 66 56 59 61 62

63 65 63 70 67 66 57 59 61 62

64 64 63 69 67 66 58 60 61 62
Este diagrama facilita determinar la cantidad de veces que se repite un dato y los valores de
los datos con el fin de escribirlos de manera ordenada en la tabla.

Para construir la tabla de datos no agrupados se debe calcular primero lo siguiente:

Número de clases
k=1+3,322log(n)
=1+3,322log (50)
=6,64≈7

Rango
R=xn−x1=72−53=19
Amplitud de clase
I=R/k
=19/7
=2,71≈3
Punto medio: mi es el valor central de la clase. Se obtiene calculando el promedio de los
límites reales, sumando al límite real inferior el límite real superior y dividiendo por dos.
Frecuencia absoluta. Se define como el número de elementos u observaciones
pertenecientes a una misma clase.

“Distribución de frecuencias”
11

Frecuencia relativa: Se obtiene dividiendo la frecuencia absoluta por el número total de


observaciones. Indica la importancia relativa de la clase.
Frecuencias acumuladas: Es la suma de las frecuencias absolutas o relativas en sentido
ascendente o descendente según se quieran acumular “hacia arriba” o “hacia abajo”
Al construir la tabla de datos agrupados con la información del ejemplo, se tiene:
Tabla de datos agrupados

Punto Frecuencia Frecuencia


Frecuencia Frecuencia
medio absoluta relativa
absoluta relativa
acumulada acumulada
Pesos mi
(Kg) fi Fi fr i Fr i
53 - 55 54 2 2 4,00% 4,00%
56 - 58 57 5 7 10,00% 14,00%
59 - 61 60 9 16 18,00% 32,00%
62 - 64 63 15 31 30,00% 62,00%
65 - 67 66 12 43 24,00% 86,00%
68 - 70 69 5 48 10,00% 96,00%
71 - 73 72 2 50 4,00% 100,00%
50 100,00%

1.3.1 Polígonos de frecuencia, histogramas y ojivas.

El polígono de una variable cuantitativa corresponde al diagrama de líneas. Se construye a


partir del histograma de frecuencias.
Para esto, se unen los puntos medios de cada una de las barras con un segmento recta.
Para que la gráfica sea un polígono, es necesario construir un segmento de recta que inicie
en el eje horizontal y termine en el punto medio de barra. De forma similar, se debe hacer en
la última barra que la figura que se obtenga sea cerrada.

“histograma, polígono de frecuencia”


12

Para construir el polígono de frecuencia se toma la marca de clase que coincide con el punto
medio de cada rectángulo de un histograma.

Diagrama de barras
Se utiliza para representar los caracteres cualitativos y cuantitativos discretos. En el eje
horizontal, o eje de abcisas, se representan los datos o modalidades; en el eje vertical o de
ordenadas, se representan las frecuencias de cada dato o modalidad.
Sobre el eje horizontal se levantan barras o rectángulos de igual base (que no se
superpongan) cuya altura debe ser proporcional a la frecuencia que representan.

Diagrama de pastel
También llamados gráficas circulares o gráficas de 360 grados, son recursos estadísticos
que se utilizan para representar porcentajes y proporciones. El número de elementos
comparados dentro de un gráfico circular puede ser de más de 5, y los segmentos se
ordenan de mayor a menor, iniciando con el más amplio a partir de las 12, como en un reloj.
Una manera fácil de identificar los segmentos es sombreando de claro a oscuro, donde el de
mayor tamaño es el más claro y el de menor tamaño, el más oscuro.
Al igual que en la gráfica de barras, el empleo de tonalidades o colores facilita la
diferenciación de los porcentajes o proporciones.
A diferencia de otros tipos de gráficos, el grafico circular no tiene ejes x o y.
Se utilizan en aquellos casos donde interesa no sólo mostrar el número de veces que se da
una característica o atributo de manera tabular sino más bien de manera gráfica, de tal
manera que se pueda visualizar mejor la proporción en que aparece esa característica
respecto del total.

“Histograma, polígono de frecuencia y ojivas”


13

Diagrama de árbol
El diagrama de árbol es una representación gráfica de los posibles resultados del
experimento, el cual consta una serie de pasos, donde cada uno de los pasos tiene un
número finito de maneras de ser llevado a cabo. Se utiliza en los problemas de conteo y
probabilidad.

Un Histograma es un tipo especial de gráfica de barras que despliega la variabilidad dentro


de un proceso, también toma datos variables (tales como alturas, pesos, densidades, tiempo,
temperaturas, etc.) y despliega su distribución. Un histograma es una representación gráfica
de una variable en forma de barras, donde la superficie de cada barra es proporcional a la
frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y
en el eje horizontal los valores de las variables, normalmente señalando las marcas de clase,
es decir, la mitad del intervalo en el que están agrupados los datos.

Tipos de histograma:
· Diagramas de barras simples
Representa la frecuencia simple (absoluta o relativa) mediante la altura de la barra la cual es
proporcional a la frecuencia simple de la categoría que representa.
· Diagramas de barras compuestas
Se usa para representar la información de una tabla de doble entrada o sea a partir de dos
variables, las cuales se representan así; la altura de la barra representa la frecuencia simple
de las modalidades o categorías de la variable y esta altura es proporcional a la frecuencia
simple de cada modalidad.

· Diagramas de barras agrupadas


Se usa para representar la información de una tabla de doble entrada o sea a partir de dos
variables, el cual es representado mediante un conjunto de barras como se clasifican
respecto a las diferentes modalidades

“histograma, polígono de frecuencia y ojivas”


14

La representación gráfica de un cuadro de frecuencia


acumulada son curvas llamadas ojivas. En la gráfica de ojiva, el
último intervalo no se une con el eje horizontal.
La ojiva apropiada para información que presente frecuencias
mayores que el dato que se está comparando tendrá una
pendiente negativa (hacia abajo y a la derecha) y en cambio la
que se asigna a valores menores, tendrá una pendiente positiva. Una gráfica similar al
polígono de frecuencias es la ojiva, pero ésta se obtiene de aplicar parcialmente la misma
técnica a una distribución acumulativa y de igual manera que éstas, existen las ojivas mayor
que y las ojivas menor que.

1.4 Medidas de tendencia central para un conjunto de datos y datos agrupados


Las medidas de tendencia central de datos agrupados se utilizan en estadística para
describir ciertos comportamientos de un grupo de datos suministrados, como por ejemplo a
qué valor están cercanos, cuál es el promedio de los datos recogidos, entre otros.
Cuando se toma una cantidad grande de datos, es útil agruparlos para tener un mejor orden
de los mismos y así poder calcular ciertas medidas de tendencia central.
Entre las medidas de tendencia central más utilizadas están la media aritmética, la mediana
y la moda.

Datos agrupados

“histograma, polígono de frecuencia y ojivas” “Vicenzo Jesús D´ Alessio Torres”


15

Para agrupar datos primero se debe calcular el rango de los datos, el cual se obtiene
restando el mayor valor menos el menor valor de los datos.

“Histograma, polígono de frecuencia y ojivas”


16

Luego se escoge un número «k», el cual es el número de clases en las que se quieran
agrupar los datos.
Se procede a dividir el rango entre «k» para obtener la amplitud de las clases a agrupar. Este
número es C=R/k.
Por último se comienza la agrupación, para lo cual se escoge un número menor que el
menor valor de los datos obtenidos.
Este número será el límite inferior de la primera clase. A este se le suma C. El valor obtenido
será el límite superior de la primera clase.
Luego, a este valor se le suma C y se obtiene el límite superior de la segunda clase. De esta
forma se procede hasta obtener el límite superior de la última clase.
Luego de que los datos están agrupados se puede proceder a calcular la media, la mediana
y la moda.

1.4.1 Media, media ponderada


La media de un conjunto de números, algunas veces simplemente llamada el promedio , es
la suma de los datos divididos entre el número total de datos.

Ejemplo:
Encuentra la media del conjunto {2, 5, 5, 6, 8, 8, 9, 11}.
Hay 8 números en el conjunto. Súmelos, y luego divida entre 8.

= 6,75
Así, la media es 6.75.

“Vicenzo Jesús D´ Alessio Torres” “Gustavo Alejandro Galindo Rosales”


17

La media ponderada (MP) es una medida de centralización. Consiste en otorgar a cada


observación del conjunto de datos (X1,X2,…,XN) unos pesos (p1,p2,…,pN) según la
importancia de cada elemento

Cuanto más grande sea el peso de un elemento, más importante se considera que es éste.
La media ponderada tiene numerosas aplicaciones, por ejemplo, la nota de una asignatura
donde el examen final tiene un peso mayor al de un trabajo.

1.4.2 Mediana
Para calcular la mediana de un conjunto de datos primero se ordenan todos los datos de
menor a mayor. Se pueden presentar dos casos:
Si el número de datos es impar, entonces la mediana es el dato que está justo en el centro.
– Si el número de datos es par, entonces la mediana es el promedio de los dos datos que
quedan en el centro.
Cuando se trata de datos agrupados, el cálculo de la mediana se hace de la siguiente forma:
– Se calcula N/2, donde N es el total de datos.
– Se busca el primer intervalo donde la frecuencia acumulada (la suma de las frecuencias)
sea mayor que N/2, y se selecciona el límite inferior de este intervalo, llamado Li.

La mediana viene dada por la siguiente fórmula:


Me = Li + (Ls-Li)*(N/2 – Frecuencia Acumulada antes de Li) / frecuencia de [Li,Ls)
Ls es el límite superior del intervalo mencionado anteriormente.
Si se utiliza la tabla de datos anterior se tiene que N/2 = 18/2 = 9. Las frecuencias
acumuladas son 4, 8, 14 y 18 (una para cada fila de la tabla).
Por lo tanto, se debe seleccionar el tercer intervalo, dado que la frecuencia acumulada es
mayor que N/2=9.
De modo que Li=5 y Ls=7. Aplicando la fórmula descrita anteriormente se tiene que:
Me = 5 + (7-5)*(9-8)/6 = 5+2*1/6 = 5 + 1/3 = 16/3 ≈ 5,333

“Universo formulas” “Vicenzo Jesús D´ Alessio Torres”


18

1.4.3 Moda

La moda es el valor que tiene mayor frecuencia entre todos los datos agrupados; es decir, es
el valor que se repite más veces en el conjunto de datos inicial. Cuando se tiene una
cantidad de datos muy grande, para calcular la moda de los datos agrupados se utiliza la
siguiente fórmula:

Mo = Li + (Ls-Li)*(frecuencia de Li – Frecuencia de L(i-1)) / ((frecuencia de Li – Frecuencia


de L(i-1)) + (frecuencia de Li – Frecuencia de L(i+1)))

El intervalo [Li,Ls) es el intervalo donde se encuentra la frecuencia mayor. Para el ejemplo


hecho en este artículo se tiene que la moda viene dada por:

Mo = 5 + (7-5)*(6-4) / ((6-4) + (6-4)) = 5 + 2*2/4 = 5+1 = 6.

Otra fórmula que se utiliza para obtener un valor aproximado a la moda es la siguiente:

Mo = Li + (Ls-Li)*(frecuencia L(i+1)) / (frecuencia L(i-1) + frecuencia L(i+1)).

Con esta fórmula, las cuentas quedan como sigue a continuación:

Mo = 5 + (7-5)*4/(4+4) = 5 + 2*4/8 = 5+1 = 6.

1.4.4 Relación entre media, mediana y moda

La media, moda y mediana pertenecen a las medidas de tendencia central, es decir son
medidas obtenidas a partir de la organización de un grupo de datos numéricos, y las tres
aunque son distintas en definición, tienden a ubicarse en el centro del grupo de datos. Es
decir, son medidas que nos dan una idea general respecto del vago comportamiento dentro
de un mismo grupo de datos.

“Vicenzo Jesús D´ Alessio Torres” “Gustavo Alejandro Galindo Rosales”


19

Media: resume en un valor las características de una variable teniendo en cuenta a todos los
casos. Es el promedio de un grupo de datos.
Mediana: es el valor de la variable que deja el mismo número de datos antes y después que
el, una vez ordenados esto. Es el número que tienes a la mitad de un grupo de datos que
esta ordenado de menor a mayor.
Moda: es el valor que cuenta con una mayor frecuencia de distribución de datos. El número
que más se repite dentro de un grupo de datos.
La relación que pueden tener, es que si tu moda, mediana y media es la misma se dice que
los datos siguen una distribución normal, es decir que tiene un comportamiento regular y
después analizarlos estadísticamente de una manera más cómoda.
Ejemplo: supongamos que 7 amigos comieron 2, 3, 3, 3, 4, 4, 6 tortillas respectivamente: la
media (promedio) es 3.7, la mediana (el valor de en medio) es 3, y la moda (el valor que más
se repite) es también 3.

1.5 Medidas de dispersión para un conjunto de datos y datos agrupados

Las medidas de dispersión, variabilidad o variación nos indican si esos datos están próximos
entre sí o sí están dispersos, es decir, nos indican cuán esparcidos se encuentran los datos.
Estas medidas de dispersión nos permiten apreciar la distancia que existe entre los datos a
un cierto valor central e identificar la concentración de los mismos en un cierto sector de la
distribución, es decir, permiten estimar cuán dispersas están dos o más distribuciones de
datos.

Estas medidas permiten evaluar la confiabilidad del valor del dato central de un conjunto de
datos, siendo la media aritmética el dato central más utilizado. Cuando existe una dispersión
pequeña se dice que los datos están dispersos o acumulados cercanamente respecto a un
valor central, en este caso el dato central es un valor muy representativo. En el caso que la
dispersión sea grande el valor central no es muy confiable. Cuando una distribución de datos
tiene poca dispersión toma el nombre de distribución homogénea y si su dispersión es alta
se llama heterogénea

“Gustavo Alejandro Galindo Rosales” “Mario Orlando Suárez Ibajes”


20

1.5.1 Rango
El rango es un valor numérico que indica la diferencia entre el valor máximo y el mínimo de
una población o muestra estadística.
El rango suele ser utilizado para obtener la dispersión total. Es decir, si tenemos una muestra
con dos observaciones: 10 y 100 euros, el rango será de 90 euros.
Sobre todo en finanzas, el rango es muy útil para observar cuán grande podría llegar a ser
una variación o cambio. Vale la pena mencionar también que, en no pocas ocasiones, el
rango no es una medida fija.
Fórmula del rango
Para calcular el rango de una muestra o población estadística utilizaremos la siguiente
fórmula:
R = Máxx – Mínx

Donde
 R es el rango.
 Máx es el valor máximo de la muestra o población.
 Mín es el valor mínimo de la muestra o población estadística.
 x es la variable sobre la que se pretende calcular esta medida.

1.5.2 Desviación media

La desviación media es un primer intento por buscar una medida de dispersión más
eficiente que el rango.

Es abreviada por Dm y se define como:

X = media aritmética Xi = Datos de la muestra N= Números de datos

“José Francisco López” “probabilidad y estadística”


21

Ejemplo:
Hallar la desviación media de un conjunto 2, 3, 6, 8, 11.
Al determinar la diferencia de cada dato dela muestra con su media nos daría como
resultado un cero, porque hay diferencias negativas y positivas y todas se contrarrestan
entre sí. Así que para evitar que se equilibren estas diferencias, usaremos en cada una su
valor absoluto para que todas ellas sean positivas.

2 + 3 + 6 + 8 + 11 / 5 = 6

Dm = │2 – 6 │ + │3 – 6 │ +│6 – 6 │ + │8 – 6 │ + │11 – 6 │/ 5 = 2.8

1.5.3 Varianza
Procura dar el grado con que puede variar un dato de la muestra; el problema es que sus
unidades son cuadradas y es poco compresible para efectos prácticos.
Recordemos la dificultad de sumar las diferencias entre cada dato de la muestra y su
media; por lo que otra manera de hacer positivas las diferencias es elevando cada diferencia
al cuadrado, de tal manera que cada cantidad encontrada será positiva.

Es abreviada por S y se define como:

X = media aritmética Xi = Datos de la muestra N= Números de datos

“probabilidad y estadística”
22

Ejemplo:
Clasificación por grupos
Determina la varianza del grupo A en partidos ganados (PG).
EQUIPO ESTUDIANTES JAGUARES NECAXA TIGRES MONTERREY SAN LUIS
PG 4 4 4 6 9 9

Varianza = S² = (4 – 6)² + (4 – 6)² + (4 – 6) ² + (6 – 6)² + (9 – 6 ) ²+ (9 – 6)² / 5


S ²= ( - 2 )² + (-2)² + (-2) ² + (0)² + (3) ²+ (3)² / 5
S²= 4 + 4 + 0 + 9 + 9 / 5
S²= 30 / 5
S²= 6

1.5.4 Desviación estándar


La desviación estándar o desviación típica es la raíz cuadrada de la varianza .
Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación.
La desviación estándar se representa por σ.

Desviación estándar para datos agrupados

Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son
equivalentes a las anteriores.

“probabilidad y estadística” “itutor”


23

Desviación estándar para datos agrupados

Ejercicios
Calcular la desviación estándar de la distribución:

9, 3, 8, 8, 9, 8, 9, 18

Propiedades de la desviación estándar


1 La desviación estándar será siempre un valor positivo o cero , en el caso de que las
puntuaciones sean iguales.
2 Si a todos los valores de la variable se les suma un número la desviación estándar
no varía.
3 Si todos los valores de la variable se multiplican por un número la desviación
estándar queda multiplicada por dicho número.
4 Si tenemos varias distribuciones con la misma media y conocemos sus
respectivas desviaciones estándar se puede calcular la desviación estándar total.

Si todas las muestras tienen el mismo tamaño:

“itutor”
24

Si las muestras tienen distinto tamaño:

CONCLUSIÓN

En esta investigación se describe cada uno de los temas que van conforma a las
distribuciones de frecuencia y nos referimos a como poder tomar cada una de las
herramientas ya sea gráficas, datos de personas para poder llegar a un resultado, como bien
se menciona esto ayuda a analizar y dar información para quien lo necesite, están las
graficas de pastel, barras y también el diagrama de árbol, por otro lado están las medidas de
tendencia central ,son el rango, la moda, la mediana y la variación estándar , se muestra que
la recolección de datos es como bien su nombre lo dice, en recolectar datos de personas o
grupos, se pueden hacer en persona que es hacer una entrevista, por observación ,
haciendo encuestas ( hojas impresas donde te indican algunas preguntas si por ejemplo
quienes son las personas que llegan a comer más de dos veces por día o si hay un máximo
de personas que come menos de dos veces al día )

En lo que se basa la investigación es de información de la población.


25

BIBLIOGRAFÍA

[ CITATION Spi03 \l 2058 ][ CITATION Gus16 \l 2058 ][ CITATION Lui \l 2058 ][ CITATION Dis
\l 2058 ][CITATION His \l 2058 ] [ CITATION Vic \l 2058 ][ CITATION Var \l 2058 ][ CITATION
uni \l 2058 ][ CITATION Gus \l 2058 ][ CITATION Mar \l 2058 ][ CITATION Jos \l 2058 ]
[ CITATION pro \l 2058 ][ CITATION itu \l 2058 ]

“Universo formulas” “Vicenzo Jesús D´ Alessio Torres”

Anda mungkin juga menyukai