DE COATZACOALCOS
Probabilidad y Estadística
Contenido
1.1 Conceptos de estadística y su clasificación.......................................................................3
1.4.2 Mediana........................................................................................................................ 16
1.4.3 Moda............................................................................................................................. 17
1.5.1 Rango........................................................................................................................... 19
1.5.3 Varianza........................................................................................................................ 20
¿Qué es la Estadística?
La Estadística es la rama de las matemáticas que se encarga de recolectar, describir,
organizar e interpretar datos con el objeto de tomar decisiones.
Clasificación de la Estadística
ESTADÍSTICA
DESCRIPTIVA INFERENCIAL
ENTREVISTAS
Las entrevistas se utilizan para recabar información en forma verbal, a través de preguntas
que propone el analista. Quienes responden pueden ser gerentes o empleados, los cuales
son usuarios actuales del sistema existente, usuarios potenciales del sistema propuesto o
aquellos que proporcionarán datos o serán afectados por la aplicación propuesta. El analista
puede entrevistar al personal en forma individual o en grupos.
Estructurada: cuando el entrevistador elabora una lista de preguntas las cuales plantea
siempre en igual orden (existe un formulario preparado).
OBSERVACIÓN
Con ella puede obtenerse información aun cuando no existía el deseo de proporcionarla y es
independiente de la capacidad y veracidad de las personas a estudiar; por otra parte, como
los hechos se estudian sin intermediarios, se evitan distorsiones de los mismos, sin
embargo, debe cuidarse el entrenamiento del observador, para que la observación tenga
validez científica.
La observación puede adoptar diferentes modalidades:
a. Observación Estructurada: Se observan los hechos estableciendo de antemano qué
aspectos se han de estudiar.
b. Observación no estructurada: Consiste en recoger y anotar todos los hechos que sucedan
en determinado momento sin poseer guía alguna de lo que se va a observar.
DIAGRAMA DE FLUJO
El resultado puede ser un producto, un servicio, información o una combinación de los tres.
Al examinar cómo los diferentes pasos es un proceso se relacionan entre sí, se puede
descubrir con frecuencia las fuentes de problemas potenciales. Los diagramas de flujo se
pueden aplicar a cualquier aspecto del proceso desde el flujo de materiales hasta los pasos
para hacer la venta u ofrecer un producto.
LA ENCUESTA
Una encuesta es un conjunto de preguntas normalizadas dirigidas a una muestra
representativa de la población o instituciones, con el fin de conocer estados de opinión o
hechos específicos.
1. Encuestas basadas en entrevistas cara a cara o de profundidad: Consisten en entrevistas
directas o personales con cada encuestado. Tienen la ventaja de ser controladas y guiadas
por el encuestador, además, se suele obtener más información que con otros medios (el
teléfono y el correo).
2. Encuestas telefónicas: Este tipo de encuesta consiste en una entrevista vía telefónica con
cada encuestado. Sus principales ventajas son:
Se puede abarcar un gran número de personas en menos tiempo que la entrevista
personal
Sus costos suelen ser bajos
Es de fácil administración (hoy en día, existen software especializado para la gestión
de encuestas telefónicas).
3. Encuestas postales: Consiste en el envío de un "cuestionario" a los potenciales
encuestados, pedirles que lo llenen y hacer que lo remitan a la empresa o a una casilla de
correo. Para el envío del cuestionario existen dos medios:
El correo tradicional
El correo electrónico (que ha cobrado mayor vigencia en los últimos años).
4. Encuestas por Internet: Este tipo de encuesta consiste en "colocar" un cuestionario en
una página Web o en enviarlo a los correos electrónicos de un panel predefinido. Sus
principales ventajas son:
SESIÓN DE GRUPO
En una sesión de grupo un pequeño número de individuos es reunido para conversar acerca
de algún tema de interés para alguna compañía, institución o persona. La reunión, que dura
aproximadamente una hora, es dirigida por un moderador el cual asegura que en la sesión
se discutan los temas deseados y que se formen discusiones acerca de las ideas planteadas
por los participantes.
Cuando hay muchos datos se agrupan en clases. Esto consiste en agrupar los datos en una
distribución de frecuencias, que puede definirse como una ordenación o arreglo de datos en
clases o categorías que muestran para cada una de ellas, el número de elementos que
contiene, denominada frecuencia.
Clase: es cada uno de los grupos en que se dividen los datos. Para determinar cuántas
clases crear, se puede utilizar la siguiente fórmula (fórmula de Sturges)
El intervalo de clase o el ancho de la clase (tamaño de la clase): es el espacio que hay entre
el límite superior y el límite inferior de la clase, los cuales corresponden a los valores
extremos de la clase. Para obtener el ancho de clase se utiliza la siguiente fórmula:
La frecuencia absoluta: es el número de veces que se repite cada dato. Cuando se agrupan
los datos, es el número de datos que tiene cada clase. Se simboliza con fj.
La marca de clase: es el punto medio de la clase. Se obtiene dividiendo entre dos la suma de
los valores extremos de cada clase.
El rango: es la diferencia entre el valor mayor y el valor menor en estudio de una distribución
de datos.
“Distribución de frecuencias”
9
Límites de clase
Los límites de clase son los valores que separan a una clase en particular de la anterior y de
la siguiente.
50,5 - 53,5 1
53,5 - 56,5 2
56,5 – 59,5 6
59,5 – 62,5 11
62,5 – 65,5 16
65,5 – 68,5 9
68,5 – 71,5 4
71,5 – 74,5 1
TOTAL 50
En el ejemplo anterior los límites indicados son 51 – 53, 54 – 56, etc. y los límites reales son:
50,5 – 53,5; 53,5 – 56,5; etc.
Es importante saber establecer los límites reales, pues con base en ellos se calcula el punto
medio, magnitud que se usará para cálculos posteriores
“Distribución de frecuencias”
10
64 65 64 72 68 66 55 57 60 62
64 65 64 71 68 66 56 59 61 62
63 65 63 70 67 66 57 59 61 62
64 64 63 69 67 66 58 60 61 62
Este diagrama facilita determinar la cantidad de veces que se repite un dato y los valores de
los datos con el fin de escribirlos de manera ordenada en la tabla.
Número de clases
k=1+3,322log(n)
=1+3,322log (50)
=6,64≈7
Rango
R=xn−x1=72−53=19
Amplitud de clase
I=R/k
=19/7
=2,71≈3
Punto medio: mi es el valor central de la clase. Se obtiene calculando el promedio de los
límites reales, sumando al límite real inferior el límite real superior y dividiendo por dos.
Frecuencia absoluta. Se define como el número de elementos u observaciones
pertenecientes a una misma clase.
“Distribución de frecuencias”
11
Para construir el polígono de frecuencia se toma la marca de clase que coincide con el punto
medio de cada rectángulo de un histograma.
Diagrama de barras
Se utiliza para representar los caracteres cualitativos y cuantitativos discretos. En el eje
horizontal, o eje de abcisas, se representan los datos o modalidades; en el eje vertical o de
ordenadas, se representan las frecuencias de cada dato o modalidad.
Sobre el eje horizontal se levantan barras o rectángulos de igual base (que no se
superpongan) cuya altura debe ser proporcional a la frecuencia que representan.
Diagrama de pastel
También llamados gráficas circulares o gráficas de 360 grados, son recursos estadísticos
que se utilizan para representar porcentajes y proporciones. El número de elementos
comparados dentro de un gráfico circular puede ser de más de 5, y los segmentos se
ordenan de mayor a menor, iniciando con el más amplio a partir de las 12, como en un reloj.
Una manera fácil de identificar los segmentos es sombreando de claro a oscuro, donde el de
mayor tamaño es el más claro y el de menor tamaño, el más oscuro.
Al igual que en la gráfica de barras, el empleo de tonalidades o colores facilita la
diferenciación de los porcentajes o proporciones.
A diferencia de otros tipos de gráficos, el grafico circular no tiene ejes x o y.
Se utilizan en aquellos casos donde interesa no sólo mostrar el número de veces que se da
una característica o atributo de manera tabular sino más bien de manera gráfica, de tal
manera que se pueda visualizar mejor la proporción en que aparece esa característica
respecto del total.
Diagrama de árbol
El diagrama de árbol es una representación gráfica de los posibles resultados del
experimento, el cual consta una serie de pasos, donde cada uno de los pasos tiene un
número finito de maneras de ser llevado a cabo. Se utiliza en los problemas de conteo y
probabilidad.
Tipos de histograma:
· Diagramas de barras simples
Representa la frecuencia simple (absoluta o relativa) mediante la altura de la barra la cual es
proporcional a la frecuencia simple de la categoría que representa.
· Diagramas de barras compuestas
Se usa para representar la información de una tabla de doble entrada o sea a partir de dos
variables, las cuales se representan así; la altura de la barra representa la frecuencia simple
de las modalidades o categorías de la variable y esta altura es proporcional a la frecuencia
simple de cada modalidad.
Datos agrupados
Para agrupar datos primero se debe calcular el rango de los datos, el cual se obtiene
restando el mayor valor menos el menor valor de los datos.
Luego se escoge un número «k», el cual es el número de clases en las que se quieran
agrupar los datos.
Se procede a dividir el rango entre «k» para obtener la amplitud de las clases a agrupar. Este
número es C=R/k.
Por último se comienza la agrupación, para lo cual se escoge un número menor que el
menor valor de los datos obtenidos.
Este número será el límite inferior de la primera clase. A este se le suma C. El valor obtenido
será el límite superior de la primera clase.
Luego, a este valor se le suma C y se obtiene el límite superior de la segunda clase. De esta
forma se procede hasta obtener el límite superior de la última clase.
Luego de que los datos están agrupados se puede proceder a calcular la media, la mediana
y la moda.
Ejemplo:
Encuentra la media del conjunto {2, 5, 5, 6, 8, 8, 9, 11}.
Hay 8 números en el conjunto. Súmelos, y luego divida entre 8.
= 6,75
Así, la media es 6.75.
Cuanto más grande sea el peso de un elemento, más importante se considera que es éste.
La media ponderada tiene numerosas aplicaciones, por ejemplo, la nota de una asignatura
donde el examen final tiene un peso mayor al de un trabajo.
1.4.2 Mediana
Para calcular la mediana de un conjunto de datos primero se ordenan todos los datos de
menor a mayor. Se pueden presentar dos casos:
Si el número de datos es impar, entonces la mediana es el dato que está justo en el centro.
– Si el número de datos es par, entonces la mediana es el promedio de los dos datos que
quedan en el centro.
Cuando se trata de datos agrupados, el cálculo de la mediana se hace de la siguiente forma:
– Se calcula N/2, donde N es el total de datos.
– Se busca el primer intervalo donde la frecuencia acumulada (la suma de las frecuencias)
sea mayor que N/2, y se selecciona el límite inferior de este intervalo, llamado Li.
1.4.3 Moda
La moda es el valor que tiene mayor frecuencia entre todos los datos agrupados; es decir, es
el valor que se repite más veces en el conjunto de datos inicial. Cuando se tiene una
cantidad de datos muy grande, para calcular la moda de los datos agrupados se utiliza la
siguiente fórmula:
Otra fórmula que se utiliza para obtener un valor aproximado a la moda es la siguiente:
La media, moda y mediana pertenecen a las medidas de tendencia central, es decir son
medidas obtenidas a partir de la organización de un grupo de datos numéricos, y las tres
aunque son distintas en definición, tienden a ubicarse en el centro del grupo de datos. Es
decir, son medidas que nos dan una idea general respecto del vago comportamiento dentro
de un mismo grupo de datos.
Media: resume en un valor las características de una variable teniendo en cuenta a todos los
casos. Es el promedio de un grupo de datos.
Mediana: es el valor de la variable que deja el mismo número de datos antes y después que
el, una vez ordenados esto. Es el número que tienes a la mitad de un grupo de datos que
esta ordenado de menor a mayor.
Moda: es el valor que cuenta con una mayor frecuencia de distribución de datos. El número
que más se repite dentro de un grupo de datos.
La relación que pueden tener, es que si tu moda, mediana y media es la misma se dice que
los datos siguen una distribución normal, es decir que tiene un comportamiento regular y
después analizarlos estadísticamente de una manera más cómoda.
Ejemplo: supongamos que 7 amigos comieron 2, 3, 3, 3, 4, 4, 6 tortillas respectivamente: la
media (promedio) es 3.7, la mediana (el valor de en medio) es 3, y la moda (el valor que más
se repite) es también 3.
Las medidas de dispersión, variabilidad o variación nos indican si esos datos están próximos
entre sí o sí están dispersos, es decir, nos indican cuán esparcidos se encuentran los datos.
Estas medidas de dispersión nos permiten apreciar la distancia que existe entre los datos a
un cierto valor central e identificar la concentración de los mismos en un cierto sector de la
distribución, es decir, permiten estimar cuán dispersas están dos o más distribuciones de
datos.
Estas medidas permiten evaluar la confiabilidad del valor del dato central de un conjunto de
datos, siendo la media aritmética el dato central más utilizado. Cuando existe una dispersión
pequeña se dice que los datos están dispersos o acumulados cercanamente respecto a un
valor central, en este caso el dato central es un valor muy representativo. En el caso que la
dispersión sea grande el valor central no es muy confiable. Cuando una distribución de datos
tiene poca dispersión toma el nombre de distribución homogénea y si su dispersión es alta
se llama heterogénea
1.5.1 Rango
El rango es un valor numérico que indica la diferencia entre el valor máximo y el mínimo de
una población o muestra estadística.
El rango suele ser utilizado para obtener la dispersión total. Es decir, si tenemos una muestra
con dos observaciones: 10 y 100 euros, el rango será de 90 euros.
Sobre todo en finanzas, el rango es muy útil para observar cuán grande podría llegar a ser
una variación o cambio. Vale la pena mencionar también que, en no pocas ocasiones, el
rango no es una medida fija.
Fórmula del rango
Para calcular el rango de una muestra o población estadística utilizaremos la siguiente
fórmula:
R = Máxx – Mínx
Donde
R es el rango.
Máx es el valor máximo de la muestra o población.
Mín es el valor mínimo de la muestra o población estadística.
x es la variable sobre la que se pretende calcular esta medida.
La desviación media es un primer intento por buscar una medida de dispersión más
eficiente que el rango.
Ejemplo:
Hallar la desviación media de un conjunto 2, 3, 6, 8, 11.
Al determinar la diferencia de cada dato dela muestra con su media nos daría como
resultado un cero, porque hay diferencias negativas y positivas y todas se contrarrestan
entre sí. Así que para evitar que se equilibren estas diferencias, usaremos en cada una su
valor absoluto para que todas ellas sean positivas.
2 + 3 + 6 + 8 + 11 / 5 = 6
1.5.3 Varianza
Procura dar el grado con que puede variar un dato de la muestra; el problema es que sus
unidades son cuadradas y es poco compresible para efectos prácticos.
Recordemos la dificultad de sumar las diferencias entre cada dato de la muestra y su
media; por lo que otra manera de hacer positivas las diferencias es elevando cada diferencia
al cuadrado, de tal manera que cada cantidad encontrada será positiva.
“probabilidad y estadística”
22
Ejemplo:
Clasificación por grupos
Determina la varianza del grupo A en partidos ganados (PG).
EQUIPO ESTUDIANTES JAGUARES NECAXA TIGRES MONTERREY SAN LUIS
PG 4 4 4 6 9 9
Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son
equivalentes a las anteriores.
Ejercicios
Calcular la desviación estándar de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
“itutor”
24
CONCLUSIÓN
En esta investigación se describe cada uno de los temas que van conforma a las
distribuciones de frecuencia y nos referimos a como poder tomar cada una de las
herramientas ya sea gráficas, datos de personas para poder llegar a un resultado, como bien
se menciona esto ayuda a analizar y dar información para quien lo necesite, están las
graficas de pastel, barras y también el diagrama de árbol, por otro lado están las medidas de
tendencia central ,son el rango, la moda, la mediana y la variación estándar , se muestra que
la recolección de datos es como bien su nombre lo dice, en recolectar datos de personas o
grupos, se pueden hacer en persona que es hacer una entrevista, por observación ,
haciendo encuestas ( hojas impresas donde te indican algunas preguntas si por ejemplo
quienes son las personas que llegan a comer más de dos veces por día o si hay un máximo
de personas que come menos de dos veces al día )
BIBLIOGRAFÍA
[ CITATION Spi03 \l 2058 ][ CITATION Gus16 \l 2058 ][ CITATION Lui \l 2058 ][ CITATION Dis
\l 2058 ][CITATION His \l 2058 ] [ CITATION Vic \l 2058 ][ CITATION Var \l 2058 ][ CITATION
uni \l 2058 ][ CITATION Gus \l 2058 ][ CITATION Mar \l 2058 ][ CITATION Jos \l 2058 ]
[ CITATION pro \l 2058 ][ CITATION itu \l 2058 ]