Anda di halaman 1dari 15

1/17/2018 Probabilidad y estadistica ITR: 2013

Más Siguiente blog» Crear un blog

Probabilidad y estadistica ITR


miércoles, 13 de febrero de 2013 Instituto Tecnológico de Reynosa

Instituto Tecnológico de Reynosa


Mapa conceptual 2: ERIK OMAR MOSQUEDA CEPEDA
Archivo del blog

▼ 2013 (12)
▼ febrero (12)
Mapa conceptual 2: ERIK OMAR
MOSQUEDA CEPEDA
Mapa conceptual 2 Marco Antonio Anaya
Mapa conceptual 2 Javier Gutiérrez
García
Mapa conceptual 2 Jesus Adrian Olvera
Juarez

Publicado por probabilidad y estadistica en 17:42 No hay comentarios: Mapa conceptual 2 Manuel René de los
Santos Manjar...
“1.6.CUANTILES”Loscuantiles son
aquellos valores d...
martes, 12 de febrero de 2013
Mapa conceptual: ERIK OMAR
Mapa conceptual 2 Marco Antonio Anaya MOSQUEDA CEPEDA
Mapa conceptual: Jesus Adrian Olvera
Juarez Enlac...
Javier Gutiérrez García - Mapa
Conceptual 1
Mapa conceptual: Marco Antonio
AnayaEnlace externo...
Mapa Conceptual: Manuel René de los
Santos Manjar...
Estadistica descriptiva

Etiquetas

ERIK OMAR
MOSQUEDA
CEPEDA (1)
Javier Gutiérrez
García (2)
Jesus Adrian
Olvera Juarez (2)
Publicado por probabilidad y estadistica en 18:04 No hay comentarios: Manuel René de
los Santos
Etiquetas: Mapas conceptuales, Marco Antonio Anaya, Unidad 1
Manjarrez (2)
Mapas
conceptuales (9)
Mapa conceptual 2 Javier Gutiérrez García Marco Antonio
Anaya (2)
Javier Gutiérrez García - Mapa Conceptual 2 Resumen (1)
Unidad 1 (11)

Datos personales

probabilidad y
estadistica
Ver todo mi perfil

http://proyestitr.blogspot.be/2013/ 1/15
1/17/2018 Probabilidad y estadistica ITR: 2013

Estadística Descriptiva

Cuantiles  Gráficos  Cajas y Alambres Diagrama de Pareto Uso de Software

Son  Son Es  Es El uso de

Valores de la variable, que Representaciones Un gráfico basado Una gráfica para Ordenadores y calculadoras
ordenados de menor a mayor visuales que en cuartiles organizar datos en facilita la comprensión de temas
dividen a la distribución en ofrecen la mayor mediante el cual forma descendente, de complejos de matemáticas, la
partes de tal manera que cada información se visualiza un izquierda a derecha y tecnología agiliza y supera la
una de ellas contiene el posible. conjunto de datos. separados por barras. capacidad de calculo de la mente
mismo numero de frecuencias humana.

Los más utilizados son Permite Software disponibles


Se dividen en

-Asignar un orden de -Excel o Calc.


prioridades. -Javascript.
-Facilitar el estudio de -Applet de Java,
Cuartiles  Deciles  Percentiles  Diagrama de Diagrama de fallas en las industrias Geogebra.
barras sectores o empresas. -Proyecto Descartes.
-Tomar decisiones -Software Libre.
Q1: (Primer División de los División de los adecuadas.
cuartil) Valor de elementos de elementos de Gráfico estadístico Gráfico empleado -Analizar causas.
la variable por la serie en diez la serie en cien en forma de barras para variables -Estudiar resultados.
debajo de ¼ de partes iguales. partes iguales. que se utiliza para cualitativas. Las -Planear una mejora
los elementos de variables modalidades se continua.
la serie. D1: 10% (P1,P2,P3…….. cualitativas y representan en un
Q2: (Segundo D2: 20% P98,P99) discretas. círculo dividido en
cuartil) coincide D3: 30% sectores.
con la mediana. D4: 40%
Q3: (Tercer D5: 50%
cuartil) Valor de D6: 60% Histogramas
la variable por D7: 70%
debajo de ¾ de D8: 80%
los elementos de D9: 90%
Es una representación gráfica de
la serie. D10: 100%
una variable en forma de barras,
Q4: (Cuarto
donde la superficie de cada barra
cuartil) Valor
es proporcional a la frecuen-
total de los
cia de los valores representados.
elementos de la
Permiten comparar datos de una Javier Gutiérrez García 
serie. 
forma rápida. 

Show me more about this topic


1 of 1
View on Scribd
Back to document
Skip carousel

Publicado por probabilidad y estadistica en 17:55 No hay comentarios:

Etiquetas: Javier Gutiérrez García, Mapas conceptuales, Unidad 1

Mapa conceptual 2 Jesus Adrian Olvera Juarez

Publicado por probabilidad y estadistica en 17:46 1 comentario:

Etiquetas: Jesus Adrian Olvera Juarez, Mapas conceptuales, Unidad 1

Mapa conceptual 2 Manuel René de los Santos Manjarrez

http://proyestitr.blogspot.be/2013/ 2/15
1/17/2018 Probabilidad y estadistica ITR: 2013

Publicado por probabilidad y estadistica en 14:30 No hay comentarios:

Etiquetas: Manuel René de los Santos Manjarrez, Mapas conceptuales, Unidad 1

“1.6. CUANTILES”
Los cuantiles son aquellos valores de la variable, que ordenados de menor a mayor,
dividen a la distribución en partes, de tal manera que cada una de ellas contiene el mismo
número de frecuencias.
Constituyen una generalización del concepto de mediana. Así como la mediana divide a
la serie estudiada en dos partes con el mismo número de elementos cada una, si la división se
hace en cuatro partes, o en diez partes, o en cien partes, llegamos al concepto de cuantil.
Hay, principalmente, tres cuantiles importantes: cuartiles, deciles y percentiles:
Cuartiles

Son tres valores con las siguientes características:


Q1: Primer cuartil, que es el valor de la variable por debajo del cual queda 1/4 de los elementos
de la serie estudiada.
Q3: Tercer cuartil, que es el valor de la variable por debajo del cual quedan los 3/4 de los
elementos que constituyen la serie.
Evidentemente el segundo cuartil coincide con la mediana. Como puede comprobarse, no
tendría ninguna utilidad definir el cuarto cuartil. El cálculo de los cuartiles se realiza por el
mismo procedimiento que el cálculo de la mediana, pues hay únicamente una diferencia
cuantitativa entre ambas medidas, pero tienen significados paralelos.

Percentiles

Hay 99 percentiles que se denotan: P1, P2, P3,.......,P98, P99. Así P90, por ejemplo, deja por
debajo de él el 90% de los elementos.

Ejercicio: De la siguiente serie hallar el primero y el tercer cuartil, el segundo y el séptimo decil
y los percentiles 8 y 73.

Resp: Q1 = 34,82; Q3 = 47,36; D2 = 32,85; D7 = 45,83; P8 = 26,94; P73 = 46,75.

Obsérvese que entre los 6 cuantiles calculados, aparecen valores muy parecidos. En particular
se dan las siguientes coincidencias:

Ø El segundo cuartil equivale a la mediana.

Ø El quinto decil y el quincuagésimo percentil se corresponden también con la mediana.

Ø Los percentiles P25 y P75 se corresponden con el primer y tercer cuartil, respectivamente.

Deciles

Es la segunda clase de cuantiles. Si se divide toda la serie en diez partes iguales tendremos
los deciles.
D1, el decil 1, deja el 10% de los valores de la serie por debajo de él.
Análogamente ocurre con los deciles D2, D3,.......D9. El decil 8, por ejemplo, deja el 80% de la
masa de datos investigada por debajo de él.
Las fórmulas para calcularlos son también análogas a las de la mediana.

“1.7 GRÁFICOS”
Las representaciones gráficas deben conseguir que un simple análisis visual ofrezca la mayor información
posible.
Según el tipo de carácter que estemos estudiando, usuraremos un grafico u otro.
Según sea la variable, los gráficos más utilizados son:
- Diagramas de barra.
- Diagramas de sectores
- Histogramas

Diagrama de barras
Es un tipo de gráfico estadístico que se utiliza para variables cualitativas y discretas.
En el eje X se sitúan:
§ Las modalidades de la variable cualitativa.
§ Los valores de la variable cualitativa discreta.
Y sobre ellos se levantan barras cuya altura sea proporcional a sus frecuencias.

http://proyestitr.blogspot.be/2013/ 3/15
1/17/2018 Probabilidad y estadistica ITR: 2013

Histogramas
Se utilizan con variables continuas, o agrupadas en intervalos, representando en el eje X
los intervalos de clase y levantando rectángulos de base la longitud de los distintos intervalos y
de altura tal que el área sea proporcional a las frecuencias representativas.
El polígono de frecuencias se obtiene uniendo los puntos medios de las bases
superiores de los rectángulos.
Los histogramas permiten compara datos de una forma rápida (basta mirar la gráfica).

Pirámides de población
Cuando se realizan representaciones correspondientes a edades de población,
cambiamos el eje Y por el eje X para obtener las llamadas pirámides de
población, que no son más que 2 histogramas a izquierda y derecha, para hombres y mujeres.

Diagramas de sectores
Es un gráfico empleado fundamental mente para variables cualitativas. Las modalidades
se representan en un círculo dividido en sectores.
La amplitud de cada sector, en grados, se obtiene multiplicando la frecuencia relativa de
cada modalidad o valor por 360°

http://proyestitr.blogspot.be/2013/ 4/15
1/17/2018 Probabilidad y estadistica ITR: 2013

“1.8 CAJAS Y ALAMBRES”

Un diagrama de caja es un gráfico, basado en cuartiles, mediante el cual se visualiza un


conjunto de datos. Está compuesto por un rectángulo, la "caja", y dos brazos, los "bigotes".

Es un gráfico que suministra información sobre los valores mínimo y máximo, los
cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y la simetría de la
distribución. Primero es necesario encontrar la mediana para luego encontrar los 2 cuartiles
restantes
Cómo expresarlo gráficamente:

+-----+-+
* o |-------| | |---|
+-----+-+

+---+---+---+---+---+---+---+---+---+---+---+---+
0 5 10 12

Ordenar los datos y obtener el valor mínimo, el máximo, los cuartiles Q1, Q2 y Q3 y el Rango
Inter Cuartilico (RIC)
En el ejemplo:
· Valor 7: es el Q1 (25% de los datos)
· Valor 8.5: es el Q2 o mediana (el 50% de los datos)
· Valor 9: es el Q3 (75% de los datos)
· Rango Inter Cuartilico RIC (Q3-Q1)=2
Para dibujar los bigotes, las líneas que se extienden desde la caja, hay que calcular los límites
superiores e inferiores, Li y Ls, que identifiquen a los valores atípicos.
Para ello se calcula cuándo se consideran atípicos los valores. Son aquellos inferiores a Q1-
1.5*RIC o superiores a Q3+1.5*RIC.
En el ejemplo:
· inferior: 7-1.5*2=4
· superior: 9+1.5*2=12
Ahora se buscan los últimos valores que NO son atípicos, que serán los extremos de los
bigotes.
· En el ejemplo: 5 y 10
Marcar como atípicos todos los datos que están fuera del intervalo (Li, Ls).
· En el ejemplo: 0.5 y 3.5
Además, se pueden considerar valores extremadamente atípicos aquellos que exceden Q1-
3*RIC o Q3+3*RIC. De modo que, en el ejemplo:
· inferior: 7-3*2=1
· superior: 9+3*2=15

http://proyestitr.blogspot.be/2013/ 5/15
1/17/2018 Probabilidad y estadistica ITR: 2013

“1.9. DIAGRAMA DE PARETO”


El diagrama de Pareto, también llamado curva 80-20 o Distribución C-A-B, es una gráfica para organizar
datos de forma que estos queden en orden descendente, de izquierda a derecha y separados por barras. Permite,
pues, asignar un orden de prioridades.

El diagrama permite mostrar gráficamente el principio de Pareto (pocos vitales, muchos triviales), es decir,
que hay muchos problemas sin importancia frente a unos pocos graves. Mediante la gráfica colocamos los "pocos
vitales" a la izquierda y los "muchos triviales" a la derecha.

El diagrama facilita el estudio de las fallas en las industrias o empresas comerciales, así como fenómenos
sociales o naturales psicosomáticos, como se puede ver en el ejemplo de la gráfica al principio del artículo.

Hay que tener en cuenta que tanto la distribución de los efectos como sus posibles causas no es un
proceso lineal sino que el 20% de las causas totales hace que sean originados el 80% de los efectos.

El principal uso que tiene el elaborar este tipo de diagrama es para poder establecer un orden de
prioridades en la toma de decisiones dentro de una organización. Evaluar todas las fallas, saber si se pueden
resolver o mejor evitarlas.

Se recomienda el uso del diagrama de Pareto:

- Para identificar oportunidades para mejorar


- Para identificar un producto o servicio para el análisis de mejora de la calidad.
- Cuando existe la necesidad de llamar la atención a los problemas o causas de una forma
sistemática.
- Para analizar las diferentes agrupaciones de datos.
- Al buscar las causas principales de los problemas y establecer la prioridad de las soluciones.
- Para evaluar los resultados de los campos efectuados a un proceso comparando sucesivos
diagramas.
- Obtenidos en momentos diferentes, (antes y después).
- Cuando los datos puedan clasificarse en categorías.
- Cuando el rango de cada categoría es importante.
- Para comunicar fácilmente a otros miembros de la organización las conclusiones sobre causas,
efectos y costes de los errores.

Los propósitos generales del diagrama de Pareto:

- Analizar las causas.


- Estudiar los resultados.
- Planear una mejora continua.

La Gráfica de Pareto es una herramienta sencilla pero poderosa al permitir identificar


visualmente en una sola revisión las minorías de características vitales a las que es
importante prestar atención y de esta manera utilizar todos los recursos necesarios para
llevar a cabo una acción de mejora sin malgastar esfuerzos ya que con el análisis
descartamos las mayorías triviales.

Algunos ejemplos de tales minorías vitales serían:

- La minoría de clientes que representen la mayoría de las ventas.


- La minoría de productos, procesos, o características de la calidad causantes del grueso de
desperdicio o de los costos de re trabajos.
- La minoría de rechazos que representa la mayoría de quejas de los clientes.
- La minoría de vendedores que está vinculada a la mayoría de partes rechazadas.
- La minoría de problemas causantes del grueso del retraso de un proceso.
- La minoría de productos que representan la mayoría de las ganancias obtenidas.
- La minoría de elementos que representan la mayor parte del costo de un inventario etc.

“1.10. USO DE SOFTWARE”


El uso de ordenadores y calculadoras facilita el que los alumnos comprendan mejor
temas complejos de matemáticas. Es evidente que en muchos casos la tecnología agiliza y
supera, la capacidad de cálculo de la mente humana, con ayuda de la tecnología, los alumnos
tienen más tiempo para concentrarse en enriquecer su aprendizaje matemático.

Las nuevas tecnologías han venido a cambiar por completo el panorama tradicional de
cómo se hacían, se veían y se enseñaban las matemáticas. Introducirse en este nuevo
panorama implica realizar profundos cambios en nuestros programas educativos.

http://proyestitr.blogspot.be/2013/ 6/15
1/17/2018 Probabilidad y estadistica ITR: 2013
Es muy amplia la variedad de aplicaciones informáticas disponibles para estadística y
probabilidad:

Excel o Calc
Javascript
Applet de Java, Geogebra
Proyecto Descartes
Software Libre
Otros Software
Ejercicio: Estadística Bidimensional
Se observaron las edades de cinco niños y sus pesos respectivos y se
consiguieron los resultados siguientes:
Edad 2 4,5 6 7,2 8

Peso 15 19 25 33 34

a) Hallar las medias y desviaciones marginales.

b) Calcular el coeficiente de correlación lineal y la recta de regresión del peso sobre la


edad.

Introducimos los datos en las celdas: en la columna A la edad y la B el peso.

A continuación podemos hacer clic con el ratón en "Función fx", del menú "Insertar”,
apareciendo la ventana de diálogo "Pegar función", donde podemos seleccionar las funciones
estadísticas y las funciones que queramos calcular; o bien directamente, si conocemos la
sintaxis de las funciones estadísticas, editamos dichas funciones. Situamos el puntero en la
columna D y vamos tecleando cada una de las funciones estadísticas en la barra de fórmulas,
situando el puntero cada vez en una celda distinta para ir conservando los datos. De esta
forma, las medias y desviaciones marginales se calculan:
=PROMEDIO (A2:A6), obtenemos la media de la edad.
=PROMEDIO (B2:B6), obtenemos la media del peso.
=DESVESTP (A2:A6), obtenemos la desviación típica de la edad.
=DESVESTP (B2:B6), obtenemos la desviación típica del peso.
Para calcular el coeficiente de correlación, tecleamos en la barra de fórmulas
=COEF.DE.CORREL (A1:A6, B2:B6), una vez situados en la celda que queramos.
=PENDIENTE (B2:B6, A2:A6) nos informa sobre la pendiente de la recta de
regresión del peso sobre la edad, en la celda donde queramos.

Por tanto, usando nuestros conocimientos estadísticos, tenemos que la recta de


regresión es: y - 25,2 = 3,4049(x - 5,54).
También podemos calcular la recta de regresión haciendo clic en "Función fx", del
menú "Insertar" y seleccionando la función ESTIMACION.LINEAL de las funciones estadísticas.
En la pantalla aparecen los valores de "a" y b", siendo y = bx + a, recta de regresión de
Y sobre X. Por tanto la recta de regresión es: y = 3,4049x + 6,33678.
Excel incorpora dos funciones que nos permiten predecir el valor de una variable,
conocido el valor de la otra, por ejemplo, tecleando: =TENDENCIA (B2:B6, A2:A6, 5)
obtenemos el peso esperado para una edad de cinco años. La otra función nos mide el error
estimado de una variable al ser estimado su valor por la recta de regresión. Su forma es:

http://proyestitr.blogspot.be/2013/ 7/15
1/17/2018 Probabilidad y estadistica ITR: 2013
=ERROR.TÍPICO.XY. (B2:B6, A2:A6), devuelve el error típico del valor de Y previsto para cada
X.
También podemos hacer la nube de puntos. Marcando los datos introducidos, pulsamos
el botón de gráficos, seleccionamos diagrama de dispersión y a través de las ventanas de
diálogos damos nombre a los ejes, hacemos la división en los mismos.

Publicado por probabilidad y estadistica en 14:06 No hay comentarios:

Etiquetas: Resumen, Unidad 1

lunes, 4 de febrero de 2013

Mapa conceptual: ERIK OMAR MOSQUEDA CEPEDA

Enlace externo

Publicado por probabilidad y estadistica en 22:21 No hay comentarios:

Etiquetas: ERIK OMAR MOSQUEDA CEPEDA, Mapas conceptuales, Unidad 1

Mapa conceptual: Jesus Adrian Olvera Juarez

Enlace externo

Publicado por probabilidad y estadistica en 20:43 No hay comentarios:

Etiquetas: Jesus Adrian Olvera Juarez, Mapas conceptuales, Unidad 1

Javier Gutiérrez García - Mapa Conceptual 1

http://proyestitr.blogspot.be/2013/ 8/15
1/17/2018 Probabilidad y estadistica ITR: 2013

Estadística Descriptiva

Población y Muestra Obtención de Medidas de Medidas de Tabla de Distribución de


Aleatoria Datos Estadísticos Tendencia Central Dispersión Frecuencias

son son es

Población:  Muestra Aleatoria: 


Conjunto de Subconjunto de una
Una ordenación en
personas o cosas. población. forma de tabla de los
son necesarios para forma de obtenerlos
Media Media Desviación datos estadísticos.
aritmética: Es ponderada: Es media: Es
según su tamaño definiciones relacionadas el promedio apropiada cuando la media de las
-Estudios de Por: de un en un conjunto de desviaciones
investigación. -Muestreo:  conjunto de datos cada uno de absolutas. los tipos de frecuencia son
-Medir el de- Observando valores. ellos tiene una
sempeño en pasivamente importancia
un servicio. una muestra y relativa (o peso)
Finita: Poca Infinita: El -Frecuencia
-Toma de de- anotando los respecto de los Rango o Varianza: Es
cantidad de número de Absoluta.
ciciones. valores de las demás datos. Recorrido: Es la media
elementos. elementos Media -Frecuencia
variables. la diferencia aritmética del
geométrica: Es Relativa.
es infinito. -Diseño de entre el cuadrado de
un promedio -Frecuencia
experimentos: mayor y el las
muy útil en Acumulada.
Fijando los Media armónica: menor de los desviaciones
conjuntos de -Frecuencia
valores en Es un promedio datos de una respecto a la
números que Relativa
ciertas muy útil en distribución media de una
son Acumulada.
variables y conjuntos de estadística. distribución
Espacio Parámetro o Estimación: Nivel de interpretados en -Distribución
observando la números que se estadística.
Muestral: Son Estadístico Es una técnica Confianza: Es orden de su de Frecuencias
respuesta de definen en
todas las Muestral: Es para conocer una medida producto, no de Agrupadas.
otras. relación con
posibles cualquier un valor de la bondad su suma.
alguna unidad.
muestras que valor aproximado. de la
se pueden calculado a estimación
extraer de partir de la realizada a
una muestra. partir de Mediana: 
Moda: Es el valor
población. estadísticos Representa el
con una mayor
valor de la
muestrales. frecuencia en una
variable de
distribución de
posición
datos.
central en un
conjunto de
datos
ordenados.
Javier Gutiérrez García 

Show me more about this topic


1 of 1
View on Scribd
Back to document
Skip carousel

Publicado por probabilidad y estadistica en 20:27 No hay comentarios:

Etiquetas: Javier Gutiérrez García, Mapas conceptuales, Unidad 1

Mapa conceptual: Marco Antonio Anaya

Enlace externo

Publicado por probabilidad y estadistica en 19:25 No hay comentarios:

Etiquetas: Mapas conceptuales, Marco Antonio Anaya, Unidad 1

Mapa Conceptual: Manuel René de los Santos Manjarrez

Enlace Externo

Publicado por probabilidad y estadistica en 17:40 No hay comentarios:

Etiquetas: Manuel René de los Santos Manjarrez, Mapas conceptuales, Unidad 1

sábado, 2 de febrero de 2013

http://proyestitr.blogspot.be/2013/ 9/15
1/17/2018 Probabilidad y estadistica ITR: 2013

Estadistica descriptiva

1.1 “ POBLACIÓN Y MUESTRA ALEATORIA”


-Población
Todo estudio estadístico ha de estar referido a un conjunto o colección de personas o cosas lo
que se denomina como población.
Las personas o cosas que forman parte de la población se denominan elementos. En sentido
estadístico un elemento puede ser algo con existencia real, como un automóvil o una casa, o
algo más abstracto como la temperatura, un voto, o un intervalo de tiempo.
A su vez, cada elemento de la población tiene una serie de características que pueden ser
objeto del estudio estadístico.
Luego por tanto de cada elemento de la población podremos estudiar uno o más aspectos
cualidades o caracteres que se llaman variables estadísticas.
La población puede ser según su tamaño de dos tipos:
Población finita: el número de elementos que la forman es finito, por ejemplo el número de
alumnos de un centro de enseñanza.
Población infinita: el número de elementos que la forman es infinito, o tan grande que
pudiesen considerarse infinitos. Como por ejemplo si se realizase un estudio sobre los
productos que hay en el mercado.
Ahora bien, normalmente en un estudio estadístico, no se puede trabajar con todos los
elementos de la población sino que se realiza sobre un subconjunto de la misma al que se le
llama muestra, es decir un determinado número de elementos de la población.

-Muestra Aleatoria
Una muestra estadística o muestra aleatoria o simplemente muestra es un subconjunto de
casos o individuos de una población estadística.
Las muestras se obtienen con la intención de inferir propiedades de la totalidad de la población,
para lo cual deben ser representativas de la misma. Para cumplir esta característica la inclusión
de sujetos en la muestra debe seguir una técnica de muestreo.
Por otra parte, en ocasiones, el muestreo puede ser más exacto que el estudio de toda la
población porque el manejo de un menor número de datos provoca también menos errores en
su manipulación.
El número de sujetos que componen la muestra suele ser inferior que el de la población, pero
suficiente para que la estimación de los parámetros determinados tenga un nivel de
confianza adecuado. Para que el tamaño de la muestra sea idóneo es preciso recurrir a su
cálculo.

Espacio Muestral
El espacio muestral del que se toma una muestra concreta está formado por el conjunto de
todas las posibles muestras que se pueden extraer de una población mediante una
determinada técnica de muestreo.

Parámetro o Estadístico muestral


Un parámetro estadístico o simplemente un estadístico muestral es cualquier valor calculado a
partir de la muestra, como por ejemplo la media, varianza o una proporción, que describe a una
población y puede ser estimado a partir de una muestra. Valor de la población.

Estimación
Una estimación es cualquier técnica para conocer un valor aproximado de un parámetro
referido a la población, a partir de los estadísticos muestrales calculados a partir de los
elementos de la muestra.

Nivel de con ianza


El nivel de confianza de una aseveración basada en la inferencia estadística es una medida de
la bondad de la estimación realizada a partir de estadísticos muestrales.

Ejemplo
La descripción de una muestra, y los resultados obtenidos sobre ella, puede ser del tipo
mostrado en el siguiente ejemplo:

Dimensión de la población: ej. 222.222 habitantes


Probabilidad del evento: ej. Hombre o Mujer 50%
Nivel de confianza: ej. 96%
Desviación tolerada: ej. 5% Resultado ej. 196
Tamaño de la muestra: ej. 270

La interpretación de esos datos sería la siguiente:


· La población a investigar tiene 222.222 habitantes y queremos saber cuántos son
hombres o mujeres.

http://proyestitr.blogspot.be/2013/ 10/15
1/17/2018 Probabilidad y estadistica ITR: 2013
· Estimamos en un 50% para cada sexo y para el propósito del estudio es suficiente un
90% de seguridad con un nivel entre 90 - 5 y 90 + 5.
· Generamos una tabla de 270 números al azar entre 1 y 222.222 y en un censo
numerado comprobamos el género para los seleccionados.

Ventajas de la elección de una muestra


El estudio de muestras es preferible, en la mayoría de los casos, por las siguientes razones:
1. Si la población es muy grande (en ocasiones, infinita, como ocurre en
determinados experimentos aleatorios) y, por tanto, imposible de analizar en su
totalidad.
2. Las características de la población varían si el estudio se prolonga demasiado tiempo.
3. Reducción de costos: al estudiar una pequeña parte de la población, los gastos de
recogida y tratamiento de los datos serán menores que si los obtenemos del total de la
población.
4. Rapidez: al reducir el tiempo de recogida y tratamiento de los datos, se consigue mayor
rapidez.
5. Viabilidad: la elección de una muestra permite la realización de estudios que serían
imposible hacerlo sobre el total de la población.
6. La población es suficientemente homogénea respecto a la característica medida, con lo
cual resultaría inútil malgastar recursos en un análisis exhaustivo (por ejemplo, muestras
sanguíneas).
7. El proceso de estudio es destructivo o es necesario consumir un artículo para extraer la
muestra (ejemplos: vida media de una bombilla, carga soportada por una cuerda,
precisión de un proyectil, etc.).

Descripción matemática de una muestra aleatoria


El uso de muestras para deducir fiablemente características de la población requiere que se
trate con muestras aleatorias. Si la muestra estadística considerada no constituye una muestra
aleatoria las conclusiones basadas en dicha muestra no son fiables y en general estarán
sesgadas en algún aspecto.
En términos matemáticos, dada una variable aleatoria X con una distribución de probabilidad F,
una muestra aleatoria de tamaño N es un conjunto finito de N variables independientes, con la
misma distribución de probabilidad F.1
En general, resulta muy difícil comprobar si una determinada muestra es o no aleatoria, cosa
que sólo puede hacerse considerando otro tipo de muestreos aleatorios robustos que permitan
decir si la primera muestra era aleatoria o no.

1.2 “OBTENCIÓN DE DATOS ESTADÍSTICOS”

¿Para qué necesitamos obtener datos en estadística?


En la estadística es importante obtener datos, para Proporcionar la introducción imprescindible
para un estudio de investigación, Medir el desempeño en un servicio o proceso de producción,
Nos Ayudar en la formulación de alternativas para la toma de decisiones. Algunos ejemplos de
para qué es necesario obtener datos son los siguientes:
n Un gerente desea investigar si la calidad del servicio o de los productos se
ajustan a los estándares de la compañía.

¿De qué manera podemos obtener datos estadísticos?


La información puede obtenerse por muestreo, observando pasivamente una muestra y
anotando los valores de las variables, o por diseño de experimentos, fijando los valores en
ciertas variables y observando la respuesta de otras.
El muestreo es por lo tanto una herramienta de la investigación científica, cuya función
Básica es determinar que parte de una población debe examinarse, con la finalidad de hacer
Inferencias sobre dicha población. Para que una muestra sea representativa, y por lo tanto útil,
debe de reflejar las similitudes y diferencias encontradas en la población, es decir ejemplificar
las características de ésta.

Tipos de muestreo
Existen diferentes criterios de clasificación de los diferentes tipos de muestreo, aunque en
general pueden dividirse en dos grandes grupos: métodos de muestreo probabilísticos y
métodos de muestreo no probabilísticos.

1. Muestreo probabilístico
Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de
equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma
probabilidad de Ser elegidos para formar parte de una muestra y, consiguientemente, todas las
posibles muestras
Dentro de los métodos de muestreo probabilísticos encontramos los siguientes tipos:

1.1. Muestreo aleatorio simple:


El procedimiento empleado es el siguiente:
1) se asigna un número a cada individuo de la población.
http://proyestitr.blogspot.be/2013/ 11/15
1/17/2018 Probabilidad y estadistica ITR: 2013
2) A través de algún medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios,
números aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos
como sea necesario para completar el tamaño de muestra requerido.

1.2. Muestreo aleatorio sistemático:


Este procedimiento exige, como el anterior, numerar todos los elementos de la población,
Pero en lugar de extraer números aleatorios sólo se extrae uno. Se parte de ese número
aleatorio “i”, que es un número elegido al azar, y los elementos que integran la muestra son los
que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k,
siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k= N/n.
El número i que empleamos como punto de partida será un número al azar entre 1 y k.

1.3. Muestreo aleatorio estratificado:


Trata de evitar las dificultades que presentan los anteriores ya que simplifican los procesos y
suelen reducir el error maestral para un tamaño dado de la muestra. Consiste en considerar
categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a
alguna característica (se puede estratificar, por ejemplo, según la profesión, el municipio de
residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es
asegurarse de que todos los estratos de interés estarán representados adecuadamente en la
muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el
muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán
parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues
exige un conocimiento detallado de la población. (Tamaño geográfico, sexos, edades,...)

1.4. Muestreo aleatorio por conglomerados:


Los métodos presentados hasta ahora están pensados para seleccionar directamente los
elementos de la población, es decir, que las unidades muéstrales son los elementos de la
población.

2. Métodos de muestreo no probabilísticos


A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso
y se acude a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar
generalizaciones (estimaciones inferenciales sobre la población), pues no se tiene certeza de
que la muestra extraída sea representativa, ya que no todos los sujetos de la población tienen
la misma probabilidad de ser elegidos. En general se seleccionan a los sujetos siguiendo
determinados criterios procurando, en la medida de lo posible, que la muestra sea
representativa.

2.1. Muestreo por cuotas:


También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un
buen conocimiento de los estratos de la población y/o de los individuos más "representativos" o
"adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con el
muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél.

2.2. Muestreo intencional o de conveniencia:


Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras
"representativas" mediante la inclusión en la muestra de grupos supuestamente típicos. Es muy
frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones han
marcado tendencias de voto.

2.3. Bola de nieve:


Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta
conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen
estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos,
etc.

2.4. Muestreo Discrecional:


A criterio del investigador los elementos son elegidos sobre lo que él cree que pueden aportar
al estudio.

1.3 “MEDIDAS DE TENDENCIA CENTRAL”


Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con
un solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución
de datos se denomina medida o parámetro de tendencia central o de centralización.
Entre las medidas de tendencia central tenemos:
· Media aritmética.
· Media ponderada.
· Media geométrica.
· Media armónica.
· Mediana.
· Moda.

Media aritmé ca o Media


Es el promedio de un conjunto de valores.
Ejemplo, la media aritmética de 34, 27, 45, 55, 22, 34 (seis valores) es
Se obtiene de la suma de todos los valores dividida

http://proyestitr.blogspot.be/2013/ 12/15
1/17/2018 Probabilidad y estadistica ITR: 2013
entre la cantidad de valores.

Media Ponderada
Es apropiada cuando en un conjunto de datos cada uno de ellos ene una importancia rela va (o peso)
respecto de los demás datos
Se ob ene del cociente entre la suma de los productos de cada dato por su peso o ponderación y la suma de los pesos.

Media geométrica
Es un promedio muy ú l en conjuntos de números que son interpretados en orden de su producto, no de su suma.
Se ob ene de la mul plicación de todos los valores, elevada a la potencia de la can dad de valores dividiendo a uno ‘‘1’.

Media armónica
La media armónica es un promedio muy útil en conjuntos de números que se definen en
relación con alguna unidad.

Mediana
Representa el valor de la variable de posición central en un conjunto de datos ordenados.
Ejemplo: tenemos el siguiente conjunto de números 8,3,7,4,11,2,9,4,10,11,4 ordenamos: 2,3,4,4,4,7,8,9,10,11,11 En esta
secuencia la mediana es 7, que es el número central. Y si tuviésemos: 8,3,7,4,11,9,4,10,11,4, entonces ordenamos:
3,4,4,4,7,8,9,10,11,11 y la mediana (Md) está en: los números centrales son 7 y 8, lo que haces es sumar 7 + 8 y divides entre 2
y Md= 7.5.
Los pasos son:
1. Ordena los valores en orden del menor al mayor.
2. Cuenta de derecha a izquierda, o al revés, hasta encontrar el valor o valores medios.

Moda
Es el valor con una mayor frecuencia en una distribución de datos.
Ejemplo Encontrar la estatura modal de un grupo que se encuentra distribuido de la siguiente forma:

Entre 1,1 y 1,15 hay 1 estudiante


Entre 1,2 y 1,25 hay 2 estudiantes
Entre 1,3 y 1,35 hay 2 estudiantes
Entre 1,45 y 1,55 hay 3 estudiantes
Entre 1,5 y 1,6 hay 4 estudiantes
Entre 1,6 y 1,7 hay 10 estudiantes
Entre 1,7 y 1,8 hay 8 estudiantes
Entre 1,8 y 1,9 hay 2 estudiantes

Clase modal = 1,6 y 1,7 (es la que ene frecuencia absoluta más alta: 10).

1.4 “MEDIDAS DE DISPERSIÓN”

Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la
distribución.
Las medidas de dispersión son:

Rango o recorrido
El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística.

Desviación media
La desviación respecto a la media es la diferencia entre cada valor de la variable estadística y
la media aritmética.
Di = x - x
La desviación media es la media aritmética de los valores absolutos de las desviaciones
respecto a la
media.

La desviación media se representa por

Ejemplo
Calcular la desviación media de la distribución:
9, 3, 8, 8, 9, 8, 9, 18

http://proyestitr.blogspot.be/2013/ 13/15
1/17/2018 Probabilidad y estadistica ITR: 2013

Desviación media para datos agrupados


Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la desviación media
es:

Varianza
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de
una distribución estadística.

La varianza se representa por

Propiedades de la varianza
ü La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones
sean iguales.
ü Si a todos los valores de la variable se les suma un número la varianza no varía.
ü Si todos los valores de la variable se multiplican por un número la varianza queda
multiplicada por el cuadrado de dicho número.
ü Si tenemos varias distribuciones con la misma media y conocemos sus respectivas
varianzas se puede calcular la varianza total.

1.5 “Tabla de distribución de frecuencias”

La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de


tabla de los datos estadís cos, asignando a cada dato su frecuencia
correspondiente
Tipos de frecuencias:

Frecuencia absoluta
La frecuencia absoluta es el número de veces que aparece un
determinado valor en un estudio estadístico. Se representa por f i .

Frecuencia relativa
La frecuencia rela va es el cociente entre la frecuencia absoluta de un determinado
valor y el número total de datos. Se puede expresar en tantos por ciento y se
representa por n i .

Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los
valores inferiores o iguales al valor considerado. Se representa por F i .

Frecuencia rela va acumulada


La frecuencia rela va acumulada es el cociente entre la frecuencia acumulada de un
determinado valor y el número total de datos. Se puede expresar en tantos por ciento.

http://proyestitr.blogspot.be/2013/ 14/15
1/17/2018 Probabilidad y estadistica ITR: 2013

Distribución de frecuencias agrupadas

La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si

las variables toman un número grande de valores o la variable es con nua.

Publicado por probabilidad y estadistica en 16:32 No hay comentarios:

Etiquetas: Unidad 1

Entradas más recientes Página principal

Suscribirse a: Entradas (Atom)

Tema Sencillo. Imágenes del tema: fpm. Con la tecnología de Blogger.

http://proyestitr.blogspot.be/2013/ 15/15

Anda mungkin juga menyukai