Anda di halaman 1dari 31

GRUPOS DE ESTUDIO

LIBRO
Nº4

Matemática / Libro 4
GRUPOS DE ESTUDIO

DATOS Y AZAR

Nombre

Curso
Profesor
MATEMÁTICAS
GE- LIBRO N°4

LIBRO 4: DATOS Y AZAR I

CONTENIDOS

- CONCEPTOS ESTADÍSTICA

- TABLA DE FRECUENCIA

- GRAFICOS

- MEDIDAS DE CENTRALIZACIÓN

- MEDIDAS DE POSICIÓN

- MEDIDAS DE DISPERSIÓN

- DIAGRAMA DE CAJA Y BIGOTES

Página 2
MATEMÁTICAS
GE- LIBRO N°4

ESTADISTICA

Estadística: Es una rama de la matemática que comprende Métodos y Técnicas que


se emplean en la recolección, ordenamiento, resumen, análisis,
interpretación y comunicación de conjuntos de datos.

Población: Es un conjunto cuyos elementos poseen alguna característica común


que se quiere estudiar.
Las poblaciones pueden ser finitas o infinitas.

Muestra: Es un subconjunto de la población, que debe ser representativa de ella


y aleatoria.

Variable Son aquellas en que las observaciones realizadas se refieren a un


Cualitativa: atributo (no son numéricas), por ejemplo: sexo, nacionalidad,
profesión, etc.

Las variables cualitativas pueden ser de 2 tipos:

 Nominal: Son clasificadas en categorías y no admiten criterio de


orden: estado civil (casado, viudo, divorciado), color de pelo
(negro, rubio, castaño), etc.

 Ordinal: En ellas existe una relación de orden intuitivo: nivel


educacional (básico, medio, superior), medallas deportivas (oro,
plata, bronce), etc.

Variable Son aquellas en que cada observación tiene un valor expresado por un
Cuantitativa: número real, por ejemplo: peso, temperatura, salario, etc.

Las variables cuantitativas pueden ser de 2 tipos:

 Discretas: Toman sólo valores enteros, por ejemplo: número de


hijos, número de departamentos en un edificio, etc.

 Continuas: Susceptibles de tomar cualquier valor, por ejemplo:


peso de un estudiante, estatura de un recién nacido, etc.

EJEMPLOS

1. Si se quiere hacer un estudio estadístico de las alturas de los alumnos de los cuartos
medios A, B y C de un colegio, que tienen entre 16 y 18 años de edad, entonces ¿cuál
sería la población de este estudio estadístico?

Página 3
MATEMÁTICAS
GE- LIBRO N°4

2. En estadística, ¿qué se entiende por muestra de la población?

3. Se pregunta a alumnos de un curso por el deporte que prefieren, entre fútbol,


basquetbol, tenis, natación o ciclismo; ¿qué tipo de variable estadística se esta
trabajando?

4. ¿Cuál de los siguientes enunciados representa el uso de una variable cualitativa?

Recuento del número de ventanas de un edificio


Edades de los alumnos de un colegio
Profesiones de los habitantes de una comuna
Salario obtenido por los trabajadores de una empresa
Las temperaturas máximas alcanzadas en el mes de Enero

5. El peso de los pacientes de un consultorio médico, ¿a qué tipo de variable estadística


corresponde?

6. ¿Cuál(es) de las siguientes variables es (son) cuantitativas discretas?

- Número de edificios en la comuna de providencia


- Metros cuadrados de Parque en la comuna de Ñuñoa
- Distancia de los alumnos de un colegio a su hogar
- Número de habitantes de las comunas de Santiago

RESPUESTAS:
1. Los alumnos de 4º A, B y C
2. Un subconjunto de la población, aleatorio y representativo
3. Cualitativa nominal
4. Profesiones de los habitantes de una comuna
5. Cuantitativa y continua
6. Número de edificios en la comuna de providencia
Número de habitantes de las comunas de Santiago

Página 4
MATEMÁTICAS
GE- LIBRO N°4

TABULACIÓN DE DATOS

Frecuencia (f): Número de veces que se repite un dato (también se le denomina frecuencia
absoluta).

Frecuencia acumulada (F): Es la que se obtiene sumando ordenadamente las frecuencias


absolutas hasta la que ocupa la última posición.

Frecuencia relativa (fr): Es el cuociente entre la frecuencia absoluta de uno de los valores
de la variable y el total de datos, expresada en tanto por ciento.

Frecuencia relativa acumulada (frac): Es aquella que se obtiene sumando


ordenadamente la frecuencia relativa hasta la que ocupa la última posición.

Marca de clase: Valor representativo de un intervalo, se calcula como el promedio de los


límites aparentes, inferior y superior de éste.

EJEMPLOS

1. La tabla adjunta, muestra la cantidad de televisores por hogar que hay en un


condominio de 20 casas. ¿En cuántas casas hay menos de 4 televisores?

Nº de Televisores Frecuencia
por casa Absoluta
2 4
3 6
4 8
5 2

2. Un alumno obtuvo las siguientes notas en matemática: 7; 2; 6; 6; 5; 4; 7; 6; 6 y 5.


¿Cuál es la frecuencia relativa a la nota 6?

Página 5
MATEMÁTICAS
GE- LIBRO N°4

3. El límite superior de un intervalo es 18 y su marca de clase es 16, entonces su límite


inferior es

4. La tabla adjunta, muestra la distribución de frecuencias del número de bicicletas (x)


que tiene cada uno de los 25 alumnos de un curso. ¿Cuál(es) de las siguientes
afirmaciones es (son) verdadera(s)?

x f fac fr fr ac
1 5 5 20% 20%
2 8 13 B% 52%
3 A 17 16% 68%
4 8 25 32% C%

I) El valor de A es 6.
II) El 52% de los alumnos tiene una o dos bicicletas.
III) El valor de C es 100.

5. La siguiente tabla estadística se refiere a las edades de personas que asisten a clases
de Yoga. ¿Cuál(es) de las siguientes afirmaciones es (son) verdadera(s) con respecto a
ella?

I) 13 personas que asisten a estas clases tienen Edad frecuencia


20 años o menos. [10, 15[ 5
II) La marca de clase del intervalo 3 es 22,5.
[15, 20[ 8
III) El 50% de estas personas tienen a lo menos
25 años. [20, 25[ 12
[25, 30[ 15
[30, 35[ 10

RESPUESTAS:
1. 10 2. 0,4 3. 14 4. II y III 5. II y III

Página 6
MATEMÁTICAS
GE- LIBRO N°4

MEDIDAS DE TENDENCIA CENTRAL

Las medidas de tendencia central son indicadores que representan valores numéricos en
torno a los cuales tienden a agruparse los valores de una variable estadística. Los
principales son: la media aritmética, la mediana y la moda.

Media Aritmética (x)

Es el cuociente entre la suma de todos los datos y el número de datos. Si se tienen n datos;
x1, x2, x3,…, xn, su media aritmética es

x1 + x2 + x3 + ... + xn
x =
n

Media Aritmética para datos organizados en una tabla de frecuencias

Si los datos son; x1, x2, x3,…, xn, y las frecuencias respectivas son f1, f2, f3,…, fn, entonces la
media aritmética es
Dato Frecuencia
x1 f1
x1 · f1 + x2 · f2 + x3 · f3 + ... + xn · fn
x = x2 f2
f1 + f2 + f3 + ... + fn
x3 f3

xn fn

Media Aritmética para datos agrupados en intervalos

Si las marcas de clases son; c1, c2, c3,…, cn, y las frecuencias de los intervalos respectivos
son f1, f2, f3,…, fn, entonces la media aritmética es

c1 · f1 + c2 · f2 + c3 · f3 + ... + cn · fn
x =
f1 + f2 + f3 + ... + fn

EJEMPLOS

1. La media aritmética del siguiente conjunto de datos: 10; 8; 6; 0; 8; 3; 2; 2; 8; 0, es

Página 7
MATEMÁTICAS
GE- LIBRO N°4

2. La media aritmética entre los siguientes números: 0,1; 0,1; 0,22; 0,23, es

3. La siguiente tabla de frecuencia, corresponde a la estatura de 10 personas. ¿Cuál es la


media aritmética de las estaturas?

Altura (m) f
1,50 3
1,60 2
1,70 5

4. La siguiente tabla muestra la distribución de frecuencias de las edades de 10 personas


(agrupadas en intervalos). ¿Cuál es el promedio de sus edades?

Edades de personas Frecuencia


Marca de clase
(en años) absoluta
[10, 20[ 15 2
[20, 30[
[30, 40[ 35 2
[40, 50[ 1
[50, 60[ 55 1

5. La tabla adjunta contiene el número de minutos que un grupo de adolescente se


conecta diariamente a las redes sociales. ¿Cuál(es) de las siguientes afirmaciones
es (son) verdadera(s)?

I) El intervalo de mayor frecuencia tiene marca Tiempo Frecuencia


(en minutos) absoluta
de clase 75.
II) La media de la muestra es 79,5. [0, 30[ 4
III) El 40% de los encuestados se conecta más [30, 60[ 8
de 90 minutos diarios. [60, 90[ 12
[90, 120[ 10
[120, 150[ 6

RESPUESTAS:

1. 4,7 2. 0,062 3. 1,62 4. 30 5. I y II

Página 8
MATEMÁTICAS
GE- LIBRO N°4

MODA (Mo)

Es el dato que se repite mayor cantidad de veces en una muestra.

MODA PARA TABLA DE FRECUENCIA DE DATOS NO AGRUPADOS POR INTERVALOS


Para este caso la moda corresponde al dato que tiene una frecuencia mayor

MODA PARA TABLA DE FRECUENCIA DE DATOS AGRUPADOS POR INTERVALO

En una tabla de frecuencia de datos agrupados por intervalo es imposible saber con
exactitud el valor de la moda, sin embargo se puede encontrar un intervalo modal y un valor
estimativo para la esta.

Intervalo Modal: Es el intervalo al que le corresponde una mayor frecuencia.

Moda: En una tabla de frecuencia de datos aplicados por intervalos se puede encontrar un
valor estimativo para la moda. Para determinar este valor estimativo se utiliza la siguiente
fórmula:

é D ù
MO = LM + ê A
ú×A
O
êë DB + DA úû

LM : extremo inf erior del int ervalo modal


0

DA : diferencia entre la frecuencia del int ervalo modal y la clase que lo precede
DB : diferencia entre la frecuencia del int ervalo modal y la clase que lo sigue
A : amplitud de la clase modal

OSERVACIÓN:

La muestra puede ser:


Amodal: Si no hay dato que tenga mayor frecuencia que el resto de ellos.
Unimodal: Si existe un solo dato que tenga mayor frecuencia.
Bimodal: Si existen dos datos que tienen la misma frecuencia y corresponde a la mayor.
Polimodal: Si existen mas de 2 datos que tienen igual frecuencia y corresponde a la mayor.

EJEMPLOS

1. La tabla adjunta, muestra los resultados de una encuesta realizada a 100 personas
respecto al número de hermanos. ¿Cuál es la moda?
Número de
f
Hermanos
0 19
1 18
2 19
3 14
4 20
5 10
Página 9
MATEMÁTICAS
GE- LIBRO N°4

2. La moda del siguiente conjunto de datos: 3, 7, 6, 5, 5, 7, 6, 8 y 7 es

3. De acuerdo al conjunto de datos: 1; 2; 2 y 4, ¿cuál(es) de las siguientes afirmaciones


es (son) verdadera(s)?

I) Si se agrega un 1, la muestra es bimodal.


II) Si se agrega un 1 y un 4, la muestra es amodal.
III) Si se agrega un 1; 4 y 5, la muestra es polimodal.

4. La tabla adjunta muestra los resultados de una encuesta referente al número de


pantallas que tienen en su casa un grupo de personas. ¿Cuál(es) de las siguientes
afirmaciones es (son) verdadera(s)?

Número de
Frecuencia
Pantallas
[0 – 2[ 1
[2 – 4[ 3
[4 – 6[ 4
[6 – 8] 2

I) La muestra tiene 1 término central.


II) El intervalo modal es [2 – 4[.
III) El valor de la moda de la muestra es 5.

RESPUESTAS:
1. 4 2. 7 3. I, II y III 4. Ninguna

Página 10
MATEMÁTICAS
GE- LIBRO N°4

MEDIANA (Me)

Para determinar la mediana se deben ordenar los datos, preferentemente en forma creciente
el dato que ocupa la posición central de la muestra corresponde a la mediana.

En cuanto al número de datos de la muestra, existen dos posibilidades:

Que el número de datos sea impar: En este caso solo se tendrá un término central, el
que corresponde a la mediana de la muestra.
Que el número de datos sea par: En este caso se tendrán dos términos centrales, la
mediana corresponderá al promedio de ellos.

MEDIANA PARA TABLA DE FRECUENCIA DE DATOS NO AGRUPADOS POR INTERVALO

Para determinar la posición de la mediana se enfrentan dos situaciones diferentes


Nº Impar de Datos : Un término central
N+1
Posición de la mediana: PMe =
2

Nº Par de Datos : Dos términos centrales, la mediana corresponde al promedio de ellos, la


posición de estos término será:

N N+2
P = y P =
T1 2 T2 2

MEDIANA PARA TABLA DE FRECUENCIA DE DATOS AGRUPADOS POR INTERVALO

Se deberá distinguir entre dos posibles preguntas:

Intervalo que Contiene la Mediana: Para este caso se determina la posición de la


mediana y luego se busca el intervalo correspondiente a la posición.

Mediana: Para estimar el valor de la mediana en una tabla de intervalos se puede usar la
siguiente fórmula:
N 
 2  Fi - 1 
Me = LM +   A
e
 fi 
 

N : Número total de datos.


LMe : extremo inferior del intervalo que contiene la mediana.

Fi-1 : frecuencia acumulada hasta el intervalo anterior al que contiene la mediana.


fi : frecuencia absoluta del intervalo que contiene la mediana.

A : amplitud del intervalo que contiene la mediana.

Página 11
MATEMÁTICAS
GE- LIBRO N°4

EJEMPLOS

1. Se encuestaron 8 familias y el número de personas por familia dio los siguientes


resultados: 7; 3; 6; 2; 4; 6; 4 y 6. Entonces, la mediana es

2. De los siguientes datos: p + 2q, 8p + 16q, 10p + 20q, 6p + 12q, 2p + 4q y 4p + 8q, con
p < q y ambos positivos, ¿cuál es la mediana?

3. La siguiente tabla representa las edades de un grupo de personas. Con respecto a esta
información determine si las siguientes afirmaciones son verdaderas o falsas

Edad f
___ 22 personas tienen 19 años o menos. 17 5
18 10
___ la moda es 18 años.
19 7
___ el 33,3 % tiene 18 años. 20 8
Total 30
___ la media aritmética es 18,6 años.
___ la mediana es 18 años.

4. En la siguiente tabla, ¿cuál(es) de la(s) siguientes afirmaciones es (son) FALSA(S)?

I) El intervalo donde se encuentra la mediana es [20, 30[.


II) La mediana es aproximadamente 20,6 .
III) El dato mayor de la muestra es 40.

Edades [0, 10[ [10, 20[ [20, 30[ [30, 40[


f 1 2 3 4

RESPUESTAS
1. 5 2. 5p + 10q 3. V-V-V-V-F 4. II y III

Página 12
MATEMÁTICAS
GE- LIBRO N°4

GRÁFICOS

REPRESENTACIÓN GRÁFICA E INTERPRETACIÓN DE GRÁFICOS

A menudo, una representación gráfica de una distribución de frecuencias nos da una mejor
idea de un estudio estadístico que un cuadro con números. Existen distintos tipos de
gráficos, algunos de los más utilizados son

GRÁFICO DE BARRAS

Utilizado en variables de tipo cualitativa y cuantitativa discreta, este gráfico (fig. 1), consiste
en una serie de barras que indican a los datos, cuyas alturas representan la frecuencia
absoluta de estos.
Gráfico de Barras
A

Frecuencia (f)
X f C
Dato 1 A fig. 1
D
Dato 2 B B
Dato 3 C E
Dato 4 D
Dato 5 E Dato 1 Dato 2 Dato 3 Dato 4 Dato 5 Dato (x)

GRÁFICO CIRCULAR
El gráfico circular (fig.2), es utilizado en variables de tipo cualitativa y cuantitativa discreta.
El gráfico consiste en un círculo dividido en secciones proporcionales al tamaño de la
muestra y la frecuencia de los datos.

Gráfico Circular
X f fr
f x°
Dato 1 a a% = Dato 5
total 360° Dato 1
Dato 4
Dato 2 b b%
f fr fig. 2
Dato 3 c c% =
total 100%
Dato 4 d d%
Dato 3 Dato 2
Dato 5 e e%

HISTOGRAMA
Se utiliza para representar a los datos agrupados en intervalos (fig3). El histograma se
elabora representando a los datos en el eje horizontal y a las frecuencias en el eje vertical, y
trazando barras cuyas bases equivalgan a los intervalos de clase y cuyas alturas
correspondan a las frecuencias de clase.
d
b
Frecuencia

x f fig. 3
c
Intervalo 1 a a
Intervalo 2 b
Intervalo 3 c 1 2 3 4
Intervalo 4 d Intervalos

Página 13
MATEMÁTICAS
GE- LIBRO N°4

POLÍGONO DE FRECUENCIAS

Al igual que el histograma, este gráfico (fig. 4), se utiliza en datos agrupados en intervalos.
Para confeccionarlo, debemos unir con una recta a los puntos donde se intersectan la marca
clase y la frecuencia de los intervalos. Para “anclar” el polígono al eje horizontal, debemos
agregar un intervalo de frecuencia cero, antes del primer y después del último intervalo.

Polígono de frecuencias
Frecuencia (f)
X C f 6

Intervalo 1 Clase 1 a a5
Intervalo 2 Clase 2 b c4
fig. 4
Intervalo 3 Clase 3 c d3
Intervalo 4 Clase 4 d b2
1
0
Clase (c)
Clase Clase 1 Clase 2 Clase 3 Clase 4 Clase

POLÍGONO DE FRECUENCIAS ACUMULADAS U OJIVA

Este gráfico (fig. 5), se representa uniendo puntos referidos al límite superior y frecuencia
acumulada de cada intervalo. Para “anclar” la Ojiva al eje horizontal, se posiciona en el
límite inferior del primer intervalo.

Polígono de frecuencias acumuladas (F)

F
X F D6
[a, b[ A C
5

[b, c[ B 4

[c, d[ C 3
fig. 5
2
[d, e[ D
1
B
0
A

a b c d e X (lim.sup.)

Página 14
MATEMÁTICAS
GE- LIBRO N°4

EJEMPLOS

1. La tabla adjunta, muestra una distribución de frecuencias de las edades, en años, de


los alumnos de un colegio que cursan 4to medio.
Edades (años) Nº de alumnos
16 3
17 9
18 12
19 6
20 0

¿Cuál(es) de los siguientes gráficos puede(n) representar los datos de la tabla de


distribución de frecuencia?

I) de barras II) poligonal III) circular

16 años
Nº de alumnos Nº de alumnos 19 años
10%
12 12
20%
9 9
6 6 30% 17 años
3 3 40%

16 17 18 19 20 Edad 18 años
0 16 17 18 19 20 Edad
(años) (años)

2. Según el histograma de la figura y su tabla de frecuencia, ¿cuál(es) de las siguientes


afirmaciones es (son) verdadera(s)?
Nº de alumnos
Distancia de la casa al 18
Nº de alumnos
colegio en km
12
[16 – 18[ 12
[18 – 20[ 18

16 17 18 19 20 km
I) La amplitud de los intervalos es 2.
II) Las marcas de clases son 17 km y 19 km.
III) El promedio o media aritmética es 18.

Página 15
MATEMÁTICAS
GE- LIBRO N°4

3. El gráfico de Ojiva de la figura, muestra el peso de niños al nacer, ¿cuál(es) de las


siguientes afirmaciones es (son) verdadera(s)?

I) 36 niños al nacer pesan menos de 4 kg.


II) 4 niños al nacer sus pesos están en el intervalo [4 - 4,5[.
III) El 90% de los niños pesan menos de 4 kg. al nacer.

F( frecuencia acumulada)
40
6
36
5
4
28
3
2
12
1
0
4

2 2,5 3 3,5 4 4,5


Peso (kg.)

RESPUESTAS:
1. I, II y III 2. I y II 3. I, II y II

Página 16
MATEMÁTICAS
GE- LIBRO N°4

MEDIDAS DE POSICIÓN

Las medidas de posición dividen la distribución en partes iguales y sirven para clasificar a un
individuo o elemento dentro de una determinada población o muestra. Así en la PSU al
puntaje obtenido en la prueba se agrega el percentil en el que se encuentra, con esto el
resultado del individuo queda clasificado dentro la población (individuos que rindieron PSU).
En economía se utiliza principalmente para definir sectores socioeconómicos según ingreso
per cápita familiar (por ejemplo quintiles).

Para determinar las medidas de posición es necesario que los datos se encuentren
ordenados en forma creciente.

Las medidas de posición, más utilizadas son: Cuartiles, Quintiles, Deciles y Percentiles.

Así como la mediana divide la distribución en dos partes iguales, existen tres cuartiles,
cuatro quintiles, nueve deciles y noventa y nueve percentiles que dividen en cuatro, cinco,
diez y cien partes iguales a la distribución.

CUARTILES
Los cuartiles son 3, dividen los datos ordenados en 4 partes.
Los cuartiles son datos bajos los cuales se acumula el 25%, 50% y el 75% de los datos
estudiados, se representan como Q1, Q2 y Q3 respectivamente.

OBSERVACIÓN: Q2 coincide con la mediana.

QUINTILES
Los quintiles son 4, dividen los datos ordenados en 5 partes.
Los quintiles son datos bajos los cuales se acumula el 20%, 40%, 60% y el 80% de los
datos estudiados.

DECILES
Los deciles son 9, dividen los datos ordenados en 10 partes.
Los deciles son datos bajos los cuales se acumula el 10%, 20%,… y el 90% de los datos
estudiados

PERCENTILES
Los percentiles son 99, dividen los datos ordenados en 100 partes.
Los percentiles son datos bajos los cuales se acumula el 1%, 2%, 3%, 4%… y el 99% de los
datos estudiados.

Página 17
MATEMÁTICAS
GE- LIBRO N°4

Si el número de datos de la muestra o población es N, entonces para determinar el LUGAR


en el que se ubica la medida de posición solicitada, existe una relación que depende de la
medida de posición que se desee calcular.

Medida de Cuartil Quintil Decil Percentil


Posición
Posición N+1 N+1 N+1 N+1
PQ =K PK =K PD = K  PP = K 
(lugar) K 4 K 5 K 10 K 100

PQ , indica la posición del cuartil K, siendo K = 1, 2, 3


K

PK , indica la posición del quintil K, siendo K = 1, 2, 3, 4


K

PD , indica la posición del decil K, siendo K = 1, 2, 3 ,4 , 5, 6, 7, 8, 9


K

PPK , indica la posición del percentil K, siendo K = 1, 2, 3, 4,…………..,99

Para determinar una medida de posición para datos no agrupados, se procede de la


siguiente manera:

- Ordenar los datos en forma creciente


- Determinar el lugar que ocupa la medida de posición buscada.
- Respecto a la posición tenemos dos posibilidades de resultados:
Número entero: el valor será el dato que ocupa ese lugar.
Número decimal: el valor será el promedio entre los datos que se encuentra a la
izquierda de la posición con el dato que se encuentra a la derecha.

DATOS TABULADOS
Si los datos se encuentran tabulados en una tabla de frecuencia, se debe proceder de
manera similar a la utilizada para encontrar la mediana, se busca en la columna de
frecuencia acumulada el lugar que corresponde a la media de posición buscada y de esta
manera se determina el dato correspondiente.

OBSERVACIÓN
Cuando los datos se encuentren en una tabla de intervalos solo indicaremos el intervalo al
que pertenece la medida de posición buscada.

EJEMPLOS

1. Para la variable números de televisores por hogar, se obtuvo la distribución que


aparece en la tabla adjunta. El primer, segundo y tercer cuartil son, respectivamente,

N° de televisores por hogar Frecuencia


0 26
1 22
2 30
3 54
4 30
5 38

Página 18
MATEMÁTICAS
GE- LIBRO N°4

2. La tabla muestra una parte de la Puntaje Corregido (PC) a Puntaje Estándar (PS) para
un Facsímil de matemática con 80 preguntas y sus correspondientes percentiles. ¿Qué
significado tiene que el puntaje de un alumno se encuentre en el percentil 89?

PC PS Percentil
43 623 87
44 626 88
45 629 88
46 633 89
47 640 90

3. El ingreso de Eugenio está ubicado en el tercer intervalo quintílico. Respecto a esta


información, ¿cuál(es) de las siguientes afirmaciones es (son) verdadera(s)?

I) Su ingreso puede igualarse a la mediana.


II) Su valor puede ser menor al valor correspondiente al tercer cuartil.
III) Su ingreso se ubica entre el percentil 40 y el percentil 60.

4. El valor de x en una muestra está ubicado entre el segundo y tercer decil. ¿Cuál(es) de
las siguientes afirmaciones respecto a x es (son) siempre verdadera(s)?

I) El valor de x es inferior al primer cuartil.


II) El valor de x es inferior al segundo quintil.
III) El valor de x es superior al percentil 28.

RESPUESTAS
1. 2. 3. 4.
Q1 = 2 El 89% de los alumnos no lo supera I , II y III Solo II
Q2 = 3
Q3 = 4

Página 19
MATEMÁTICAS
GE- LIBRO N°4

MEDIDAS DE DISPERSIÓN

Las medidas de dispersión, o medidas de variabilidad, indican la dispersión de los valores de


la muestra respecto a su valor central. Mientras menor sea la medida de dispersión mas
homogénea será la muestra.

RANGO

Rango o recorrido es la diferencia entre el mayor y el menor de los datos.

DESVIACIÓN ESTÁNDAR o TÍPICA

Es una medida de dispersión y nos indica cuánto tienden a alejarse los datos del promedio
aritmético.

Para calcular la desviación estándar () se utiliza la siguiente fórmula:

Para datos no agrupados


(x1  x)2 + (x2  x)2 + ... + (xn  x)2
=
n

Para datos agrupados


en tablas de frecuencia f1 · (x1  x)2 +f2 · (x2  x)2 + ... + fn · (xn  x)2
=
f1 + f2 + f3 + ..... + fn

Donde xi : dato que se encuentra en la posición i


fi : frecuencia del dato de posición i

OBSERVACIÓN:

Al trabajar con datos agrupados en intervalos se utiliza la marca de clase de cada uno de
ellos, en lugar de xi.

PROPIEDADES
Sea x una variable aleatoria y k un número real

1)  (x)  0 : La desviación estándar es un número real no negativo


2)  (k) = 0 : Si todos los datos de la muestra son iguales, la desviación estándar es 0.
3)  (x + k) =  (x) : Al sumar a todos los datos de la muestra un mismo valor, la
desviación estándar se mantiene constante.
4)  (kx) = k·  (x) : Al multiplicar todos los datos de la muestra por un mismo valor k, la
nueva desviación estándar será k veces la desviación estándar
original.

Página 20
MATEMÁTICAS
GE- LIBRO N°4

VARIANZA

Es otra medida de dispersión que corresponde al cuadrado de la desviación estándar.

Para datos no agrupados (x1  x)2 + (x2  x)2 + ... + (xn  x)2
Var(x) = 2 =
n

Para datos agrupados


en tablas de frecuencia f1(x1  x)2 + f2 (x2  x)2 + ... + fn(xn  x)2
Var(x) = 2 =
f1 + f2 + f3 + ... + fn
Siendo xi : dato que se encuentra en la posición i
fi : frecuencia correspondiente al dato de posición i

OBSERVACIÓN:
Al trabajar con datos agrupados en intervalos se utiliza la marca de clase de cada uno de
ellos, en lugar de xi.

PROPIEDADES DE LA VARIANZA

Sea x una variable aleatoria y k un número real

1) Var (x)  0 : La varianza es un número real no negativo

2) Var (k) = 0 : Si todos los datos de la muestra son iguales, la varianza es 0.

3) Var (x + k) = Var (x) : Al sumar a todos los datos de la muestra un mismo valor, la
varianza se mantiene constante.
4) Var (kx) = k2 · Var(x) : Al multiplicar todos los datos de la muestra por un mismo valor
k, nueva varianza será igual al producto del cuadrado de k por
la varianza original.

EJEMPLOS

1. El rango en el conjunto de datos {3, 7, 8, 11, 1, 10, 15, 20, 21, 22, 24, 23} es

Página 21
MATEMÁTICAS
GE- LIBRO N°4

2. ¿Cuál(es) de las siguientes proposiciones es (son) verdadera(s)?

I) La desviación estándar es un número real no negativo.


II) La diferencia entre un dato y el promedio de la muestra puede ser
negativa.
III) El rango es una medida de dispersión que puede ser negativa.

3. Con respecto a la tabla de frecuencias adjunta, ¿cuál(es) de la siguientes proposiciones


es (son) verdadera(s)?

I) El promedio es 6. Edad (años) Nº de niños


II) El total de datos es 5. [0 – 4[ 2
III) La desviación estándar es 12,8 . [4 – 8[ 1
[8 – 12[ 2

4. En una familia las edades de sus hijos son 3, 4, 7, 9 y 12 años. ¿Cuál(es) de las
siguientes afirmaciones es (son) verdadera(s)?

I) Si todos aumentaran un año, entonces la media sería 5 unidades mayor.


II) La muestra es amodal.
III) La desviación estándar es de 10, 8 años.

RESPUESTAS
1. 23 2. I y II 3. I, II y III 4. II y III
Página 22
MATEMÁTICAS
GE- LIBRO N°4

GRÁFICO DE CAJA Y BIGOTES

El diagrama de caja es una representación gráfica basada en cuartiles, que ayuda a ilustrar
una muestra de datos. Para elaborar este gráfico, sólo se necesitan cinco datos: el valor
mínimo, el primer cuartil, la mediana, el tercer cuartil y el valor máximo de la muestra.

TIPOS DE MUESTRA

Muestra Simétrica: Los valores intercuartílicos están igualmente dispersos.

Valor Q1 Q2 Q3 Valor
mínimo máximo

Muestra Positivamente Asimétrica: Los valores más grandes se encuentran más


dispersos que los más pequeños.

Valor Q1 Q2 Q3 Valor
mínimo máximo

Muestra Negativamente Asimétrica: Los valores más pequeños se encuentran más


dispersos que los más grandes.

Valor Q1 Q2 Q3 Valor
mínimo máximo

EJEMPLO:

1. ¿Qué valores deben ser considerados de la muestra adjunta para construir un diagrama
de caja y bigotes?
22 32 32 42 40 24 43 24 37 29 40

2. ¿A qué tipo de muestra se asemeja?

RESPUESTAS

1. Valor mínimo: 22 Valor Máximo: 43 Q1=24 Q2=32 Q3=40 2. Simétrica

Página 23
MATEMÁTICAS
GE- LIBRO N°4

EJERCICIOS ADICIONALES DE ESTADÍSTICA Y PROBABILIDAD

1. Determine la veracidad o falsedad de las siguientes proposiciones

a) ____ El número de calzado es una variable cualitativa.

b) ____ El número de hermanos de un individuo es una variable cuantitativa


continua.

c) ____ La preferencia de un equipo de fútbol es una variable cualitativa.

d) ____ La moda del conjunto {2,3,3,5,5,5,7,7,8,9} es 5.

a+b+c
e) ____ La media aritmética entre a, b y c es .
2

f) ____ La mediana del conjunto {3,5,7,9,11,12} es 8.

g) ____ La mediana del conjunto {3,5,7,9,11} es 7.

h) ____ El percentil 50 coincide con la moda de los datos en un conjunto.

i) ____ El cuartil 2 coincide con la mediana.

j) ____ En un estudio estadístico la cantidad de datos que está entre los cuartiles 1 y
3, corresponde al 75% de los datos.

k) ____ Al realizar un estudio estadístico, el conjunto de todos los elementos que son
objeto de estudio se llama muestra.

l) ____ De las notas de un curso en una prueba se sabe que el percentil 75


corresponde a una nota 5, entonces se puede concluir que el 75% obtuvo
nota 5 o menos.

m) ____ El rango de los datos {2,3,3,8,6,7,19,11,17} es 15.

n) ____ En un conjunto de datos la moda es siempre única.

ñ) ____ La mediana no siempre es coincidente con alguno de los datos del conjunto
dado.

Página 24
MATEMÁTICAS
GE- LIBRO N°4

2. La siguiente tabla muestra las notas de una prueba de química correspondiente a un


curso.

Frecuencia
Notas Frecuencia
Acumulada
1,0 1
2,0 4
3,0 5
4,0 6
5,0 9
6,0 12
7,0 8

Complete la tabla y responda las siguientes preguntas:

a) ¿Cuántos alumnos rindieron la prueba?


b) ¿Cuántos alumnos obtuvieron nota igual o inferior a 5?
c) ¿Cuántos alumnos obtuvieron nota inferior a 4?
d) ¿Cuántos alumnos obtuvieron nota superior a 6?

3. Dada la siguiente tabla de frecuencias, determine los valores de a, b, c, d, e, f, g, h, i,


j, k

Frecuencia Frecuencia Frecuencia


Xi
Absoluta Acumulada Relativa
X1 12 d 0,08

X2 12 e h

X3 a 48 0,16

X4 21 f 0,14

X5 15 84 i

X6 b 114 j

X7 21 135 k

X8 c g l

4. De los datos del conjunto A = {6,7,7,3,4,1,7,5}, determine las medidas de


centralización de los valores.

Página 25
MATEMÁTICAS
GE- LIBRO N°4

5. La siguiente tabla muestra el precio de una revista en diferentes locales comerciales.

Local 1 Local 2 Local 3 Local 4 Local 5


$ 940 $ 1100 $ 845 $ 820 $ 745

Determinar:

a) El promedio.

b) La moda.

6. Encuentre la Media Aritmética, Moda y Mediana de los datos de tabla adjunta.

Notas Frecuencia
7,0 6
6,0 8
5,0 15
4,0 10
3,0 12
2,0 8
1,0 2

Página 26
MATEMÁTICAS
GE- LIBRO N°4

Ejercicios Selección Múltiple


(Preguntas Oficiales publicadas por Demre)

1. La tabla adjunta muestra las edades de 220 alumnos de un colegio. ¿Cuál(es) de las
siguientes afirmaciones es (son) verdadera(s)?

I) La moda es 17 años.
II) La mediana es mayor que la media (promedio).
III) La mitad de los alumnos del colegio tiene 17 o 18 años.

A) Solo I
B) Solo II
Edad (en años) 15 16 17 18 19
C) Solo I y II
D) Solo II y III Alumnos 50 40 60 50 20
E) I, II y III

2. El gráfico circular de la figura muestra las preferencias de 30 alumnos en actividades


deportivas. ¿Cuál(es) de las siguientes afirmaciones es (son) correcta(s)?

I) La frecuencia relativa porcentual del grupo de fútbol es de 40%.


II) La frecuencia relativa porcentual del grupo de básquetbol es de 30%.
III) La mitad del grupo no prefirió fútbol ni tenis.

Fútbol
A) Solo I 12 Tenis
B) Solo II 3
C) Solo I y II Atletismo
D) Solo II y III Básquetbol 6
E) I, II y III 9

3. La tabla adjunta muestra la distribución de los puntajes obtenidos por los alumnos de
un curso en una prueba de matemática. ¿Cuál(es) de las siguientes afirmaciones
es (son) verdadera(s)?

I) El total de alumnos que rindió la prueba es 40.


II) La mediana se encuentra en el intervalo [20 – 29].
III) El intervalo modal (o clase modal) es el intervalo [30 – 39].

Intervalos de Frecuencia
A) Solo I puntaje
B) Solo II [10 – 19] 6
C) Solo III [20 – 29] 8
D) Solo I y III [30 – 39] 12
E) I, II y III [40 – 49] 5
[50 – 59] 9

Página 27
MATEMÁTICAS
GE- LIBRO N°4

4. Una misma prueba se aplica a dos cursos paralelos. En uno de ellos, con
20 estudiantes, la nota promedio fue 6 y, en el otro, con 30 estudiantes, la nota
promedio fue 5. Entonces, la nota promedio correspondiente al total de alumnos de
ambos cursos es

A) 5,7
B) 5,6
C) 5,5
D) 5,4
E) 5,3

5. Se ha lanzado un dado 100 veces y se obtuvo la siguiente tabla:

Cara 1 2 3 4 5 6
Frecuencia 13 15 17 16 20 19

¿Cuál(es) de las siguientes afirmaciones es (son) verdadera(s)?

I) El 50% de las veces se obtuvo un número par.


II) El 30% de las veces resultó 1 o 3.
III) El 20% de las veces salió el número 5.

A) Solo III
B) Solo I y II
C) Solo I y III
D) Solo II y III
E) I, II y III

6. A los 45 alumnos de un curso se les consultó acerca de cuál era su deporte favorito. La
tabla adjunta muestra los resultados obtenidos. Para estos datos, ¿cuál(es) de las
siguientes afirmaciones es (son) verdadera(s)?

I) La moda es 19.
II) La media aritmética (o promedio) es 11,25.
III) La mediana es 11.
N° de
A) Solo I Deporte
alumnos
B) Solo I y II
Tenis 9
C) Solo II y III
D) I, II y III Básquetbol 13
E) Ninguna de ellas. Fútbol 19
Natación 4

Página 28
MATEMÁTICAS
GE- LIBRO N°4

7. Sea el conjunto A formado por elementos a1, a2, a3, a4, a5 y a6, con desviación
estándar  y varianza 2. ¿Cuál de las siguientes afirmaciones es verdadera?

A)  y 2 nunca son iguales.


B) 2 nunca será cero.
C) Siempre 2 > 0.
D) Si los elementos de A son impares consecutivos, entonces  = 1.
E) Si los elementos de A son números positivos distintos entre sí, entonces  es
mayor que 0.

8. Si a, b y c son números enteros positivos cuya desviación estándar es , entonces la


desviación estándar de na, nb y nc, con n un número entero positivo es

A) n2
B) 
C) n
D) n
E) 3n

9. Se tienen los puntajes del total de estudiantes de un curso en un examen de


matemática, los cuales se agrupan posteriormente en intervalos como se muestra en la
tabla adjunta. ¿Cuál de las siguientes afirmaciones es FALSA?

A) 39 alumnos obtuvieron al menos de 20 puntos.


B) 45 alumnos rindieron el examen.
C) La mediana de los puntajes se encuentra en el intervalo [30,39].
D) 6 alumnos obtuvieron a lo más de 19 puntos.
E) Se puede deducir que la moda de los puntajes se encuentra en el intervalo [40,50].

Puntaje Nº de alumnos
[0,9] 2
[10,19] 4
[20,29] 7
[30,39] 15
[40,50] 17

10. Al observar los grupos de datos P y Q de la tabla adjunta, se puede deducir que

P 10 12 13 13 15 16
Q 10 12 13 13 15 17

A) Solo las medias aritmética y moda de P y Q son iguales.


B) Las medias aritméticas y las medianas de P y Q son iguales.
C) Las medianas y las modas de P y Q son iguales.
D) Las medias aritméticas, las medianas y las modas de P y Q son iguales.
E) Las medias aritméticas, las medianas y las modas de P y Q son distintas.

Página 29
MATEMÁTICAS
GE- LIBRO N°4

RESPUESTAS EJERCICIOS ADICIONALES

I. Estadística

1. a) F b) F c) V d) V e) F f) V g) V h) F i) V

j) F k) F l) V m) F n) F ñ) V

2.
a) 45 b) 25 c) 10 d) 8

3. a = 24, b = 30, c = 15, d = 12, e = 24, f = 69, g = 150, h = 0,08, i = 0,10, j = 0,20,
k = 0,14, l = 0,10

4.
a) La moda es 7. b) La mediana es 5,5. c) La media aritmética es 5.

5.
a) El promedio es $ 890. b) Amodal.

6.
a) Promedio es 4,24 aprox. b) La moda es 5. c) La mediana es 4.

Claves Ejercicios Selección Múltiple

Nº Pregunta 1 2 3 4 5 6 7 8 9 10
Clave E E D D E E E D E C

Página 30
MATEMÁTICAS
GE- LIBRO N°4

Aprendizajes Esperados Libro 4

El alumno al finalizar el libro será capaz de:

 Manejar conceptos básicos de estadística.


 Interpretar las diferentes tablas de frecuencias.
 Extraer datos desde un gráfico.
 Determinar medidas de centralización para datos no agrupados y agrupados en tablas
de intervalos.
 Determinar medidas de posición.
 Valorar la medida de posición como instrumento para clasificar datos o personas
pertenecientes a una muestra o población.
 Encontrar medidas de dispersión.
 Comparar dos o más muestras en relación a las medidasde dispersión de cada una de
ellas

Revisa Tema 3, Estadística I desde el módulo 1 al 6 en www.preupdvonline.cl


www.preupdvonline.cl

GEMA-L04
Puedes complementar los contenidos de esta guía visitando nuestra web
http://www.pedrodevaldivia.cl/

Página 31

Anda mungkin juga menyukai