Anda di halaman 1dari 32

¿Qué es la Estadística?

Semana 1
Temas
• DISTRIBUCIÓN DE FRECUENCIAS
DISTRIBUCIÓN DE FRECUENCIAS
• Es un método que organiza y resume información.
• Ordena y clasifica datos para calcular la frecuencia (número de veces
que se repiten)

Grandes cantidades de
información en
espacios reducidos
DISTRIBUCIÓN DE FRECUENCIAS
Característica: Número de mascotas en
el hogar
Población/Universo: Conjunto de
elementos/unidades que tienen
características de interés a estudiar.
DISTRIBUCIÓN DE FRECUENCIAS
Característica: Número de mascotas en
el hogar
Población/Universo: Conjunto de
elementos/unidades que tienen
0
2 características de interés a estudiar.
1 3
0
1 Investigación exhaustiva: Con todas las
0
1 unidades de la población
DISTRIBUCIÓN DE FRECUENCIAS
Característica: Número de mascotas en
el hogar
Población/Universo: Conjunto de
elementos/unidades que tienen
características de interés a estudiar.
Investigación exhaustiva: Con todas las
unidades de la población
Investigación parcial o muestra: Con una
parte de laMuestra
población.
seleccionada al azar
DISTRIBUCIÓN DE FRECUENCIAS
Característica: Número de mascotas en
el hogar
Población/Universo: Conjunto de
elementos/unidades que tienen
2 características de interés a estudiar.
3
Investigación exhaustiva: Con todas las
1 unidades de la población
Investigación parcial o muestra: Con una
parte de laMuestra
población.
seleccionada al azar
DISTRIBUCIÓN DE FRECUENCIAS
Característica: Número de mascotas en
el hogar
Población/Universo: Conjunto de
2
1
elementos/unidades que tienen
3
1 1
1
características de interés a estudiar.
2
1
0 Investigación exhaustiva: Con todas las
0
3 unidades de la población
0 0 0 0
Investigación parcial o muestra: Con una
parte de laMuestra
población.
azar
seleccionada al
DISTRIBUCIÓN DE FRECUENCIAS
Característica: Estatura
Población/Universo: Conjunto de
elementos/unidades que tienen
1.54m características de interés a estudiar.
1.68 m
Investigación exhaustiva: Con todas las
1.71 m unidades de la población
Investigación parcial o muestra: Con una
parte de laMuestra
población.
seleccionada al azar

15
1.64
DISTRIBUCIÓN DE FRECUENCIAS
Según su
forma de Tipo de
ser variables
descritas

Cualitativa
Característic Números enteros
Discreta
a (Variable) No valores intermedios
Cuantitativa p.ej. núm. de mascotas

Contínua Admite valores fraccionarios


p.ej. estatura
DISTRIBUCIÓN DE FRECUENCIAS
Según su
forma de Escala de
ser medición
descritas

Nominal Etiquetas, sin orden


Cualitativa color_ojos
Ordinal Negro
Característic Verde
a (Variable)
Azul
Intervalo
Cuantitativa
Razón
DISTRIBUCIÓN DE FRECUENCIAS
estado_salud
Según su
Muy saludable
forma de Escala de
ser medición Medianamente saludable
descritas Saludable
Poco saludable
Nominal
No saludable
Cualitativa
Ordinal Etiquetas, con orden
Característic
a (Variable) nivel_socioeconómico
Intervalo
Alto
Cuantitativa
Medio
Razón Bajo
DISTRIBUCIÓN DE FRECUENCIAS
Según su
forma de Escala de temp_c
ser medición
descritas 36.8
38.4
Nominal 37.1
Cualitativa
Ordinal Valores numéricos.
Característic Unidades de medidas constantes.
a (Variable) Se conoce la distancia exacta entre
Intervalo mediciones.
Se pueden hacer comparaciones
Cuantitativa
entre la diferencia de mediciones.
Razón El cero es una convención.
DISTRIBUCIÓN DE FRECUENCIAS
Según su
forma de Escala de
ser medición precio
descritas $5000
$3200
Nominal $0
Cualitativa
Ordinal
Valores numéricos.
Característic
Unidades de medidas constantes.
a (Variable)
Se conoce la distancia exacta entre
Intervalo
mediciones.
Cuantitativa Se pueden hacer comparaciones
Razón entre la diferencia de mediciones.
El cero es absoluto, representa
ausencia de lo que se mide.
DISTRIBUCIÓN DE FRECUENCIAS
Nivel de medición Identificación: Orden: Unidad de medida Cero absoluto:
constante:
Hay distinción entre Se pueden ordenar Se conoce la Ausencia de valor en
categorias distancia exacta la escala que se
entre cada categoría traduzca
Operaciones Contar Ordenar Comparar Comparar razones
Operaciones Contar Ordenar Comparar
diferencias Comparar razones
diferencias
Relaciones posibles
Relaciones posibles
Nominal
Nominal
Ordinal
Ordinal
Intervalo
Intervalo
Razón
Razón
TABLA DE FRECUENCIAS
Notación empleada en las tablas
Símbolo Definición Símbolo Definición
Tamaño de la población Frecuencia absoluta
Tamaño de la muestra Frecuencia relativa
Posible valor de la variable discreta Frecuencia absoluta ACUMULADA
Frecuencia absoluta ACUMULADA
Identifica un intervalo de una variable Frecuencia relativa ACUMULADA
continua Frecuencia relativa ACUMULADA
Amplitud del intervalo
Valor observado Amplitud del intervalo
Núm. de valores/intervalos de variable
Núm. de valores/intervalos de variable

NOTA: Se debe tener claridad si la variable es discreta o contínua


• Tabla de frecuencias para variable DISCRETA
• Tabla de frecuencias para variable CONTÍNUA
TABLA DE FRECUENCIAS
Tabla de frecuencias para variable DISCRETA

1. Determinar los valores que toma la variable


2. Conteo
3. Cálculo de columnas
TABLA DE FRECUENCIAS
Tabla de frecuencias para variable DISCRETA

1. Determinar los valores que toma la variable

NOTA: Únicamente se consideran en la distribución los valores que aparecen en


la base de datos.
TABLA DE FRECUENCIAS
Tabla de frecuencias para variable DISCRETA

2. Conteo
0 4
1 5
2 7
3 8
4 6
30
TABLA DE FRECUENCIAS
Tabla de frecuencias para variable DISCRETA

3. Cálculo de columnas
Símbolo Definición
Frecuencia absoluta
0 4 4 0.13 0.13
Frecuencia relativa
1 5 9 0.17 0.30
Frecuencia absoluta ACUMULADA 2 7 16 0.23 0.53
Frecuencia relativa ACUMULADA 3 8 24 0.27 0.80
Amplitud del intervalo 4 6 30 0.20 1.00
Núm. de valores/intervalos de variable 30 1.00
TABLA DE FRECUENCIAS
Tabla de frecuencias para variable CONTÍNUA

1. Calcular valores máximo, mínimo y rango (recorrido)


2. Determinar número de intervalos y amplitud de intervalo
3. Definición de valores por intervalo y conteo
4. Cálculo de columnas
TABLA DE FRECUENCIAS
•Tabla de frecuencias para variable CONTÍNUA

1. Calcular valores máximo, mínimo y rango (recorrido)


TABLA DE FRECUENCIAS
•Tabla de frecuencias para variable CONTÍNUA

2. Determinar número de intervalos y amplitud de intervalo

?
94

Si el número de intervalos () es 6, ¿de qué tamaño queda la amplitud de cada intervalo?


TABLA DE FRECUENCIAS
•Tabla de frecuencias para variable CONTÍNUA

3. Definición de valores por intervalo y conteo [46.1 , 54) 3


Intervalo 1 [54 , 62) 6
Intervalo 2 [62 , 70) 8
[70 , 78) 6
[78 , 86) 4
[86 , 94) 3
30
TABLA DE FRECUENCIAS
Tabla de frecuencias para variable CONTÍNUA

? de columnas
4. Cálculo
Marca de
clase
[46.1
[46.1 ,, 54)
54) 50
50 3
3 3
3 0.10
0.10 0.10
0.10
[54
[54 ,, 62)
62) 58
58 6
6 9
9 0.20
0.20 0.30
0.30
¿Cómo se calcula la marca de clase? [62 , 70) 66 8 17 0.27 0.57
[62 , 70) 66 8 17 0.27 0.57
Se promedian el límite inferior y [70 , 78) 74 6 23 0.20 0.77
[70 , 78) 74 6 23 0.20 0.77
superior del intervalo [78 , 86) 82 4 27 0.13 0.90
[78 , 86) 82 4 27 0.13 0.90
[86 , 94) 90 3 30 0.10 1.00
[86 , 94) 90 3
30 30 0.10
1.00 1.00
30 1.00
TABLA DE FRECUENCIAS
Actividad:
A 20 personas se les pregunta su número de hijos, obteniendo lo
siguientes valores:

A partir de los datos construya la tablas de frecuencia


TABLA DE FRECUENCIAS
•Propiedades:
• Las frecuencias absolutas son valores enteros
• La suma de las frecuencias absolutas es igual a
• Las frecuencias relativas son siempre valores fraccionarios
• La suma de frecuencias relativas es igual a 1
• El último valor de las frecuencias absolutas acumuladas es igual a ?
• El último valor de las frecuencias relativas acumuladas es igual a 1?
GRÁFICOS DE FRECUENCIA
Diagrama de barras Histograma de frecuencia

• Barras separadas indican • Barras unidas indican la división


diferencia en cada categoría del rango en intervalos

La altura de cada barra obedece a la frecuencia absoluta observada en cada clase


GRAFICOS DE FRECUENCIAS
Kaggle, your home
for Data Science

Dataset Pokemon
https://www.kaggle.c
om/abcsds/pokemon
GRÁFICOS DE FRECUENCIA
Pokemon dataset: Primeros 10 datos
# Name Type 1 Total HP Attack Defense Sp. Atk Sp. Def Speed Generation Legendary
1 Bulbasaur Grass 318 45 49 49 65 65 45 1 FALSE
2 Ivysaur Grass 405 60 62 63 80 80 60 1 FALSE
3 Venusaur Grass 525 80 82 83 100 100 80 1 FALSE

3 Venusaur Grass 625 80 100 123 122 120 80 1 FALSE

4 Charmander Fire 309 39 52 43 60 50 65 1 FALSE

5 Charmeleon Fire 405 58 64 58 80 65 80 1 FALSE


6 Charizard Fire 534 78 84 78 109 85 100 1 FALSE
7 Squirtle Water 314 44 48 65 50 64 43 1 FALSE
8 Wartortle Water 405 59 63 80 65 80 58 1 FALSE
9 Blastoise Water 530 79 83 100 85 105 78 1 FALSE
10 Caterpie Bug 195 45 30 35 20 20 45 1 FALSE
GRÁFICOS DE FRECUENCIA
Datos originales o no agrupados Tabla de frecuencia para variable
contínua
Clase Intervalo Punto medio Frecuencia Frecuencia Frecuencia Absoluta Frecuencia Relativa
(bin) de clase de clase Absoluta Relativa Acumulada Acumulada

1 [5,25.6) 15.3 24 3.000% 24 3.000%

Tabla de frecuencia para una 2 [25.6,46.1) 35.85 94 11.750% 118 14.750%

3 [46.1,66.7) 56.4 205 25.625% 323 40.375%

variable discreta 4 [66.7,87.2) 76.95 191 23.875% 514 64.250%


Frecuencia Frecuencia 5 [87.2,108) 97.5 142 17.750% 656 82.000%
Frecuencia Frecuencia
Generación Absoluta Relativa
absoluta Relativa
Acumulada Acumulada 6 [108,128) 118.05 77 9.625% 733 91.625%
1 166 20.750% 166 20.750%
2 106 13.250% 272 34.000% 7 [128,149) 138.6 38 4.750% 771 96.375%
3 160 20.000% 432 54.000%
8 [149,169) 159.15 22 2.750% 793 99.125%
4 121 15.125% 553 69.125%
5 165 20.625% 718 89.750% 9 [169,190] 179.7 7 0.875% 800 100.000%
6 82 10.250% 800 100.000%
Total 800 100.000% *** *** - Total - 800 100.000% *** ***

Actividad: Construya gráficos de frecuencia para las dos variables resumidas mediante tablas
Siguiente tema
Medidas de posición

Anda mungkin juga menyukai