Anda di halaman 1dari 8

Módulo N°1: Estadística Descriptiva.

Definición de Estadística.
- Descriptiva: todo cúmulo de datos cuantitatvios sobre un conj. de individuos que tienen un
atributo en común.
- Cálculo de Probabilidad: métodos adecuados para dar significado a un conjunto de datos,
afectados por el azar, usando instrumentos de la matemática.
- Inferencial: recopilación, presentación, análisis e interpretación de daros numéricos extraídos
de un conj de individuo, que permiten formular conclusiones válidas y efectuar decisiones
basadas en dicho análisis y extender los resultados desde un grupo pequeño a uno mas grande.
Estadística descriptiva e inferencial.
- Descriptiva: se refiere en un sentido técnico a la rama de la matemática aplicada que se ocupa
de interpretar pos resultados numéricos, elaborar tablas y gráficos explicativos para después
inferir parámetros etadisticos que caracterizan al conj total de datos.
- Inferencial: ciencia que estudia a los fenómenos regidos por el azar, midiendo los riesgos y
llevando a valores numérico los resultados de hechos aleatorios, observando el comportamiento
de una muestra y generalizando conclusiones a toda una población. Trata de la generalización
hacia la población de resultados obtenidos en las muestras y de las condiciones bajo las cuales
estas conclusiones son válidas.
El lenguaje de la estadística.
Teoría de las muestras: establece resultados calidos para una población númerosa partiendo de
la observación del comportamiento de una parte de la misma, la muestra, que bajo ciertas
condiciones, resulta representativa de las características de la población.
- Poblacion: conjunto de todos los elementos que cumplen una determinada característica, que
deseamos medir o estudiar.
- Muestra: cualquier subconjunto de la población.
- Unidad estadística: cada individuo de una población.
- Carácter estadístico: propiedad del atributo que estamos aislando para estudiarla.
Estos a su vez se clasifican en:
1) Carácter estadístico cualitativo o atributo: no es medible, contable, no es cuantitativo. Las
distintas modalidades de un carácter deben cubrir todas las posibilidades y deben ser
exhaustivas y no se puede presentar más de una de ellas pero si una.
Para medir esta variables se usan las siguientes escalas:
- Escalas Nominales: las categorías no mantienen un orden entre sí
- Escalas Ordinales: existe un cierto orden o jerarquía entre las categorías.
2) Carácter estadístico cuantitativo: lo podemos clasificar numéricamente.
- Carácter estadístico discreto: entre 2 elementos consecutivos no existe un valor intermedio.
(Conteo)
- Carácter estadístico continuo: entre 2 elementos consecutivos puede existir uno intermedio.
(Mediciones)

Series estadísticas o distribuciones estadísticas


Es el ordenamiento sistemático de los datos recolectados. Pueden ser:
- Cronológicas: orden teniendo en cuenta el tiempo
- Espaciales o geográficas: orden teniendo en cuenta el territorio o el espacio
- De distribución o frecuencias: correspondencia entre cada valor de la variable y su respectivo
número de observaciones o frecuencias.

Esquema de realización de un trabajo estadístico


1) Especificación del problema
Establecer con precisión el tema a tratar; definir los objetivos del trabajo; seleccionar el material
experimental.
2) Recolección y ordenación de datos
Fijar los procedimientos para realizar el experimento; tener a disposición los elementos
requeridos para recoger los datos; Examinar el tipo de datos requeridos (cuanti o cuali); Disponer
los datos en forma creciente o descendiente, para mejor ubicación y análisis; Encontrar el rango
de variación para saber valores máximos y mínimos.
3) Organización de distribuciones de frecuencias
Se basa en el armado de las tablas.
Distribución de frec. para la variable aleatoria cualitativa
Muestra el número de observaciones para cada una de las clases o categorías del mismo.
- fi: Nro total de observaciones que pertenecen a cada clase
- fir: Relacion entre la frec absoluta y el numero total de observaciones fi/n
- fir%: expresión porcentual de fir
Distribución de frec. para la variable aleatoria cuantitativa discreta (VAD)
- fi- fir-fir%
- Fk: Suma de las frecuencias absolutas hasta un determinado valor de la variable, inclusive.
Fk=∑fi
- Fkr: Realcion entre las frecuencias acumuladas y el numero total de observaciones.
Fkr= Fk/n
- Fkr%: expresión porcentual de Fkr
Distribución de frec. para la variable aleatoria cuantitativa continua (VAC)
- Rango: R= Xmax-Xmin
- Intervalos de clase: cada subintervalo que divide el recorrido de la VAC

- Número de intervalos de clase: 𝐾 = √𝑛


- Amplitud o tamaño de clase: R/K
- Límites de clase: extremos de un intervalo de clase
- Límites reales de clase (LRI-LRS): LRS es la semisuma del límite sup de la clase e inf de la
siguiente clase. LRI semisuma del límite inferior de la clase y el superior de la anterior.
- Marca de clase: Mi= punto medio de cada intervalo de clase, promedio.
4) Presentación de datos por medio de gráficos
Existen diferentes gráficos.
- Diagrama de barras: Cualitativo y VAD
- Histogramas: VAC, su ancho es el tamaño de clase
- Pirámide de Población: 2 histogramas y se unen por los lados
- Polígono de Frecuencias: Marco las Mi en el extremo superior de lso histogramas y los uno con
una línea
- Diagrama de torta
- Pictogramas
- Cartogramas
- Diagramas de frecuencias acumuladas: VAD
- Ojiva: VAC
5) Obtención de parámetros característicos:
Los parámetros característicos son toso aquellos valores que describen de manera precisa a un
conjunto de datos.
Medidas de Centralización.
- Media Aritmética: Promedio
∑xi.fi ∑Mi.fi
X= VAD y VAC
𝑛 𝑛
∑xi.wi
- Media Aritmética ponderada= 𝑛

- Mediana: Valor que se encuentra en el centro o punto medio de una serie de datos ordenados
𝑛
𝑐.( 2 −∑f ant)
Me=LRI+
𝑓𝑀𝑒
- Moda: Valor de un conjunto de datos que se repite con mayor frecuencia
𝑐.∆1
Mo= LRI+
∆1+2
Medidas de Dispersión
Absolutas
- Rango: Diferencia entre el mayor y el menor valor que toma la variable
R= Xmax- Xmin
- Desvíos: Desde la media aritmética
di= Xi- X
- Desviación media: Promedio de los valores absolutos de los desvios
∑[di] ∑[di]∗fi
DM= y en VAC: DM=
𝑛 𝑛

- Varianza: Promedio del cuadrado de los desvíos


∑(xi−X)2 ∑(xi−X)2 .𝑓𝑖
Var(x)= y para VAC: Var(x)=
𝑛 𝑛

- Desviación Típica o Estandar: 𝜎 = √𝑉𝑎𝑟(𝑥) para población y 𝑠 = √𝑉𝑎𝑟(𝑥) para muestras.


Relativas
Coeficiente de Variación: Es la desviación típica expresada en porcentaje de la media aritmética.
Nos permite comparar la dispersión o variabilidad de dos o mas grupos
𝜎
CV= 𝑋 . 100

Medidas de Concentración
𝑖.𝑛
( −∑𝑓 𝑎𝑛𝑡).𝑐
- Cuartiles: Qi= LRI+ 4
𝑓𝑄𝑖

𝑖.𝑛
( −∑𝑓 𝑎𝑛𝑡).𝑐
- Deciles: Di= LRI+ 10
𝑓𝐷𝑖
𝑖.𝑛
( −∑𝑓 𝑎𝑛𝑡).𝑐
- Percentiles: Pi= LRI+ 100
𝑓𝑃𝑖

Forma de una distribución


Sesgo: mide el grado de concentración de los datos de una distribución a un lado y otro de la
moda, expresando la asimetría.
Unimodal y simétrica: Me=Mo=X
Unimodal y asimétrica:
Mo<Me<X SESGO A DERECHA
Mo>Me>X SESGO A IZQUIERDA

𝑋−𝑀𝑜
- Coeficiente de Asimetría de Pearson: As= UNIMODAL!!!
𝑠

(𝑋𝑖−𝑋)3 .𝑓𝑖

- Coeficiente de Asimetría de Fisher: As= 𝑛
𝑠3
Modulo N°2: Regresión y Correlación
Diagrama de Dispersión
Es una gráfica que se representa en un sistema de ejes cartesianios, en la cual se marcan los
pares ordenados (x;y) correspondientes a los datos apareados que resultan de las mediciones
experimentales de las dos variables X e Y.
Los puntos pueden mostrar una tendencia curva o lineal, lo cual representa la relación entre las
variables.
Para encontrar y llevar a términos matemáticos la influencia de X sobre Y, debemos crear un
modelo matemático y = f ( x ) que ligue a las variables experimentales, llamándose a ese modelo
curva de mejor ajuste y, en este casoparticular, “recta de mejor ajuste”.

Cuando no hay una curva que de ajuste que se adapte a al comportamiento entre las variables
se dice que son independientes.
Además de ser curva o lineal, la relación puede ser:
- Positiva: aumenta x y aumenta y
- Negativa: aumenta x y disminuye y, inversa
- Perfecta: los puntos están alineados en una, la nube de puntos esta contenida en una
línea rectal
- Imperfecta: nube de puntos con tendencia lineal, directa o inversa, pero no están
alineados los puntos

Regresión lineal simple


Su objetivo es investigar la relación estadística entre la variable dep Y y la variable indep X. La
variable Y es la variable probabilística o aleatoria.
1° Paso: Se realiza el diagrama de dispersión correspondiente al experimento y luego se analiza
si este diagrama se ajusta o no a un modelo de regresión lineal y se trata de hallar la ecuación
que exprese la relación entre las variables.
2° Paso: Determinamos la recta. A la expresión y= bx+a se la denomina ecuación de regresión
estimada, y a su representación gráfica se la llama línea de regresión estimada.
Método de los mínimos cuadrados
3° Paso: Se agrega al gráfico la línea de tendencia obtenida
Error típico de la estimación
El error estándar de estimación es la medida de la dispersión de los valores observados, con
respecto a la línea de regresión.
∑(𝑦𝑖−{𝑦𝑖−𝑦𝑖 𝑒𝑠𝑡)2
Sy;x=√ 𝑛

Regresión y Correlación lineal


1° Paso: Determinar la intensidad o grado de relación a través del coeficiente de determinación.
2° Paso: Obtener la recta de regresión, siempre y cuando el cálculo del coeficiente de
correlación obtenido en la primera etapa lo justifique.
- Coeficiente de determinación: es una medida de la bondad del ajuste de los datos
observados a la ecuación de regresión e indica el porcentaje de variación total de la
variable dependiente Y, que se debe a la variación de la variable independiente X.
Suma de los residuos. “Suma de cuadrados debido al error” SCE= ∑(𝑦𝑖 − 𝑦 𝑒𝑠𝑡)2
Eror cometido en la estimación.“Suma de cuadrados del total” SCT= ∑(𝑦𝑖 − 𝑦 𝑚𝑒𝑑𝑖𝑎)2
Cuanto de desvían los valoles de y estimado en la línea de regresion“Suma de cuadrados debida
a la regression” SCR= ∑(𝑦 𝑒𝑠𝑡 − 𝑦 𝑚𝑒𝑑𝑖𝑎)2
SCT= SCR + SCR
𝑆𝐶𝑅
Coeficiente de determinación: D= 𝑆𝐶𝑇 D puede ir entre 0 y 1, mientras mas cerca esta de uno,
mas perfecta es la relación entre X e Y

Coeficiente de correlación lineal: r= ±√𝐷 o D= 𝑟 2 r puede ir entre -1 y 1, si r=0 no hay


dependencia, si es positivo, mientras mas cercano a 1 es, mas realcion, y si es negativa, es una
relación negativa y cuanto mas cercana a -1 sea, mas fuerte es la relación.