Anda di halaman 1dari 29

ESTADSTICA I

Ingeniera en Sistemas

Universidad Mariano Glvez de Guatemala


FORMA DE UNA
DISTRIBUCIN
Cuando dos distribuciones coinciden en sus medidas de
posicion y dispersion, no tenemos datos analticos para ver
si son distintas. Una forma de compararlas es mediante su
forma. Bastar con comparar la forma de sus histogramas
o diagramas de barras para ver si se distribuyen o no de
igual manera.
Para efectuar este estudio de la forma en una sola
variable, hemos de tener como referencia una distribucion
modelo. Como convenio, se toma para la comparacion la
distribucion Normal de media 0 y varianza 1. En
particular, es conveniente estudiar si la variable en
cuestion est ms o menos apuntada que la Normal. Y si
es ms o menos simtrica que sta, para lo que se
definen los conceptos de Asimetra y Curtosis, y sus
correspondientes formas de medida.
La asimetra y su medida
El objetivo de la medida de la asimetra es estudiar la
deformacion horizontal de los valores de la variable
respecto al valor central de la media. Las medidas de
forma pretenden estudiar la concentracion de la variable
hacia uno de sus extremos.
Una distribucion es simtrica cuando a la derecha y a la
izquierda de la media existe el mismo nmero de valores,
equidistantes dos a dos de la media, y adems con la
misma frecuencia.

Una distribucion es Simtrica si = Me = Mo


Asimtrica a la Izquierda.

Es el caso en que Mo > Me >


Asimtrica a la derecha.

Es el caso en que Mo < Me <


Coeficiente de Asimetra de Fisher
Es una distribucion simtrica los valores se sitan en torno a la
media Aritmtica de forma simtrica. El coeficiente de asimetra de
Fisher se Basa en la relacion entre la distancia a la media y la
desviacion tpica.

En una distribucion simtrica = Me = Mo. Por eso define


como:

Si g1 > 0, la distribucion es asimtrica positiva o a la derecha


Si g1 = 0, la distribucion es simtrica
Si g1 < 0, la distribucion es asimtrica negativa o a la izquierda
La curtosis y su medida
Mesocrtica
Leptocrtica
Platicrtica
Mesocurtica

Leptocurtica

Platicurtica

ASIMETRIA Y AGUDEZ DE UNA DISTRIBUCIN DE DATOS


REGRESION Y CORRELACION
La regresion y la correlacion son dos tcnicas estrechamente relacionadas y
comprenden una forma de estimacion.
En forma ms especifica el anlisis de correlacion y regresion comprende el
anlisis de los datos muestrales para saber que es y como se relacionan
entre si dos o mas variables en una poblacin. El anlisis de correlacion
produce un nmero que resume el grado de la correlacion entre dos
variables; y el anlisis de regresion da lugar a una ecuacion matemtica que
describe dicha relacion.
El anlisis de correlacion generalmente resulta til para un trabajo de
exploracion cuando un investigador o analista trata de determinar que
variables son potenciales importantes, el inters radica bsicamente en la
fuerza de la relacion. La correlacion mide la fuerza de una entre variables; la
regresion da lugar a una ecuacion que describe dicha relacion en trminos
matemticos
Los datos necesarios para anlisis de regresion y correlacion provienen de
observaciones de variables relacionadas.
Regresion Lineal Simple
En este caso hay una sola variable de regresion independiente llamada x
y una sola variable aleatoria dependiente o respuesta llamada Y, los datos
Pueden representarse por los pares de observaciones

(xi, yi); i = 1, 2, , n

Ejemplo: El contenido de Alquitrn en el producto de salida de un proceso


qumico esta relacionado con la temperatura con la que se lleva a cabo.
Entonces:
La temperatura es la variable: Independiente
El contenido de Alquitrn es la variable: Dependiente_
La Ecuacion de prediccion recibe el nombre de: Ecuacion de regresion
Regresion Lineal

Anlisis de Datos
El primer paso para determinar si existe o no una
relacion entre dos variables es analizar la grfica de
datos observados. Esta grfica se llama diagrama de
dispersion

Un diagrama puede dar dos tipos de informacion,


visualmente se pueden buscar patrones que indiquen
que las variables estn relacionadas. Entonces si esto
sucede, se puede ver qu tipo de lnea, o ecuacion de
estimacion describe la relacion
Ejemplo
Los estudiante de la carrera de ingeniera en sistemas
de la UMG impartieron un curso intensivo de manejo del
programa Microsoft Excel a un grupo formado por
estudiantes de diversas edades con el fin de contrastar la
hipotesis de trabajo, la cual establece que a mayor
Edad, mayor dificultad para el manejo del programa
Al finalizar el curso se midio el nivel alcanzado por los
estudiantes con un examen de conocimientos que
est en una escala de 0 a 100 puntos.

EDAD 16 17 18 20 22 23 25 28 30 35 38 40

CALIFICACIN 84 96 86 90 80 88 76 84 78 82 74 68

a- Construir el modelo de regresion lineal estimado


b- Elaborar una grfica que contenga la nube de puntos formada con
los datos y la recta de regresion estimada.
c- Hacer una estimacion de la calificacion a los 32 y 39 aos

En este caso, la variable independiente X es, la Edad

la Calificacion
la variable dependiente Y es
FORMULA
Calificacin xy x2 y2
Edad (x) (y)
1344 256 7056
16 84
1632 289 9216
17 96
1548 324 7396
18 86
1800 400 8100
20 90
1760 484 6400
22 80
2024 529 7744
23 88
25 76 1900 625 5776
28 84 2352 784 7056
30 78 2340 900 6084
35 82 2870 1225 6724
38 74 2812 1444 5476
40 68 2720 1600 4624
312 986 25102 8860 81652
Y = 100.728 0.7139x
Nube de puntos y recta de regresin
120

100

80

60

40

20

0
10 20 30 40 50

Y = 100.73 0.7139x y = 100.73 0.7139(32) = 77.88


Y = 100.73 0.7139x y = 100.73 0.7139(39) = 72.88
CORRELACION
EL objetivo de un estudio de correlacion es determinar la
consistencia de una relacion entre observaciones por
partes. EL termino correlacion significa relacion mutua,
ye que indica el grado en el que los valores de una
variable se relacionan con los valores de otra. Se
considera tres tcnicas de correlacion uno para datos de
medicion, otro para datos jerarquizados y el ltimo para
clasificaciones nominales.
Coeficiente de Correlacion de Pearson
EL grado de relacion entre dos variables continuas se resume mediante un
coeficiente de correlacion que se conoce como r de Pearson en honor del
gran matemtico Kart Pearson, quien ideo este mtodo.

-1.00 = Correlacion negativa perfecta,


Mayor X menor Y o a menor X mayor Y.
-0.90 = Correlacion negativa muy fuerte
-0.75 = Correlacion negativa considerable
-0.50 = Correlacion negativa media
-0.10 = Correlacion negativa dbil.
Y = Observacion 0.00 = No existe ninguna correlacion entre las variables
Y = Valor estimado de Y calculado +0.10 = Correlacion positiva dbil
con la ecuacion de la recta +0.50 = Correlacion positiva media
= Media de las observaciones +0.75 = Correlacion positiva considerable
+0.90 = Correlacion positiva muy fuerte
+1.00 = ]Correlacion positiva perfecta
(A mayor X mayor Y o a menor X menor Y)

Calificaci Y'= 100.728 - (Y' -


Edad (x) Y- (Y - )2 (Y' - )
n (y) 0.7139X )2
16 84 82.17 1.83 3.36 89.31 7.14 50.96
17 96 82.17 13.83 191.36 88.59 6.43 41.28
18 86 82.17 3.83 14.69 87.88 5.71 32.62
20 90 82.17 7.83 61.36 86.45 4.28 18.35
22 80 82.17 -2.17 4.69 85.02 2.86 8.15
23 88 82.17 5.83 34.03 84.31 2.14 4.59
25 76 82.17 -6.17 38.03 82.88 0.71 0.51
28 84 82.17 1.83 3.36 80.74 -1.43 2.04
30 78 82.17 -4.17 17.36 79.31 -2.86 8.15
35 82 82.17 -0.17 0.03 75.74 -6.43 41.28
38 74 82.17 -8.17 66.69 73.60 -8.57 73.39
40 68 82.17 -14.17 200.69 72.17 -9.99 99.89
312 986 635.67 381.22
Por lo tanto, el coeficiente de correlacion de Pearson para este caso es:

Hay una correlacion positiva considerable


FIN DE LA PRESENTACIN

Anda mungkin juga menyukai