Anda di halaman 1dari 63

Universidad Central de Venezuela

Facultad de Agronoma
Ctedra de Estadstica

ESTADSTICA I
2017

Profa. Raquel Mayela Parra


estadistica.fagro.ucv@gmail.com

1
Universidad Central de Venezuela
Facultad de Agronoma
Ctedra de Estadstica

OBJETIVO 1-TEMA 1
IMPORTANCIA DE LA
ESTADSTICA
Clave de matriculacin en el campus virtual:
estadistica022017

2
OBJETIVO 1- TEMA 1
IMPORTANCIA DE LA ESTADSTICA
Definicin de Estadstica. Importancia de la Estadstica
en el campo agronmico. Conceptos bsicos.
Escalas de medicin.
Anlisis Exploratorio de datos: Recoleccin, Tabulacin y
Representacin Grficas de datos univariados.
Mtodos de agrupacin de datos: Diagramas de Tallo y
Hoja. Distribucin de Frecuencias para datos numricos
continuos y discretos. Histogramas y Polgonos de
frecuencias.
Formas, Simetra y Curtosis.
Interpretacin de las representaciones grficas.

Objetivos Especficos
Aplicar e interpretar las diferentes formas de recolectar,
organizar y presentar datos de acuerdo a la escala de
medicin.

Ponderacin: 10% 3
DEFINICIONES DE ESTADSTICA
Es una rama de la matemtica aplicada, que tiene
por objeto la recoleccin, organizacin,
interpretacin, anlisis y presentacin de datos
numricos sujetos a variacin.
La Estadstica se ocupa de los mtodos y
procedimientos para recoger, clasificar, resumir,
hallar regularidades y analizar los datos, siempre y
cuando la variabilidad e incertidumbre sea una
causa intrnseca de los mismos; as como de realizar
inferencias a partir de ellos, con la finalidad de
ayudar a la toma de decisiones y en su caso
formular predicciones.

4
AR ANALIZAR
P IL
EC O
R

ESTADSTICA
I NT E
ORGANIZAR RPR
ETAR

5
DEFINICIONES DE ESTADSTICA

Podramos por tanto clasificar la Estadstica en:

DESCRIPTIVA, cuando los resultados del anlisis no


pretenden ir ms all del conjunto de datos, e

INFERENCIAL cuando el objetivo del estudio es


derivar las conclusiones obtenidas a un conjunto de
datos ms amplio,

6
DEFINICIONES DE ESTADSTICA
Es decir que,

La Estadstica DESCRIPTIVA: Describe, analiza y


representa un grupo de datos utilizando mtodos
numricos y grficos que resumen y presentan la
informacin contenida en ellos.

La Estadstica INFERENCIAL: Apoyndose en el clculo


de probabilidades y a partir de datos muestrales,
efecta estimaciones, decisiones, predicciones u otras
generalizaciones sobre un conjunto mayor de datos.

7
CONCEPTOS BSICOS
POBLACIN
POBLACIN O
O CONJUNTO
CONJUNTO
UNIVERSAL
UNIVERSAL
Conjunto de elementos con caractersticas similares
presentes en un espacio definido y en un tiempo
determinado.

POBLACIN
POBLACIN ESTADSTICA
ESTADSTICA

Conjunto de DATOS numricos que corresponden a


la medicin o conteo de alguna caracterstica de los
elementos de una poblacin en un espacio definido
y en un tiempo determinado.

8
CONCEPTOS BSICOS
MUESTRA
MUESTRA

Subconjunto representativo de una poblacin.

CONSTANTE
CONSTANTE

Si el valor de una variable toma igual valor para


todos los elementos de una poblacin, este se
denomina constante.

9
CONCEPTOS BSICOS
VARIABLE
VARIABLE

Caractersticas que le son comunes a los elementos de una


poblacin y que varan de uno a otro.

Por ejemplo: el peso de cada uno de nosotros, el promedio de


calificaciones de los integrantes de esta seccin de clase, el
nmero de horas que le dedicamos a leer la prensa semanalmente,
el nmero de horas que le dedicamos a navegar en internet.

OBSERVACIN
OBSERVACIN

El valor que toma la variable en un momento


determinado.
10
CONCEPTOS BSICOS
PARMETRO
PARMETRO

Funcin definida sobre los valores numricos de


caractersticas medibles de una poblacin. Valor que
caracteriza a una poblacin como un todo.

ESTADSTICO
ESTADSTICO

Funcin definida sobre los valores numricos de una


muestra. Valor que caracteriza a una muestra.

Los PARMETROS son constantes y los


ESTADSTICOS son variables.
11
AR ANALIZAR
P IL
EC O
R

ESTADSTICA
I NT E
ORGANIZAR RPR
ETAR

12
DEFINICIONES DE ESTADSTICA

CENSOS: Cuando se estudia TODA la


poblacin.

MUESTREO: cuando se estudian porciones


representativas de una poblacin .

13
CONCEPTOS BSICOS
MUESTRA
MUESTRA AL
AL AZAR
AZAR SIMPLE
SIMPLE

Es aquella que se selecciona cuando a cada


elemento de la poblacin se le asigna la misma
probabilidad de formar parte de la muestra.

POR EJEMPLO:
En un galpn de conejos para engorde se desea de un
lote de 50 animales tomar el 16% para estudiar su
peso. Se procede dndole a cada una de los animales
la misma probabilidad de ser parte de la muestra.

14
MUESTRA AL AZAR SIMPLE

15
MUESTRA AL AZAR SIMPLE
16
2 4
87
5 3

16
MUESTRA AL AZAR SIMPLE

1 6
2
4
5 8
7
3
17
CONCEPTOS BSICOS
MUESTRA
MUESTRA ESTRATIFICADA
ESTRATIFICADA

Es aquella que se selecciona cuando los elementos


de la poblacin se clasifican en funcin de los
objetivos mismos del muestreo y luego de cada
estrato se selecciona una muestra al azar simple.

Es importante sealar que no considerar el o los


criterios de estratificacin podra afectar el
comportamiento de la variable bajo estudio.

18
CONCEPTOS BSICOS
MUESTRA
MUESTRA ESTRATIFICADA
ESTRATIFICADA
POR EJEMPLO:
Se desea estudiar la produccin de leche de un
rebao compuesto por varias razas.

Supongamos que de un rebao de 200 animales


debemos extraer una muestra de 20 animales.

19
MUESTRA ESTRATIFICADA
POBLACIN 3
0
17 1 4 2 13 6 0
22
27
2 1 1 85 172 3 3 4
23 12 416 1 2 5 10
2 310 1 11
13 121 19 6
218 1 9 12 16 23
25 19 1 15 1 7
8 4 8 13 152717
2 4 29
20 5 3 7 9 7
15 23 2414 18 19
21 25 2228 20
9 6 27 11 2 26 30
16
17 10 1 14 5 7 15 13 1 9 7 11
8 1 15
26 4 22 8 1 12 17 2 3 2
4 2 9
6 5 4 16
20 1219
23 16
8 6
3 7 8 12 9 10 15 4 13
1 10 11 13 11 7186 3 1410
31
4 16 14 15 19
26 1 7 16 18 20
5 20 2 26 2 24 17
3 3 3 218 25723 1 8 22 21
30 17 2 7 2 2 19
17 9 23
23 21 10 3 28 21 20 16
29 6 19 15 11 10 8
8 1 4
12 1 4 2522 9 1 3 12 5 6 7 27
1 4 1 5
20 2 13 4 2
3 1 33
20
MUESTRA

1 4 20 13 6
22
23 12 4 21 185 172 3
1 3 4
13 16 21 231019 2 5 10
2 1 1 1 6 11
2 5 19 1 9 12 16
8 8 1 1 7
20 5 3 7 24 15 4 8 1 15 2717
29
15 9 7 2324
3 14 1819
2 2 212530222820
16 9 6 1 7 11 14 5 7 15 13 1 26
17 0 1
26 4 22 8 4 2
1 12 9 17 2 3
89 7 11
8 6 6 5 4 2 1 1519
16 3 8 9 10 16 20 12
23
10 11 7
13 12 11 1
5
6 3 4 13
1 14 15 18
7 1410
31 16 19
4 26 2 24 16 18 20
26 0
1 7 17
52 32 2572 18
3 3 1 8 22 1 9 22 21
2 17
30 17 27 8 213 20 16 9 23
1 3 2 1 0
2 10 6 9 1415 11 8
17 29 8 5
1
9 1 31 2 5
6 7
3
12 1 4 2 22 5 4 2
23 1 2413 1 3 1 0
23
20 33
27 27
21 21
MUESTRA

1 4 20 13 6
22
23 12 4 21 185 172 3
1 3 4
13 16 21 231019 2 5 10
2 1 1 1 6 11
2 5 19 1 9 12 16
8 8 1 1 7
20 5 3 7 24 15 4 8 1 15 2717
29
15 9 7 2324
3 14 1819
2 2 212530222820
16 9 6 1 7 11 14 5 7 15 13 1 26
17 0 1
26 4 22 8 4 2
1 12 9 17 2 3
89 7 11
8 6 6 5 4 2 1 1519
16 3 8 9 10 16 20 12
23
10 11 7
13 12 11 1
5
6 3 4 13
1 14 15 18
7 1410
31 16 19
4 26 2 24 16 18 20
26 0
1 7 17
52 32 2572 18
3 3 1 8 22 1 9 22 21
2 17
30 17 27 8 213 20 16 9 23
1 3 2 1 0
2 10 6 9 1415 11 8
17 29 8 5
1
9 1 31 2 5
6 7
3
12 1 4 2 22 5 4 2
23 1 2413 1 3 1 0
23
20 33
27 27
22 22
MUESTRA

1 4 20 13 6
22
23 12 4 21 185 172 3
1 3 4
13 16 21 231019 2 5 10
2 1 1 1 6 11
25 19 1 9 12 16
8 8 1 1 7
20 5 3 7 24 15 4 8 1 15 2717
29
15 9 7 2324
3 14 1819
2 2 212530222820
16 9 6 1 7 11 14 5 7 15 13 1 26
17 0 1
26 4 22 8 4 2
1 12 9 17 2 3
89 7 11
8 6 6 5 4 2 1 1519
16 3 8 9 10 16 20 12
23
10 11 7
13 12 11 1
5
6 3 4 13
1 14 15 18
7 1410
3 1 16 19
4 26 2 24 16 18 20
26 0
1 7 17
52 3 2 2572 18
3 3 1 8 22 1 9 22 21
2 17
30 17 27 8 213 20 16 9 23
1 3 2 1 0
2 1 0 6 9 1415 11 8
17 29 8 5
1
9 1 31 2 5
6 7
3
12 1 4 2 22 5 4 2
23 1 2413 1 3 1 0
23
20 33
27 27
23 23
COMPOSICIN DE UNA MUESTRA ESTRATIFICADA REPRESENTATIVA
del 10%N; n=20

# DE ANIMALES
11 8
RAZA POBLACION MUESTR
A 12
33 3
9
17 2 20 6
2
30 3 22
7
30 1
23 2 7 23 17
27 3 5
13
13 15
20 2 8
27 3
15 8
23 2

24
AR ANALIZAR
P IL
EC O
R

ESTADSTICA
I NT E
ORGANIZAR RPR
ETAR

25
ESCALAS DE MEDICIN ORGANIZAR

Medir una variable trae como consecuencia directa


el pensar que tipo de respuesta tenemos bajo
estudio.

En el nivel ms bajo de abstraccin, podemos


pensar que cualquier variable puede ser
clasificada en cualitativa o cuantitativa. Es decir
que, puede medirse como datos categricos o
como datos mtricos.

26
ESCALAS DE MEDICIN

VARIABLES CUALITATIVAS-
DATOS CATEGRICOS

Color de las flores

Estado del tiempo

Direccin del viento


Estado de nimo

27
ESCALAS DE MEDICIN

VARIABLES CUANTITATIVAS-
DATOS MTRICOS

Tiempo (Duracin)

Concentraciones

Temperatura
Caudal

28
Sin embargo a un nivel de abstraccin ms elevado
podemos decir que cualquier medicin puede
clasificarse como medida en cuatro tipos de escalas,
a saber:

29
Escala nominal

En este tipo de escala, slo se le asigna un nombre a


cada una de las posibles categoras de medicin que
se realiza.

Por ejemplo: cuando se evala el color de las flores de una


especie, rojo, rosado, moteado y blanco, en este caso no
existe ningn tipo de relacin de jerarqua entre las distintas
categoras.

Podramos decir que con este tipo de escala lo que hacemos es


los asignar valores de la respuesta en clases o categoras.

30
Escala ordinal
En este tipo de escala tambin se le asigna un nombre
a cada una de las posibles categoras de medicin
que se realiza, pero en este caso existe una relacin
de jerarqua, un cierto orden, entre las distintas
categoras. Razn por la cual hay una relacin de
importancia entre categoras.

Por ejemplo: El grado de recuperacin de un paciente al aplicarle


un tratamiento, en el que podemos tener como respuesta Nada,
Poco, Moderado, Bueno, Muy Bueno.
A veces se representan este tipo de variables en escalas numricas,
por ejemplo, puntuar el dolor en una escala de 1 a 5. Debemos
evitar sin embargo realizar operaciones algebraicas con estas
cantidades, Un dolor de intensidad 4 no duele el doble que otro
de intensidad 2!
31
Escala de intervalo
En este tipo de escala las respuestas no slo pueden
ser ordenadas segn una relacin de importancia
entre categoras, sino tambin se pueden establecer
entre clases medidas de distancia, sin embargo para
este tipo de medicin tanto el cero como las
medidas de distancia son arbitrarios.

Por ejemplo: El caso de la variable temperatura, donde


segn la escala que se utilice el cero grados tiene diferente
significado.

32
Escala de proporcin o razn
En este tipo de escala las respuestas corresponden a
los nmeros reales. Entre los valores observados de
este tipo de mediciones no slo pueden establecer
relaciones de igualdad, orden o jerarqua, distancia
y razn; en este caso el cero es real.

Por ejemplo: El caso del rea, el rendimiento y el peso.

33
Preparar los datos
para el anlisis

En resumen:

Variables

Tipo de respuesta
Cualitativa Cuantitativa

Escala de
Nominal MedicinDiscreta
Ordinal Continua

Proporcin o
Intervalo
Razn

09:45:16 PM 34
AR ANALIZAR
P IL
EC O
R

ESTADSTICA
I NT E
ORGANIZAR RPR
ETAR

35
ANLISIS EXPLORATORIO DE DATOS
ANALIZAR
E INTERPRETAR

Aplicacin de herramientas de observacin


exploratorias e informales a los datos con el fin de
obtener una primera impresin de los mismos.

ANLISIS ANLISIS
GRFICO NUMRICO
36
TCNICAS DE AGRUPACIN DE DATOS
Construccin e interpretacin de Tablas de
Distribucin de Frecuencias (TDF) y
Diagramas

37
TABULACIN DE DATOS-TABLAS DE
DISTRIBUCIN DE FRECUENCIAS
En el caso de variables cualitativas o cuantitativas con
pocos datos:

Clase fi
Tigres 55
Magallanes 35
Leones 45
Caribes 25
Cardenales 25
Tiburones 20
Aguilas 30

38
TABULACIN DE DATOS-TABLAS DE
DISTRIBUCIN DE FRECUENCIAS
En el caso de variables cuantitativas:
Tiempo que se tardan en realizar una labor
(minutos)

Clase LI LS MC FA FR FAA FRA


1 [ 19,00 20,10 ) 19,55 5 13,00 5 13,00
2 [ 20,10 21,20 ) 20,65 9 23,00 14 35,00
3 [ 21,20 22,30 ) 21,75 6 15,00 20 50,00
4 [ 22,30 23,40 ) 22,85 5 13,00 25 63,00
5 [ 23,40 24,50 ) 23,95 11 28,00 36 90,00
6 [ 24,50 25,60 ] 25,05 4 10,00 40 100,00

39
CONSTRUCCIN DE TABLAS DE
DISTRIBUCIN DE FRECUENCIAS
En el caso de variables cuantitativas:
Tiempo que se tardan en realizar una labor
(minutos)

40
CONSTRUCCIN DE LA TDF
1. Ordenar los valores de menor a mayor

2. Calcular la Amplitud de Variacin


AV=VMax-Vmin

3. Determinar el nmero de clases


K=(5,20)

4. Calcular el Intervalo de Clases


IC=AV/K

5. Construir la tabla siguiente:


41
CONSTRUCCIN DE LA TDF
Ttulo: Tiempo que se tardan en realizar una labor (minutos)

Clase LI LS CC fA fR FAA FRA


1
2
3
4
5
6

42
REPRESENTACIONES GRFICAS
ANALIZAR
E INTERPRETAR

El aserto una imagen vale ms que mil palabras se


puede aplicar al mbito de la estadstica
descriptiva diciendo que un grfico bien
elaborado vale ms que mil tablas de
frecuencias.

43
HISTOGRAMA Y POLGONO DE FRECUENCIAS
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil TtuloVersin Estudiantil
Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
12
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
10
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
frecuencia absoluta

Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
8
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
6
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
4
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
2
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
0
Versin Estudiantil Versin Estudiantil
17,9 19,0 Versin
20,1 Estudiantil
21,2 22,3 Versin
23,4 Estudiantil
24,5 25,6 Versin
26,7 Estudiantil
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil
minutos
Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil Versin Estudiantil

44
SIMETRIA DE LA DISTRIBUCIN
DE UN CONJUNTO DE DATOS

Simtrica

45
SIMETRIA DE LA DISTRIBUCIN
DE UN CONJUNTO DE DATOS

Asimtrica positiva

46
SIMETRIA DE LA DISTRIBUCIN
DE UN CONJUNTO DE DATOS

Asimtrica negativa

47
KURTOSIS DE LA DISTRIBUCIN
DE UN CONJUNTO DE DATOS

Platicrtica

48
KURTOSIS DE LA DISTRIBUCIN
DE UN CONJUNTO DE DATOS

Mesocrtica

49
KURTOSIS DE LA DISTRIBUCIN
DE UN CONJUNTO DE DATOS

Leptocrtica

50
POLGONO DE FRECUENCIAS ACUMULADAS U OJIVA

51
OTRAS REPRESENTACIONES
GRFICAS

52
Anlisis estadstico
unidimensional Representaciones grficas y resmenes
descriptivos numricos ms aconsejables

VARIABLES CUALITATIVAS

NOMINAL ORDINAL

Nivel de
Variable Frec. (%) estudios Frec. % % vlido % acum.
RAZA 1 5 6,3 Sin estudios 217 36,0 36,2 36,2
RAZA 2 15 18,8 Bachiller 200 33,2 33,4 69,6
Tcnico
RAZA 3 14 17,5 105 17,4 17,5 87,1
medio
RAZA 4 27 33,8 Tcnico
37 6,1 6,2 93,3
RAZA 5 19 23,8 superior
Universitario 40 6,6 6,7 100,0
Total 599 99,5 100,0

Perdidos
40.0 3 0,5
RAZA 1; 6% 35.0

RAZA 5; 24% Total 30.0 602 100,0


RAZA 2; 19% 25.0
20.0
15.0
10.0 (%)
Frec. rel.
5.0
RAZA 3; 18%
0.0
RAZA 4; 34%
Nivel de Estudio

09:45:17 PM 53
Anlisis estadstico
unidimensional Representaciones grficas y resmenes
descriptivos numricos ms aconsejables

VARIABLES CUANTITATIVAS

DISCRETA CONTINUA

N de empleados PRECIPITACION
Resumen Resumen 110
110

fijos POCA SECA


n 90
n 41 82
82
Media 24,13
Mediana 3

PRECIPITACION
PRECIPITACION
D.E. 26
Q1 2 55
Var(n-1) 676,13 55
Q3 4
CV 107,75
Asimetra 0,14
Mn 0 27
27
Kurtosis 0,13
Mx 104
Mediana 13,55 -1
-1

35.0 Q1 3,2
Q3 39,8
30.0 0,50
0,50
Asimetra 1,18
25.0 1,00
1,00
Kurtosis 0,43
20.0 0,38
0,38
relativa
frecuenciarelativa

0,75
0,75
Frec. rel. (%) 15.0

acumulada
rel.acumulada
0,25
frecuencia

0,25
10.0 0,50
0,50

frec.rel.
5.0

frec.
0,13
0,13 0,25
0,25
0.0
1 2 3 4 5 6 7 8 0,00
0,00 0,00
0,00
00 11 21 32 42 53 63 74 84 95 105 00 11 21 32 42 53 63 74 84 95
11 21 32 42 53 63 74 84 95 105 11 21 32 42 53 63 74 84 95 105
105
N de empleados fijos PRECIPITACION
PRECIPITACION PRECIPITACION
PRECIPITACION
09:45:17 PM 54
Anlisis estadstico
bidimensional Representaciones grficas y resmenes
descriptivos numricos ms aconsejables

Una vez realizado el estudio unidimensional de


cada variable por separado, el siguiente paso
consiste en analizar la existencia de posibles
relaciones entre ellas. Dicho estudio puede
realizarse desde una ptica bidimensional o
multidimensional.

En el caso bidimensional las tres situaciones


generales que pueden presentarse son las
siguientes:
1) Ambas variables son cualitativas.
2) Ambas variables son cuantitativas.
3) Una variable es cuantitativa y la otra cualitativa.

09:45:17 PM 55
Frec.
Preparar los datos
1) Ambas variables son cualitativas Total %
nopara elsianlisis
Total
Col %
Fila %
Se utiliza una tabla de contingencia que contiene en 42 18
cada casilla la correspondiente frecuencia conjunta que A 10,45 4,48
Anlisis
60
35,90 6,32 14,93
representa el nmero de datos que pertenecen a la 70,00 estadstico
30,00
modalidad isima de la primera variable y a la unidimensional
16 16
modalidad j-sima de la segunda. B
3,98 3,98 32
13,68 5,61 7,96
A partir de dicha tabla podemos estudiar si las dos
variables son o no independientes. Si no son
50,00Anlisis
50,00
10 36
independientes se analiza el tipo y el grado de su
C
estadstico
2,49 8,96 46
dependencia tanto grfica como numricamente. 8,55 12,63 11,44
bidimensional
21,74 78,26
1,00
19 69
4,73 17,16 88
Uso de control biol.

D 16,24 24,21 21,89


0,75
21,59 78,41
si
13 59
0,50 3,23 14,68 72
E 11,11 20,70 17,91
18,06 81,94
0,25
12 44
no
2,99 10,95 56
0,00
F 10,26 15,44 13,93
A B C D E F G 21,43 78,57
Variedad
5 43
1,24 10,70 48
Prob>ChiCuadrad G 4,27 15,09 11,94
Test ChiCuadrado
o 10,42 89,58
Razn de verosimil. 68,956 <,0001* 117 285
Total 402
Pearson 73,004 <,0001* 29,10 70,90
09:45:17 PM 56
2) Ambas variables son cuantitativas

La distribucin conjunta de dos variables puede


expresarse grficamente mediante un diagrama de
dispersin que proporciona una buena descripcin de la
relacin entre las dos variables.
La relacin entre las variables tambin puede
expresarse de forma numrica. Una medida de la
relacin entre dos variables que resuma la informacin
del grfico de dispersin y que no dependa de las
unidades de medida es el coeficiente de correlacin
lineal.
1,4

1,2

1
PESOMAZ

0,8

0,6

0,4

0,2
0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
PESOGRAN

Variable Media Desv. Correlacin Signif. Prob


Estnd.
PESOGRAN 0,62396 0,186505 0,985403 <,0001*
PESOMAZ 0,854 0,271155 09:45:17 PM 57
2) Ambas variables son cuantitativas

Cuando se estudia la relacin entre dos variables es


importante asegurarse de que los individuos estudiados
son homogneos respecto a dichas variables.
A continuacin se muestra dos casos frecuentes de
heterogeneidad.

Factor de grupo
Valor atpico

La conclusin fundamental de este anlisis es que


conviene asegurarse mirando el grfico de dispersin
que el coeficiente es un buen resumen del mismo.
Tratar de interpretar un coeficiente de correlacin sin
haber visto previamente el grfico de las variables
puede ser muy peligroso.
09:45:17 PM 58
3) Una variable cuantitativa y otra
cualitativa

En este caso el estudio se enfoca como un problema de


comparacin del comportamiento de la variable
numrica en las diferentes subpoblaciones que define la
variable cualitativa. Ignorar la heterogeneidad debida a
la presencia de subpoblaciones puede conducir a
conclusiones equivocadas en el anlisis.
Una forma de realizar dicho anlisis es mediante los
diagramas de cajas y los test de diferencias de medias.
Resumen CRECBACT AMBIENTE NEVERA
n 40 20 20
Media 400,7 454,8 346,6
D.E. 59,88 12,47 32,28
Mn 301 430 301
Mx 469 469 435
Asimetra -0,28 -0,72 0,97
Kurtosis -1,58 -0,63 0,81

pHomVar T p-valor
0,0001 13,98 <0,0001

Media(1)-
Grupo 1 Grupo 2 Media(1) Media(2) Media(2) LI(95) LS(95)
{AMBIENTE
} {NEVERA} 454,8 346,6 108,2 09:45:17
92,26
PM 124,14 59
Anlisis estadstico
multidimensional Ejemplo de representaciones grficas y
resmenes descriptivos

1,2
1
0,8 PESOMAZ

0,6
0,4
0,2
17
16
15 LONGMAZ
14
13
12
11
0,9
0,8
0,7 Columna Media Desv. Mnimo Mximo
0,6 PESOGRANO
0,5
Std.
0,4 PESOMAZ 0,7728 0,2563 0,2500 1,3000
0,3
LONGMAZ 14,7500 1,1585 12,0000 17,1000
0,2
0,20,4 0,6 0,8 1 1,2 11 12 13 14 15 16 17 0,2 0,40,5 0,70,8 PESOGRANO 0,6004 0,1756 0,2680 0,9530

Variable Correlaci LI 95% LS 95% Signif Prob


n
LONGMAZ PESOMAZ 0,3377 0,0655 0,5631 0,0165*
PESOGRANO PESOMAZ 0,9698 0,9471 0,9828 <,0001*
PESOGRANO LONGMAZ 0,3534 0,0832 0,5752 0,0118*
09:45:17 PM 60
Rcuadrado 0,941284
RCuadrado 0,938785
Ajust.
Raz CMEE 0,043446
Media de Y 0,60038
Observaciones 50

Fuente GL SC CM F
Modelo 2 1,4221832 0,711092 376,7284
Error 47 0,0887146 0,001888 Prob > F
Total 49 1,5108978 <,0001*

09:45:17 PM 61
300

250

P R E CIPITA CIO N
200

150

100

50

AGO JUL SEP

MES

Level Std Dev MeanAbsDif to MeanAbsDif to


Mean Median
AGO 63,69770 51,20533 51,07000
JUL 44,30364 32,24933 32,10667
SEP 65,77957 52,03333 51,53000

Test F Ratio Prob > F


O'Brien[.5] 2,5793 0,0816
Brown-Forsythe 2,8043 0,0660
Levene 2,9992 0,0550
Bartlett 2,4923 0,0827
09:45:19 PM 62
ALGUNAS REPRESENTACIONES
GRFICAS MULTIVARIADAS

63

Anda mungkin juga menyukai