Anda di halaman 1dari 25

Finanzas de Empresas

Tursticas
Francisco Prez Hernndez
(f.perez@uam.es)
Departamento de Financiacin e Investigacin de la
Universidad Autnoma de Madrid

Introduccin al Anlisis de Datos
1. Introduccin al Anlisis de Datos
El primer tipo de anlisis que se realiza sobre las variables obtenidas de fuentes
secundarias o primarias, es el clculo de estadsticos descriptivos y el clculo de
frecuencias. Antes de analizar este tipo de anlisis primario o de exploracin de la
informacin estadstica objeto de estudio, es importante situarnos en el MARCO
CONCEPTUAL ESTADSTICO Y ECONOMTRICO (Maha 2006):

Y \ X CUALITATIVA CUANTITATIVA
**Coeficiente de Correlacin de
Pearson
**Anlisis Discriminante
CUALITATIVA **Tablas de Contingencia
**Modelo LOGIT / PROBIT
**Modelo de Regresin (MBRL)
**Anlisis de la Varianza
(ANOVA) / (MANOVA)
**Modelo de Datos de Panel
(PANEL DATA)
**Modelo VAR
CUANTITATIVA
**Anlisis de la Covarianza
(ANCOVA) / (MANCOVA)
**Modelo ARCH / GARCH
**Anlisis Factorial
VARIANTES
**Anlisis Cluster

Obtencin, Elaboracin y Anlisis de Datos del
Tercer Sector
2. Anlisis Descriptivo
Distribuciones Unidimensionales de Frecuencias

Medidas de Posicin (Tendencia Central)

Medidas de Dispersin

Medidas de Concentracin
Anlisis Descriptivo
DISTRIBUCIONES UNIDIMENSIONALES DE FRECUENCIAS
Al observar los elementos o componentes en una determinada muestra se presentan
distintos valores de cualquier variable, en la cual puede repetirse un mismo dato en
varias observaciones. As pues, surgen distintos conceptos que engloban las
distribuciones de frecuencias:
Al nmero de veces que se presenta un valor en cada variable se le denomina
FRECUENCIA ABSOLUTA de dicho observacin.
A la divisin de la frecuencia absoluta de un valor de la variable por la
suma de frecuencias absolutas de todos los valores observados le
llamaremos FRECUENCIA RELATIVA de dicho valor.
Llamaremos FRECUENCIA ABSOLUTA O RELATIVA ACUMULADA de un
valor a la suma de las frecuencias absolutas o relativas de todos los
valores menores o iguales que dicho valor.
Estos son los principales conceptos bsicos de las Distribuciones
Unidimensionales de Frecuencias. NOTA: El calificativo UNIDIMENSIONAL
quiere decir que se est observando UNA SOLA VARIABLE de cada elemento
de una muestra o poblacin.
Anlisis Descriptivo
Pero qu se puede hacer con las frecuencias de los valores de distintas
variables:
Ordenacin, ya sea de forma ascendente o descendente.
Agrupacin de los valores que se repiten en la muestra.
De la agrupacin de valores se obtiene la TABLA ESTADSTICA DE DISTRIBUCIN
DE FRECUENCIAS.
Frecuencias
Edad
(X
i
)
Absoluta
(n
i
)
Absoluta
Acumulada
(N
i
)
Relativa
(f
i
)
Relativa
Acumulada
(F
i
)
18 5 5 0,25 0,25
19 3 8 0,15 0,40
20 7 15 0,35 0,75
21 4 19 0,20 0,95
22 1 20 0,05 1,00
20 (n) 1,00

Al conjunto de
estas operaciones
se le denomina
TABULACIN
Anlisis Descriptivo
Existen dos tipos de Representaciones Grficas de Variables Unidimensionales:
Diagrama de Barras,
utilizado en frecuencias
simples (frecuencias no
acumuladas).
Polgono de Frecuencias,
tambin utilizado en
frecuencias simples.
Diagrama de Barras
5
3
7
4
1
0
1
2
3
4
5
6
7
8
18 19 20 21 22
Polgono de Frecuencias
5
3
7
4
1
0
1
2
3
4
5
6
7
8
18 19 20 21 22
Anlisis Descriptivo
Ms conceptos Bsicos:
Recorrido, intervalos y marcas de clase
Es importante distinguir dos tipos fundamentales de distribuciones de
frecuencias: las que NO se agrupan por INTERVALOS y las que se agrupan en
INTERVALOS.
Frecuencia NO agrupada en intervalos.
Estamos hablando de este tipo de frecuencias, una vez que recogemos y
tabulamos la informacin en la que cada variable dispone de sus propios tipos
de frecuencias (ver anteriores diapositivas).
Frecuencia agrupada en intervalos.
Pero en la prctica, el nmero de valores distintos que ha tomado la variable
es muy grande, por lo que se aconseja AGRUPAR ESTOS VALORES EN
CLASES O INTERVALOS.
Entonces una distribucin de frecuencias agrupada est representada por el
par:
n L L
i i i
;
1
Li
Li 1
Extremo superior
Extremo inferior
Anlisis Descriptivo
Para agrupar los datos en intervalos o clases, es necesario comenzar
determinando el RECORRIDO o RANGO de la variable.
Definiremos como RANGO (Re) es la diferencia entre el valor mximo y
mnimo de la variable:


As, se divide en intervalos.

Denominaremos AMPLITUD (C
i
) del intervalo a la diferencia entre los
extremos superior e inferior del intervalo, es decir:



Por ltimo, y como representante de cada intervalo o clase, se elige el PUNTO
MEDIO. A este estadstico lo llamaremos MARCA DE CLASE (x
i
).
i
i
i
i
x x
min max Re
Re
L L c
i i i 1
2
1 L L
x
i i
i
Anlisis Descriptivo
Cuando tenemos ya la tabulacin de datos y se ha definido estructuralmente la
informacin estadsticas podemos comenzar nuestro ANLISIS DESCRIPTIVO. Para
ello, es necesario conocer la clasificacin de estas medidas:
Medidas de Posicin: permiten situar una distribucin. Las
ms utilizadas son las de Tendencia Central.
Medidas de Dispersin: sirven para medir el grado de
esparcimiento de los datos de una distribucin.
Medidas de Concentracin: Se utilizan para medir la
uniformidad en la distribucin o la concentracin de ciertos
grupos cuya variable caracterstica es de significado econmico.
Medidas de Forma: Sirven para caracterizar de manera precisa
una distribucin de frecuencias.
Anlisis Descriptivo
MEDIDAS DE POSICIN
Las medidas de Tendencia Central ms utilizadas son tres:
Las Medias (Aritmtica, Geomtrica y Armnica), la Mediana y la Moda.

Media Aritmtica.
Se define como la suma de todos los valores de la distribucin dividida por el
nmero total de observaciones.
n
X
n
i
i X
1
n
i
i
n
i
i i
n
n X
X
1
1
Media Aritmtica Simple
Media Aritmtica Ponderada
Asignar a cada valor
de la variable la
IMPORTANCIA que
tiene dentro de la
distribucin
Anlisis Descriptivo
Media Geomtrica.
Se define como la raz N-sima del
producto de los n valores de la
distribucin.
n
n
i
i
x
G

1
Media Armnica.
Al igual que la media geomtrica,
considera todos los valores de la
distribucin, y en ocasiones es ms
representativa que la media aritmtica
X X X i n
n n
H
1 1
...
1
1
Mediana.
El valor de la variable que deja a su
izquierda el mismo nmero de
valores que a su derecha en una
distribucin (que estar a priori
ordenada)

Su smbolo es:
Moda.
Es el valor de la variable que ms
veces se repite en una distribucin de
frecuencias.

Su smbolo es:
Me
Mo
Anlisis Descriptivo
MEDIDAS DE DISPERSIN
Con las medidas de Tendencia Central tratbamos de sintetizar mediante UN SOLO
nmero toda la informacin proporcionada por una tabla de distribucin de frecuencias.
Sin embargo, esta medida no nos da una idea sobre la VARIABILIDAD o
ESPARCIMIENTO de los valores de una distribucin, POR ELLO ES NECESARIO
UTILIZAR MEDIDAS DE DISPERSIN.
Absolutas.
Recorrido o rango (ver anteriores diapositivas).
Recorrido intercuartlico.
Desviacin absoluta media.
Varianza .
Desviacin Tpica.
Las medidas de dispersin se pueden clasificar as:
Relativas.
Coeficiente de apertura.
Recorrido relativo
Recorrido semi-intercuartlico.
Coeficiente de variacin.
Anlisis Descriptivo
Recorrido o rango.
Recordando! Es la diferencia entre
los dos valores extremos de una
variable. Inconveniente: por tener
en cuenta slo 2 valores es muy
sensible a fluctuaciones.
Desviacin absoluta media
Se define como la media aritmtica
de las desviaciones, en valor
absoluto, entre los valores de la
variable.
Varianza.
La varianza es el momento de
segundo orden respecto a la media. La
varianza nos medir qu tan
dispersos estn los valores de una
variable respecto a la media.
Desviacin Tpica.
Es la raz cuadrada (con signo
positivo) de la varianza. sta es la
medida de dispersin ms utilizada.
i
i
i
i
x x
min max Re
N
n
i
i i
m
n X X
D
1
N
n
X
X
S
i
n
i
i
2
1
2
S S
2
2
Anlisis Descriptivo
Ejemplo:
Se tiene la siguiente tabla de distribucin de frecuencias. Se pide calcular la
desviacin absoluta media, la varianza y su desviacin tpica.



2 1 2 8//-8 8 16 16
9 2 18 1//-1 2 1 2
11 4 44 1//1 4 1 4
12 3 36 2//2 6 4 12
10 100 20 34

2
10
20
Dm
S S
2
n
i n
i n X X i i
X Xi
10
10
100
X
4 , 3
10
34 2
S
N
n
i
i i
m
n X X
D
1
N
n
X
X
S
i
n
i
i
2
1
2
N
n
X
X
S
i
n
i
i
2
1
2
84 , 1
4 , 3
S
Xi Xi
2
X Xi n X X i i
2
Anlisis Descriptivo
Coeficiente de apertura.
Se define como el coeficiente entre
los dos valores extremos de una
distribucin.
Coeficiente de variacin.
Se define como el coeficiente entre
la desviacin tpica y la media.
X
X
C
n
A
1
Tiene gran utilidad en variables
discretas, como pueden ser los
salarios mensuales. Ejemplo:
60.000 75.000 80.000
33 , 1
000 . 60
000 . 80
C
A
X
C
S
V
Para el ejemplo de la diapositiva
anterior, el coeficiente de variacin
sera:
13 , 0
10
34 , 1
C
V
Anlisis Descriptivo
MEDIDAS DE CONCENTRACIN
Las medidas de concentracin tienen como principal finalidad medir la
uniformidad del reparto del conjunto de informacin estadstica.

Por ejemplo, si todos los trabajadores de la Fundacin Luis Vives recibieran el mismo
salario, la uniformidad de dicho reparto sera absoluta. Por el contrario, si el total de
salarios fuesen percibidos por un solo trabajador, la falta de uniformidad sera total,
es decir la concentracin sera mxima.
Curva de Lorenz.
ndice de Gini.
Medial.
Asimetra.
Curtosis.
Las principales medidas de concentracin son:
Medidas de Forma
Anlisis Descriptivo
Asimetra.
El objetivo principal de este coeficiente es medir si las observaciones estn
dispuestas simtrica o asimtricamente respecto a un valor central
(normalmente la media aritmtica) y el grado de esta asimetra.

El coeficiente que se utiliza para obtener esta incgnita es el propuesto por
Fisher:
S
n X X
g
n
i i
3
3
1
Si la distribucin es asimtrica a la izquierda.
la distribucin es simtrica.
la distribucin es asimtrica a la derecha.
0
1
g
0
1
g
0
1
g
Anlisis Descriptivo
Curtosis.
El coeficiente de curtosis trata de medir el grado de apuntamiento de una
distribucin respecto a la una distribucin normal ( ).

La expresin utilizada es la siguiente:

Si la distribucin leptocrtica (ms apuntada que la normal).
la distribucin es normal.
la distribucin es platicrtica (menos apuntada que la normal).
0
3
g
0
3
g
0
3
g
) , (
2
0
N
3
4
4
2
S
n X X
g
n
i i
Obtencin, Elaboracin y Anlisis de Datos del
Tercer Sector
3. Anlisis de Relacin entre Dos Variables.
Tablas de Contingencia
Coeficiente de correlacin de Pearson
Anlisis de relacin entre dos variables
Relacin entre dos variables
Adicionalmente al anlisis de una variable aislada, mediante la Estadstica Descriptiva
(vista hasta ahora) es de gran importancia revisar la relacin existente entre dos
variables.

Al analizarse la relacin entre dos variables debe de tenerse en cuenta la ESCALA DE
MEDIDA DE LA VARIABLE, ya que dependiendo de sta (si es cualitativa o
cuantitativa) se elegir la tcnica estadstica o economtrica.

Entre las medidas de asociacin existen distintas alternativas:




Entre los coeficientes de correlacin destacamos dos:

Las basadas en la Chi-Cuadrada .
Coeficiente de Contingencia.
V de Cramer.
2
Coeficiente de Pearson.
Coeficiente de Spearman.

Anlisis de relacin entre dos variables
Tablas de Contingencia
Al analizar dos variables cualitativas nominales, debemos estudiar su distribucin
conjunta o TABLA DE CONTINGENCIA. Esta tabla es de doble entrada, donde en
cada casilla figurar el nmero de casos o individuos que poseen las modalidades por
filas y columna correspondientes.

As, la Tabla de Contingencia se define por el nmero de atributos que se analiza
conjuntamente y el nmero de modalidades de los mismos.
HOMBRE MUJER
SI
NO
SEXO
EXTRANJERO
n
11
n
12
n
21 n
22
Nmero de observaciones que tienen
el atributo i y j.
nij
Para analizar si existe dependencia entre los atributos de una tabla de
contingencia utilizaremos el estadstico
2
Anlisis de relacin entre dos variables
Pearson plante la utilizacin del estadstico para analizar la INTERDEPENDENCIA
de dos variables. Es decir, el grado de asociacin existente entre dos variables
cualitativas nominales.

La hiptesis nula es que los atributos son independientes o que no estn
relacionados, y la hiptesis alternativa es que las variables cualitativas estn
asociadas.





Cuando utilicemos SPSS (y en la mayora de paquetes estadsticos y economtricos),
la salida de resultados nos dar el NIVEL DE SIGNIFICACIN o P-VALUE y por
tanto la probabilidad de equivocarnos.
Si este P-Value es inferior a 0,05, rechazaremos la hiptesis nula y no nos
equivocaremos y en consecuencia diremos que las variables cualitativas estn
relacionadas entre si (dependientes.
Por el contrario, si el nivel de significacin es superior a 0,05 aceptaremos la
hiptesis nula de interdependencia.
2
H0
H1
2
) 1 )( 1 (
2

k h
Rechazamos
2
) 1 )( 1 (
2

k h
Aceptamos
H0
H0
Mirar el valor de tablas chi-cuadrada
Anlisis de relacin entre dos variables
Coeficiente de Correlacin de Pearson
Este coeficiente tiene como objetivo analizar el grado de asociacin de dos variables
cuantitativas. As, la siguiente expresin es una de las principales herramientas de
exploracin estadstica y economtrica:





El valor del coeficiente de correlacin (r) estar comprendido entre -1 y 1.
Siendo -1 una fuerte relacin negativa; 1 una fuerte relacin positiva y 0 una
nula relacin o asociacin entre las dos variables cuantitativas.

En SPSS, al igual que la Tabla de Contingencia, la salida de resultados nos dar el valor
del coeficiente, el p-value y el nmero de observaciones.
y
x
y
x
i
i
i
i
r
2
2
BIBLIOGRAFA:

Martin-Guzman, M. Pilar y Martn, F.Javier (1989). Curso Bsico de Estadstica Econmica EditorialAC.

Pardo, Antonio (2003). SPSS 11 Gua para el Anlisis de Datos Editorial McGraw Hill.

Prez, Cesar (2007). Econometra Bsica Tcnicas y Herramientas Editorial Pearson-Prentice Hall.

Prez, Cesar (1999). Tcnicas de Muestreo Estadstico Teora, Prctica y Aplicaciones Informticas Editorial Ra-ma.

Uriel, Ezequiel y Muiz, Manuel (1993). Estadstica econmica y empresarial Editorial AC

Vicns, Jos. (2005). Obtencin y Anlisis de Datos Universidad Autnoma de Madrid.


Francisco Prez Hernndez
Universidad Autnoma de Madrid
Facultad de Ciencias Econmicas y Empresariales.

Departamento de Financiacin e Investigacin Comercial
Modulo XVI Despacho 207
Tel. 00 (34) 914977682

Instituto de Prediccin Econmica L.R. Klein
Modulo E-XIV (UDI Econometra) Despacho 201
Tel. 00 (34) 914973528
Fax 00 (34) 914974191

Mail: f.perez@uam.es

Anda mungkin juga menyukai