Capítulo 1 (Libro)

Captulo 1 Estadstica Superior
1

Captulo 1: introduccin: mtodos estadsticos y construccin de modelos

Definicin de anlisis multivariante

En sentido muy amplio, se refiere a todos los mtodos estadsticos que analizan
simultneamente medidas mltiples de cada individuo u objeto sometido a investigacin.
Cualquier anlisis simultneo de ms de dos variables puede ser considerado
aproximadamente como un anlisis multivariante.
En sentido estricto, muchas tcnicas multivariantes son extensiones del anlisis univariante y
del anlisis bivariante.
En muchas ocasiones las tcnicas multivariantes son un medio de representar en un anlisis
simple aquello que requiri varios anlisis utilizando tcnicas univariantes. Otras tcnicas
multivariantes, sin embargo, estn diseadas exclusivamente para tratar con problemas
multivariantes, tales como el anlisis factorial que sirve para identificar la estructura
subyacente de un conjunto de variables o el anlisis discriminante que sirve para diferenciar
entre grupos basados en un conjunto de variables
Algunos autores afirman que el propsito del anlisis multivariante es medir, explicar y
predecir el grado de relacin de los valores tericos.
Conceptos bsicos del anlisis multivariante:
Valor terico: es una combinacin lineal de variables con ponderaciones determinadas
empricamente. Es decir, representa una combinacin de todo el conjunto de variables que
mejor se adaptan al objeto del anlisis multivariante especfico. En regresiones mltiples, el
valor terico se determina de tal forma que guarde la mejor correlacin con la variable que se
est prediciendo.
Escalas de medida: el anlisis de los datos implica la separacin, identificacin y medida de la
variacin en un conjunto de variables, tanto entre ellas mismas como entre una variable
dependiente y una o ms variables independientes. Existen 2 tipos bsicos de datos:
- No mtricos: son atributivos, caractersticas o propiedades categricas que identifican
o describen a un sujeto. Describen diferencias en tipo o clase indicando la presencia o
ausencia de una caracterstica o propiedad. Pueden tener escalas nominales su
ordinales:
o Nominales: asigna nmeros que se usan para etiquetar o identificar sujetos u
objetos. Etas tambin son conocidas como escalas de categora, proporcionan
el nmero de ocurrencias en cada clase o categora de la variable que se est
estudiando.
o Ordinales: representan un nivel superior de precisin de la medida. Las
variables pueden ser ordenadas o clasificadas con escalas ordinales en relacin
a la cantidad del atributo posedo
- Mtricos: reflejan cantidades relativas o grado. Las medidas mtricas son las ms
apropiadas para casos que involucran cantidad o magnitud, tales como el nivel de
satisfaccin o la demanda de trabajo.

2

Las escalas de intervalos y de razn proporcionan el nivel ms alto de medida de
precisin. Estas dos escalas tienen unidades constantes de medida de tal forma que las
diferencias entre dos puntos adyacentes de cualquier parte de la escala son iguales. La
nica diferencia real entre las escalas de intervalo y las de razn es que las de intervalo
tienen un punto cero arbitrario, mientras que las escalas de razn tienen un punto
cero absoluto.
o Las escalas de razn representan la forma superior de medida de precisin,
dado que poseen las ventajas de todas las escalas inferiores ms un punto de
cero absoluto

Error de medida y medidas multivariantes:
Error de medida: es el grado en que los valores observados no son representativos de los
valores verdaderos. El error de medida tiene mltiples fuentes, que van desde errores de
entrada de datos a la imprecisin en la medicin, pasando por la incapacidad de los
encuestados a proporcionar informacin precisa
- Por tanto, se debe asumir que todas las variables usadas en las tcnicas multivariantes
tienen algn grado de error de medida. El valor observado obtenido representa tanto
el nivel verdadero como el ruido
El objetivo del investigador de reducir el error de medida puede seguir varios caminos. Al
valorar el grado de error de media presente en cualquier medicin, el analista debe
enfrentarse tanto con la validez como con la fiabilidad de la medida.
- Validez: es el grado en que la medida representa con precisin lo que se supone que
representa. SI la validez est asegurada, el investigador debe considerar la fiabilidad de
las medidas
- Fiabilidad: es el grado en que la variable observada mide el valor verdadero y est
libre de error. Por tanto es lo opuesto al error de medida, las medidas ms fiables
mostrarn una mayor consistencia que las medidas menos fiables
El investigador puede optar por desarrollar mediciones multivariantes, tambin conocidas
como escalas sumadas, donde diversas variables se unen en una medida compuesta para
representar un concepto.
EL objetivo es evitar usar slo una nica variable para representar un concepto, y en su lugar
utilizar varias variables como indicadores, representando todos ellos diferentes facetas del
concepto para obtener una perspectiva ms completa. El uso de indicadores mltiples permite
al investigador llegar a una especificacin ms precisa de las respuestas deseadas y no deja la
fiabilidad plena a una nica respuesta sino en la respuesta media o tpica de un conjunto
de respuestas relacionadas.
La premisa bsica es que las respuestas mltiples reflejan con mayor precisin la respuesta
verdadera que la respuesta nica. El impacto del error de medida y la escasa fiabilidad no

3

pueden ser observadas directamente, dado que se encuentran en las variables observadas.
Pero la presencia del error de medida es garanta de distorsin en las relaciones observadas y
hace menos poderosas las tcnicas multivariantes. Reducir el error de medida puede mejorar
resultados dbiles o marginales, as como fortalecer resultados probados.
Significacin estadstica frente a potencia estadstica:
Todas las tcnicas multivariantes, excepto el anlisis Cluster y el anlisis multidimensional, se
basan en la inferencia estadstica de los valores de una poblacin o la relacin entre variables
de una muestra escogida aleatoriamente de esa poblacin
Para interpretar las inferencias estadsticas, el investigador debe especificar los niveles
aceptables de error estadstico. El modo de aproximacin es determinar el nivel de error de
tipo 1, tambin conocido como alfa.
- ERROR TIPO 1 (): es la probabilidad de rechazar la hiptesis nula cuando es cierta. O
bien, la posibilidad de que la prueba muestre significacin estadstica cuando en
realidad no est presente.
o Especificando un nivel alfa, el investigador fija los mrgenes admisibles de
error especificando la probabilidad de concluir que la significacin existe
cuando en realidad no existe.
- ERROR TIPO 2 (): es la probabilidad de fallar en rechazar la hiptesis nula cuando
realmente es falsa.
- POTENCIA (1-): es la probabilidad de rechazar correctamente la hiptesis nula
cuando es realmente falsa. Por tanto es la probabilidad de que la inferencia estadstica
se indique cuando est presente.
Aunque la especificacin alfa establece el nivel de significacin estadstica aceptable, es el
nivel de potencia el que dicta la probabilidad de xito en la bsqueda de las diferencias si es
que realmente existen.
- No se plantean niveles aceptables ni de alfa ni de beta, ya que los errores Tipo 1 y Tipo
2 estn inversamente relacionados, y a medida que el error de Tipo 1 se hace ms
restrictivo (se acerca a cero) el error Tipo 2 aumenta. Al disminuir el error de Tipo 1
tambin se reduce el poder de la prueba estadstica.

La potencia est determinada por tres factores:
a) Efecto tamao: la probabilidad de conseguir significacin estadstica se basa no slo en
consideraciones estadsticas sino tambin en la magnitud real del efecto que nos
interesa en la poblacin, denominado efecto tamao.
a. Un efecto grande es ms probable de encontrar que un efecto pequeo y por
tanto, afecta a la potencia de la prueba estadstica.

4

Los efectos de tamao se miden en trminos estandarizados para facilitar la
comparacin. Las diferencias respecto de la media se determinan en trminos de
desviaciones estndar. Para las correlaciones, el efecto tamao se basa en la
correlacin efectiva entre las variables.
b) Alfa (): a medida que alfa se vuelve ms restrictivo, la potencia decrece. Esto significa
que como el analista reduce la oportunidad de encontrar un efecto incorrecto
significativo, la probabilidad de encontrar correctamente un efecto tambin
disminuye.
a. Las directrices convencionales sugieren niveles alfa de 005 o 001
c) Tamao de la muestra: el aumento de la muestra siempre produce una mayor
potencia del test estadstico. Pero aumentar el tamao de la muestra tambin puede
producir demasiada potencia. Entendemos que al aumentar el tamao de la
muestra, se observar qu efectos cada vez ms y ms pequeos sern significativos,
hasta que para muestras muy grandes casi cualquier efecto es significativo. El
investigador debe tener siempre presente que el tamao de la muestra puede afectar
a la prueba estadstica tanto por hacerlo insensible o demasiado sensible.

Los estudios deben disearse para conseguir niveles de alfa de al menos 05, con niveles de
potencia del 80%. Para conseguir dichos niveles, deben considerarse simultneamente los tres
factores.
- Al planificar la investigacin, el investigador debe estimar el efecto tamao esperado
para seleccionar entonces el tamao de la muestra

Capítulo 1 (Libro)

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Capítulo 1 (Libro)

Diunggah oleh

Hak Cipta:

Format Tersedia

Captulo 1 Estadstica Superior

Anda mungkin juga menyukai