Anda di halaman 1dari 19

INTEGRANTES:

• Edgardo Meneses Riquelme


• María Paz Núñez Rivera
• Raúl Pérez Morales
• Lorena Pizarro Ossandón
• Daniela Santana Contreras

PROFESOR CÁTEDRA: Daniel


Pinto
Introducción
• Avance en las tecnologías de la
Información
• Análisis de diversos temas como industrias,
organizaciones, comportamiento humano,
minería, etc.
• Desarrollo de técnicas estadísticas como el
Análisis Multivariante.
• Estudio mas detallado con información que
los análisis univariables o bivariables no
obtienen.
• Permite tomar mejores decisiones.
¿QUÉ ES EL ANÁLISIS
MULTIVARIANTE?

• Es un método que analiza


simultáneamente medidas
múltiples de cada individuo u
objeto sometido a
investigación.
• Existen muchas técnicas
multivariantes que son
extensiones del análisis
univariable y del bivariable.
Objetivos
Resumir el conjunto de variables en unas pocas nuevas
variables, construidas como transformaciones de las
originales, con la mínima pérdida de información.

Encontrar grupos en los datos si existen.

Clasificar nuevas observaciones en grupos definidos.

Relacionar dos o más conjuntos de variables


Aplicación
Administración de empresas

• Construir tipologías de clientes

Agricultura

• Clasificar terrenos de cultivo por fotos aéreas

Geología

• Clasificar sedimentos

Economía

• Identificar dimensiones del desarrollo económico


Clasificación - Análisis de Regresión
Métrica o - Análisis de Supervivencia
Cuantitativa - MANOVA
Métodos de - Correlación Canónica
Dependencia
- Análisis Discriminante
No Métrica o
Técnicas Multivariantes

- Regresión Logística
Cualitativa
- Análisis Conjoint

- A. Comp. Principales
Datos Métricos - Análisis Factorial
o cuantitativos - Escalas Multidimensionales
- Análisis Clúster
Métodos de
Independencia
- Análisis de Correspondencias
Datos No - Modelos Log-lineales
Métricos o
Modelos cualitativos - Escalas Multidimensionales
Estructurales
- Análisis Clúster
Métodos
DEPENDENCIA INDEPENDENCIA
El objetivo de los métodos Estos métodos no
de dependencia consiste en distinguen entre variables
determinar si el conjunto de dependientes e
independientes y su
variables independientes objetivo consiste en
afecta al conjunto de identificar qué variables
variables dependientes y de están relacionadas, cómo lo
qué forma. están y por qué.
Modelos Estructurales
• Suponen que las variables
están divididas en dos
grupos: el de las variables
dependientes y el de las
independientes. El objetivo
de estos métodos es
analizar, no sólo como las
variables independientes
afectan a las variables
dependientes, sino también
cómo están relacionadas
las variables de los dos
grupos entre sí.
Etapas del Análisis Objetivos del Análisis

Diseño del Análisis


Multivariante

Hipótesis del Análisis

Realización del Análisis

Interpretación de los Resultados

Validación del Análisis


Descripción de los datos
• La clasificación de la información de partida es mediante
una tabla con valores de p variables observadas sobre n
elementos. Se describen variables cualitativas y
cuantitativas (binarias)

CO X1 X2 X3

A 1 0 0
CO: variable
V 0 1 0
A,v,c,n: categorías
C 0 0 1

N 0 0 0
Descripción de los datos
• Suponiendo que se observan p variables numéricas en un
conjunto de n elementos. Cada una de estas variables p se
denomina variable escalar o univariante y el conjunto de las p
variables forman una variable vectorial o multivariante.
• Los valores de las p variables escalares en cada uno de los n
elementos se representan en una matriz de datos (X=nxp)

𝑥11 ⋯ 𝑥1𝑝 𝑥′1


𝑿= ⋮ ⋱ ⋮ = … Para describir datos
𝑥𝑛1 ⋯ 𝑥𝑛𝑝 multivariantes se debe
𝑥′𝑛
estudiar cada variable
aisladamente y las
i: individuo i=1…,n relaciones entre ellas.
p: representa la
variable, p=1…,p
Procedimiento de Regresión Múltiple

• Está diseñado para construir un modelo estadístico


describiendo el impacto de dos o más factores cuantitativos X
sobre una variable dependiente Y.
• El modelo ajustado entrega una respuesta estimada y se
representa como:
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖1 + 𝛽2 𝑋𝑖2 + 𝜀

• Donde:
• Yi = variable dependiente que denota la respuesta en las n-ésimas
tentativas
• Xi1 y Xi2 =variables independientes o predictoras
• β = coeficientes de regresión y ε el error.
• En forma matricial:
𝑌1 1 𝑋11 ⋯ 𝑋𝑘1 𝛽0 𝜀1
⋮ = ⋮ 𝑋12 ⋱ ⋮ ⋮ + ⋮
𝑌𝑛 1 𝑋1𝑛 ⋯ 𝑋𝑘𝑛 𝛽𝑘 𝜀𝑛

• Para medir que tan bien se ajusta el modelo de regresión


a los datos se utiliza el coeficiente de determinación
múltiple R2, que se mide como proporción de 0 a 1, o
porcentaje. El valor 1 indicaría un ajuste perfecto.
Se parte de una tabla de datos de individuos por variables, que
fundamentalmente deben ser cuantitativas. Si hay variables
cualitativas, se codifican para transformarlas en cuantitativas y se
denominan como variables dummy.

Tabla de datos de individuos por variable.


EJEMPLO
• Se analiza la siguiente tabla de datos que corresponde a
la prospección de un yacimiento en Perú.

Zn ppm Au ppm Ley Cu Ley Mo Alteración AR1 AR2


1 119 0,241 0,061 0,0012 Pot 0 0
2 106 0,201 0,058 0,0009 Pot 0 0
3 79 0,182 0,096 0,0036 Pot 0 0
4 100 0,160 0,103 0,0012 Arg 1 0
5 86 0,081 0,117 0,0018 Arg 1 0
6 92 0,140 0,100 0,0031 Arg 1 0
7 129 0,000 0,112 0,0023 Prop 0 1
8 102 0,031 0,173 0,0025 Prop 0 1
9 102 0,042 0,195 0,0031 Prop 0 1
• La variable alteración es una variable cualitativa con tres
niveles de medición, potásica, argílica y propilítica. La
cual debe ser transformada en una variable Dummy

1 𝑠𝑖 𝑒𝑠 𝐴𝑟𝑔 1 𝑠𝑖 𝑒𝑠 𝑃𝑟𝑜𝑝
𝐴𝑅1 ቊ 𝐴𝑅2 ቊ
0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜 0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

• Suponemos que no hay interacción entre las variables


independientes y se realiza una Regresión Múltiple
utilizando los datos de la base de datos en Statgraphics.
• La variable dependiente será Cu en función de las otras
variables cuantitativas como Au, Zn y Mo. Y las variables
Dummy, AR1 y AR2

Relacionar  Varios Factores  Regresión Múltiple

• En opciones de regresión múltiple se selecciona el


procedimiento de ajuste de mínimos cuadrados.
En el resumen del análisis tenemos:
Error Estadístico
Parámetro Estimación Estándar T Valor - P
Zn ppm 0,000005803 0,000041578 0,139583 0,8891
Au ppm 0,0859905 0,00671029 12,8147 0,0000
Ley Mo 7,50486 1,51789 4,94426 0,0000
AR1 0,0332206 0,00683944 4,85721 0,0000
AR2 0,0245736 0,00599102 4,10174 0,0001

• R2 es aproximadamente 77,75%.
• Luego, la ecuación del modelo ajustado es:
𝐶𝑢 = −0,0329499 + 0,0857393 ∗ 𝐴𝑢 + 0,000345742 ∗ 𝑃𝑏 +
7,5124 ∗ 𝑀𝑜 + 0,0333134 ∗ 𝐴𝑅1 + 0,0247832 ∗ 𝐴𝑅2

Anda mungkin juga menyukai