Anda di halaman 1dari 9

ANLISIS DISCRIMINANTE

El anlisis discriminante es una tcnica estadstica capaz de decirnos


qu variables permiten diferenciar a los grupos y cuantas de estas
variables son necesarias para alcanzar la mejor clasificacin posible. La
pertenencia a los grupos, conocida de antemano, se utiliza como
variable dependiente (una variable categrica con tantos valores
discretos como grupos), las variables en las que suponemos que se
diferencian los grupos se utilizan como variables independientes o
variables de clasificacin (o llamadas variables discriminantes). Segn
veremos, deben ser variables cuantitativas continuas o al menos,
admitir un tratamiento numrico con significado.
Adems el anlisis discriminante nos ayuda a encontrar la combinacin
lineal de las variables independientes que mejor permite diferenciar
(discriminar) a los grupos. Una vez encontrada esa combinacin (la
funcin discriminante) podr ser utilizada para clasificar nuevos casos.
Se trata de una tcnica de anlisis multivariada que se utiliza para
pronosticar la pertenencia a un grupo sobre la base de dos o ms
variables independientes. Es decir que es una tcnica capaz de
aprovechar las relaciones existentes entre una gran cantidad de
variables

independientes

para

maximizar

la

capacidad

discriminacin.
Los objetivos del Anlisis Discriminante son:
1. La identificacin de las variables que mejor discriminen
entre los grupos y la evaluacin del poder discriminante de
cada una de ellas.

de

2. Asignar, con un cierto grado de riesgo, un individuo, que


no forma parte de los datos iniciales, y del que se conoce el
valor de las variables discriminantes, a uno de los grupos.

El anlisis discriminante puede aplicarse para:


Describir: Explicar la diferencia entre los distintos tipos de
objetos.
Hacer Inferencia: Contrastar diferencias significativas entre
poblaciones.
Tomar de decisiones: Decidir donde clasificar un objeto.

CLASIFICACION DEL ANALISIS DISCRIMINANTE


Anlisis Discriminante Predictivo:
En el anlisis discriminante predictivo se trata de estimar a partir de los
datos unas ecuaciones que aplicadas a un nuevo sujeto, para el que se
determinan los valores de las diferentes variables, pero del que se
desconoce a qu grupo pertenece, nos proporcionen una regla de
clasificacin lo ms precisa posible. Se trata pues de formular un
algoritmo por el que se pueda determinar a qu grupo pertenece una
nueva observacin. Este tipo de anlisis puede constituir por ejemplo
una ayuda al diagnstico, o un mtodo de ayuda a la decisin sobre la
utilizacin de una terapia concreta. En el anlisis discriminante
predictivo es importante cuantificar con qu precisin se clasificar a un
nuevo sujeto.
Ejemplo:
Anlisis Discriminante PREDICTIVO

Objetivo: Se desea prever el riesgo de morosidad relativa a los


prstamos personales en una entidad bancaria.

Diseo: Se explora el fichero histrico de los clientes morosos


no morosos y se observan variables cuantitativas potencialmente
explicativas: renta total, edad, crditos adicionales, aos de

estabilidad laboral.
Resultado: Aplicando el modelo estimado con el fichero histrico,
el anlisis permitir anticipar el riesgo de morosidad de nuevos
clientes.

Anlisis Discriminante descriptivo:


En el anlisis discriminante descriptivo estamos ms interesados en las
variables empleadas para diferenciar los grupos, en las variables
explicativas, y lo que deseamos es determinar cules de esas variables
son las que ms diferencian a los grupos, cuales son importantes y
cules no a efectos de clasificar los sujetos.
Ejemplo:
Anlisis Discriminante DESCRIPTIVO

Objetivo: Se desea caracterizar el perfil de los compradores de un

determinado producto en un determinado establecimiento.


Diseo: Se disea una muestra con 100 compradores y 100 no
compradores y se toman datos de renta, edad y cercana al

establecimiento.
Resultado: El anlisis discriminante establecer la importancia
relativa de cada uno de estos atributos en la decisin de compra
permitiendo

orientar

mejor

distribucin del producto.

la

poltica

promocional

de

EL PROBLEMA GENERAL EN CLASIFICACIN EN EL ANALISIS


DISCRIMINANTE
Poblacin 1

Poblacin 2
Cada punto
representa un
sujeto, en el
espacio de p-

El problema de la clasificacin es uno de los primeros que aparecen en


la actividad cientfica y constituye un proceso consustancial con casi
cualquier actividad humana, de tal manera que en la resolucin de
problemas y en la toma de decisiones la primera parte de la tarea
consiste precisamente en clasificar el problema o la situacin, para
despus aplicar la metodologa correspondiente y que en buena medida
depender de esa clasificacin. Por supuesto tambin es as en la
medicina, ciencia en la que el diagnstico constituye una parte
primordial, siendo una fase previa para la aplicacin de la terapia.
Diagnosticar es equivalente a clasificar a un sujeto en una patologa
concreta en base a los datos correspondientes de su anamnesis,
exploracin y pruebas complementarias. Cuando hablamos de clasificar
a un sujeto en un grupo determinado, a partir de los valores de una serie
de parmetros medidos u observados, y esa clasificacin tiene un cierto
grado de incertidumbre, resulta razonable pensar en la utilizacin de
una

metodologa

probabilstica,

que

nos

permita

cuantificar

incertidumbre.
Enfoques del problema de clasificacin:
Desde el punto de vista estadstico podemos distinguir dos enfoques
diferentes al problema de la clasificacin.

esa

En el primero de ellos los grupos estn bien definidos y se trata de


determinar un criterio para etiquetar cada individuo como
perteneciente a alguno de los grupos, a partir de los valores de
una serie limitada de parmetros. En este caso las tcnicas ms
utilizadas se conocen con el nombre de anlisis discriminante,
aunque como veremos existen otras posibles alternativas, tales
como la utilizacin de la regresin logstica.

El segundo enfoque corresponde a aquel caso en el que a priori no


se conocen los grupos y lo que precisamente se desea es
establecerlos a partir de los datos que poseemos. Ahora tenemos
en esencia un problema taxonmico, y las tcnicas estadsticas
ms utilizadas en esa rea se conocen con el trmino anlisis de
cluster, que podemos traducir como anlisis de agrupaciones y
tambin como anlisis de conglomerados por algunos autores.

FUNCIN DISCRIMINANTE
La Funcin discriminante es la combinacin lineal de las variables
independientes desarrolladas por medio del anlisis discriminante que
diferenciaran mejor entre las categoras de la variable dependiente. Por
lo tanto, el anlisis discriminante es una herramienta estadstica para
determinar combinaciones lineales de esas variables independientes, y
utilizar esto para pronosticar la pertenencia a un grupo.
LA FUNCIN DISCRIMINANTE LINEAL
El mtodo est basado en modelos de probabilidad lineal, y se conoce
como funcin discriminante lineal (FD). Supone que si se tienen n
entidades6 para las que se conocen k variables explicativas, y se
observa que n1 de ellas pertenece a un grupo (1) y n2 a otro grupo (2),
donde: n1+n2=n; es posible construir una funcin lineal de las k
variables que puede usarse para predecir si una nueva observacin

pertenece a un grupo u otro con una probabilidad determinada. La


funcin lineal general se define como sigue:

El problema de la funcin de anlisis discriminante desde el punto de


vista

del

anlisis

de

variancia consiste en

responder a la pregunta

de si dos o ms grupos

son

diferentes uno de otro

significativamente

respecto a la media de una variable en particular. Debe tenerse presente


que si la media de una variable es significativamente diferente en varios
grupos, puede decirse que esta variable discrimina entre grupos.
Al igual que en el caso de conglomerados, anlisis factorial y de
correlacin

cannica,

el

anlisis

discriminante

realiza

diferentes

desgloses de las variancias de un conjunto de datos para someterlos a


una serie de pruebas estadsticas y determinar el grado de asociacin
entre esas variancias y, por tanto, entre las variables. De esta forma, la
mejor discriminacin se tiene al maximizar:

Variancia de Z entre grupos


Variancia de Z dentro de grupos

En el caso de una nica variable explicativa, la prueba final de


significancia de si esta variable discrimina o no entre grupos es una
prueba F, que es bsicamente una razn de las variancias entre grupos
sobre el promedio de la variancia dentro de los grupos. Si la variancia
entre grupos es significativamente mayor, deber haber diferencias
significativas entre las medias.

Para el caso de ms de una variable, se busca determinar cul o cules


de ellas contribuyen a la discriminacin entre grupos. En este caso, se
tiene una matriz de variancias y covariancias. Puede compararse las
matrices con una prueba F multivariable, para determinar si hay o no
diferencias significativas en las medias entre grupos.

INTERPRETACIN DE LA FUNCIN DISCRIMINANTE


En esta seccin se estudia la aplicacin de la ecuacin (1) de la seccin
anterior a dos casos particulares: para dos grupos y para mltiples
grupos. Tambin se incluye la significancia de la funcin discriminante.

La Funcin Discriminante para Dos Grupos


En este caso, la funcin discriminante puede verse como una caso de
anlisis de regresin lineal mltiple. Si se codifican los dos grupos como
1 y 2, y se emplea tal variable como dependiente en un anlisis de
regresin lineal mltiple, pueden obtenerse resultados similares a los
que se obtendran de un anlisis discriminante. En general, en el caso de
dos grupos se ajusta una ecuacin lineal del tipo:

Donde a es una constante y b1 a bm son coeficientes de regresin. La


interpretacin de estos resultados es similar a la de un modelo de
regresin mltiple. Los ms significativos son lo que contribuyen ms a
la prediccin de pertenencia a un grupo.
La Funcin Discriminante para Mltiples Grupos

Cuando es posible identificar ms de dos grupos, puede estimarse ms


de una funcin discriminante similares a la presentada anteriormente.
Por ejemplo cuando se tienen tres grupos, puede estimarse 1) una
funcin para discriminar entre grupo 1 y grupos 2 y 3 combinados, y 2)
otra funcin para discriminar entre grupo 2 y grupo 3.
En la prctica, cuando se realiza un anlisis discriminante entre varios
grupos, no debe especificarse cmo combinar los grupos para formar las
diferentes funciones. El paquete computacional que se emplee, por
ejemplo SPSS, automticamente las conforma de manera que la primera
es la que ofrece la mayor discriminacin como un todo entre grupos, la
segunda provee una menor y as sucesivamente. Las funciones son
independientes

ortogonales,

esto

es,

su

contribucin

la

discriminacin entre grupos no se sobrepone.

Significancia de La Funcin Discriminante


Puede probarse el nmero de variables que agregan significancia a la
discriminacin entre grupos. Solo aquellas que sean estadsticamente
significativas deben ser usadas para interpretar, las no significativas
deben ignorarse.
En resumen, cuando se interpretan funciones discriminantes mltiples,
que surgen del anlisis con ms de dos grupos y ms de una variable, se
puede probar primero la significancia estadstica de las diferentes
funciones, y considerar solo las significativas para las siguientes
pruebas. Luego, se observan los coeficientes b estandarizados (vase
ecuacin 2) para cada variable para cada funcin significativa. Cuantos
mayores

sean

ms

alta

es

la

contribucin

la

discriminacin

especificada por la respectiva funcin. Finalmente, pueden verse las


medias para las funciones discriminantes significativas para determinar
entre cules grupos discrimina la respectiva funcin.

Anda mungkin juga menyukai