Anda di halaman 1dari 16

Cmo aplicar rboles de decisin en SPSS.

Vanesa Berlanga Silvente, Mara Jos Rubio Hurtado, Ruth Vil Baos
Fecha de presentacin! ""#"$#%$"%
Fecha de aceptacin! "&#"$#%$"%
Fecha de publicacin! $'#$"#%$"(
Resumen
)n *rbol de decisin es una +or,a gr*+ica - analtica de representar todos los eventos
.sucesos/ 0ue pueden surgir a partir de una decisin asu,ida en cierto ,o,ento1 2os
a-udan a to,ar la decisin ,*s 3acertada4, desde un punto de vista probabilstico, ante
un abanico de posibles decisiones1 5stos *rboles per,iten e6a,inar los resultados -
deter,inar visual,ente c,o +lu-e
el ,odelo1 7os resultados visuales a-udan a buscar subgrupos espec+icos - relaciones 0ue tal ve8
no encontrara,os con estadsticos ,*s tradicionales1
7os *rboles de decisin son una tcnica estadstica para la seg,entacin, la
estrati+icacin, la prediccin, la reduccin de datos - el +iltrado de variables, la identi+icacin
de interacciones, la +usin de categoras - la discreti8acin de variables continuas1
7a +uncin *rboles de decisin .9ree/ en S:SS crea *rboles de clasi+icacin - de decisin
para identi+icar grupos, descubrir las relaciones entre grupos - predecir eventos +uturos1
56isten di+erentes tipos de *rbol! ;H<=>, ;H<=> e6haustivo, ;R9 - ?)5S9, seg@n el 0ue ,eAor
se aAuste
a nuestros datos1
##:alabras clave
Brbol de decisin, ;H<=>, clasi+icacin, ,inera de datos1
## Re+erencia reco,endada
Berlanga Silvente, V1, Rubio Hurtado, M1 J1, Vil Baos, R1 .%$"(/1 ;,o aplicar *rboles de
decisin en S:SS1 [5n lnea] R5=R5, Revista dC=nnovaci i Recerca en 5ducaci, D ."/, DEFG&1
<ccesible en! http!##HHH1 u b 1ed u #ice#reire1ht,
## >atos de las autoras
Vanesa Berlanga Silvente1 :ro+esora1 )niversidad de Barcelona1 >eparta,ento de
Mtodos de =nvestigacin - >iagnstico en 5ducacin .M=>5/1 berlanga1silventeIub1edu
Mara Jos Rubio Hurtado1 :ro+esora1 )niversidad de Barcelona1 >eparta,ento de
Mtodos de =nvestigacin - >iagnstico en 5ducacin .M=>5/1 ,ArubioIub1edu
Ruth Vil Baos1 :ro+esora1 )niversidad de Barcelona1 >eparta,ento de Mtodos de
=nvestigacin - >iagnstico en 5ducacin .M=>5/1 ru thJvila I u b1edu


"1 >nde ubica,os los *rboles de decisin
7os *rboles de decisin son una tcnica de ,inera de datos .>ata Mining, >M/ prepara, sondea
- e6plora los datos para sacar la in+or,acin oculta en ellos1 Se aborda la solucin a proble,as
de prediccin, clasi+icacin - seg,entacin1
7as tcnicas de la ,inera de datos provienen de la =nteligencia <rti+icial - de la
5stadstica1 >ichas tcnicas no son ,*s 0ue algorit,os, ,*s o ,enos so+isticados, 0ue se
aplican sobre un conAunto de datos para obtener unos resultados1 7as tcnicas ,*s
representativas son! redes neuronales, regresin lineal, *rboles de decisin, ,odelos estadsticos,
agrupa,iento o clustering
- reglas de asociacin1
7a clasi+icacin inicial de las tcnicas de ,inera de datos distingue entre tcnicas predictivas, en
las 0ue las variables pueden clasi+icarse en dependientes e independientesK tcnicas descriptivas,
en las 0ue todas las variables tienen el ,is,o estatus - tcnicas au6iliares, en las 0ue se reali8a
un an*lisis ,ultidi,ensional de datos1 5n la +igura " se ,uestra una clasi+icacin de las tcnicas
de ,inera de datos donde halla,os los *rboles de decisin .:re8 - Santn, %$$'/1
Figura "1 ;lasi+icacin de las tcnicas de >ata Mining .:re8 - Santn, %$$'/1

%1 )sos generales del an*lisis de *rboles de decisin
7os *rboles de decisin crean un ,odelo de clasi+icacin basado en diagra,as de +luAo1 ;lasi+ican
casos en grupos o pronostican valores de una variable dependiente .criterio/ basada en valores
de variables independientes .predictoras/1
7as ventaAas de un *rbol de decisin son .:re8, %$""/!
Facilita la interpretacin de la decisin adoptada1
Facilita la co,prensin del conoci,iento utili8ado en la to,a de decisiones1
56plica el co,porta,iento respecto a una deter,inada decisin1
Reduce el n@,ero de variables independientes1
:ara eAe,pli+icar de +or,a gr*+ica lo 0ue es un *rbol de decisin propone,os un sencillo
eAe,plo1 =,agine,os 0ue 0uere,os conocer 0u variables in+lu-en pri,ordial,ente a la hora
de aprobar el pri,er curso de =ngeniera 5lectrnica1 5s decir, 0uere,os conocer 0u estudiantes
,atriculados de pri,er curso de esta carrera tienen ,*s probabilidades de aprobar el conAunto
de las asignaturas, - 0u caractersticas est*n asociadas a este 6ito acad,ico1 5n este caso, la
variable de inters .V>/ es el rendi,iento acad,ico en el pri,er curso1 9ras introducir los datos
necesarios en el progra,a, ste nos devuelve un diagra,a 0ue nos per,ite co,probar 0ue la
satis+accin con la carrera - las horas de estudio diarias son las variables 0ue deter,inan
principal,ente el 6ito acad,ico de un estudiante1 <prueban, sobre todo, los estudiantes
satis+echos con la carrera 0ue cursan -, dentro de este grupo, los 0ue dedican ,*s horas
al estudio1 5s decir, si un estudiante de pri,er curso de =ngeniera 5lectrnica est* satis+echo con
la carrera - estudia ,*s de tres horas diarias, entonces tiene una probabilidad de aprobar
el
conAunto del pri,er curso del &(L1
Estudiantes de primer curso de Ingeniera Electrnica
Aprueban 65% Suspenden 45%
Satisfechos con la carrera
Aprueban 75% Suspenden 25%
No satisfechos con la carrera
Aprueban 40% Suspenden 60%
Estudian menos de tres horas diarias
Aprueban 45% Suspenden 55%
Estudian tres o ms horas diarias
Aprueban 93% Suspenden 7%
Figura %1 Brbol de clasi+icacin del rendi,iento acad,ico de estudiantes de pri,er curso de =ngeniera
5lectrnica .datos +icticios para uso did*ctico/1
7a ter,inologa asociada a la tcnica de los *rboles de decisin recurre a una ter,inologa
espec+ica, por lo 0ue considera,os interesante, antes de seguir adelante, clari+icarla1
2odo de decisin! 2odo 0ue indica 0ue una decisin necesita to,arse en ese punto del
proceso1 5st* representado por un cuadrado1
2odo de probabilidad! 2odo 0ue indica 0ue en ese punto del proceso ocurre un evento
aleatorio1 :robabilidades de 0ue ocurran los eventos posibles co,o resultado de las
decisiones1 5st* representado por un crculo1
2odo ter,inal! 2odo en el 0ue todos los casos tienen el ,is,o valor para la
variable dependiente1 5s un nodo ho,ogneo 0ue no re0uiere ninguna divisin adicional,
-a 0ue
es 3puro41
Ra,a! 2os ,uestra los distintos ca,inos 0ue se pueden e,prender cuando
to,a,os una decisin o bien ocurre alg@n evento aleatorio1 Resultados de las
posibles interacciones entre las alternativas de decisin - los eventos1
56isten cuatro ,todos de divisin para los *rboles cu-as caractersticas resu,i,os a
continuacin!
;H<=> .;hiFs0uare auto,atic interaction detector/! ;onsiste en un r*pido algorit,o de
*rbol estadstico - ,ultidireccional 0ue e6plora datos de +or,a r*pida - e+ica8, -
crea seg,entos - per+iles con respecto al resultado deseado1 :er,ite la deteccin
auto,*tica
de interacciones ,ediante ;hiFcuadrado1 5n cada paso, ;H<=> elige la
variable independiente .predictora/ 0ue presenta la interaccin ,*s +uerte con la
variable dependiente1 7as categoras de cada predictor se +unden si no son
signi+icativa,ente distintas respecto a la variable dependiente1
;H<=> e6haustivo! Supone una ,odi+icacin de ;H<=> 0ue e6a,ina todas las divisiones
posibles para cada predictor - trata todas las variables por igual, independiente,ente del
tipo - el n@,ero de categoras1
Brboles de clasi+icacin - regresin .;R9F;lassi+ication and regression trees/! ;onsiste en
un algorit,o de *rbol binario co,pleto 0ue hace particiones de los datos - genera
subconAuntos precisos - ho,ogneos1 ;R9 divide los datos en seg,entos para 0ue sean
lo ,*s ho,ogneos posible respecto a la variable dependiente1
?)5S9 .?uicM, unbiased, e++icient, statistical tree/! ;onsiste en un algorit,o
estadstico 0ue selecciona variables sin sesgo - crea *rboles binarios precisos de
+or,a r*pida - e+ica81 ;on cuatro algorit,os tene,os la posibilidad de probar
,todos di+erentes de creci,iento de los *rboles - encontrar el 0ue ,eAor se
adapte a nuestros datos1 5s un ,todo r*pido - 0ue evita el sesgo 0ue presentan
otros ,todos al +avorecer los predictores con ,uchas categoras1 Slo puede
especi+icarse ?)5S9 si la variable dependiente es no,inal1
5l pa0uete estadstico de S:SS per,ite las siguientes posibilidades en relacin con la tcnica de
los *rboles de decisin!
=denti+icar grupos, seg,entos - patrones de +or,a alta,ente visual1
Seleccionar entre di+erentes tipos de *rbol! ;H<=>, ;H<=> e6haustivo, ;R9 - ?)5S9,
seg@n el 0ue ,eAor se aAuste a nuestros datos1
:resentar resultados de +or,a intuitiva, lo 0ue +acilita la interpretacin para p@blicos sin
de,asiados conoci,ientos de estadstica1
Nuardar in+or,acin de los *rboles co,o nuevas variables en los datos1
=n+or,acin co,o el n@,ero de nodo de ter,inal, el valor pronosticado - las
probabilidades pronosticadas1
(1 ;rear un *rbol de decisin
:ara aco,paar la creacin de un pri,er *rbol de decisin - concretarlo en el progra,a S:SS,
propone,os el siguiente caso pr*ctico!
Se ha reali8ado una encuesta a (1E"" estudiantes de =ngeniera 5lectrnica de diversas
universidades catalanas con el obAetivo de identi+icar los +actores ,*s signi+icativos a la hora
de aprobar el pri,er curso de esta carrera universitaria1
5s i,portante 0ue antes de e,pe8ar revise,os!
7as escalas de ,edida asignadas a la ,atri8 de datos del S:SS, -a 0ue pueden a+ectar a la
creacin del *rbol, si no est*n bien de+inidas1
7a ,uestra! se aconseAa 0ue sea su+iciente,ente cuantiosa .evitar ,uestras con ,enos de
"1$$$ casos/1
7a seleccin del ,todo de creci,iento ,*s adecuado! ;H<=>, ;H<=> 56haustivo, ;R9 o
?)5S91
:ara eAecutar el an*lisis de *rbol de decisiones se seleccionan los ,en@s! <nali8arF;lasi+icarFBrbol1
Figura (1 ;uadro de di*logo *rbol de decisin en S:SS1
7a variable 0ue 0uere,os e6plicar, es decir, la variable dependiente es el rendi,iento acad,ico
de los estudiantes de pri,er curso de =ngeniera 5lectrnica, - co,o variables e6plicativas, esto
es, las variables independientes, selecciona,os algunas del total de variables de
tipo sociode,ogr*+ico incluidas en la encuesta, las consideradas ,*s probables1 5n nuestro
eAe,plo selecciona,os las siguientes variables! n@,ero de horas de estudio diarias, eleccin de la
carrera
en pri,era opcin, trabaAar - satis+accin con la carrera1
a
b
c
Figura O1 ;uadro de di*logo *rbol de decisin ;H<=> e6haustivo1
5l procedi,iento e6cluir* de +or,a auto,*tica cual0uier variable de las seleccionadas cu-a
contribucin al ,odelo +inal no sea signi+icativa1 5n este ,o,ento -a se puede eAecutar el
procedi,iento - generar un ,odelo de *rbol b*sico, pero va,os a ,odi+icar
algunos par*,etros 0ue pode,os seleccionar en los di+erentes botones del cuadro de di*logo
general de
la +igura O1
5n el botn ;ategoras se pueden especi+icar las categoras obAetivo de inters de la variable
dependiente1 Ha- 0ue tener en cuenta 0ue, si bien las categoras obAetivo no a+ectan al ,odelo
del *rbol propia,ente dicho, algunos resultados - opciones slo estar*n disponibles si se
han seleccionado categoras obAetivo1 5s decir, para variables dependientes categricas
.no,inales, ordinales/, se puede controlar 0u categoras se incluir*n en el an*lisis e identi+icar
las categoras obAeto de inters1
7a opcin pri,era variable +or8osa sirve para +or8ar 0ue la pri,era variable independiente de la
lista sea la pri,era 0ue apare8ca en la divisin del *rbol1 5sta opcin @nica,ente se
,arcar* cuando la investigacin as lo re0uiera1
5l desplegable ,todo de creci,iento per,ite seleccionar entre los cuatro e6istentes! ;H<=>,
;H<=> e6haustivo, ;R9 - ?)5S91 :ara este eAe,plo, utili8are,os el ,todo ;H<=> e6haustivo1
Resultados
:ulsando el botn de Resultados .en la +igura O ,arcado con 3a4/ se abre un cuadro de
di*logo con pestaas, en el 0ue se pueden seleccionar distintos tipos de opciones1
Figura E1 ;uadro de di*logo Resultados, pestaa *rbol1
7a pestaa *rbol per,ite controlar el aspecto inicial del *rbol o supri,ir co,pleta,ente su
presentacin1 :or de+ecto aparecen -a ,arcadas las siguientes opciones!
Prientacin1 5l *rbol se ,uestra de arriba abaAo, con el nodo ra8 situado en la parte
superior1 9a,bin se podra ,ostrar de i80uierda a derecha, o de derecha a
i80uierda1
;ontenidos de los nodos1 7os nodos pueden ,ostrar tablas, gr*+icos o a,bos1 :ara
variables dependientes categricas, las tablas ,uestran +recuencias - porcentaAes, - los
gr*+icos son diagra,as de barras1 :ara variables dependientes de escala, las tablas
,uestran ,edias, desviaciones tpicas, n@,ero de casos - valores
pronosticados, - los gr*+icos son histogra,as1 :or de+ecto, aparece la tabla, aun0ue
sugeri,os seleccionar *rbol en +or,ato de tabla - gr*+ico1 5sta opcin o+rece una
opcin gr*+ica ,u- clari+icadora del *rbol1
5scala1 :or de+ecto, los *rboles grandes se reducen de +or,a auto,*tica para
intentar aAustar el *rbol a la p*gina, pero se puede especi+icar un porcentaAe
de escala personali8ado de hasta el %$$L1
5stadsticos de las variables independientes1 :ara ;H<=> - ;H<=> e6haustivo,
los estadsticos inclu-en el valor F .para variables dependientes de escala/ o el
valor ;hiFcuadrado .para variables dependientes categricas/ as co,o el
valor de signi+icacin - los grados de libertad1 :ara ;R9, se ,uestra el valor de
,eAora1 :ara ?)5S9, se ,uestra el valor F, el valor de signi+icacin - los grados de
libertad para
las variables independientes ordinales - de escalaK por su parte, para las
variables independientes no,inales se ,uestra el valor
;hiFcuadrado, el valor de signi+icacin - los grados
de libertad1
>e+iniciones de los nodos1 7as de+iniciones de nodos ,uestran el valor o valores de
la variable independiente utili8ados en cada divisin de nodos1
5n la pestaa 5stadsticos las opciones disponibles dependen del nivel de ,edida de
la variable dependiente, del ,todo de creci,iento - de otros valores de con+iguracin1
:or de+ecto est*n seleccionadas las siguientes opciones!
Resu,en1 5l resu,en inclu-e el ,todo utili8ado, las variables incluidas en el
,odelo - las variables especi+icadas pero no incluidas en el ,odelo1
Riesgo1 5sti,acin del riesgo - su error tpico1 )na ,edida de la precisin
predictiva del *rbol1 :ara variables dependientes categricas, la esti,acin de
riesgo es la proporcin de casos clasi+icados incorrecta,ente despus de haber sido
corregido respecto a las probabilidades previas - los costes de clasi+icacin errnea1
:ara variables dependientes de escala, la esti,acin de riesgo corresponde a
la varian8a dentro del nodo1
9abla de clasi+icacin1 :ara variables dependientes categricas .no,inales,
ordinales/, esta tabla ,uestra el n@,ero de casos clasi+icados correcta e
incorrecta,ente para cada categora de la variable dependiente1 2o est* disponible
para variables dependientes escalares1
7a pestaa Reglas o+rece la capacidad de generar reglas de seleccin o
clasi+icacin#prediccin en +or,a de sinta6is de co,andos, S?7 o slo te6to .ingls
sin +or,ato/1 5stas reglas se pueden visuali8ar en el Visor -#o guardar en un archivo e6terno1
Validacin del ,odelo
5n el botn Validacin .en la +igura O ,arcado con 3b4/ pode,os validar el ,odelo1 7a
validacin per,ite evaluar la bondad de la estructura de *rbol cuando se generali8a para
una ,a-or poblacin1 56isten dos ,todos de validacin disponibles! la validacin cru8ada
- la validacin por divisin ,uestral1
7a validacin cru8ada divide la ,uestra en un n@,ero de sub,uestras -, a continuacin, se
generan los ,odelos de *rbol1
;on la validacin por divisin ,uestral, el ,odelo se genera utili8ando una ,uestra de
entrena,iento - despus pone a prueba ese ,odelo con una ,uestra de reserva1
Figura D1 ;uadro de di*logo validacin1
;riterios de creci,iento del *rbol
5l botn ;riterios .en la +igura O ,arcado con 3c4/ per,ite establecer los criterios de
creci,iento del *rbol1 :ara este eAe,plo, desea,os 0ue el *rbol sea lo ,*s sencillo posible,
as 0ue li,itare,os el creci,iento del *rbol elevando el n@,ero de casos ,ni,o para
nodos parentales - +iliales, tal co,o aparece por de+ecto en el progra,a1
7a pestaa 7,ites de creci,iento per,ite li,itar el n@,ero de niveles del *rbol - controlar
el n@,ero de casos ,ni,o para nodos parentales - +iliales1 Se pueden ,odi+icar algunos
de los siguientes par*,etros!
M*6i,a pro+undidad de *rbol1 ;ontrola el n@,ero ,*6i,o de niveles
de creci,iento por debaAo del nodo ra81 5l aAuste <uto,*tica li,ita el *rbol
a tres niveles por debaAo del nodo ra8 para los ,todos ;H<=> - ;H<=>
e6haustivo - a cinco niveles para los ,todos ;R9 - ?)5S91
2@,ero de casos ,ni,o1 ;ontrola el n@,ero de casos ,ni,o para los nodos1 7os
nodos 0ue no cu,plen estos criterios no se dividen1 5l au,ento de los
valores ,ni,os tiende a generar *rboles con ,enos nodos1 7a dis,inucin de
dichos valores ,ni,os generar* *rboles con ,*s nodos1 :ara archivos de
datos con un n@,ero pe0ueo de casos, es posible 0ue, en ocasiones, los valores
por de+ecto de
"$$ casos para nodos parentales - de E$ casos para nodos +iliales den co,o
resultado *rboles sin ning@n nodo por debaAo del nodo ra8K en este caso, la
dis,inucin de los valores ,ni,os podra generar resultados ,*s @tiles1
Figura G1 ;uadro de di*logo ;riterios, pestaa 7,ites de creci,iento1
:ara los ,todos ;H<=> - ;H<=> e6haustivo .pestaa ;H<=>/, puede controlarse el nivel
de signi+icacin para la divisin de nodos - la +usin de categoras1 :ara a,bos criterios, el
nivel de signi+icacin por de+ecto es igual a $,$E1
>ebe tenerse en cuenta 0ue, para variables dependientes ordinales, el valor de ;hiF
cuadrado para deter,inar la divisin de nodos - la +usin de categoras se calcula
,ediante el ,todo de la ra8n de verosi,ilitud1 :ara variables dependientes no,inales,
puede seleccionarse el ,todo :earson1
O1 ;,o interpretar los outputs
<l generar el *rbol obtene,os tres outputs en S:SS!
9abla 0ue proporciona in+or,acin acerca del ,odelo1
>iagra,a del *rbol1
7as variables de prediccin del ,odelo aadidas al conAunto de datos activo1
7a 9abla de resu,en del ,odelo proporciona in+or,acin general sobre las
especi+icaciones utili8adas para crear el ,odelo - sobre el ,odelo resultante1 7a seccin
5speci+icaciones o+rece in+or,acin sobre los valores de con+iguracin utili8ados para generar
el ,odelo de *rbol, incluidas las variables utili8adas en el an*lisis1 7a seccin Resultados ,uestra
in+or,acin sobre el n@,ero de nodos totales - ter,inales, la pro+undidad del *rbol .n@,ero
de niveles por debaAo
del nodo ra8/ - las variables independientes incluidas en el ,odelo +inal1
Figura '1 9abla Resu,en del ,odelo11
5l >iagra,a de *rbol obtenido es una representacin gr*+ica del ,odelo del *rbol1 5n el
eAe,plo, todas las variables son tratadas co,o no,inales - cada nodo contiene una tabla
de +recuencias 0ue ,uestra el n@,ero de casos .+recuencia - porcentaAe/ para cada categora de
la variable dependiente1 9a,bin inclu-e el gr*+ico de +recuencias1
7a categora 3pronosticada4, 0ue es la categora con el ,a-or valor de +recuencia en cada nodo,
aparece resaltada con una +ranAa gris1
Figura &1 >iagra,a del *rbol para el ,odelo de 6ito acad,ico en el pri,er curso de =ngeniera
5lectrnica1
;,o e,pe8ar a interpretar el *rbol de decisin!
"1 5n pri,er lugar, nos +iAa,os en el nodo $ 0ue describe la variable dependiente! porcentaAe de
los estudiantes 0ue suspenden - de los 0ue aprueban1
%1 Seguida,ente observa,os 0ue la variable dependiente se ra,i+ica en dos nodos! 2odo " - %
pertenecientes a la variable Satis+accin con la carrera, indicando 0ue sta es la variable principal
predictora1
(1 < continuacin, debe,os +iAarnos en el 2odo ", -a 0ue su ;hiF;uadrado es superior a la del
2odo %1 <de,*s, nos interesa conocer el per+il de los estudiantes 0ue aprueban, por ser nuestro
obAetivo de investigacin1 5l 2odo " nos indica 0ue del EE1&L de los 0ue est*n satis+echos con
su carrera, el DGL aprueban1
O1 5l 2odo " se vuelve a ra,i+icar en los 2odos ( - O pertenecientes a la variable Horas
de estudio1 Pbserva,os en el 2odo O 0ue aprueban ,*s los estudiantes 0ue dedican ,*s de
tres horas diarias al estudio, con un GO1DL, +rente a un E"1OL del 2odo ( 0ue aprueban
estudiando ,enos de tres horas diarias1
E1 5l 2odo O se ra,i+ica en los nodos & - "$, pertenecientes a la variable Si trabaAa o no1 Q a0u
observa,os 0ue un &%1&L de los estudiantes 0ue no trabaAan aprueban1
D1 :or tanto, a ,odo resu,en, los nodos 0ue de+inen el per+il de los estudiantes 0ue aprueban
.variables 0ue in+lu-en en <probar/ son! 2odo $ F2odo " F 2odo O F 2odo "$1 5s decir, in+lu-en
las siguientes variables! Rendi,iento acad,ico F Satis+accin con la carrera F 2@,ero de horas
de estudio F Si trabaAa o no1
<lgunas conclusiones posibles del *rbol de la +igura "$, son!
7a variable Satis+accin con la carrera es el ,eAor predictor para el Rendi,iento
acad,ico del pri,er curso, con dos categoras! aprobar - suspender1
7a probabilidad ,*s alta de aprobar .&%1&L/ se da entre los estudiantes 0ue se sienten
satis+echos con la carrera, estudian ,*s de tres horas diarias - no trabaAan .tal
co,o he,os sealado en el crculo de la +igura &/1
7a probabilidad ,*s baAa de aprobar .%$1GL/ se da entre los estudiantes 0ue no est*n
satis+echos con la carrera - 0ue dedican ,enos de tres horas diarias al estudio1 Si estos
alu,nos estudian ,*s de tres horas diarias - ade,*s no trabaAan, la probabilidad
de aprobar au,enta hasta el '%1(L1
5ntre los estudiantes 0ue est*n satis+echos con la carrera, los 0ue estudian ,enos de tres
horas - no han escogido la carrera co,o pri,era opcin slo tienen el O"1(L de
probabilidad de aprobar1
:ara +inali8ar, las variables de prediccin del ,odelo aparecen en las tablas de riesgo - de
clasi+icacin, - proporcionan una r*pida evaluacin de la bondad del +unciona,iento del
,odelo, tal - co,o se observa en la +igura "$1
Figura "$1 9ablas de riesgo - clasi+icacin del *rbol de decisin1
:ara la interpretacin de estas tablas debe,os considerar 0ue los resultados en la tabla de
clasi+icacin son coherentes con la esti,acin de riesgo1 7a tabla ,uestra 0ue el ,odelo clasi+ica
de +or,a correcta, apro6i,ada,ente, al D&1(L de los individuos en general1 >e +or,a espec+ica
para cada categora de la variable dependiente o+rece un 3acierto4 ligera,ente ,*s elevado en
el caso de la categora 3aprobar4, con un D&1DL1
RRe+erencias bibliogr*+icasS
Hern*nde8, J1K Ra,re8, M1J1 - Ferri, ;1 .%$$O/1 =ntroduccin a la ,inera de datos1 Madrid! :earson
educacin1
7ind, >1<K Marchal, T1N1 - Tathen, S1<1 .%$"%/1 5stadstica aplicada a los negocios - la econo,a1
M6ico >1F1! M;NraH Hill1
:re8, ;1 .%$""/1 9cnicas de seg,entacin1 ;onceptos, herra,ientas - aplicaciones1 Madrid! Naceta
Nrupo 5ditorial1
:re8, ;1 .%$$O/1 9cnicas de an*lisis ,ultivariante de datos1 <plicaciones con S:SS1 Madrid! :earson
educacin1
:re8, ;1 - Santn, >1 .%$$G/1 Minera de >atos! 9cnicas - Herra,ientas1 Madrid! 5diciones
:aranin+o, S1<1
Silberschat8, <1 .%$$G/1 Funda,entos de diseo de bases de datos .EU ed1/1 Madrid! McgraHFhill#
=ntera,ericana de 5spaa, S1<1
9orrado, M1 .%$""/1 Minera de datos aplicados a la educacin1 ;onsultado el " de octubre de
%$"%, en >epsito digital de la )B http!##hdl1ha n dle1net#%O O E#"&' D %
Valderre-, :1 .%$"$/1 9cnicas de seg,entacin de ,ercados1 Madrid! StarbooM editorial1
Vil, R1 - Bis0uerra, R1 .%$$O/1 5l an*lisis cuantitativo de los datos1 Bis0uerra, R1 .coord/1
Metodologa de la investigacin educativa .pp1 %E&F%GO/1 Madrid! 7a Muralla1
Vil, R1 .%$"%/1 <rbres de decisi a,b S:SS1 ;onsultado el " de octubre de %$"%, en >epsito digital de la
)B! http!## h dl1handle1net#%OO E #%% % ' % 1

Anda mungkin juga menyukai