Anda di halaman 1dari 28

Investigación en la Educación Superior, Vol. 43, No.

2,de abril de de 2002(©2002)

REDES NEURONALES ARTIFICIALES:


Un nuevo enfoque para la predicción del
comportamiento de aplicaciones

Julie M. Byers González y StephenL.DesJardins

···················································································································································
···· ·
En este artículo examinamos cómo el modelo predictivo puede ser utilizado para
estudiar el comportamiento de la aplicación. Aplicamos una técnica relativamente
nueva, las redes neuronales artificiales, para ayudar a predecir el cual los
estudiantes son susceptibles de aplicarse a una gran institución de investigación I,
en el oeste del medio. Comparamos los resultados de estas nuevas técnicas a la
herramienta de análisis tradicional, un modelo de regresión logística. La adición de
modelos de inteligencia artificial es una emocionante área nueva y este artículo
alienta a otros investigadores institucionales para utilizar esta técnica para explorar
los complejos procesos que se encuentran en nuestras instituciones educativas.

PALABRAS CLAVE:redes neuronales artificiales; análisis de regresión logística; solicitud


de la universidad comportamiento.

INTRODUCCIÓN
La investigación sobre la elección de la universidad se ha basado
principalmente en los modelos económicos, socio lógicos y combinados (Kohn,
Manski y Mundel, 1976; Litten, 1982). Los modelos econométricos presumen
que los estudiantes tienen como objetivo maximizar su utilidad o ex sospecha
vienen del beneficio de su elección de la institución (Bruggink y Gambhir,
1996; Ganderton, 1992; Hossler, Braxton y Coopersmith, 1989; Paulsen, 1990;
Welki y Navratil, 1987). Por otra parte, estos modelos asumen que los
estudiantes tengan conocimiento de las características, costos y beneficios de
los colegios, y se comportarán de una manera que tiende a maximizar los
beneficios (Hamrick y Hossler, 1996). modelos sociológicos de logro o de
estado se centran en las aspiraciones de la universidad. Estos modelos se
derivan de la literatura consecución estado general que se centra en la
identificación y la interrelación de los factores y características que influyen en
aspiraciones universitarias (Hossler et al, 1989;. McDonough, 1994; Paulsen,
1990). modelos combinados, por el contrario, se deducen de ambos
econométrico y modelos sociológicos. Estos modelos pretenden dar cuenta de
las diversas fuerzas económicas y sociales que influyen en la toma de
decisiones.
Si bien existe una amplia literatura de la elección de la universidad, hay una
necesidad de más del edificio ORY y la investigación empírica adicional con el
ThisEl contenido descargado desde el mar 190.234.181.161,20 Nov 2018 16:11:20
GMT Todas uSE sujetohttps: //about.jstor.org/terms
fin de comprender mejor el complejo proceso de elección de la universidad. La
investigación adicional es especialmente necesario en el área de
comportamiento de la aplicación del estudiante debido a que la literatura de la
elección de la universidad se ha centrado generalmente en las decisiones de
inscripción de los estudiantes (Manski y Wise, 1983). Pocos estudios han
examinado el comportamiento de solicitud de la universidad (para las
excepciones, véase Weiler, 1994; DesJardins, Dundar, y Hendel, 1999; y
Goyette, 1999).
Este estudio ayuda a hacer frente a la relativa escasez de investigaciones en
esta área mediante la utilización de técnicas de redes neuronales artificiales
(ANN) para predecir el comportamiento de apli cación de la universidad en una
institución de investigación I en Iowa. También comparamos cómo los
resultados del modelo de ANN en comparación con los métodos estadísticos
tradicionales que se utilizan para estudiar el comportamiento de solicitud de
estudiante. También documentamos cómo los modelos de predicción
contribuyó a los esfuerzos de reclutamiento institucionales a la institución de
estudio. Las redes neuronales artificiales se han utilizado en los esfuerzos de
gestión de la matrícula en algunas instituciones de educación superior (ver
Carlson, 2000, para más detalles), pero los resultados de estos esfuerzos no han
sido presentados en el dominio público. No sabemos de ningún otro estudio
publicado que utiliza el modelado de redes neuronales artificiales como el
principal instrumento de análisis para investigar el comportamiento de solicitud
de estudiante.

REVISIÓN DE LITERATURA
Estudiante de elección Literatura
Litten (1982) retrata el proceso de elección de la universidad como un
embudo que se divide en tres etapas. antecedentes sociológicos y las
características personales comprenden la primera etapa, mientras que las
variables institucionales y económicos son importantes durante la segunda y
tercera etapas del modelo (Bateman y Spruill, 1996). El enfoque de embudo
presume que la elección de la universidad implica un proceso de eliminación
por el cual la decisión final para inscribirse en una institución en particular es el
resultado de un proceso secuencial. Litten determinó que las características de
la escuela secundaria, el rendimiento del estudiante, y el currículo de la escuela
secundaria tienden a afectar a las aspiraciones de los estudiantes para asistir a
una universidad en particular. Por otra parte, el nivel socioeconómico, ticas de
carácter personal, y el clima económico, político y cultural también afectan a la
propensión de un estudiante asista a una institución específica.

ThisEl contenido descargado desde el mar 190.234.181.161,20 Nov 2018 16:11:20


GMT Todas uSE sujetohttps: //about.jstor.org/terms
REDES NEURONALES ARTIFICIALES 237

En Hossler y (1987) Tres modelo de desarrollo de la Fase de Gallagher, la


primera etapa de elección de la universidad se conoce como la etapa de
predisposición. La etapa ción predisposi implica el desarrollo de las
aspiraciones educativas, y es en esta etapa que los procesos de toma de
decisiones de los estudiantes comienzan a tomar forma. Si bien el proceso de
toma de decisiones de los estudiantes durante la fase de predisposición no se
entiende bien, la investigación demuestra una relación positiva entre la calidad
del plan de estudios de la escuela secundaria y la universidad de matrícula
eventual (Hearn, 1984; Kol stad, 1979). La segunda etapa se conoce como la
etapa de búsqueda. En esta etapa los estudiantes Búsqueda de una institución y
las instituciones apropiadas búsqueda de la forma apropiada solicitante. La
comprensión de los procesos de toma de decisiones de los estudiantes en la
predisposición ybuscaretapas pueden resultar fundamental para entender por
qué algunos estudiantes deciden aplicar y, finalmente, inscribirse en una
universidad en particular. El finalescenarioes la etapa de selección de
universidad, donde los estudiantes evalúan las instituciones en su"elecciónset"
y elegir uno para inscribirse en.

Factores de influencia para la universidad


El tiempo y la información precisa es especialmente importante durante el
proceso de apli cación. Si bien la información puede provenir de una variedad
de fuentes, los padres son la fuente más influyente (Chapman, 1981). Los
padres que han completado una educación superior serán más capaces de dar a
sus hijos un buen consejo, y esta relación es especialmente importante ya que
los niños normalmente de Pend de sus padres para orientación y apoyo. La
mayor accesibilidad al capital social y la información fiable y recursos tiende a
orientar de manera más efectiva a los estudiantes a través del proceso de
solicitud de la universidad. McLanahan y Sandefur (1994) señalan que las
familias intactas proporcionan el capital social necesario para que los
estudiantes se aplican de manera más eficaz a la universidad, mientras que las
familias rotas a menudo carecen de este tipo de apoyo.
Los niveles más altos de nivel socioeconómico permiten comúnmente
familias para suministrar mejores recursos materiales a sus hijos en la forma de
llevar a cabo búsquedas de universidades más Sophis ticated, la recogida de
información sobre pro cedimientos uso de la universidad, y la disponibilidad de
los recursos financieros para el ACT o SAT clases de preparación. Hay algunas
diferencias importantes en las prácticas de aplicación de abolladuras Stu de
diferentes niveles socioeconómicos. Por ejemplo, McDonough (1994) observó
que los estudiantes de niveles socioeconómicos superiores presentaron una tura
av de l 0 aplicaciones, mientras que los alumnos de orígenes socioeconómicos
más bajos presentaron un promedio de 2 a 3 aplicaciones. Una de las razones
para las tasas de aplicación más bajas entre los estudiantes de los niveles
socioeconómicos más bajos puede ser la tasa de solicitud, que puede variar
considerablemente de una institución a otra. Solicitud

ThisEl contenido descargado desde el mar 190.234.181.161,20 Nov 2018 16:11:20


GMT Todas uSE sujetohttps: //about.jstor.org/terms
238 GONZALEZ Y DESJARDINS

las tasas utilizadas en un rango de $ 15 a $ 50 (McDonough, 1994), pero en los


últimos años estas tasas han aumentado. Por ejemplo, las tasas de solicitud de
graduación en la Big Ten ahora van desde $ 30 en Iowa a $ 100 en Michigan.
Sin embargo, hay que señalar que las instituciones con frecuencia renuncian a
las tasas de solicitud para estudiantes de niveles socioeconómicos más bajos.
La investigación también indica que la gente consulte la información de
individu als, de niveles socioeconómicos comparables (Stanton-Salazar y
Dornbusch, 1995). Stanton-Salazar y Dornbusch sostienen que cuanto mayor
sea el fondo nómica socioeco de la persona que proporcione la información con
respecto a la columna elección lege, mayores serán las probabilidades son de
que la información sea fiable, la tasa de ACCU, y pertinente. Por estas razones,
los estudiantes de los niveles socioeconómicos más altos son propensos a
recibir una información más adecuada con respecto a los procedimientos de
aplicación de la universidad que sus contrapartes más bajos SES.
El nivel educativo de los padres de uno también se relaciona positivamente
con las expectativas educativas de un estudiante (Goyette, 1999). Goyette
conjetura que las expectativas de educación superior pueden explicar las tasas
de aplicación de la universidad más altas entre los grupos americanos asiáticos.
Con respecto a los esfuerzos de reclutamiento institucionales, Freeman
(1984) encontró que las acciones, como invitar a los estudiantes a un banquete,
cartas personales del presidente de la universidad, o certificados especiales
fueron influyentes durante la fase de elección para todos los tipos de
estudiantes. La investigación también indica que los pro cedimientos de cortejo
basada no ayuda, tales como visitas a los campus, son altamente efectivos
(Freeman, 1984). Por ejemplo, aproximadamente el 40% de las personas
mayores que hacen que una visita al campus, finalmente, se aplica a dicha
institución (Dehne, 1994).
Sin embargo, muchas instituciones siguen siendo inciertas que las actividades
de marketing y reclutamiento realmente funcionan (DesJardins et al., 1999). Por
otra parte, la universidad elección tura Litera no es completa, especialmente en
relación con el análisis de los factores que influyen en la elección del estudiante
ing en diferentes tipos de instituciones. Además, muchas instituciones carecen
de información sobre los factores que afectan la elección propensiones
universitarios futuros estudiantes (DesJardins et al., 1999). Además, una
variedad de temas como el cambio de patrones demográficos, el aumento de las
solicitudes de estudiantes, y un mercado de Stu dent compradores sugieren que
necesitamos reexaminar solicitud de la universidad sea comporta-.

Problemas actuales en la literatura para la universidad


Las investigaciones indican que los años 1980 y 1990 fue un período en el
que el núm ero de los graduados de secundaria estaba por debajo de las
tendencias históricas. De 1981 a 1986, el número de graduados de secundaria se
redujo 14% en toda la nación (Bryant y Crockett, 1993; Melia y Goodman,
1988; Rainsford, 1985). Esta tendencia fue seguido por una disminución
adicional de 200.000 graduados de secundaria por 1992 (Bryant y Crockett,
1993; Melia y Goodman, 1988; Rainsford, 1985). Si bien la década de 1990 fue
un período de relativamente pocos graduados de secundaria, colegios

ThisEl contenido descargado desde el mar 190.234.181.161,20 Nov 2018 16:11:20


GMT Todas uSE sujetohttps: //about.jstor.org/terms
REDES NEURONALES ARTIFICIALES 239

y universidades, irónicamente encuentran por encima de las aplicaciones de


medios (McDonough, 1994) porque los estudiantes tendían a presentar más
solicitudes que en el pasado (Dey, Astin, y Korn, 1991). Esto también puede
complicar nuestra comprensión del proceso de elección de la universidad
debido a un aumento de las solicitudes de estudiantes no necesariamente se
traduce en un aumento de la matrícula. Por lo tanto, un aumento en el número
de candidatos no puede ser un buen predictor de futuras inscripciones (Sanoff,
1994).
perspectivas universitarios de hoy también se inclinan a aplicarse a las
instituciones de mayor prestigio (Shea, 1994) y es probable que pagar los
depósitos de matrícula en varias instituciones(Hossler,Schmit, y Vesper, 1999).
estudiantes de alta capacidad, que son cada vez más el foco de muchos
esfuerzos de reclutamiento institucionales, es probable que se aplican a e
investigar un mayor número de colegios y universidades (Galotti y Mark, 1994)
y tienen una mayor propensión a realizar búsquedas más eficientes y mejor
refinados ( lhlanfeldt, 1980; Litten, Sullivan, y Brodigan, 1983). abolladuras
Stu también comienzan el proceso de búsqueda de la universidad mucho antes.
En 1975, Lewis y Morrison determinaron que sólo el 10% de los estudiantes de
secundaria empezó a preguntar acerca de información de la universidad durante
octubre del último año (citado en Hossler et al., 1989). En 1998, Hossler,
Schmidt, y Vesper encontraron que los estudiantes ahora comienzan el proceso
de búsqueda a finales de la primavera o el verano entre su penúltimo o último
año.
Para el año 2007, se prevé que el número de graduados de secundaria para
aumentar a nivel nacional (Almanaque, 1997). A medida que el número de
graduados de la escuela secundaria aumento, estos graduados traerán nuevos y
distintos desafíos para las instituciones de educación superior (Sevier, 1992).
En general, esta población de estudiantes será más urbano, de menor
SESestado,y compuesta de una población minoritaria más grande. Como
resultado, las tasas de participación de la universidad es probable que caigan.
Todos estos cambios sugieren que la población universitaria pectiva Pro ha
cambiado drásticamente en los últimos años. Por lo tanto, el comportamiento
de la aplicación pre dicting basado en modelos desarrollados en los datos
históricos puede ser sospechoso. Por lo tanto, tenemos que perfeccionar
nuestros modelos que se construyeron en las cohortes anteriores, ya que estos
modelos se montan en diferentes poblaciones estudiantiles.

MÉTODO
Marco analítico
Para ayudar en el desarrollo de nueva información sobre la elección del
estudiante se compara la eficacia de dos técnicas analíticas para predecir el
comportamiento del estudiante aplica ción: redes neuronales artificiales y
análisis de regresión logística. ANN investigación ha sido utilizada
principalmente por los ingenieros, estadísticos, matemáticos y psicólogos
cognitivos, pero ha sido virtualmente inexplorada como una herramienta para
ayudar a los investigadores educativos.
La estructura del RNA se basan en cómo funciona el cerebro humano. los
ThisEl contenido descargado desde el mar 190.234.181.161,20 Nov 2018 16:11:20
GMT Todas uSE sujetohttps: //about.jstor.org/terms
240 GONZALEZ Y DESJARDINS

las células en el cerebro humano proveen a los humanos con la capacidad de pensar,
razonar y aplicar experiencias previas a la acción humana. La capacidad del cerebro
para aprender es una función de la cantidad de neuronas en el cerebro y las
diferentes conexiones entre las neuronas. Dentro del cerebro humano, las neuronas
tienen cuatro nentes básicos compo: dendritas, soma, axón, y las sinapsis (véase la
figural).Dentro de una neurona biológica, dendritas reciben entradas desde el
ambiente externo, las cesos soma pro las entradas recibidas, y un axón convierte las
entradas procesadas en una salida. La sinapsis continuación, crea un contacto
electroquímico de una neurona a otra.Silas cargas eléctricas enviadas por los
receptores de lograr un nivel de edad Thresh particular, el núcleo de las neuronas
envía señales a otras áreas (por ejemplo, músculos) dentro del cuerpo humano. Los
niveles de umbral exactos necesarios para desencadenar cada neurona pueden ser
previamente atados al nacer o aprendidas a lo largo de los años.EsoEs este proceso
biológico de aprendizaje que imitan modelos de RNA.
neuronas artificiales (véase la Figura 2) simulan los cuatro componentes básicos
de la neurona biológica, sin embargo, las neuronas artificiales son mucho más
simplista que las neuronas lógicas bio. Al igual que en el cerebro humano, una red
neuronal aprende a resolver problemas a través de la experiencia. Dentro de la
arquitectura ANN, las neuronas (nodos) se dividen en tres capas: una capa de
entrada, una capa oculta, y una capa de salida. En la nomenclatura estadística cional
Tradi, la capa de entrada es similar a los Ables vari independientes que incluimos en
regresiones, y la capa de salida es el resultado o variable dent Depen. Las capas
ocultas consisten en una variedad de neuronas que están conectadas a las neuronas
vecinas por pesos. Estos pesos actúan como coeficientes en modelos de regresión.
(De hecho, Kuan y White [1994] demostraron que los modelos de regresión lineal,
logístico y probit son casos especiales de RNAs.

Synapse

axón

Soma

• dendrita -l
¢
HIGO. 1.Cuatro componentes básicos de una neurona biológica humana.

ThisEl contenido descargado desde el mar 190.234.181.161,20 Nov 2018 16:11:20


GMT Todas uSE sujetohttps: //about.jstor.org/terms
REDES NEURONALES ARTIFICIALES 241

Suma Límite
dendritas

axón

HIGO. 2. Los componentes de una neurona artificial básica.

una neurona artificial las entradas se procesan (resume) dentro del cuerpo de la
célula. Si la suma supera el valor umbral, la neurona envía un impulso al axón
(matrices de peso).
Los pesos se establecen inicialmente a un pequeño número aleatorio, y como
los datos son alimentados al modelo de los pesos se ajustan usando un método
de retroalimentación (véase la Figura 3). El método de retroalimentación más
común se conoce como propagación hacia atrás (Rumelhart, Hin tonelada, y
Williams, 1986). La diferencia entre los UE val predichos y reales (de error) se
alimenta de nuevo (de nuevo propaga) en la red, y este proceso continúa una
capa a la vez hasta que el error se reduce al mínimo a un nivel preespecificado o
el modelo se detiene por el investigador. Este proceso permite la detección de
tendencias y patrones en los datos que normalmente pasarían por descubrir.
Una vez capacitados, la red se puede suministrar datos y clasificaciones o
predicciones nuevas o no entrenados pueden hacer. Más específicamente, el
tipo de clasificación ANN

. .Spren.ddeActivación

: ·,,.,Deseado
· · · · ·Salida
Respuesta
·:computariz
ada·Error

.Entrada. .
lAyer·.
4111
Error Fed hacia atrás en ANN

HIGO. 3. El encadenamiento de las operaciones de


propagación hacia atrás.

ThisEl contenido descargado desde el mar 190.234.181.161,20 Nov 2018 16:11:20


GMT Todas uSE sujetohttps: //about.jstor.org/terms
242 GONZALEZ Y DESJARDINS

utilizado en este estudio es el perceptrón multicapa (MLP). Un MLP contiene


esti acoplado pesos entre las entradas y la capa oculta, y la capa oculta se aplica
una función de activación lineal. MLP son capas redes de alimentación directa
y son comúnmente capacitados a través de propagación hacia atrás. (Para un
tratamiento relativamente no técnico de la teoría ANN y aplicación ver Garson,
1998.)

Las muestras
Los datos para este estudio se obtuvo de la oficina de admisiones de una gran
institución que busco Re se encuentra en Iowa. Se utilizaron dos cohortes de
información, cada una compuesta de aproximadamente 20.000 registros. Las
cohortes se definen como todos los estudiantes que enviaron ACT a la
institución de estudio que estaban interesados en la solicitud de admisión para
el otoño de 1998 y otoño de 1999 clases de entrar. Utilizamos los remitentes de
puntuación como el grupo potencial de los estudiantes universitarios curso en
lugar de los graduados de secundaria, porque sentimos que el primero es más
un reflejo de la piscina real de las perspectivas de la universidad.
Los datos para este estudio se obtuvo de la base de datos de la admisión de
que con tains una gran cantidad de información que incluye respuestas de los
estudiantes a la sección del perfil del estudiante de la Evaluación ACT. Las
variables independientes (que se enumeran en la Tabla 1) fueron elegidos en
base a la investigación previa del comportamiento de la aplicación del
estudiante y el borde Conocimiento acerca de los factores específicos de la
institución. La medida dependiente o salida utilizada en este estudio es un
indicador de si un estudiante aplicado (1) o no se aplicaba
(0) a la institución de estudio. El principal objetivo fue probar la ANN y la
precisión predictiva modelos de regresión logística y utilizar los resultados para
proporcionar infor mación sobre las propensiones de aplicación del estudiante a
reclutadores institucionales.

RESULTADOS DE LA ANN y modelos logísticos


La estrategia analítica general utilizado fue estimar modelo (tren) la logística
(ANN), utilizando el conjunto de datos 1999, y luego probar la exactitud
predictiva de cada uno de estos modelos en los datos de 1998. El modelo de
RNA entrenada fue diseñado para ser utilizado para predecir el comportamiento
de la aplicación de los remitentes de puntuación posteriores, por lo tanto, se
utilizó la cohorte más reciente de los remitentes de puntuación (1,999 archivo)
que la muestra de desarrollar mentales. En términos estadísticos tradicionales,
los datos de 1999 es la muestra mentales se desarrollan y los datos de 1998 es la
validación (o, a veces conocida como la "retención") de la muestra. En ANN
éstos se llaman formación y las pruebas conjuntos de datos, respectivamente.
Los modelos de RNA se estimaron utilizando SPSS Clementine versión de
software 5.21, y el modelo de regresión logística se ajustaron con el programa
SPSS versión 9. El

ThisEl contenido descargado desde el mar 190.234.181.161,20 Nov 2018 16:11:20


GMT Todas uSE sujetohttps: //about.jstor.org/terms
REDES NEURONALES ARTIFICIALES 243

TABLA 1. Definición de las variables explicativas

Nombre de la Definición
variable

Variables demograficas
Género
Mujer Raza / Etnia Un maniquí (= I) si elestudiantees mujer
Native American Indian
Hispano Afroamericano Un maniquí (= I) si nativos americanos / nativos de
asiático Alaska Un maniquí (= I) si afroamericano
americanomultirracia Un maniquí (= I) si hispana
l caucásica Un maniquí(= I)Si asiáticaoIslas del
Pacífico Un maniquí (= I) si multirracial
Grupo de referencia.Un maniquí (= I) si el estudiante
Ingresos familiares es de raza blanca, había falta de datos, o prefiere
Top Ingresos por no responder
cuartiles
Un maniquí (= I) si el ingreso familiar es de $ 80.000
Segundo cuartil Tercer $ 100.000
Ingresos Ingresos
Un maniquí (= I) si el ingreso familiar es de $
cuartil de ingresos que
60,000 a $ 80,000 al ficticia (= I) si la
falta
familiaingresoses $ 42,000- $ 60,000 al ficticia (= I)
Inferior cuartil de
los ingresos familiares no se encuentra
ingresos
Grupo de referencia.Un maniquí (= I) si el ingreso
<$ 42.000
Tamaño comunidad
Fann
Grupo de referencia.Un maniquí (= I) si de una granja
Menos de 500
Un maniquí (= I) si el tamaño de la comunidad es
de menos de 500 personas
500-1,999
Un maniquí (= I) si el tamaño de la comunidad 500-
2,000-9,999
1,999
10,000-49,999
Un maniquí (= I) si comunidadtamaño2,000-9,999
50,000-249,999
Un maniquí (= I) si el tamaño de la comunidad
250,000-499,999
I0,000-49,999 Un maniquí (= I) si el tamaño de la
500,000-999,999
comunidad 50,000-249,999
Un millón o más
Un maniquí (= I) si comunidadtamaño250,000-
499,999 Un maniquí (= I) si el tamaño de la
Missing Comunidad
comunidad 500,000-999,999 Un maniquí (= I) si
Las variables de la escuela comunidadtamañoun millón o
secundaria Más
Hecho compuesto por Un maniquí (= I) si el tamaño de la comunidad no se
cuartiles de los cuartiles encuentra
inferior ACT

Tercer acto por


cuartiles segundo acto Grupo de referencia.Un maniquí (= I), si ACT del
cuartil superior cuartil estudiante es 0-19
ACT Un maniquí (= I), si ACT del estudiante es 20-23 Un
maniquí (= I), siestudiante deACT compuesto 24-26
Un maniquí (= I), si ACT del estudiante compuesta
27-36

ThisEl contenido descargado desde el mar 190.234.181.161,20 Nov 2018 16:11:20


GMT Todas uSE sujetohttps: //about.jstor.org/terms
244 GONZALEZ Y DESJARDINS

TABLA 1.(Continuación)

Nombre de la variable Definición

GPA de la Escuela
GPA Un maniquí (= I) si el estudiante SA GPA era A o B
SA Curso de
Trabajo Inglés Un maniquí (= I) si el estudiante tenía 4 años de
Mates Inglés Un maniquí (= I) si el estudiante tenía 3
Estudios Sociales años de matemáticas
Un maniquí (= I) si el estudiante tenía 2 años de
Ciencias Naturales estudios sociales
Un maniquí (= I) si el estudiante tenía 3 años de
español Natural
alemánf Ciencias
rancés Un maniquí (= I) si el estudiante tenía 2 años de
Escuela secundaria Tipo español Un maniquí (= I) si el estudiante tenía 2
Catholic High School años de alemán Un maniquí (= I) si el estudiante
Graduarse del tamaño tenía 2 años de Francés
de clase Menos de
25 Un maniquí (= I) si el estudiante asistió a una SA
Católica
25-99
Grupo de referencia.Siclase contenida SA <25
100-199 estudiantes
200-399 Un maniquí (= I) si la esteatosis graduarse tamaño
400-599 de la clase 25-99 estudiantes
600-899 Un maniquí (= I) si SA graduarse tamaño de la clase
900 o más 100-199 Un maniquí (= I) si SA graduarse tamaño
de la clase 200-399 Un maniquí (= I) si SA
Los solicitantes de Alto
graduarse tamaño de la clase 400-599 Un maniquí
Rendimiento Alto
(= I) si SA graduarse tamaño de la clase 600-899 Un
Rendimiento
maniquí (= l) si SA graduarse tamaño de la clase
Secundaria
900+
estudiantes
Variables de preferencia
universidad Un maniquí (= I) si el estudiante es de una SA con una
Distancia de la Institución relación cal histori de los solicitantes para poner a
menos de lo que 0 prueba los remitentes de puntuación> = .75
millas

10-25 millas
26-100 millas Grupo de referencia.Un maniquí (= I) si la residencia
Mas queJOOmillas Otro hogar del estudiante es menor de diez millas de la
institución
Matrícula (No incluye Un maniquí (= I) si la distancia es IO a 15 millas
habitaciónytablero) Un maniquí (= I) si la distancia es 26 a 100 millas
$ 500 Un maniquí (= l) si la distancia es más de 100
$ 1.000 millas de un maniquí (= I) si la distancia faltante /
no he decidido las
Universidad

ThisEl contenido descargado desde el mar 190.234.181.161,20 Nov 2018 16:11:20


GMT Todas uSE sujetohttps: //about.jstor.org/terms
Un maniquí (= l) si
espera la matrícula anual
de $ 500. Un maniquí (=
l) si espera matrícula
anual $ 1,000

ThisEl contenido descargado desde el mar 190.234.181.161,20 Nov 2018 16:11:20


GMT Todas uSE sujetohttps: //about.jstor.org/terms
REDES NEURONALES ARTIFICIALES 245

MESA1.(Continuación)

Nombre de la variable Definición

$ 2.000 Un maniquí (= I) si se espera que la matrícula anual


$ 3.000 de $ 2,000
Grupo de referencia. Un maniquí (= l) si se espera
$ 4.000 que la matrícula anual de $ 3,000
$ 5.000 Un maniquí (= l) si se espera que la matrícula anual de
$ 7.000 $ 4.000 A ficticia (=!) Si espera que la matrícula anual
$ 10.000 de $ 5,000 al ficticia (= l) si se espera que la matrícula
Missing / Otros anual de $ 7,000 al ficticia (= l) si se espera que la
University College de First matrícula anual de $ 10.000 al maniquí (= l) los datos
Choice Elección que faltan / no preferencia matrícula
Institución Pública
Suplementaria Un maniquí (= l) si institución es primero universidad
Segunda Tercera elección Un maniquí (= l) si institución es segunda
Opción Opción elección
Un maniquí (= 1) si institución es tercera elección
Mayor
Un maniquí (= l) si el estudiante envía las puntuaciones
Agricultura Ciencias de
suplementarios Un maniquí (= l) si el estudiante tiene
previsto asistir pública
Empresas y Marketing
institución
Arquitectura de
Un maniquí (= l) si se planifica importante en
comunicaciones de la
Ciencias de la Agricultura
comunidad
relacionados Un maniquí (= l) si se planifica importante en los
negocios o la comercialización
Un maniquí (= l) si se planifica importante en
Educación Comunicaciones Un maniquí (= l) si se planifica
Matemática / Comp. importante en Arquitectura
Ciencia Un maniquí (= l) si se planifica importante en la
Comunidad / por Servicios sonales; , Familia, vice
Artes liberales Ser Consumidor humano o un Comercio
Un maniquí (= l) si se planifica importante en
Educación
Ciencias de la Un maniquí (! =) Si se planifica importante en
ingeniería Matemáticas / Ciencias de la Computación
Un maniquí (= l) si se planifica importante en Estudios
disciplinarias cruz; Idioma extranjero; Letras;
Indeciso / Missing Major Filosofía, ligion Re, y Teología; Artes visuales y
escénicas
del equipo universitario de Un maniquí (= l) si se planifica importante en
Ingeniería
atletismo Fraternidad / Un maniquí (= l) si se planifica importante en
Ciencias de la Salud, Health Allied, Bio o
Sorority Ciencias Físicas, Ciencias Sociales
Tamaño de la universidad Un maniquí (= l) si el estudiante está indeciso / no
respondió
Un maniquí (= l) si el interés en participar en
atletismo universitario
Un maniquí (= l) si el interés en fraternidad o
ThisEl contenido descargado desde el mar 190.234.181.161,20 Nov 2018 16:11:20
GMT Todas uSE sujetohttps: //about.jstor.org/terms
hermandad Un maniquí
(= l) si el interés en la
universidad de 20.000+
estudiantes

ThisEl contenido descargado desde el mar 190.234.181.161,20 Nov 2018 16:11:20


GMT Todas uSE sujetohttps: //about.jstor.org/terms
246 GONZALEZ Y DESJARDINS

TABLA 1.(Continuación)

Nombre de la variable Definición

Esperado más alto de


Cultura
Profesional Un maniquí (= I) si el interés en grado profesional
Grado de dos años Un maniquí (= I) si interés en obtener un grado de
dos años
Licenciatura Postgrado Grupo de referencia.Un maniquí (= I) si el interés en
Profesional de Grado Las un BA Un maniquí (= I) si el interés en un grado
expectativas que faltan graduado
Institucion publica Un maniquí (= I) si el interés de un título profesional
Un maniquí (= I), si la expectativa educativa le falta
una ficticia (= I) si el interés en una institución
pública

modelo logístico se estimó utilizando técnicas de máxima verosimilitud,


mientras que los modelos de RNA se estimaron usando el método de
retropropagación.
A continuación se presentan los resultados de los enfoques que compiten
discutidos anteriormente. Las variables independientes definidos en la Tabla l
se utilizaron para adaptarse a la regres modelo sión logística. Debido a que las
redes neuronales están diseñados para descubrir patrones no lineales y son muy
adecuadas para hacer frente a los datos que faltan, algunas de las variables que
se incluyeron como especificaciones ficticias en el modelo de regresión
logística (por ejemplo, la Ley de calificación combinada, Escuela rango
percentil) se incluyeron como variables continuas en uno de los modelos de
RNA formados. También capacitamos a un modelo ANN utilizando las mismas
variables exactas utilizadas en la regresión logística. Hicimos para que
pudiéramos comparar cómo los modelos realizan cuando cada técnica analítica
se alimenta la misma infor mación.
Debido a que nuestro objetivo era ayudar a las actividades de reclutamiento
en la institu ción de estudio, que son los principales interesados en la precisión
con los modelos predijeron apli cación de la institución. A pesar de que no es
nuestro principal interés, también discutimos brevemente la importancia
relativa de las entradas (variables independientes) en EXCLUYEN en estos
modelos.
Los resultados del modelo de RNA entrenada usando las variables de entrada
continuas indican que el modelo estimado en la muestra de desarrollo (L999) de
datos cor rectamente clasificado el 80,2% de los futuros estudiantes (ver Tabla
2). Los resultados también indican que el 66,2 por ciento de los solicitantes
fueron clasificados correctamente, y 88,4% de nonapplicants fueron
clasificados como tal. Como se señaló anteriormente, sin embargo, el modelo
mental el desarrollo global de los tipos de clasificación correcta (CCR) es
demasiado optimista cuando se utiliza para predecir fuera de la muestra.
Cuando se utilizó el modelo de RNA entrenada para predecir el
comportamiento de la aplicación en la muestra reservada (datos de 1998), el
CCR se redujo a 77,8%. En relación con los resultados del conjunto de datos de
ThisEl contenido descargado desde el mar 190.234.181.161,20 Nov 2018 16:11:20
GMT Todas uSE sujetohttps: //about.jstor.org/terms
entrenamiento, hubo una mejora en la predicción de los solicitantes en el
conjunto de datos de prueba (66,2 frente a 70,9, respectivamente), pero el

ThisEl contenido descargado desde el mar 190.234.181.161,20 Nov 2018 16:11:20


GMT Todas uSE sujetohttps: //about.jstor.org/terms
REDES NEURONALES ARTIFICIALES 247

TABLA 2. Clasificación efectividad del modelo de red neuronal artificial variable


continua

Predicho

Aplicado HizoNo

norte % norte %

Tabla de clasificación de
Modelo Formado en 1999 Datos
Real
Aplicado 4853 66.2 1451 11.6
No 2479 33.8 11074 88.4
En general correcta Tasa
Clasifi cación 80.2

La exactitud de clasificación
utilizando Formado Modelo
sobre la muestra reservada
Real
Aplicado 5280 70.9 1766 17.1
No 2171 29.1 8531 82.9
En general correcta Tasa
Clasifi cación 77.8

predicción de nonapplicants fue inferior en la muestra reservada que en el


modelo mental desarrollar (82,9 vs. 88,4, respectivamente).
La importancia relativa de las variables incluidas en el modelo continuo
variable de ANN se presentan en la Tabla 3. La importancia relativa es similar a
los coeficientes de correlación parcial (R denotado en la producción SPSS) en
el análisis de regresión logística. Nos encontramos con que las escuelas
secundarias con históricamente alto aplicación a ACT proporciones de
puntuación remitente tienen el más alto nivel de importancia en la ANN,
seguida de la variable que mide cuando la institución estaba en el set
estudiantes opción, y la puntuación en el test del futuro estudiante. Como se
verá, estas construcciones también se encuentran para ser altamente relacionado
con el comportamiento de la aplicación en los otros modelos estimados.
Los resultados del modelo variable ficticia RNA entrenada usando el mismo
vari
ables en el modelo de regresión logística indicar que el modelo entrenado en la
muestra de desarrollo (datos 1999) tenía una tasa global de clasificación
correcta (CCR) de 78% (véase la Tabla 4). Los resultados indican que el 59,3%
de los solicitantes fueron clasificados correctamente, y 89% de nonapplicants
fueron clasificados como tal. Una vez más, el modelo general de desarrollo de
CCR es una evaluación optimista de lo bien este modelo predecirá fuera de la
muestra. Cuando se utilizó este modelo ANN para pre-

ThisEl contenido descargado desde el mar 190.234.181.161,20 Nov 2018 16:11:20


GMT Todas uSE sujetohttps: //about.jstor.org/terms
248 GONZALEZ Y DESJARDINS

TABLA 3. variable continua Resultados del modelo de red neuronal artificial

La precisión global pronosticada 80,2%

Estructura del Modelo


capa de entrada 170neuronas
Oculta la capa # 1 20neuronas
Oculta la capa # 2 15neuronas
Oculta la capa # 3 IOneuronas
capa de salida 1neurona

Importancia relativa de las entradas


Alto Rendimiento de la Escuela Secundaria 0,674
Elección 0,500
ACT se 0,255
Años de SA Francés 0,155
Distancia de la Institución 0,146
Tamaño de la comunidad 0,137
Raza / origen étnico 0,122
Nivel de Matrícula Preferred 0.119
SA años de matemáticas 0.119
Años de SA español 0.118
Años de SA alemán 0.118
Mayor 0.1dieciséis
SA años de Ciencias Naturales 0,115
Años de SA Inglés 0,115
Ingresos familiares 0,113
Interesado en Frat / Sorority 0,095
Tipo de alta escuela que atendió 0,091
Tamaño de la universidad preferida 0,080
Tipo preferido de la universidad 0,077
Años de Ciencias Sociales SA 0,072
Género 0,071
Previsión de Educación 0,056
Interesado en equipo universitario de atletismo 0,054
GPA de la Escuela 0,030
Tamaño de SA curso de graduación 0,017

comportamiento de la aplicación seguido una dieta en la muestra


reservada(l998datos), el CCR se redujo en dos puntos a 76%. Hubo una ligera
mejora en los solicitantes la predicción, pero la predicción de nonapplicants fue
inferior en la muestra reservada que en el modelo de desarrollo (87,2 vs. 89,0 por
ciento, respectivamente).
La importancia relativa de las variables en el modelo variable ficticia ANN se
presentan en la Tabla 5. El patrón es similar a la encontrada cuando utilizamos conti-

ThisEl contenido descargado desde el mar 190.234.181.161,20 Nov 2018 16:11:20


GMT Todas uSE sujetohttps: //about.jstor.org/terms
ARTIFICIALREDES NEURONALES 249

TABLA 4. Clasificación efectividad del modelo de red neuronal artificial variable


ficticia

Predicho

Aplicado HizoNo

norte % norte %

Tabla de clasificación de
Modelo Formado en 1999
Datos
Real 4344 59.3 1384 11.0
¿No 2988 40.7 11141 89.0
Aplicad
a 78.0
En general correcta Tasa
Clasifi cación

La exactitud de la clasificación
basada en el modelo entrenado
Muestra holdout
Real
Aplicado 4522 60.7 1323 12.8
No 2929 39.3 8974 87.2
En general correcta Tasa
Clasifi cación 76.0

las variables superfluas para entrenar la red neuronal, lo que implica una cierta
consistencia en los factores que se encuentran a estar relacionado con el
comportamiento de solicitud de estudiante.
Los resultados de la clasificación del modelo logístico se presentan en la
Tabla 6. El modelo construido en la muestra de desarrollo (datos de 1999) tuvo
una tasa global de clasificación correcta (CCR) de 73,8%. Los resultados
indican que el 61,1% de los solicitantes fueron clasificados correctamente, y
85,5% de nonapplicants fueron clasificados como tal. Cuando los resultados de
este modelo se validaron en los datos de 1998 y se comparan con los resultados
de la muestra del desarrollo del CCR se redujo sólo ligeramente al 72,3%.
La Tabla 7 presenta las estimaciones de las variables independientes
utilizadas en el modelo de regresión logística. Una inspección minuciosa de los
tics STATIS Wald o R (correlación parcial) revela que la mayoría de las
construcciones identificadas en los modelos de RNA como impor tante son
también los factores que muestran efectos potentes en el modelo de regresión
logística. Así, se observa una gran cantidad de consistencia entre los resultados
de estos diferentes modelos.
En general, hemos encontrado que la ANN entrenado usando variables
continuas tenían el CCR más alto (78%), seguido de la variable ficticia ANN
(76%) y luego el modelo de regresión logística (72%). Así, para las muestras
utilizadas en este

ThisEl contenido descargado desde el mar 190.234.181.161,20 Nov 2018 16:11:20


GMT Todas uSE sujetohttps: //about.jstor.org/terms
250 GONZALEZ Y DESJARDINS

TABLA 5. Chupete Variable Artificial Neural Red modelos Resultados

La precisión global pronosticada 78,0%

Estructura de la capa
del modelo de 75 neuronas
entrada 20 neuronas
Capa oculta #I 15 neuronas
capa oculta # 2 10
Capa oculta # 3 neuronas
Resultado de capa que las
neuronas

Importancia relativa de las entradas


suplementarios Opción 0.5958
Alto 0.4223
Rendimiento 0.2784
SA First Choice 0.1 188
segundo Qrt. 0,1 109
ACT Top trim. 0,0899
ACTO 0.0808
Comunicaciones 0.0789
Top trim. 0,0764
Multirracial 0,0718
ingresos Latino / a 0,0650
Comm. Tamaño de 500 0.0641
Comunidad, humano, Serv personal. 0.0627
Qrt tercero. ACTO 0,0572
Distancia 10 a 25 0,0525
grados Segunda 0,0522
Opción AA 0,0504
SA grados A o B en Ciencias 0,0485
Agrícolas / Tech SA Tamaño 0,0483
Missing 0,0459
Matrícula $ 1000 Ingeniería 0,0454
Arquitectura / Diseño Ambiental 0,0454
Prefiero Institución 0,0453
0,0440
Pública 2 años franceses
0,0432
Asistido Comm
0.0420
Católica SA Postgrado.
0,0392
Tamaño de 249999 0,0380
Comm. Tamaño 0,0374
Missing Missing 0,0367
Matrícula
Falta Educación
ingreso

Importancia relativa de las entradas


Titulo profesional 0.0364
Tamaño del SA a 100 0,0352
Matrícula $ 5000 0.0338

ThisEl contenido descargado desde el mar 190.234.181.161,20 Nov 2018 16:11:20


GMT Todas uSE sujetohttps: //about.jstor.org/terms
ARTIFICIALREDES NEURONALES 251

MESA5.(Continuación)

distancia que falta 0,0304


indio americano 0,0304
Frat interés / Sor. 0,0299
Matemáticas / Ciencias de la Computación 0,0286
Prefiero Colegio GT 20K 0,0282
2 años. alemán 0.0268
Comm. Tamaño de 49999 0,0267
Tamaño del SA a 200 0,0266
Distancia GT 100 0,0262
Matrícula $ 7500 0,0260
Tamaño del SA a 25 0,0258
4 años. SA Inglés 0,0256
El interés del equipo universitario de Ath. 0,0251
Género 0,0234
La matrícula de $ 10000 0,0231
Salud, Ciencias, Ciencias Sociales 0,0228
Comm. Tamaño de 1999 0,0220
2 años. Ciencias Sociales 0,0193
asiático americano 0,0193
Distancia 26 a 100 0.0191
Tamaño del SA a 400 0,0185
tercera elección 0,0184
Businss / Marketing 0,0177
Matrícula $ 500 0,0174
Matrícula $ 4000 0,0172
Tamaño del SA a 900 0,0163
Artes liberales 0,0154
Comm. Tamaño de 499999 0.0151
Ed esperada. Desaparecido 0,0150
Comm. Tamaño 1 M Plus 0,0145
3 años. SA Matemáticas 0,0143
2 años. Español 0,0126
Qrt segundo. Ingresos 0,0124
indecisos Mayor 0,0119

Importancia relativa de las entradas


Comm. Tamaño de 9999 0,0116
Tamaño del SA a 600 O.Ql l4
Comm. Tamaño de 999999 0,0110
3 años. Ciencias Naturales 0,0102
afroamericano 0,0100
Qrt tercero. Ingresos 0,0090
Voe Tech Grado 0.0069
Matrícula $ 2000 0,0055

ThisEl contenido descargado desde el mar 190.234.181.161,20 Nov 2018 16:11:20


GMT Todas uSE sujetohttps: //about.jstor.org/terms
252 GONZALEZ Y DESJARDINS

TABLA 6. Clasificación Eficacia del modelo de regresión logística

Predicho

Aplicado No

norte % norte %

Tabla de clasificación
de modelo logístico
Utilizando los datos
de 1999
Real
Aplicado 3653 61,1% 945 14,5%
No 2325 38,9% 5551 85,5%
En general correcta Tasa
Clasifi cación 73.8

La exactitud de clasificación
utilizando Equipada Modelo
sobre Holdout Muestra
Real
Aplicado 3734 63,3% 922 17,5%
No 2167 36,7% 4346 82,5%
En general correcta Tasa
Clasifi cación 72.3

estudio, el modelo de regresión logística no predice comportamiento de la


aplicación, así como los modelos de RNA hacen.

IMPLICACIONES Y CONCLUSIONES
Las RNA tienen varias ventajas sobre los métodos estadísticos tradicionales.
En primer lugar, las RNA no requieren conocimiento de la relación funcional
entre el inde pendiente y la dependiente (es decir, la forma funcional correcta o
el grado de no linealidad) las variables con el fin de estimar el modelo. A
diferencia de las técnicas de cal estadísti tradicionales, las redes neuronales
aprenden de los ejemplos con un pequeño número de suposiciones como antes
acerca de las relaciones estructurales. En segundo lugar, las RNA son útiles
cuando los modelos logísticos son incapaces de reconocer plenamente la
complejidad de los datos. En tercer lugar, las RNA son muy buenos en el
reconocimiento de patrones y pueden adaptarse a las variables relacionadas sin
incurrir en problemas de multicolinealidad (Etheridge, Sriram, y Hsu, 2000). En
cuarto lugar, las RNA también funciona bien cuando hay grandes cantidades de
datos o cuando se carece de datos (Garson, 1998).

ThisEl contenido descargado desde el mar 190.234.181.161,20 Nov 2018 16:11:20


GMT Todas uSE sujetohttps: //about.jstor.org/terms
REDES NEURONALES ARTIFICIALES 253

Tabla 7. Resultados del modelo de regresión


logística

Chi- df importancia
Modelo cuadrado 74 0.000
4.802,67
Posibili
Variable segundo SE Wald Significado R dades
Proporc
ión
Género 0,192 0,052 13.758 0.000 0,027 1,211
indio americano -0.1 17 0,466 0,063 0,802 0.000 0,890
afroamericano 0,318 0,150 4.506 0,034 0,012 1,374
Latino / a 0,575 0,182 9,948 0,002 0,022 1,776
asiático americano 0,418 0,153 7.480 0,006 0,018 1,519
Multirracial -4.866 3.049 2,546 0,1 1 1 -0.006 0,008
Top trim. Ingresos 0,470 0,085 30.214 0.000 0,042 1,599
Qrt segundo. Ingresos 0,202 0,080 6,486 0.01 1 0,017 1,224
Qrt tercero. Ingresos 0,020 0,082 0,061 0,805 0.000 1.020
Falta el ingreso 0,259 0,106 5,971 o.oi5 0,016 1.295
Comm. Tamaño de 500 -0.177 0,165 1.152 0,283 0.000 0,838
Comm. Tamaño de 1999 0,069 0,1 IO 0,393 0,531 0.000 1,071
Comm. Tamaño de 9999 0,063 0,098 0,418 0,518 0.000 1,065
Comm. Tamaño de 0,169 0,101 2,769 0,096 0,007 1,184
49999
Comm. Tamaño de 0,292 0,104 7,865 0,005 0,019 1,339
249999 Tamaño de
Comm. 0,172 0,142 1.476 0,224 0.000 1.188
499999
Comm. Tamaño de -0.056 0,221 0,064 0,800 0.000 0,946
999999 Tamaño IM Plus
Comm. 0,392 0,182 4.655 0,031 0,013 1,479
Comm. tamaño Missing 0,637 0,175 13.205 0.000 0,026 1,892
Top trim. ACTO 0,862 0,085 103.224 0.000 0,079 2,368
Qrt segundo. ACTO 0,920 0,077 144.451 0.000 0,093 2,509
Qrt tercero. ACTO 0,640 0,070 83.748 0.000 0,071 1.896
Grados HS A o B 0,523 0,066 63.525 0.000 0,061 1,687
4 años. SA Inglés 0,208 0,078 7.1 IO 0,008 0,018 1,232
3 años. SA Matemáticas 0,036 0,065 0,318 0,573 0.000 1.037
2 años. Ciencias Sociales -0.144 0,129 1,247 0,264 0.000 0,866
3 años. Ciencias 0,034 0,054 0,402 0,526 0.000 1,035
Naturales
2 años. Español -0.046 0,058 0,642 0,423 0.000 0,955
2 años. alemán 0,132 0,159 0,696 0,404 0.000 1.142
2 años franceses -0.337 0,135 6.233 0,013 -0.016 0,714
Tamaño del SA a 25 0,735 0,193 14.475 0.000 0,028 2.086
Tamaño del SA a 100 0,633 0,196 10.484 0,001 0,023 1,884
Tamaño del SA a 200 0,820 0,194 17.937 0.000 0,031 2,270
Tamaño del SA a 400 0,887 0,198 20.183 0.000 0,033 2,428
Tamaño del SA a 600 0,945 0,210 20.185 0.000 0,033 2,574
Tamaño del SA a 900 1.095 0,227 23.341 0.000 0,036 2,988
Tamaño del SA Missing 2.125 0,298 50.915 0.000 0,055 8,371
Alto Rendimiento SA 1.983 0,149 178.222 0.000 0,104 7.262
Distancia IO a 25 -0.369 0,172 4,625 0,032 -0.013 0,691
Distancia 26 a I 00 0.21 1 0,1 16 3.320 0,068 0,009 1,235
Distancia GT I 00 0,483 0,109 19.592 0.000 0,033 1,621
distancia que falta 0,188 0,1 IO 2,899 0,089 0,007 1,206

ThisEl contenido descargado desde el mar 190.234.181.161,20 Nov 2018 16:11:20


GMT Todas uSE sujetohttps: //about.jstor.org/terms
REDES NEURONALES 25
ARTIFICIALES 5

254 GONZALEZ Y DESJARDINS

MESA7.(Continuación)

Chi- df importancia
Modelo cuadrado 74 0.000
4.802,67
Posibili
Variable segundo SE Wald Significado R dades
Proporci
ón
Matrícula $ 500 -0.269 0,540 0,247 0,619 0.000 0,764
La matrícula de $ 000 me 0,077 0,337 0,053 0,819 0.000 1,080
Matrícula $ 2000 -0.198 0,177 1.255 0,263 0.000 0,820
Matrícula $ 4000 -0.048 0,128 0,141 0,707 0.000 0,953
Matrícula $ 5000 0,017 0,109 0,023 0,879 0.000 1.017
Matrícula $ 7500 0,061 0,1 12 0,292 0,589 0.000 1.062
La matrícula de $ I 0000 0,201 0,1 15 3.073 0,080 0,008 1,223
Falta de matrícula 0,005 0,088 0,004 0,951 0.000 1.005
Primera opción 1 0,075 595.479 0.000 0,190 6.284
Segunda elección 0.838
0,702 0,078 82.052 0.000 0,070 2,018
tercera elección 0,320 0,082 15.165 0.000 0,028 1,378
Elección suplementaria 4.141 0,135 935.724 0.000 0,239 62.861
El interés del equipo -0.214 0,051 17.753 0.000 -0.031 0,808
universitario
Frat interés / de
Sor.Ath. 0,164 0,049 1 1.417 0,001 0,024 1.178
Prefiero Colegio GT 20K 0,300 0,056 28.256 0.000 0,040 1,350
Voe Tech Grado -0.186 0,615 0,091 0,762 0.000 0,830
Grado AA -0.768 0,290 6,996 0,008 -0.017 0,464
Diploma de graduación 0,271 0,062 19.261 0.000 0,032 1.31 1
Titulo profesional 0,286 0,064 20.186 0.000 0,033 1,331
Ed esperada. Desaparecido -0.040 0,173 0,053 0,818 0.000 0,961
Prefiero Institución Pública 0,251 0,066 14.539 0.000 O.D28 1.285
Indeciso / señorita. Mayor 0,158 0,167 0,893 0,345 0.000 1.171
Ag Sciencesffech. -0.552 0,290 3,624 0,057 -0.0IO 0,576
Arquitectura -0.344 0,239 2,081 0,149 -0.002 0,709
Negocios / Marketing 0,159 0,152 1.095 0,295 0.000 1.173
comunicaciones 0,177 0,1 18 2,228 0,136 0,004 1.193
Comm / Servicios -0,280 0,162 2,995 0,084 -0.008 0,756
Personales
Matemáticas / Ciencias de -0.203 0,134 2,271 0,132 -0.004 0,817
la Computación
Artes liberales 0,163 0,177 0,847 0,358 0.000 1.177
Educación -0.132 0,174 0,574 0,449 0.000 0,876
Ingenieria 0,006 0,172 0,001 0,972 0.000 1.006
Salud, Ciencias Sociales 0,227 0,157 2,091 0,148 0,002 1.255
Constante -5.121 0,304 284,1 15 0.000

-2 Log Likelihood 1 1.618,35


TimonelySnellR' 0.32
NagelkerkeR' 0,437

legítima o no. En quinto lugar, a diferencia de regresión logística, las RNA detectan
lazos nonlineari e interacciones de forma automática y pueden estimar varias
salidas a la vez (Lee, blanca, y Granger, 1993).
Esto no quiere decir que las RNAdeberíaLámparas
Este contenido descargado desde 190.234.181.161 en el mar,20Nov 2018 16:11:20 GMT
Todo usotemaa https://about.jstor.org/terms
REDES NEURONALES 25
ARTIFICIALES
tradicionalesestadísticométodos; Las RNA tienen algunas desventajas. En primer 6
lugar, la técnica es unaalgométodo de "recuadro negro" en el que la teoría y los
conceptos subyacentes están evolucionando y no son bien entendidos por muchos
investigadores. En segundo lugar, las RNA puede requerir tener en cuenta el tiempo
de formación capaces. Una variante de la variable continua ANN corrió durante
muchas horas. Lo que el investigador debe hacer es convertirse en expertos en
cuando para detener manualmente los modelos (a diferencia de regresión puede
elegirdetenerla formación y seguir obteniendo resultados). A veces el tiempo extra
dejando el tren modelo no vale la pena el aumento mínimo en la exactitud
predictiva. En tercer lugar, las RNA que sea culto cultad para determinar la relación
entre la variable dependiente e independiente. Por ejemplo, las RNA puede
proporcionar información de que dos variables independientes son importantes. Sin
embargo, la ANN no distinguir cómo los solicitantes y nonapplicants son distintas
con respecto a estas variables independientes.Los modelos de regresión de tics
Logis, por el contrario, son muy buenos para distinguir entre los diversos factores y
características de los solicitantes y nonapplicants y TYPI camente hacerlo muy
rápidamente. Por último, la implementación de una red neuronal puede ser difícil
proceso (Hecht-Nielsen, 1990). Fue un tiempo considerablegastadoen el aprendizaje
del soft ware, aunque parece que las recientes mejoras en este paquete y otros
pueden hacer que una preocupación menor en el futuro inmediato.
Con respecto a la política institucional, los resultados de este esfuerzo analítico
se utilizan en la institución de estudio para ayudar a los esfuerzos de reclutamiento
institucionales. El modelo ANN superfluo Contin se utiliza para predecir el
comportamiento de la aplicación de los estudiantes que envió a la
ACTestudiarinstitución y están considerando inscripción en la universidad en el
otoño de 2002. La estimación de una probabilidad de solicitud para cada solicitante
prospectivo permite al personal de la admisión a priorizar y dirigir sus esfuerzos de
reclutamiento en grupos particulares de los estudiantes. Si lo hace, permite a los
reclutadores para determinar si se debe de bajar los correos y / o contactos
telefónicos en los grupos que son pobres perspectivas de aplicación.Este enfoque
específico tiene el potencial de ahorrar recursos considerables, dado que más de
20.000estudiantessuelen enviar las puntuaciones a la institución de estudio en
cualquier año. Además, el personal de telemarketing ha utilizado las predicciones a
los futuros estudiantes de grupo en deciles y dar prioridad a las campañas de
teléfono tele. Esto está muy lejos de ser el enfoque más bien ad hoc utilizado en el
pasado.
También utilizamos las predicciones para volver a evaluar cómo la institución
adquiere nombres de vendedores como Educational Testing Service.El uso de las
predicciones con otras variables en la base de datos de la admisión, hemos sido
capaces de eliminar algunos estudiantes de compras de cinta, lo que resulta en un
ahorro moderado de los fondos de admisión de reclutamiento. Otro beneficio de
este proyecto fue que mientras estábamos aprendiendo acerca de las RNA y
compartir nuestros éxitos y frustraciones con los colegas y administradores,

Este contenido descargado desde 190.234.181.161 en el mar,20Nov 2018 16:11:20 GMT


Todo usotemaa https://about.jstor.org/terms
REDES NEURONALES 25
ARTIFICIALES 7
aprendimos que algunos colegas de ingeniería están utilizando inteligencia
artificial (AI) para estudiar otros resultados. No sólo hay un grupo de
investigadores de la IA justo al lado de nosotros, pero también han establecido
un laboratorio de IA para hacer la investigación y formar a las personas en el
uso de estas nuevas técnicas. Con la ayuda de estos expertos, estamos
empezando a aprender más acerca de la técnica y se empieza a formar a los
estudiantes del Colegio de Educación en el uso de estos métodos. Además, uno
de los autores de este artículo y un miembro de la facultad de ingeniería escribió
una propuesta de subvención de la NSF para ayudar a financiar la formación de
colegas y estudiantes.
Mientras que las redes neuronales y regresión logística Cada uno tiene sus
ventajas e disadvan, una combinación de las dos técnicas proporciona a los
investigadores institucionales con nuevas formas de perfeccionar la precisión de
la predicción, la generalización y el ajuste del modelo (Hung, Hu, Patuwo y
Shanker, 1996; Richard y Lippman, 1991). Las cuestiones relativas a
comportamiento de la aplicación deben ser crítica y analíticamente trazaron
como una medida de asegurar la asignación de recursos y el desarrollo óptimos.
Estos esfuerzos pueden ayudar a hacer que la planificación educativa más
eficiente y eficaz. Cómo siempre, como se mencionó anteriormente, el interés
en las redes neuronales ha permanecido sin explorar por investigadores de la
educación y analistas políticos.

Expresiones de gratitud.Nos gustaría dar las gracias a SPSS, Inc. para


proporcionar el software Clementina utilizado en este estudio. Este documento
fue presentado en la Asociación para la Investigación Institucional (AIR) 4lst
Foro Anual, Long Beach, California, 5 de Junio del 2001.

Referencias
Almanaque. (1997). El Chronicle of Higher Education 44: 6-7, 19.
Baker, BD, y Richards, CE (1999). Una comparación de los métodos de
regresión lineal convencional y redes neuronales para la previsión de gasto
educativo. Economía de Edu Revisión de cationes 18 (4): 405-415.
Bateman, M., y Spruill, D. (1996). Estudiante de la toma de decisiones:
Publicaciones del proceso de elección de la universidad. Diario del
estudiante universitario 30: 182-186.
Bruggink, TH, y Gambhir, V. (1996). modelos estadísticos para la
admisión a la universidad y la inscripción: un estudio de caso para un
selectiva universidad de artes liberales. La investigación en Superior ción
Educa 37 (2): 221-240.
Bryant, P., y Crockett,K.(1993). La oficina de admisiones va científica. La planificación
de la educación superior 22:1 -8.
Carlson, S. (24 de marzo de 2000). Las redes neuronales pueden transformar planificación
universitaria, Chroni CLE de Educación Superior 46: A5 l.
Chapman, DW (1981). Un modelo de elección del estudiante universitario. Journal of ción
Superior Educa 52 (5): 490-505.
Cybenko, G. (1989). Aproximación por superposiciones de una función sigmoide. Mathemati
Control de cal Signals Sistemas 2: 303-314.

Este contenido descargado desde 190.234.181.161 en el mar,20Nov 2018 16:11:20 GMT


Todo usotemaa https://about.jstor.org/terms
REDES NEURONALES 25
ARTIFICIALES 8
Dehne, GC (1994). Reinventando el reclutamiento de estudiantes.
Confianzamieship2 (3): 11-15. DesJardins, SL, Dundar, H.,y Hendel, DD
(1999). Modelización de la apli universidad
proceso de toma ción en una universidad de concesión de tierras. economidosde
Evaluación de la Educación18: 1 17-132.
Dey, E.L., Astin, AW, y Korn, W.S. (1991). el AmeridounEstudiante de primer
año:Veinticinco años de Tendencias, 1966-1990.Los Ángeles: Superior
Education Research Institute, UCLA.Etheridge,HL,Sriram, R.S., y Hsu, HYK
(Primavera 2000). Una comparación de las redes neuronales artificiales
seleccionados que ayudan a los auditores evalúan la viabilidad financiera del
cliente.
Ciencias de la Decisión31 (2):531-549.
Freeman, HB (1984). Impacto de las becas sin necesidad de la decisión de
maturidad de estudiantes con talento académico.Trabajo presentado en la
reunión anual de la Asociación Americana de Educación Superior, Chicago.
Galotti, KM, y Mark, M.C. (1994). ¿Cómo los estudiantes de secundaria
estructurar una decisión de vida impor tante? Un estudio longitudinal de corto
plazo del pro ceso de toma de decisiones de la universidad. Investigación en la
Educación Superior 17: 589-607.
Ganderton, PT (1992). El efecto de los subsidios en especie en la elección de la universidad.
El Journal of Public Economics 48:269-292.
Garson, GD (1998).Redes neuronales :Una guía introductoria para los científicos sociales.
Thousand Oaks, CA:Sage Publications.
Goyette,K. (1999). Aplicación a la universidad:Una comparación de los
estudiantes secundarios asiáticos americanos y blancos. Trabajo presentado
en la reunión anual de la Asociación de Investigación de América Educa
cional,Montreal (ED432 623).
Hamrick, F., y Hossler, H.(1996). Diversos métodos de recopilación de
información en el proceso de toma de decisiones post-secundaria. Revisión
de Edu Superiordoación 19:179-198.
Hearn, J. (1984). Los papeles relativos de adscritos y characteris
socioeconómica tics académicos en la universidad destinos.Sociología de la
Educación 57: 22-30.
Hecht-Nielsen, R. (1990). Neurocomputación. Reading, MA: Addision-Wesley.
Hosmer, DW, y Lemeshow, S.(1989). Análisis de Regresión Aplicada. Nueva York: John
Wiley and Sons.
Hossler, D.,Braxton, J.,y Coopersmith, G. (1989). la elección de la universidad el estudiante.
En JC inteligente (ed.),Educación Superior: Handbookde Teoría e Investigación,Vol. 5,pp.
231-288.Nueva York :Agatón Press.
Hossler, D.,y Gallagher, KS (1987). El estudio de elección del estudiante
universitario: un modelo de tres fases y las repercusiones para las
autoridades. College y la Universidad 2:207-221.
Hossler, D., Schmit, J., y Vesper, N.(1999). Ir a Collmisolmi:Cómo Sociales, Económicos y
factores educativos influir en las decisiones Los estudiantes hacen.Baltimore: The Johns
Hopkins University Press.
Hung, MS, Hu, MY, Patuwo, BE, y Shanker, M. (1996). La estimación de probabilidades a
posteriori en problemas de clasificación con redes neuronales.Revista Internacional de
Inteligencia Computacional y Organizaciones1: 49-60.
Ihlanfeldt, W. (1980). AchievinsolLas inscripciones e ingresos de matrícula óptima.San Fran
cisco: Jossey-Bass.
Kitano, H.H.L.,y Daniels, R. (1988).americanos asiáticos:Las minorías
emergentes.Acantilados de madera Engle,Nueva Jersey:Prentice Hall.

Este contenido descargado desde 190.234.181.161 en el mar,20Nov 2018 16:11:20 GMT


Todo usotemaa https://about.jstor.org/terms
REDES NEURONALES 25
ARTIFICIALES
Kohn, M.SOL.,Manski,do.F., y Mundel,DS (1976).Una investigación empírica de 9los
factores que influyen en el comportamiento de la universidad va. Anales <fmidosurement
onómic y Social Mea5 (4): 391-418 .
Kolstad, AJ (1979).La influencia del tipo de escuela secundaria y programa de
estudios sobre la matrícula en la educación superior y la formación post-
secundaria. Trabajo presentado en la reunión anual de la American
Educational Research Association, San Francisco (ED 173 627).

Este contenido descargado desde 190.234.181.161 en el mar,20Nov 2018 16:11:20 GMT


Todo usotemaa https://about.jstor.org/terms
Kuan, C., y White, H. (1994). Las redes neuronales artificiales: una perspectiva
econométrica.
REDES NEURONALES 26
Los comentarios econométricos13 (1): 1-91.
ARTIFICIALES 0
Lee, T., White, H., y Granger, Clive WJ (1993). Las pruebas para detectar la no
linealidad descuidado en modelos de series temporales: una comparación de
métodos de redes neuronales y pruebas alternativas. Journal of Econometrics
56 (3): 269-291.
Litten, LH (1982). Diferentes estilos en el grupo de candidatos: algunos
refinamientos en un modelo de elección del estudiante universitario. Revista
de Educación Superior 53 (4): 383-402.
Litten, LH, Sullivan, D., y Brodigan, D.L.(1983).La aplicación de investigación de
mercado en admisiones de la universidad.Nueva York: ingreso a la universidad
Examination Board.
Manski, CF, y Wise, DA (1983).Elección de la universidad en Estados Unidos.Cambridge,
MA: Harvard University Press.
McDonough, PM (1994). Compra y venta en la educación superior: la construc
ción social del solicitante de la universidad. Revista de Educación Superior
65 (4): 427-446.
McLanahan, S., y Sandefur, G. (1994).Creciendo con un solo padre: lo que duele, qué
ayuda.Cambridge, MA: Harvard University Press.
Melia, P., y Goodman, M. (1988). Control de los impactos demográficos.Universidad y Uni
versidad64: 51-63.
Min, P. (1988). La familia coreana. EnDO.H. Mindel, RW Habenstein, y R. Wright Jr.
(eds.),Las familias étnicas en América: Los patrones y variaciones,pp. 199-299. Nueva
York: Elsevier.
Patuwo, BE, Hu, MY, y Hung, MS (1993). Dos clasificación del grupo
usando redes neuronales. Ciencias de la Decisión 24 (4): 825-845.
Paulsen, MB (1990). la elección de la universidad: el comportamiento de
inscripción comprensión del estudiante. Digest 6. Washington, DC: ASHE-
ERIC Informes de Educación Superior.
Rainsford, GN (1985). la gestión de la matrícula: la perspectiva de un presidente.College y la
Universidad60: 336-344.
Richard, MD, y Lippman, RP (1991). clasificadores de red neural estiman
Bayse Sian unas probabilidades a posteriori. Computación Neural 3: 461-
483.
Rumelhart, DE, Hinton, GE, y Williams, RJ (1986). ciones represen interna Leaming por la
propagación de errores. En el documento DE Rumelhart, y J.L.Williams
(Eds.),Procesamiento distribuido en paralelo: Exploraciones en la microestructura de
la cognición.Cambridge: MIT Press.
Sanoff, AP (1994). Admisión decanos en el asiento caliente.US News and World Report117:
98-101.
Sevier, RA (1992). Es Demografía el destino? Diario de Admisión a la
Universidad 135: 13-22. Shea, C. (1994). Una avalancha de aplicaciones.
Chronicle of Higher Education 40: A31-A32. Stanton-Salazar, RD, y
Dornbusch, SM (1995). El capital social en la reproducción de la desigualdad:
Las redes de información entre los estudiantes de la escuela de origen
mexicano. Soci
logía de la Educación68: 1 16-135.
Weiler, WC (1994). La transición de la consideración de la universidad para la
decisión de aplicar.
Investigación en la Educación Superior35 (6): 631-646.
Welki, AM, y Navratil, FJ (1987). El rol de las percepciones de los
solicitantes en la elección de la universidad. College y la Universidad de
invierno: 147-160.

Este contenido descargado desde 190.234.181.161 en el mar,20Nov 2018 16:11:20 GMT


Todo usotemaa https://about.jstor.org/terms

Anda mungkin juga menyukai