ms orientado a la psicologa se pueden distinguir principalmente dos enfoques: el enfoque conductista y el enfoque cognitivista.
Incluir en cada uno de los materiales los objetivos educativos que se pretenden alcanzar El uso de test, cuestiones y actividades como forma de proporcionar interaccin con el material Mejorar la adaptabilidad mediante la incorporacin de textos suplementarios para aquellos alumnos que quieran profundizar en algn aspecto Proporcionar cuestiones de autoevaluacin para ayudar al estudiante a comprobar sus propios conocimientos
dispositivos mviles la que tendr un crecimiento ms grande durante los prximos aos. Estos dispositivos tienen doble uso: en su pantalla se pueden visualizar contenidos de forma limitada y pueden ser utilizados como mdem inalmbrico. Estos dispositivos son de uso personal, son nuestros organizadores digitales (correo electrnico, contactos, agenda, calendario, etc.) y los podremos utilizar como dispositivos para comunicarnos con la voz y para transferir informacin digital. Con ellos estaremos siempre conectados a Internet. En lugar de tener computadoras personales conectadas a Internet, sern las personas las que estarn conectadas en cualquier lugar y momento.
2.2.3 UMTS La tecnologa posterior a GPRS se llama UMTS (Universal Mobile Telephony System). UMTS permite una velocidad de transferencia de hasta 2 megabits por segundo (velocidad 50 veces superior a la que tenemos con un mdem estndar).
2.3 Tecnologa Mvil En Mxico, los principales proveedores de dispositivos mviles son Ericsson, Nokia, Alcatel, Nextel, Movistar, Telcel, AT&T, Palm, Benq. Hoy en da tenemos los siguientes sistemas operativos y equipos competidores: Dispositivos Palm OS, hoy en da mantenido casi en solitario por Palm, pero que hasta hace poco ha tenido importantes fabricantes como Sony; Dispositivos Pocket PC con HP como lder de fabricantes acompaado por otras empresas de informtica como Dell o Acer, a quienes se han incoporado los fabricantes de Taiwn como High Tech Computer que van copando el mercado del Smartphone con sus marcas propias (como Qtek) o fabricando para terceros y, sobre todo, operadores de telefona mvil; Research In Motion con sus Blackberry, ms propiamente Smartphones que PDAs, pero que han copado una parte importante del mercado corporativo a la vez que incorporaban prestaciones de PDA. Dispositivos Symbian OS presente en las gamas altas de telfonos mviles de Nokia y Sony Ericsson; Dispositivos Linux liderado por las Sharp Zaurus. Y por ltimo, multitud de PDAs de juguete, desde los verdaderos juguetes infantiles como los de VTech (lder del boyante mercado del ordenador infantil) a los aparatos baratos fabricados en China, pero que, aparte del reconocimiento de escritura, incorporan todas las prestaciones bsicas de las primeras PDAs (incluyendo cmaras digitales bsicas y comunicaciones con los PCs).
Costos Dispositivos Mviles Modelo Acer C510 HP iPAQ Rx5720 Travel Companion Blackberry Pearl 8100 Nokia 9500 Benq P51 Palm Treo 650 Costo $ 4,200.00 $ 3,500.00
Costos Servicios Altos precios, bajas velocidades y desconocimiento entre los usuarios frenan el crecimiento del negocio de acceso a Internet por medio de redes celulares. Mientras que en pases como Estados Unidos, Espaa, Italia, Alemania, Reino Unido e incluso Chile, al menos 15 por ciento de la poblacin accesa a Internet por su celular, en Mxico no llega ni a 5 por ciento, segn un comparativo de la consultora ComScore. Esta situacin se debe a que los precios son altos y los usuarios desconocen esta posibilidad de acceso. Por ejemplo, en Estados Unidos, un plan bsico de voz con acceso de datos ilimitado cuesta desde 20 dlares al mes con AT&T, hasta 55 dlares con Sprint. En cambio con Telcel, el precio de un plan de voz promedio es de 31 dlares ms 52 dlares por el servicio de datos y puede llegar a 83 dlares dependiendo del plan que se elija. En el caso de Iusacell, el servicio ms robusto puede llegar hasta 160 dlares mensuales.
Si la compaa fabricante del software propietario se va a la banca rota el soporte tcnico desaparece. Si una compaa fabricante de software es comprada por otra ms poderosa, es probable que esa lnea de software quede descontinuada y nunca ms en la vida vuelva a tener una modificacin.
Desventajas
La curva de aprendizaje es mayor. El software libre no tiene garanta proveniente del autor. No existira una compaa nica que respaldar toda la tecnologa La mayora de la configuracin de hardware no es intuitiva, se requieren conocimientos previos acerca del funcionamiento del sistema operativo y fundamentos del equipo a conectar para lograr un funcionamiento adecuado. El usuario debe tener nociones de programacin, ya que la administracin del sistema recae mucho en la automatizacin de tareas y esto se logra utilizando, en muchas ocasiones, lenguajes de guiones (perl, python, shell, etc).
3.2 Licenciamiento de software La licencia de software es una especie de contrato, en donde se especifican todas las normas y clusulas que rigen el uso de un determinado programa, principalmente se estipulan los alcances de uso, instalacin, reproduccin y copia de estos productos, en el momento en que usted decide descargar, instalar, copiar o utilizar un determinado Software, implica que usted acepta las condiciones que se estipulan en el licenciamiento de cada programa especifico.
3.2.1 Tipos de licencias de software libre El software libre no tiene nada que ver con el precio, tiene que ver con libertad (El Proyecto GNU es una campaa para difundir el Software libre. Fue iniciada por Richard Stallman en 1984 y pretende implantar la tendencia hacia el desarrollo de software sin limitantes de derechos de autor y bajo precio).
Open Source Open Source y Software libre, son esencialmente lo mismo, el software que puede ser compartido abiertamente entre desarrolladores y usuarios finales de tal forma que todos aprendan de todos.
Licencia GPL (General Public License) La licencia GPL se aplica al software de la FSF (Free Software Foundation) y el proyecto GNU y otorga al usuario la libertad de compartir el software y realizar cambios en l. La licencia advierte que el software debe ser gratuito y que el paquete final, tambin debe ser gratuito.
10
3.3 Por qu elegir software Libre? Bsicamente son tres razones principales por las cuales un proyecto podra inclinarse por este modelo: Al optar por el modelo de desarrollo y distribucin libre, el proyecto queda habilitada a utilizar la gran cantidad de herramientas libres disponibles en la actualidad. El liberar un programa facilita enormemente su distribucin y publicidad. De esta manera no es necesario invertir enormes sumas de dinero en campaas publicitarias y en marketing para poder competir con productos establecidos en el mercado. Si el producto en cuestin tiene suficientes mritos tcnicos, con seguridad despertar el inters de un gran nmero de desarrolladores, usuarios y otras empresas en todo el mundo.
El sistema operativo Linux El servidor de Web Apache El manejador de bases de datos objeto-relacional PostgreSQL El navegador Mozila El entorno de escritorio y suite de aplicaciones de productividad de GNOME El entorno de escritorio y suite de aplicaciones de productividad de KDE La suite de compiladores GCC El servidor de correo Sendmail El servidor de nombres Bind La suite de aplicaciones de escritorio OpenOffice (antes StarOffice)
La Internet misma se basa en los estndares abiertos que fueron desarrollados por estas aplicaciones. Es indicativo que el servidor de pginas web ms utilizado en el Internet es Apache.
Existe la necesidad de saber elegir cul herramienta utilizar, ya que hay varias como Server PagesTM (ASP), JavaServer PagesTM (JSP), Personal Home Pages (PHP), Cold Fusion, etc., y muchas veces esta eleccin se torna difcil, debido a que cada una tiene sus ventajas y desventajas, as como diversos usos. Por ejemplo ASP provee el ambiente de desarrollo ms fcil, mientras que JSP requiere el conocimiento de Java y Servlets. PHP es una tecnologa popular basada en una fuente de desarrollo abierta. ASP se acomoda mejor para sitios pequeos que tengan entre 100-500 consultas por da, mientras que JSP es capaz de manejar entre 100 y un milln de consultas por da. El analisis se desarroll de la siguiente manera: Instalacin de los sistemas operativos: Windows 2000 y Linux Red Hat 7. Instalacin de los servidores Web Apache, Apache Tomcat y Internet Information Server en Windows 20000; en Linux: los anteriores, pero a diferencia de IIS, se trabajar One Active Server Page. Instalacin de JDK y PHP. Diseo de la base de datos. Creacin del Modelo Entidad Relacin Creacin del Modelo Relacional Creacin de tablas en la base de datos Access y My SQL Desarrollo de prototipo en ASP, JSP y PHP. Desarrollo de las pruebas, ejecutando los servidores, haciendo llamados a travs de Internet Browser, de las pginas de cada prototipo.
Las variables tipo cuya posible respuesta es un si o un no, se midieron por observacin directa. Para evaluar la portabilidad, se colocaron los cdigos fuentes en cada servidor y sistema operativo sin ningn cambio, as: migrar de Linux a Windows sin alterar el cdigo y viceversa, y migrar de un servidor Web hacia otro sin hacer modificaciones en el cdigo. El tiempo de respuesta se midi desde el inicio del cdigo de cada herramienta hasta el fin, tomando el tiempo al inicio y al final de cada ejecucin, y de esta forma se obtuvo la diferencia.
3.5.1 Presentacin de los resultados Las tres herramientas son portables de Windows a Linux y viceversa; esto quiere decir que se puede migrar de un sistema operativo a otro sin realizar cambios en el cdigo.
12
Como se observa en la tabla anterior, en el servidor Apache, tanto PHP como ASP (a partir de la versin 4) son portables de Windows 2000 hacia Linux Redhat y viceversa. Se puede apreciar que ASP slo puede ejecutarse en IIS en Windows y en Linux slo si se agrega un software intrprete como modulo de Apache, en este caso One Active Server Page. Por otro lado, JSP es portable en ambos sistemas operativos bajo el servidor Tomcat. Es de destacar que PHP puede ejecutarse en IIS.
A pesar que PHP y JSP ejecutan correctamente bajo Windows, su funcionamiento adecuado se da en Linux, debido a que inicialmente fueron diseados para este ltimo sistema operativo, y como era de esperarse, ASP tiene un mejor desempeo en Windows, debido a que es una herramienta exclusiva Microsoft. De igual forma sucede con el manejo de los servidores sobre los cuales se almacenan las pginas desarrolladas en los mismos. Por otro lado, hay que destacar que JSP requiere una memoria ms grande, debido a que est basado en JAVA, y consume gran cantidad de recursos de memoria.
13
Para los datos desplegados en la tabla anterior se tuvo en cuenta la ejecucin de procesos que generaban 150 errores en promedio. JSP fue el que tuvo la mejor calidad de deteccin, ubicacin de errores y del tipo de error. En cuanto a PHP, posee una buena deteccin y ubicacin de errores, sin embargo tiene problemas en referenciar el tipo de error. ASP detect el 55% (Hay error + ubicacin del error) y el 46% (tipo de error), mientras que JSP el 95% y 93% respectivamente.
La siguiente tabla despliega los tiempos de ejecucin de cada una de las herramientas para los comandos de actualizacin, borrado, consulta e inserciones sobre un mismo prototipo de software. Tiempos de respuesta
El tiempo de respuesta se midi desde el inicio del prototipo de cdigo hasta el fin, tomando el tiempo al inicio y al final de cada ejecucin, y de esta forma se obtuvo la diferencia.
14
4.1 Necesidades del nuevo paradigma de aprendizaje Cuando se habla de nuevas formas de aprendizaje debemos analizar si se trata de cambios e innovaciones en trminos de los procesos cognitivos del individuo o de nuevos procedimientos, metodologas y modelos para promover el aprendizaje, aprovechando para ello diversos recursos y estrategias a nuestro alcance, en especial la introduccin de las redes que en la educacin ha venido a ampliar y acelerar el manejo e intercambio de informacin y de comunicacin y en especial la educacin a distancia. La educacin a distancia se ha venido consolidando con el uso de los medios informticos y de telecomunicaciones como modelos virtuales de educacin, que mantienen en comn factores como; la no presencia fsica, el tiempo, el espacio y el modelo educativo. El entorno de aprendizaje a distancia o aprendizaje virtual se define como un programa informtico interactivo de carcter pedaggico que posee una capacidad de comunicacin integrada. Con el desarrollo de la Internet, el World-Wide Web y de los dispositivos mviles como medio de acceso, el panorama educativo afronta realmente un cambio tecnolgico en el aprendizaje. Si bien es importante saber buscar y localizar bancos de informacin que enriquezcan y apoyen los procesos de aprendizaje, es necesario replantear las maneras en que los alumnos pueden adquirir conocimientos e informaciones sin perder de vista que en toda situacin didctica el centro deber ser el estudiante. La funcin del profesor ser la de un facilitador que presta asistencia cuando el estudiante busca conocimientos.
De la reproduccin a la construccin de conocimiento. Los alumnos deben participar activamente en la construccin de conocimiento a travs de su propio proceso de aprendizaje, trabajando tanto solos como en grupo.
Resumen analgico: en formato impreso Resumen digital: en formato digital (CD-ROM, DVD, Web, etc.) Segn la tcnica de elaboracin empleada: Manual: realizado por mediacin humana. El autor del resumen puede ser el propio autor del documento original que es quien mejor conoce el tema, o un especialista en la materia tratada. Un problema que puede derivarse de este tipo de autoras es que tanto el autor como los especialistas en una materia concreta pueden conocer muy bien el tema, pero desconocer la metodologa del resumen y el anlisis documental. En el caso contrario encontramos los resmenes elaborados por documentalistas, quienes pueden conocer perfectamente la metodologa del resumen, pero tambin deben conocer la materia tratada. Automatizado: resumen realizado por mtodos mecnicos, sin intervencin humana. El resumen de documentos ha sido siempre considerado una labor lenta y tediosa para los profesionales de la documentacin, adems de un trabajo tcnico complicado. Se necesita mucha rapidez para tener actualizados y al da los resmenes de esa ingente cantidad de documentos que entran o se gestionan en cualquier unidad documental. Antes de la aparicin de la World Wide Web, ya existieron algunos avances enfocados hacia la automatizacin de esta tarea, aunque ha sido la explosin de Internet, el verdadero motor del resumen automtico de documentos. Existen 3 tipos de resmenes automticos, aunque muchos sistemas son hbridos y combinan varias de estas tcnicas: Resmenes por extraccin: operan sobre uno o varios documentos entresacando la informacin ms relevante por medio de la extraccin de las oraciones que responden a unos criterios determinados y presentando nicamente las oraciones del texto original que ms se ajustan a los criterios dados. Seleccionan la informacin en funcin de la frecuencia de las palabras clave, de la localizacin de informacin y de otros parmetros relevantes. Los sistemas de extraccin ms sofisticados son capaces, tambin, no slo de extraer oraciones, sino de insertar material lxico para que el texto resultante tenga cohesin. Resmenes por abstraccin: no se limitan a extraer las oraciones del texto original, sino que generan un nuevo documento con una nueva redaccin, a partir de la informacin contenida en el primero. Este tipo de resmenes presentan una excesiva dificultad tcnica y la investigacin en este mbito apenas ha comenzado a dar sus primeros pasos por medio de los recientes avances en el procesamiento del lenguaje natural.
18
Resmenes grfico-relacionales: basados en tcnicas vectoriales y algoritmos grficos de mapeo de la informacin que comparan conjuntos de documentos para extraer sus similitudes y diferencias. No existe un nico enfoque a la hora de plantearse la cuestin central de en qu debe consistir un resumen automtico, sino que tal enfoque puede obedecer a muy diversos factores dependiendo del tipo de resumen que persigamos, del tipo de documentos que tomemos como origen (artculos, noticias, pginas web, mensajes de correo electrnico, listas, etc.), del lenguaje en que estn construidos (HTML, XML, texto sin marcas...), de si el documento o el texto presentan algn tipo de estructura, etc. La tipologa de los resmenes automticos es muy variada y por lo tanto, cada uno de estos tipos necesita un determinado tipo de tcnicas y tratamientos diferentes. No es lo mismo un resumen meramente indicativo (para utilizarse en la clasificacin y filtrado de documentos) que un resumen informativo (para ser ledo como abstract o como sustituto del documento completo), un resumen genrico que un resumen guiado (en respuesta a una bsqueda concreta), un resumen genrico que un resumen de actualizacin (que obvie la informacin conocida y aporte slo los elementos nuevos), un resumen multidocumental (que condense en un nico documento otros documentos que tratan sobre el mismo tema o bsqueda) o un resumen multinivel (que ofrezca distintos niveles de comprensin del documento original), etc. El resumen automtico de documentos se puede realizar de muy diversas formas, pero las tcnicas utilizadas se pueden englobar en 3 grandes grupos: Tcnicas sin anlisis lingstico: tratan el texto de forma superficial, como si se tratara de una simple cadena de caracteres. La oracin se distinguira como una cadena que comienza por una mayscula y termina con un punto. Los mtodos son variados: seleccin de los trminos ms frecuentes y extraccin de las oraciones que los contienen, seleccin de fragmentos que ocupan posiciones destacadas como el ttulo, subttulos, encabezamientos, o las que contienen cadenas de caracteres tales como: es importante, en conclusin, en suma, en resumen, etc. Tcnicas basadas en el anlisis lingstico morfosintctico: permiten reconocer las unidades lingsticas mediante algn tipo de reconocimiento y clasificacin del lxico utilizando, por ejemplo, analizadores morfolgicos y desambiguadores lxicos, lematizadores, sistemas de resolucin de referencias anafricas, bases de conocimiento lxico, reconocedores de entidades que no forman parte de los diccionarios o vocabularios comunes, como por ejemplo, siglas o nombres propios, etc. Esto permite representar las conexiones del texto en forma de grafos para determinar qu oraciones son las ms relevantes para el resumen. Tcnicas basadas en la estructura discursiva: se trata ya de tcnicas muy sofisticadas en donde entra en juego la ingeniera lingstica puesto que se
19
trata de analizar la estructura argumental del documento para poder detectar los fragmentos ms relevantes. Para ello, sern de gran ayuda la deteccin y anlisis de marcadores discursivos tales como ejemplo: "en primer lugar", "en segundo trmino", "por el contrario", "sin embargo", "adems", "es importante", "en conclusin", "en suma", "en resumen", etc. Tambin es importante la estructura del propio documento hipertextual ya que la propia armazn del documento HTML permite reconstruir la estructura argumental del documento y de los fragmentos ms relevantes. Por otro lado, ser ms fcil de analizar an, cualquier documento estructurado en XML que contenga metadatos, esquemas o que contenga algn tipo de estructuracin semntica basada en RDF, OWL o cualquier otro lenguaje de estructuracin semntica. Resumen del Sistema de Aprendizaje En base en lo anterior, los resmenes que se obtendrn en el sistema de aprendizaje sern de tipo automtico. Ser un resumen informativo para que el usuario tenga la idea general. Ser tambin un resumen en texto libre y estar en lnea. Tambin ser un resumen por abstraccin y se utilizaran tcnicas de anlisis lingstico morfosintctico
El sistema de aprendizaje estar formado por 3 mdulos: El modulo de Confirmar Datos, el modulo de Avance de Usuario y el modulo de Hacer Resumen. Como lo muestra la siguiente figura.
20
Usuario Solicitud Datos no Validos Entrada al Sistema ((Nombre de usuario y Contrasea) Nombre de
Confirmar Datos
B.D. Usuario
B.D. Usuario
Usuario
21
22
Datos de salida El sistema compara los datos proporcionados por el usuario con la informacin de la base de datos del sistema. Si los datos son correctos se le da acceso al sistema, pasando al mdulo de obtener avance de usuario para mostrarle el captulo, tema y subtema correspondiente al usuario. En caso contrario el sistema le mostrar nuevamente la pantalla de datos de entrada.
23
Para mantener actualizada la base de datos donde se administra el avance del usuario, seguiremos este algoritmo:
24
1) Hacer mientras los datos sean incorrectos Pedir datos al usuario Fin mientras 2) Revisar avance del usuario 3) Mostrar el captulo, el tema y subtema correspondiente al usuario. 4) Hacer mientras no se revisen todos los captulos 4.1.) Hacer mientras no se revisen todos los temas 4.1.1) Hacer mientras no se revisen todos los subtemas Revisar subtema Fin mientras Mostrar siguiente tema Fin mientras Revisar ejercicios del capitulo 4.2.) Hacer mientras no se apruebe la evaluacin Presentar evaluacin Fin mientras Mostrar siguiente captulo Fin mientras
25
Inicio
Pedir Datos
Valido
Si
Si
Siguiente Capitulo
Presentar Evaluacin
Aprobad
Si N Si
Mensaje
Fin
26
Las tablas de la base de datos que se utilizan para mantener actualizado el avance de cada usuario son :
Usuario
Avance
Usuario
Avance
La tabla usuario tendr los siguientes campos: Usuario Contrasea Nombre Correo UEA Calificacin La tabla avance tendr los siguientes campos: Usuario Captulo Tema Subtema
27
Datos de salida La salida de este mdulo ser el resumen de uno de los subtemas correspondiente al tema y captulo del usuario en cuestin, como lo muestra la siguiente figura.
Con los datos de entrada (captulo, tema y subtema) se recupera el subtema correspondiente al usuario de un documento XML.
28
5.4 Fundamentos de XML XML (Lenguaje de Marcado Extensible) es una versin simplificada de SGLM(Lenguaje Estructurado Generalizado de Marcado), optimizada para la Web. Al igual que SGLM, XML nos permite determinar nuestro propio conjunto de elementos a la hora de describir un documento concreto. Tambin al igual que en SGML, un individuo o un comit de estndares pueden definir una aplicacin XML ( tambin denominada vocabulario),que es un conjunto de elementos y una estructura de documento de propsito general, que pueden utilizarse para describir documentos de un determinado tipo.
5.4.1 Los objetivos oficiales de XML 1.- XML se debe poder utilizar directamente en Internet. 2.- XML debe admitir una gran variedad de aplicaciones. 3.- XML debe ser compatible con SGML. 4.- Debe ser fcil crear programas que procesen documentos XML. 5.- El nmero de funcionalidades opcionales de XML deber mantenerse en un mnimo absoluto. Preferiblemente cero. 6.- Los documentos XML debern ser inteligibles para los humanos y razonablemente claros. 7.- El diseo de XML deber prepararse rpidamente. 8.- El diseo de XML deber ser formal y conciso. 9.- Los documentos XML debern ser fciles de generar. 10.- La concisin en los marcadores XML tiene una importancia mnima.
5.4.2 Algunas reglas bsicas de XML Las siguientes son unas pocas reglas bsicas para crear un documento XML bien formado. Un documento bien formado es aqul que se adapta al conjunto mnimo de reglas, que permiten que el documento sea procesado por un explorador o por cualquier otro programa. El documento debe tener exactamente un elemento de nivel superior (elemento documento, o elemento raz). Todos los dems elementos deben estar anidados dentro de l. Los elementos han de estar adecuadamente anidados. Cada elemento deber tener un marcador de inicio y un marcador de fin.
29
El nombre del tipo de elemento en un marcador de inicio debe coincidir exactamente con el nombre de su marcador de fin correspondiente. En los nombres de los tipos de elemento se distingue entre maysculas y minsculas.
5.4.3 Estructura de un documento XML Un documento XML puede estar formado por un prlogo (es una parte opcional) y un ejemplar. Aunque el prlogo es opcional, su inclusin es muy recomendable ya que facilita un procesado fiable y robusto de la informacin contenida en el ejemplar. El prlogo puede a su vez dividirse en dos partes: La Declaracin XML. La Declaracin del Tipo del Documento. La Declaracin XML cumple varias funciones: Marca el documento como texto XML. Declara cul es la versin de XML utilizada para elaborar el documento a travs de lo que se denomina una declaracin de versin. Aporta informacin sobre la codificacin empleada para representar los caracteres mediante una declaracin de codificacin. Incluye tambin una declaracin de documento autnomo. Un ejemplo de declaracin XML completa podra ser el siguiente. <?xml versin = 1.0 encoding =ISO-8859-1 standalone=yes ?> La declaracion del tipo de documento La funcion de la DTD es describir el lenguaje de marcado que se ha creado. Proporciona la lista de instrucciones o restricciones que utilizan los analizadores sintacticos como reglas para comprobar los elementos,atributos,entidades y anotaciones de un documento XML. Las DTD son la clave para documentos XML valido. Los analizadores sintacticos de XML validadotes utilizan las restricciones que stas proporcionan para comprobar el documento, garantizar que est bien formado y asegurarse de que ninguno de los elementos que contiene se ha utilizado mas alla de las restricciones impuestas por la DTD. 5.5 Documento XML El documento XML que usar el sistema es el siguiente: <?xml version="1.0" encoding="ISO-8859-1"?> <?xml:stylesheet href="prueba.xsl" type="text/xsl"?>
30
<capitulos> <capitulo> <numero>1</numero> <nombre>Capitulo 1</nombre> <tema> <numero>1</numero> <nombre>Tema 1</nombre> <subtema> <numero>1</numero> <nombre>Subtema 1</nombre> <contenido> Este es el contenido de 1 1 1 </contenido> </subtema> <subtema> <numero>2</numero> <nombre>Subtema 2</nombre> <contenido> Este es el contenido de 1 1 2 </contenido> </subtema> ... </tema> <tema> </tema>
31
</capitulo> <capitulo> </capitulo> ... </capitulos> Una vez recuperado el subtema correspondiente, ahora considerado como un documento de texto, ste pasar por el agoritmo de resumen del documento. La primera versin de este algoritmo tiene las siguientes etapas:
Documen to Original
Anlisis Morfosintcti co
Peso de Oraciones
Seleccin de Oraciones
La primera etapa consiste en obtener el documento (contenido de un subtema) del cual se obtendr el resumen. Este documento se tomar del archivo XML. Para lograr este objetivo se utilizar la herramienta DOM (Modelo ObjetoDocumento). La segunda etapa El anlisis morfosintctico consiste en clasificar cada palabra del documento con un peso determinado. Para lograrlo es necesario guardar cada palabra del documento en un arreglo, despus guardar en otro arreglo las palabras del documento pero sin repeticiones. Con este nuevo a arreglo se clasifican las palabras del documento en su categora lexica, ya sea en clases abiertas (sustantivo, adjetivo, verbo) o e n clases cerradas (Artculo, pronombre, preposicin). Las clases abiertas se conservan y las clases cerradas se desechan. Para lograr esta clasificacin se compara con respecto a las palabras del dominio que se encuentran en una base de datos. El diagrama de esta etapa es la siguiente:
32
Inici
Documento
No
Si
Formar P l b
Guardar Palabra En Un
No
Fin
Tomar P l b
Palabra Clave
Si
No
Se Desecha
Guardar P l b
Se Guarda El Peso De La Palabra Segn Su Categora Lxico, Por Su frecuencia Y Si Aparece En Ttulo O No, En Un A l
33
La tercera etapa Peso de Oraciones, determina el peso de cada oracin del documento. Lo primero que realiza esta etapa es guardar en un arreglo cada oracin del documento. Para obtener el peso de cada oracin, se compara cada palabra de la oracin con los arreglos que contienen las palabras clasificadas y sus pesos correspondientes, sumando dichos pesos. El diagrama de esta etapa es el siguiente
34
Inici
Documento
No
Si No
Tomar Una O i
Si
Tomar Una O i
No
No Fin De
Si Guardar El Peso De La Oracin En Un
Tomar una P l b
No
35
La cuarta etapa Seleccin de oraciones consiste en seleccionar las oraciones que formarn parte del resumen. Lo primero que se debe calcular es que porcentaje del documento se tendr en el resumen, esto en numero de caracteres. Despus, del arreglo de oraciones se va tomando la de mayor peso y que no este marcada. Se calcula el nmero de caracteres de la oracin y se suman. Si la suma es menor al porcentaje calculado, entonces esta oracin formar parte del resumen, se tomar la siguiente de mayor peso y no marcada, se calcula el numero de caracteres y se suman y se vuelve a comparar con el porcentaje calculado y as, hasta que la suma sea mayor que el porcentaje calculado.
36
Inici
No
Desplegar el Resumen
No
37
5.6 Algoritmo del resumen del documento. La primera versin del algoritmo es la siguiente: 1) Obtener el documento. 2) Obtener cada una de las oraciones que forman el documento. 3) Clasificar cada palabra de la oracin en una categora lxica. 4) Para cada palabra del documento. Si la palabra pertenece a una categora lxica abierta. Seleccionar la palabra. Si no Desechamos la palabra. 5) Para cada palabra seleccionada. Calcular su peso en base a su: categora lxica. Asignando X puntos a los sustantivos, adjetivos y verbos. Nmero de repeticiones en el documento. Asignando Y puntos cada vez que aparece en el documento. Ttulo y/o Subttulo del Tema estudiado. Asignando Z puntos a cada palabra del Ttulo y/o Subttulo. 6) Para cada oracin del documento. Calcular su peso en base a los pesos de cada una de las palabras seleccionadas y las palabras que forman la oracin. 7) Determinar las oraciones que forman parte del resumen. Obtener el nmero de caracteres que debe contener el resumen en base al X% del documento original. Para cada una de las oraciones de Mayor a menor puntaje.
38
Mientras el nmero de caracteres del resumen sea mayor que la suma de los caracteres de las oraciones revisadas. Sumar el nmero de caracteres de la oracin. Fin Mientras Fin Para
39
BIBLIOGRAFA
[1] Inderjeet Mani and Maybury. Advances in Automatic Text Summarization. Cambridge, Massachusetts, MIT Press. [2] Gael Dias and Bruno Conde. Efficient Text Summarization For Web Browsing On Mobile Devices. Portuguese Foundation for Science and Tecnology Under the SUMO Project POSC / PLP / 57438 / 2004. [3] Inderjeet Mani. Recent Developments in Text Summarization. ACM CIKM, pp 529 531, Georgia, USA, 2001. [4] Chris Houser, Patricia Thorntn, David Kluge and Finjo Gakuin. Mobile Learning: Cell Phones and PDAs for Education. In Proc. Of the International Conference on Computers in Education, 2002. [5] Luca Chitaro. Visualizing Information on Mobile Devices. IEEE Computer Society, March 2006. [6] Blanco, Catalina. (1999) "Los desafos del aprendizaje en el afuera de la enseanza" en Tercer Simposio Internacional de Educacin a Distancia: La educacin a distancia y el aprendizaje abierto: Aportes para la construccin de un nuevo paradigma educativo. Mayo 19,20y21 de 1999. Santa Fe de Bogot, Colombia.pp. 16-23. [7] Moreno Angarita, Marisol. "El aprendizaje, un solo motor para la triada ms poderosa del siglo 21: informacin, comunicacin y tecnologa" en Tercer Simposio Internacional de Educacin a Distancia: La educacin a distancia y el aprendizaje abierto: Aportes para la construccin de un nuevo paradigma educativo. Mayo 19,20y21 de 1999. Santa Fe de Bogot, Colombia.pp.95-117. [8] Colom Caellas, Antonio J. (1998) "Pedagoga tecnolgica para la educacin a distancia en Los nuevos escenarios educativos y las transformaciones tecnolgicas. Patricia Avila comp., ILCE, Mxico, pp. 25-40. [9] Comparation between server-side scripting technologies JSP,ASP,PHP.Tomado de http://216.239.53.100/search?q=cache:SMCxSaA3JKgC:www.csc.liv.ac.uk/~u1bbj/ CGI.doc++%22php%22++%22asp%22++%22jsp%22+++comparison&hl=en&ie=U TF-8.
[10] Jim Keogh. Manual de referencia. J2EE. Mc Graw Hill. [11] Heater Williamson. Manual de referencia. XML. Mc Graw Hill.
40