Ad verba per numeros

Integración de documentos, Hojas de ruta
Monday, May 7, 2007, 09:22 AM
Algunos de los que estáis trabajando en el proyecto de integración de documentos ya habéis revisado y documentado el material sobre TextTiling; confio en que también hayáis preparado el correspondiente proyecto Eclipse para la versión Java.

Lo que deberíais hacer ahora es construir un pequeño prototipo de aplicación web (podéis usar cualquier lenguaje) que permita a un usuario enviar varios textos (ficheros de su disco duro) y almacenarlos en un directorio remoto del servidor.

Los textos almacenados en el servidor deberían segmentarse en pasajes mediante JTexttiling, cada pasaje deberá grabarse en su propio archivo y tener un identificador único que ayude, además, a determinar el documento al que pertenece (p.ej. doc000-003.txt).

Sería interesante que aprovechéis este prototipo para estudiar el modo de mantener "aislado" el material de los distintos usuarios que pueden utilizar vuestro servicio de manera simultánea.

(Continuará...)



Back Next