SABER UCV >
2) Tesis >
Pregrado >

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/123456789/15541

Título : Implementación de los módulos de adquisición y almacenamiento de un prototipo para el archivado de sitios Web en Venezuela.
Autor : Rivero Perdomo, Lorena Elisa
García Laguado, Jonathan Eduardo
Palabras clave : Archivo Web
WARC
Indexación
Fecha de publicación : 29-Mar-2017
Citación : Biblioteca Alonso Gamero Facultad de Ciencias;TG-19165
Resumen : Resumen El patrimonio cultural define a los pueblos y representa su herencia histórica, por lo cual es importante su preservación. El patrimonio cultural se ha clasificado como tangible (obras materiales) o intangible (generación y transmisión de conocimiento, costumbres, etc.), dentro de este último se define el patrimonio digital como aquel que ha sido originado de manera digital y abarca recursos como contenido Web, bases de datos, libros digitales, material multimedia, grabaciones, programas informáticos, entre otros. Entre éstos se tienen las paginas Web que se diferencian de cualquier otro tipo de recurso digital por su naturaleza cambiante y su estructura de hiperenlaces, por lo que su preservación tiene características propias y retos que deben ser abarcados por los Archivos Web, los cuales son sistemas de información cuya finalidad es la preservación histórica de estos recursos conocidos como patrimonio Web.El presente Trabajo Especial de Grado propone la implementación de los módulos de adquisición y gestión de almacenamiento de un prototipo de Archivo Web para la salvaguarda de contenido cultural,educativo y que en general sea significativo para la herencia cultural de Venezuela. Para la adquisición del contenido se adoptó una estrategia de archivado del lado del cliente utilizando como herramienta el rastreador Heritrix. El contenido recuperado por el rastreador se almacena en contenedores Web que usan un formato para Archivos Web denominado WARC, los cuales son indexados utilizando la plataforma de búsqueda Solr. Para el almacenamiento se adoptó una estrategia de archivado con servidor Web, lo que significa almacenar la respuesta que proporciona el servidor Web del sitio a cosechar. Además se implementaron dos aplicaciones en Ruby on Rails una de ellas para administrar los trabajos de rastreos, y la otra para la búsqueda y visualización de métricas de los contenidos almacenados. Palabras clave: Archivo Web, preservación Web, WARC, cosecha, almacenamiento, rastreo, Heritrix, indexación, Solr.
Descripción : TUTOR: Profa. Mercy Ospina Torres
URI : http://hdl.handle.net/123456789/15541
Aparece en las colecciones: Pregrado

Ficheros en este ítem:

Fichero Descripción Tamaño Formato
TESIS_Garcia-17160622_Rivero-19064474.pdf3.97 MBAdobe PDFVisualizar/Abrir

Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.

 

Valid XHTML 1.0! DSpace Software Copyright © 2002-2008 MIT and Hewlett-Packard - Comentarios