DSpace About DSpace Software
 

SABER UCV >
2) Tesis >
Pregrado >

Please use this identifier to cite or link to this item: https://saber.ucv.ve/handle/10872/15541

Title: Implementación de los módulos de adquisición y almacenamiento de un prototipo para el archivado de sitios Web en Venezuela.
Authors: Rivero Perdomo, Lorena Elisa
García Laguado, Jonathan Eduardo
Keywords: Archivo Web
WARC
Indexación
Issue Date: 29-Mar-2017
Series/Report no.: Biblioteca Alonso Gamero Facultad de Ciencias;TG-19165
Abstract: Resumen El patrimonio cultural define a los pueblos y representa su herencia histórica, por lo cual es importante su preservación. El patrimonio cultural se ha clasificado como tangible (obras materiales) o intangible (generación y transmisión de conocimiento, costumbres, etc.), dentro de este último se define el patrimonio digital como aquel que ha sido originado de manera digital y abarca recursos como contenido Web, bases de datos, libros digitales, material multimedia, grabaciones, programas informáticos, entre otros. Entre éstos se tienen las paginas Web que se diferencian de cualquier otro tipo de recurso digital por su naturaleza cambiante y su estructura de hiperenlaces, por lo que su preservación tiene características propias y retos que deben ser abarcados por los Archivos Web, los cuales son sistemas de información cuya finalidad es la preservación histórica de estos recursos conocidos como patrimonio Web.El presente Trabajo Especial de Grado propone la implementación de los módulos de adquisición y gestión de almacenamiento de un prototipo de Archivo Web para la salvaguarda de contenido cultural,educativo y que en general sea significativo para la herencia cultural de Venezuela. Para la adquisición del contenido se adoptó una estrategia de archivado del lado del cliente utilizando como herramienta el rastreador Heritrix. El contenido recuperado por el rastreador se almacena en contenedores Web que usan un formato para Archivos Web denominado WARC, los cuales son indexados utilizando la plataforma de búsqueda Solr. Para el almacenamiento se adoptó una estrategia de archivado con servidor Web, lo que significa almacenar la respuesta que proporciona el servidor Web del sitio a cosechar. Además se implementaron dos aplicaciones en Ruby on Rails una de ellas para administrar los trabajos de rastreos, y la otra para la búsqueda y visualización de métricas de los contenidos almacenados. Palabras clave: Archivo Web, preservación Web, WARC, cosecha, almacenamiento, rastreo, Heritrix, indexación, Solr.
Description: TUTOR: Profa. Mercy Ospina Torres
URI: http://hdl.handle.net/10872/15541
Appears in Collections:Pregrado

Files in This Item:

File Description SizeFormat
TESIS_Garcia-17160622_Rivero-19064474.pdf3.97 MBAdobe PDFView/Open
View Statistics

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

 

Valid XHTML 1.0! DSpace Software Copyright © 2002-2010  Duraspace - Feedback