DSpace About DSpace Software
 

SABER UCV >
2) Tesis >
Pregrado >

Please use this identifier to cite or link to this item: https://saber.ucv.ve/handle/10872/13696

Title: Desarrollo de una solución de inteligencia de negocio para la obtención de indicadores para apoyar la preservación web
Authors: López, Adriana
Sarno, Rosangela
Keywords: Archivo Web
Formato WARC
Datos Estadísticos
Issue Date: 16-Mar-2016
Series/Report no.: Biblioteca Alonso Gamero Facultad de Ciencias;TG-20325
Abstract: Los Archivos Web son sistemas de información que surgen para archivar, de manera histórica, documentos que están publicados en la Web, considerados parte del patrimonio digital de las naciones, y tienen como objetivo preservar conjuntos seleccionados de páginas, o sitios web, y sus documentos mediante su replicación y/o migración de su formato original a otra representación. El formato de archivo utilizado para esta tarea es el formato WARC, el cual es un contenedor de documentos Web estandarizado y desarrollado con la finalidad de soportar la preservación. Actualmente, se está desarrollando un prototipo de Archivo Web en Venezuela, en la Facultad de Ciencias de la Universidad Central de Venezuela, como una iniciativa de Preservación Web para sitios web en Venezuela. En esta iniciativa de preservación web, se generan constantemente una gran cantidad de metadatos a partir de los rastreos realizados al conjunto de sitios web venezolanos seleccionados, sin embargo, estos metadatos están embebidos en los archivos WARC o en los logs de rastreo, por lo que no son accesibles de manera directa. Los metadatos son definidos como información estructurada que describe, explica, localiza o, de cierta forma, facilita la obtención, uso o manejo de algún recurso, y aunque pueden ser categorizados como descriptivos, administrativos y estructurales, son los metadatos administrativos quienes poseen la mayoría de los metadatos sobre los rastreos realizados dentro del Prototipo de Archivo Web. El objetivo de este Trabajo Especial de Grado, el cual forma parte de dicho prototipo, es definir los datos estadísticos e indicadores útiles para los diferentes usuarios, para apoyar y facilitar las tareas de administración del sistema. Este trabajo forma parte del Prototipo de Archivo Web de Venezuela, y fue realizado bajo una adaptación del método ciclo de vida de Ralph Kimball, para la extracción de los metadatos se utilizó la librería WAT, para el almacenamiento de dichos metadatos, se utilizaron archivos en formato JSON y MongoDB, y para mostrar los indicadores y datos estadísticos se utilizó la herramienta Pentaho. Palabras Claves: Archivo Web, preservación Web, Formato WARC, Indicadores, Datos Estadísticos.
Description: Tutoras: Profa. Mercy Ospina; Profa. Concettina Di Vasta
URI: http://hdl.handle.net/10872/13696
Appears in Collections:Pregrado

Files in This Item:

File Description SizeFormat
Tesis_Lopez_Sarno.pdf4.48 MBAdobe PDFView/Open
View Statistics

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

 

Valid XHTML 1.0! DSpace Software Copyright © 2002-2010  Duraspace - Feedback