DSpace About DSpace Software
 

SABER UCV >
2) Tesis >
Pregrado >

Please use this identifier to cite or link to this item: https://saber.ucv.ve/handle/10872/13728

Title: Desarrollo de una interfaz gráfica en R para la ejecución de métodos de minería de datos sobre plataformas Hadoop para Big Data
Authors: Madrid, Pascual
Keywords: Interfaz gráfica programada en R
Hadoop
MapReduce
Issue Date: 16-Mar-2016
Series/Report no.: Biblioteca Alonso Gamero Facultad de Ciencias;TG-20353
Abstract: El análisis de grandes volúmenes de datos representa un gran reto para los científicos de datos, ya sea desde un punto de vista intelectual y uno de recursos. No es sencillo realizar análisis en plataformas de Big Data debido a que los scripts deben seguir un paradigma de programación llamado MapReduce el cual resulta todo un reto hasta para las personas con mucha experiencia en la programación sin contar lo costoso que es implementar toda una infraestructura que de soporte a la cantidad masiva de datos. La intención de este trabajo de grado es la realización de una aplicación que provea una interfaz gráfica para la ejecución de métodos de minería de datos sobre una plataforma Hadoop de una manera remota sin tener que implementar métodos MapReduce ni tener que preparar una infraestructura Hadoop, sólo utilizar una ya preparada previamente. La aplicación fue programada utilizando el lenguaje de programación estadístico R utilizando una gran gama de paquetes para el desarrollo de la interfaz y de los cálculos. La comunicación con la plataforma Hadoop se hace mediante el protocolo SSH (Secure Shell) permitiendo un tráfico de información de manera segura en todo momento. Se realizaron pruebas sencillas que englobaron todas las funcionalidades de la aplicación. Este trabajo dejó como fruto final una interfaz gráfica programada en R capaz de ejecutar métodos de minería de datos de manera local y remota sobre un clúster Hadoop y también la posibilidad de ejecutar funciones Map y Reduce en un clúster Hadoop utilizando la funcionalidad llamada Hadoop Streaming.
Description: Tutores: Prof. Jesús Lares; Prof. José Sosa
URI: http://hdl.handle.net/10872/13728
Appears in Collections:Pregrado

Files in This Item:

File Description SizeFormat
TEG_PascualMadrid4.pdf2.99 MBAdobe PDFView/Open
View Statistics

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

 

Valid XHTML 1.0! DSpace Software Copyright © 2002-2010  Duraspace - Feedback