Aspirantes
Estudiantes
Docentes
Administrativos
SAPIENS
Correo Institucional

EXDACLET: Herramienta de datacleaning basada en agentes inteligentes orientada a la web

Lasso Achicanoy, Javier Armando Y Quintas Rodríguez, Jhon Freddy (2008) EXDACLET: Herramienta de datacleaning basada en agentes inteligentes orientada a la web. Project Report. Universidad de Nariño, Pasto.

[img] Text
74405.pdf

Download (15MB)

Resumen

En este trabajo se presenta el análisis, diseño e implementación de EXDACLET, una Herramienta de Datacleaning Basada en Agentes Inteligentes Orientada a la Web para ayudar en los procesos de Limpieza, Selección y Transformación de datos. La arquitectura de EXDACLET consta de cinco módulos, el módulo de conexión encargado de mantener una comunicación constante entre la herramienta y el Sistema Gestor de Base de Datos (SGBD) el cual almacena los resultados de los procesos de Limpieza de Datos, el módulo de importación encargado de interpretar y cargar los archivos soportados por la herramienta, el módulo de Kernel dentro del cual se encuentran todos los filtros de limpieza, selección y transformación implementados, el módulo de exportación que permite almacenar los resultados en archivos y el módulo de interfaz gráfica que permite la interacción sencilla y amigable entre el usuario y la herramienta. Los filtros de limpieza implementados son Number Null Clean que contiene varios filtros internos, String Null Clean, Trim, Expert Rule Editor y Email Cleaner. Los filtros de transformación son Discretize, Normalize, Char Replace, Upper Case, Lower Case, Truncate String, Non-printable Character Search, Change Attribute Name, Change Attribute Type, Add Attribute, Delete Attribute, Attribute Clear, Binarize, Table Encoder y Table Decoder. Los filtros de selección son Max Length, Min Length, Jaro-Winkler Search, Metaphone Search, Double Metaphone Search, LD Search, Soundex Search, Duplicates Search y Table Union. En este trabajo se analiza y evalúa los resultados y el desempeño de Duplicates Search, Soundex Search y LD Search para filtros de selección, Char Replace, NonPrintable Character Search, Binarize y Table Enconder/Decoder para filtros de transformación y Email Cleaner para filtros de limpieza.

Tipo de Elemento: Monografía (Project Report)
Información Adicional: Director Dr. Ricardo Timaran Pereira, Ph.D.
Palabras Clave: EXDACLET, datacleaning, web, limpieza, selección, transformación, datos
Asunto: Q Ciencias > QA Mathematics > QA76 Computer software
T Tecnología > T Technology (General)
Division: Facultad de Ingeniería > Programa de Ingeniería de Sistemas > Trabajos de grado
Depósito de Usuario: Monitor Biblioteca 4 Quijano Guerrero
Fecha Deposito: 17 Abr 2024 20:38
Ultima Modificación: 17 Abr 2024 20:38
URI: http://sired.udenar.edu.co/id/eprint/11604

Ver Elemento Ver Elemento