Lasso Achicanoy, Javier Armando Y Quintas Rodríguez, Jhon Freddy (2008) EXDACLET: Herramienta de datacleaning basada en agentes inteligentes orientada a la web. Project Report. Universidad de Nariño, Pasto.
Text
74405.pdf Download (15MB) |
Resumen
En este trabajo se presenta el análisis, diseño e implementación de EXDACLET, una Herramienta de Datacleaning Basada en Agentes Inteligentes Orientada a la Web para ayudar en los procesos de Limpieza, Selección y Transformación de datos. La arquitectura de EXDACLET consta de cinco módulos, el módulo de conexión encargado de mantener una comunicación constante entre la herramienta y el Sistema Gestor de Base de Datos (SGBD) el cual almacena los resultados de los procesos de Limpieza de Datos, el módulo de importación encargado de interpretar y cargar los archivos soportados por la herramienta, el módulo de Kernel dentro del cual se encuentran todos los filtros de limpieza, selección y transformación implementados, el módulo de exportación que permite almacenar los resultados en archivos y el módulo de interfaz gráfica que permite la interacción sencilla y amigable entre el usuario y la herramienta. Los filtros de limpieza implementados son Number Null Clean que contiene varios filtros internos, String Null Clean, Trim, Expert Rule Editor y Email Cleaner. Los filtros de transformación son Discretize, Normalize, Char Replace, Upper Case, Lower Case, Truncate String, Non-printable Character Search, Change Attribute Name, Change Attribute Type, Add Attribute, Delete Attribute, Attribute Clear, Binarize, Table Encoder y Table Decoder. Los filtros de selección son Max Length, Min Length, Jaro-Winkler Search, Metaphone Search, Double Metaphone Search, LD Search, Soundex Search, Duplicates Search y Table Union. En este trabajo se analiza y evalúa los resultados y el desempeño de Duplicates Search, Soundex Search y LD Search para filtros de selección, Char Replace, NonPrintable Character Search, Binarize y Table Enconder/Decoder para filtros de transformación y Email Cleaner para filtros de limpieza.
Tipo de Elemento: | Monografía (Project Report) |
---|---|
Información Adicional: | Director Dr. Ricardo Timaran Pereira, Ph.D. |
Palabras Clave: | EXDACLET, datacleaning, web, limpieza, selección, transformación, datos |
Asunto: | Q Ciencias > QA Mathematics > QA76 Computer software T Tecnología > T Technology (General) |
Division: | Facultad de Ingeniería > Programa de Ingeniería de Sistemas > Trabajos de grado |
Depósito de Usuario: | Monitor Biblioteca 4 Quijano Guerrero |
Fecha Deposito: | 17 Abr 2024 20:38 |
Ultima Modificación: | 17 Abr 2024 20:38 |
URI: | http://sired.udenar.edu.co/id/eprint/11604 |
Ver Elemento |