Cujar Rosero, Felipe Y Pinchao Ortiz, David Santiago (2021) Motor de búsqueda inteligente de informes de investigación basado en recursos semánticos para el sistema de investigaciones de la Universidad de Nariño. Project Report. Universidad de Nariño, San Juan de Pasto.
|
Text
210764.pdf Download (10MB) |
Resumen
En este documento se presenta la construcción de un motor de búsqueda semántico que utilizó una Ontología y un modelo entrenado con Machine Learning para soportar la búsqueda semántica de proyectos de investigación del Sistema de Investigaciones de la Universidad de Nariño. Para la construcción de THAQHAÑA, como se le denomina a este motor, se utilizó la metodología que comprende las etapas de: apropiación del conocimiento; instalación y configuración de las herramientas, bibliotecas y tecnologías; recolección, extracción, preparación, exploración y análisis de proyectos de investigación; diseño, desarrollo, implementación y despliegue del motor de búsqueda semántico; realización de pruebas finales y evaluación del rendimiento del motor de búsqueda semántico. Los resultados principales del trabajo fueron los siguientes: a) la construcción completa de la Ontología con classes (clases), object properties(predicados), data properties(atributos) e individuals (instancias) en Protegé, consultas SPARQL con Apache Jena Fuseki y la respectiva codificación con Owlready2 usando Jupyter Notebook con Python dentro del entorno virtual de Anaconda; b) el entrenamiento exitoso del modelo para el cual se usaron algoritmos de Machine Learning y específicamente de Procesamiento de Lenguaje Natural como: SpaCy, NLTK, Word2Vec y Doc2Vec, esto también se realizó en Jupyter Notebook con Python dentro del entorno virtual de Anaconda y con Elasticsearch; y c) la creación de THAQHAÑA gestionando y unificando las consultas para la Ontología y para el modelo de Machine Learning. Las pruebas demostraron que THAQHAÑA fue exitoso en todas las búsquedas llevadas a cabo porque sus resultados fueron satisfactorios.
| Tipo de Elemento: | Monografía (Project Report) |
|---|---|
| Información Adicional: | Director: Ph.D. Silvio Ricardo Timarán Pereira |
| Palabras Clave: | Machine Learning, Entorno virtual, Lenguaje natural SpaCy, NLTK, Word2Vec y Doc2Vec |
| Asunto: | T Tecnología > T Technology (General) |
| Division: | Facultad de Ingeniería > Programa de Ingeniería de Sistemas > Trabajos de grado |
| Depósito de Usuario: | Funcionario Biblioteca Uno |
| Fecha Deposito: | 17 Dec 2025 17:02 |
| Ultima Modificación: | 17 Dec 2025 17:02 |
| URI: | http://sired.udenar.edu.co/id/eprint/17541 |
![]() |
Ver Elemento |


