Por favor, use este identificador para citar o enlazar este ítem: http://200.188.131.162:8080/jspui/handle/123456789/360
Título : Implementación de un prototipo de un sistema de recuperación de información que utilice ontologias para la expansión de consultas
Autor : HERNÁNDEZ GONZÁLEZ, LUCIA JANETH
Palabras clave : 7
Fecha de publicación : 2016-12
Editorial : IT Ciudad Madero
Descripción : Resumen Los Sistemas de Recuperaci on de Informaci on (IRS) son un estudio importante desde 1945 [Singhal, 2001]. La esencia de estos sistemas est a en el empleo de los Modelos de Recuperaci on de Informaci on (IRM), los cuales se encargan de comparar los t erminos semejantes de consulta con una colecci on de documentos tomando en cuenta la concurrencia de t erminos, para recuperar un conjunto de documentos de acuerdo a ciertos criterios de clasi caci on. Existen m etricas que permiten clasi car un conjunto de documentos de acuerdo al grado de similitud, tal como el coseno de similitud y el soft cosine measure [Sidorov et al., 2014]. En este trabajo se compararon tres diferentes m etodos de expansi on:(a) Familia l exica, (b) sin onimos y (c) lexema, utilizando el dominio en Ciencias de la Computaci on. El IRM seleccionado para realizar la b usqueda y recuperaci on de documentos en este trabajo fue el Modelo de Espacio Vectorial (VSM), el cual empleo una muestra de la colecci on CACM. Esta muestra est a compuesta por 5 consultas y 130 documentos. Y para determinar cual de las dos m etricas de similitud mencionadas en el primer p arrafo ser a aplicada en el proceso de clasi caci on se realizo una experimentaci on para evaluar los ndices de Recall y Precision. Ambas m etricas obtuvieron el 100% de Recall lo cual indica que el sistema recupero todos los documentos relevantes en cada consulta. Sin embargo Soft Cosine Measure obtuvo 0.7% m as precisi on que la m etrica del coseno, por lo tanto se utilizo este ultimo. Para hacer las expansiones de las consultas se agregaron por cada t ermino de la consulta un m aximo de 5 t erminos que comparte el mismo lexema para la familia l exica; un m aximo de 5 sin onimos para la expansi on usando sin onimos y para la expansi on del lexema se incorpor o por cada t ermino de la consulta, el lexema y en caso de que el t ermino sea un lexema no se agrega ning un t ermino. Los resultados obtenidos en la fase experimental bajo la con guraci on de 5 consultas y 130 documentos fueron que el Recall fue de un 100% para todas las consultas. Utilizando los resultados de precisi on se realizo una prueba de Wilcoxon que muestra diferencia estad sticamente signi cativa del 0.0411 entre la consulta original y el m etodo de expansi on con sin onimos.
URI : http://200.188.131.162:8080/jspui/handle/123456789/360
Aparece en las colecciones: Tesis de Maestría

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
Tesis_versionBiblioteca.pdf2.2 MBAdobe PDFVista previa
Visualizar/Abrir


Este ítem está protegido por copyright original



Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons