STEMMING EN ESPAÑOL PARA DOCUMENTOS RECUPERADOS DE LA WEB

Hugo Armando Ordoñez Eraso; Carlos Alberto Cobos Lozada

STEMMING EN ESPAÑOL PARA DOCUMENTOS RECUPERADOS DE LA WEB

Autores/as

Hugo Armando Ordoñez Eraso Universidad Mariana
Carlos Alberto Cobos Lozada

Palabras clave:

Búsqueda web, stemming en español, evaluación n-gramas

Resumen Autores/as Referencias bibliográficas Cómo citar

Resumen

La recuperación de información en internet, hoy en día se ha convertido en una importante área de investigación, debido al crecimiento acelerado de las fuentes de información que en la web se encuentran. La investigación en este campo se ha centrado en crear mecanismos, métodos y herramientas como los algoritmos de stemming y los meta-buscadores, que optimizan la precisión en este tipo de tareas, mejorando así los resultados retornados al usuario que utiliza el sistema. En este artículo se presenta y describe a nivel general, los componentes de un algoritmo denominado Filtro Español, que permite rea-lizar stemming a documentos escritos en español en un sistema de búsqueda web. Este se diseña, con el fin de ampliar automáticamente la búsqueda a todas las variaciones morfológicas de las palabras digitadas por los usuarios en las consultas y el contenido de los documentos. Para validar la eficiencia del analizador, se realizó un cálculo de similitud entre los documentos, aplicando el método de n-gramas. La evaluación contempla la precisión del filtro donde los resultados de la primera valoración son interesantes.

Biografía del autor/a

Hugo Armando Ordoñez Eraso, Universidad Mariana

Docente Investigador, Facultad de Ingeniería, Universidad Mariana, San Juan de Pasto, Colombia.

Doctorando Ingeniería Telemática, Universidad del Cauca; Magíster en Computación, Universidad del Cauca; miembrodel Grupo de I+D en Tecnología de Información (GTI), Universidad del Cauca; Miembro del Grupo de Investigación en Ingeniería de Sistemas, Universidad Mariana.

Carlos Alberto Cobos Lozada

Docente Investigador Titular, Departamento de Sistemas, Universidad del Cauca, PopayÃ¡n, Colombia

Referencias bibliográficas

Manning, C., Raghavan, P. & Schütze, H. (2008) An Introduction to Information Retrieval. Cambridge, England: Cambridge University Press.

Baeza-Yates, R., Castillo, C. & Keith, B. (2006) Web Searching. En: Encyclopedia of Language & Linguistics. Elsevier: Oxford. p. 527-538.

Rolleke, T., Tsikrika, T. & Kazai, G (2006) A general matrix fra-mework for modelling Information Retrieval. Information Processing & Management Vol. 42, (1) 4-30.

Jardine & C.J.V. Rijsbergen. (2008) The Use of Hierarchic Clustering in Information Retrieval ... 193 - Usa: Pittsburgh.

Jansen, B. & Spink, A. (2006) How are we searching the World Wide Web? A comparison of nine search engine transaction logs. Information Processing & Management.

Carmona, J., Cervell, S., Màrquez, L., Martí, M., Padró, L., Placer, R., Rodríguez, H., Taulé M. & Turmo, J. (1998) An Environment for Morphosyntactic Processing of UnrestrictedSpanish text.

Cómo citar

Ordoñez Eraso, H. A., & Lozada, C. A. C. (2014). STEMMING EN ESPAÑOL PARA DOCUMENTOS RECUPERADOS DE LA WEB. Revista UNIMAR, 29(2), 109–114. Recuperado a partir de https://revistasumarianaeduco.biteca.online/index.php/unimar/article/view/220

Descargar cita

Descargas

Los datos de descargas todavía no están disponibles.

Lenguajes:

español

Tipo:

Texto

Descargas

Publicado

2014-04-04

Número

Vol. 29 Núm. 2 (2011): Revista UNIMAR - Julio - Diciembre

Sección

Artículos resultado de investigación

Licencia

Derechos de autor 2014 Revista UNIMAR

Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.

Los autores que publiquen en esta revista aceptan las siguientes condiciones:

1. Los autores conservan los derechos de autor y ceden a la revista el derecho de la primera publicación, con el trabajo registrado con la licencia de atribución de Creative Commons, que permite a terceros utilizar lo publicado siempre que mencionen la autoría del trabajo y a la primera publicación en esta revista.

2. Los autores pueden realizar otros acuerdos contractuales independientes y adicionales para la distribución no exclusiva de la versión del artículo publicado en esta revista (p. ej., incluirlo en un repositorio institucional o publicarlo en un libro) siempre que indiquen claramente que el trabajo se publicó por primera vez en esta revista.

3. Se permite y recomienda a los autores publicar su trabajo en Internet (por ejemplo en páginas institucionales o personales) antes y durante el proceso de revisión y publicación, ya que puede conducir a intercambios productivos y a una mayor y más rápida difusión del trabajo publicado (veaThe Effect of Open Access).

Métricas

Estadísticas de artículo
Vistas de resúmenes
Vistas de PDF
Descargas de PDF
Vistas de HTML
Otras vistas

Buzón de sugerencias

Queremos mejorar para usted. ¿Tiene algún comentario, idea o sugerencia sobre cómo podemos hacerlo?

STEMMING EN ESPAÑOL PARA DOCUMENTOS RECUPERADOS DE LA WEB

Autores/as

Palabras clave:

Resumen

Biografía del autor/a

Hugo Armando Ordoñez Eraso, Universidad Mariana

Carlos Alberto Cobos Lozada

Referencias bibliográficas

Cómo citar

Descargas

Lenguajes:

Tipo:

Descargas

Publicado

Número

Sección

Licencia

Métricas

Algunos artículos similares: