Internet ha causado una gran revolución en la forma de comunicarnos y trasmitir el conocimiento, disponemos de una gran cantidad de información en cualquier momento en cualquier parte del mundo, estamos en un punto en que algunos navegadores como Google, ofrecen servicios de traducción de los contenidos al idioma respectivo del sitio donde se hace la búsqueda, es importante crear sistemas de información que permitan que la recuperación de información ser cada vez más precisa.
Es importante entonces que se organice el conocimiento de forma que se pueda hacer una buena recuperación de información, para lograrlo debemos empezar con la indización, los motores de búsqueda hacen su trabajo con base en el texto que encuentran en las páginas, para esto utiliza estructuras de apoyo como la indización; consiste en construir estructuras de acceso a los documentos con base en los términos que contienen, estas estructuras hacen posible que los sistemas de recuperación de información basen su búsqueda en la comparación de los términos utilizados.
Para un sistema de recuperación de información establece si utiliza o no índices. Los campos a usar para la recuperación de información se tiene un archivo invertido, en algunos casos se hace referencia de partes del párrafo del documento, esta pues el archivo invertido a los términos para indexar una colección de documentos, en el encontramos el vocabulario de las palabras que componen un texto, las ocurrencias que son la cantidad de veces que se encuentra una palabra en un texto y el sitio donde se encuentran, la indexación de un documento seria entonces con una serie de términos remplazar el contenido del texto para so posterior recuperación.
Fuente
Gomez Laureano Felipe. Introducción a la Recuperación de información clase 2: [En línea]. [Consultado 04 septiembre 2011]. Disponible en: http://uvirtual.lasalle.edu.co/file.php/807/Tema_2/introduccion_a_la_ri_2010-II.pdf
5 ways I'm handling the holidays with Gemini
Hace 16 horas
0 comentarios:
Publicar un comentario