jueves, 20 de mayo de 2010

TIPOS DE BUSQUEDA OPERADORES BOLEANOS, CLAVES DE BASES




Dentro de lo que hemos visto en la materia de recuperación de informaciónnos encontramos con los buscadores Boleanos, en clase se han realizado ejercicios buscando por palabras claves en tres buscadores de este tipo: Google, Yahoo, y bink para hacer comparativos con cada uno de los buscarores para ver cual era el que mas recuperaba, cual era el buscaro con mayor y menor registro de acuerdo a criterios dados en clases
and, AND,or, OR entre otros terminos hicieron parte de la busqueda que realizo en la red, arrojando resultados muy inesperados por parte de las herramientas que se trabajar
En otra clase se trabajo la busqueda de bases de datos en ebsco, y wilson web, para el ingreso
para cada una de ellas, lo resultados fueron lo esperado encontrando las claves para el acceso a cada una de las bases en cuestión.

LUPUS RENAME

Para el cambio de las extenciones que se requerian para cada una de las colecciones, en especial los que se encontraban en otrso formatos diferentes a .txt la herramienta que se utilizo fue Lupus Rename, de muy sencillo manejo, y de rapido funcionamiento, y hace cambio de monbre de archivos, renombramiento de archivos, y las extenciones que nosotros queramos de forma masiva por medio de esta herramienta.
Para descargar la herramienta puedes entrar al sigunte link, y lo instalas en tu PC

TUTORIAL DOS SWISH-E


Despues de presentar la modificaciones de el tutorial uno, nos prestamos realizar el tutorial dos con herramientas de busqueda de la información mas rapidas para la realizar la recuperación de información , una de ellas es SWISH-E que es una herramienta que sirve para recuperación de información,

Una de las carateristicas que tiene la herramienta es en su manejo ya que este funciona es por simbolos de sistema (como se precia en la imagen) y por comandos de sistema, una de las mayores carateristicas de la herramiernta es la rapidez en el momento de realizar la indización como tal.

Para comenzar se descarga la herramienta, el link de abajo de sercarga la herramienta

http://swish-e.org/download/index.html (archivo comprimido). despues de descargar el software,en C, procedemos a el manejo por los comandos de sistema , hasta llegar al siguiente criterio para la indización dentrop de los comandos:

C:SWISH-E/bin>swish-e.exe _i 1
Posteriormente la colección se guarda dentro de una carpeta para facilitar la indizacion de información llamada "bin" dando los resultados esperados de forma mas rapida.

SISTEMAS DE RECUPERACIÓN DE INFORMACIÓN


En una de las clases la expliación fue sobre los sistemas de recuperación de información.


Es el analisis de los cuerpos de información cuya finalidad es la recuperar la información de forma automatizada.

Estos se hacen con un conjunto de tareas, procedimientos procesos entre otros, por medio de un usuarios que es el encargado de localizar y de acceder a los recursos de información, lo mismo que a los documentos, y datos, todo con el fin de resolver un problema.


En un mundo como el internet, donde la información esta infoxicada, la información que encuentra es inutil , la persona que se encarga de la recuperacion como tal se encarga de mostra un conjunto de documentos , con base en:

1-palabras

2- parrafos

3-información relevante

4-trozos de textos

En base de toddo esto se consigue la información relevante para que el usuario pueda optener la informacion nececaria

Los objetivos de la recuperación de la informacion son

1-Recuperar la información

2-Consultas en el lenguaje natural

3-las consultas formuladas

4- Evaluacion de contenidos para el ajuste de la relación de acuero a su relevancia


Pelicula El espinazo de la noche,


Dentro de lo que estaba programado para las clases teniamos que ver esta emocionamte serie de Carl Sagan. Cosmos, El espinazo de la noche. Esta historia se desarrolla al principio dentro de las calles de la gran cuidad de Nueva York, y despues el autor se transporta a las islas del mediterraneo griego.
De la historia al que nos trasporta sagan, nos lleva hacia los antepasados de cada uno de nosotros y sus atiguas creencias, la mayoria de ellos creeian en la astronomia, pero estas creencias se fueron perdiendo en el tiempo , una de las antiguas creencias era que el espinazo de la noche era mismisima “Via lactea”, ya en la antigua grecia nos hace ver varias teorias una de ellas es la gravedad.
Este emocionante recorrido nos conduce a una sola pregunta¿Qué son las estrellas? Este es un interrogante que el mismo sagan contestaria durante su recorrido en la escuela en la cuidad de nueva York, hasta la antigua Grecia.

En los siguentes link podemos ver las 6 partes de la pelicula en su totalidad

Primera Parte
http://www.youtube.com./watch?v=9fLmAtAQE7Q

Segunda parte
http://www.youtube.com./watch?v=Gtazo4auEwg&feature=related

Tercera parte
http://www.youtube.com./watch?v=hXlNsLls064&feature=related

Cuarta parte
http://www.youtube.com./watch?v=YusCzcEpIWQ&feature=related

Quinta parte
http://www.youtube.com./watch?v=MueRHTd6Rz4&feature=related

Sexta Parte
http://www.youtube.com./watch?v=wTNjDtVeMu0&feature=related

miércoles, 19 de mayo de 2010

GREESTONE

Una de las herramientas para la recuperacion de información vuiastas en clase feue la herramienta Greenstone, es un proyecto de biblioteca digitas, nacido en Nueva Zelanda con el fin de recuperar documentos digitales, este se maneja como un software libre.
varias de las caracteristicas de la herramienta es la modificacion de la información y la demora en el proceso de indización
Para mayor información sobre esta herramienta la puede encontrar en la direccion que se encuntra a continuación

Para descargar el software para su instalcion en el PC en esta direccion se peuede descargar, cabe recordar que este archivo se encuentra comprimido.
http://sourceforge.net/projects/greenstone/files/Source/Greenstone-2.83-source-distribution.tar.gz/download

sábado, 13 de marzo de 2010

Memoria de Clase No 13








Clase 12 Marzo de 2010

En está clase continuamos con la actividad de búsqueda de terminos en los buscadores google, yahoo y bing, utilizando operadores boleanos como OR, or, and, AND, *, &, +, entre otros; pero en está oportunidad se plantean nuevos terminos de búsqueda obteniendo los siguientes resultados:
Finalmente se realiza un análisis grupal d los resultados, en donde se identifica lo siguiente:
(ver el cuadro de arriba)

- Google recupera la misma cantidad de información con el operador AND en (mayús) y and (minús).
- Google recupera más información utilizando el *pegado al termino que solito.
- El buscador bing es my malo debido a que recupera siempe la misma cantidad de información, es decir no trabaja con operadores y no tiene cobertura ni cantidad de información.
- Yahoo es el buscador con la mayor cantidad de contenidos, por ello sus resultados son los más altos, aunque recupera más información con el operador (+) que con los demás.
- El operador &, es el que mayor cantidad de inf recupera a través del buscador Google.

Memoria de clase No 12

Clase 08 Marzo de 2010

Está clase inicia nuevo tema acerca de las estrategias de búsqueda, inicialmente se nos explica acerca de la importancia de definir o aclarar el tema o asunto.

Debemos definir algunos atributos que ayudan a delimitar el tema, como son:

- Grupo Edad
- Periodo a cubrir
- Área Geográfica en la que se encuentra
- Definir los términos de búsqueda, a través de herramientas como
sinónimos, traducciones etc.




Posteriormente se elabora una tabla, en donde se establecen algunos parámetros y términos para la búsqueda y R.I a través de operadores, se presenta a continuación lo mencionado:



Definida la tabla con los términos, se establecen tres de ellos (password, clave, contraseña) para realizar las búsquedas en Internet, a través de buscadores como google, bing y yahoo.


Se realizan las búsquedas de cada término, utilizando los operadores señalados en la parte superior de la tabla, con el fin de analizar como funcionan frente a la R.I, cada término es revisado en los tres buscadores y se extraen los resultados para posterior análisis.

Memoria de Clase No 11

Clase 05 Marzo de 2010


En está oportunidad la clase se trato sobre la demanda documental, acerca de la problemática en la búsqueda de información, las dificultades de los usuarios en las etapas de búsqueda según (Baro-Maña).

Problemática en la búsqueda

- El conocimiento ha crecido más allá de la capacidad retentiva de la memoria

- La literatura primaria está repartida en varias fuentes y es difícil de resumir

- Las fuentes de literatura secundaria muchas veces no son sistemáticas

- Sintaxis y gramática

- Identificación de conceptos

- Idioma


Dificultades de los usuarios

- Es importante enseñar a la persona como concretar su necesidad, detallando la solicitud exactamente.
- Incluye un proceso de alfabetización informacional.
- Conocer los instrumentos de búsqueda: catálogos y clasificaciones.
- Obtención de la Información
- Reelaboración de la Información

Búsqueda de los documentos

-No se orientan en el espacio de la biblioteca
-No conocen los instrumentos de búsqueda: catálogos y clasificaciones
-Tienen dificultades para utilizar el orden alfabético como sistema de búsqueda
-Buscan sistemáticamente en los estantes
-No tiene en cuenta la existencia de fuentes de información complementarias al libro/Internet
- Esperan que el bibliotecario solucione la consulta

Localización de la Información en los documentos impresos

- Esperan dar con un titulo que responda exactamente a su consulta
- No utilizan los instrumentos que facilitan la consulta de los documentos: sumarios e índices
- No comprenden las distintas formas de presentación de la información: imágenes, esquemas, textos, tipografía

Obtención de la Información

- Acumulación de la información sin ningún método selectivo

- No consideran necesaria la consulta de distintas fuertes

Fueron recomendadas algunas páginas web como son:

- Searchcube
- 3ddigg
- Kartoo

Tipos de Búsquedas

-Documentación: Localiza referencias bibliográficas del material
-Factográfica: Documentar hechos concretos
-De actualización: Surge la necesidad de encontrar información sobre un campo especializado
-Retrospectiva: Buscar información retrospectiva de un tema.

Memoria de Clase No 10

Clase 26 Febrero de 2010

En está clase se hablo acerca del modelo genérico de R.I propuesto por Tramullas, se explicó el siguiente esquema

-NECESIDAD DE INFORMACIÓN
-DEFINICIÓN DE LA NECESIDAD
-SELECCIÓN DE RECURSOS DE INFORMACIÓN
-CONSULTA DE RECUPERACIÓN DE INFORMACIÓN
-EVALUACIÓN DE RESULTADOS
-PRESENTACIÓN AL USUARIO

Se explico que el proceso de R.I inicia con una necesidad de información de un usuario, independiente de la temática que requiera se busca tener claro la temática solicitada, para así dar una búsqueda exacta, luego son seleccionados los recursos en los cuales será realizada la búsqueda, se hace la consulta respectiva de la temática solicitada, se hace una evaluación de los resultados arrojados por el recurso en el cuál se hizo la consulta y deacuerdo con este análisis se realiza la presentación al usuario.

También se hablo de los tipos de representación de la información, en donde se hablo de tomar un lenguaje natural, sacar unos términos representativos y normalizar.

Se deben emplear listas, anillos de sinónimos, taxonomias, tesauros.

Inicialmente trabajar sobre lenguaje natural, posterior a ello con el lenguaje normalizado y unir los términos y ordenarlos, lo que se conoce como crear las ecuaciones de búsqueda. Es importante tener en cuenta que las ecuaciones de búsqueda deben estar ajustadas a la herramiena seleccionada.
Ejemplo: Google NO usa OR, NOT, AND; mientras que Copernico SI.

Expresión de Búsqueda Lenguaje usuario
Ecuación de Búsqueda Lenguaje Artificial

Otro tema de importancia fue el Proceso Informático Genérico
-DEFINICIÓN DELA NECESIDAD DE INF
-SELECCIÓN DE FUENTES
-FORMULACIÓN DE EXPRESIONES
-FORMULACIÓN DE ECUACIONES
-EJECUCIÓN DE ECUACIONES
-REVISIÓN DE RESULTADOS
-PRESENTACIÓN AL USUARIO

Memorias de Clase No 9

Está sesión se dedico a la observación de tres videos en clase dejados como trabajo por el docente en su ausencia, uno de ellos denominado “El mundo según google”, el cuál trataba básicamente aspectos como el Clima organizacional en google, nos informaba como contrataban a las personas más calificadas y en esa medida les daban espacios de entretenimiento y recreación en sus instalaciones, también se hablo de la protección de la información, la privacidad de los datos y las estrategias utilizadas por google para ser uno de los buscadores más consultados en el mundo.

El segundo video se denomino “El hombre del futuro”, el cuál se refería a un tema en general y es la certeza.

Y el tercero fue la película de google, la cuál se trataba de la tendencia de la unificación de la información, donde google conocía la información y la produce a la medida.

jueves, 25 de febrero de 2010

Memorias de Clase No 8

22 de Febrero
En la Clase se vio un vidoe sobre la historia y el funcionamiento de Google
En estos links encontraremos mas informacion sobre el tema
Parte 1
http://www.youtube.com/watch?v=wsSo3WjuUPE
Parte 2
http://www.youtube.com/watch?v=FxPlZrUzTrc&feature=related

Memorias de Clase No 7

18 de febrero.
NECESIDADES DE INFORMACIÓN
En la clase se hablo de los tipos de necesidad de información:
Concreta
Las temáticas están definidas, la petición de las palabras son exactas y esta requiere de un buen documento, y tan pronto aparece desaparece la necesidad de información

Se observo una página web como ejemplo de esta necesidad de información, que se llama
Wólfram Alpha
este el el link de entrada
NECESIDAD DE INFORMACIÓN ORIENTADA AL PROBLEMA
Las temáticas que son orientadas al problema, no es satisfecha
Recuperación de información
Proceso donde se pasa de un estado actual a un estado necesario.
Estado anormal del conocimiento que se manifiesta en
Carencia informacional
Estructuras mentales
SISTEMAS DE RECUPERACIÓN DE INFORMACIÓN
Son los sietmas automatizados oara la busqueda y analisis de cuerpos de información , y que al mismo tiempo se encrga de conservar esta informacion de fora automatizada
Tambien es definido como los conjuntos de tareas , procedimientos , procesos mediante los cuales un usuario accede a los recursos, datos y documentos de información de mayor relevancia, todo con el fin de resolver un problema

EXTRACCION DE DOCUMENTACIÓN
Es la busqueda manual o automatica de palabras, parrafos o trozos de textos que contengan información relevante

RECUPERACIÓN DE DATOS:
Solo es el encargado de devolver los datos sobre un mismo tema, los esquemas son estructurados, ambiguos ante las consultas . pero no resuleve el problema de la recuperancion de la información.

COMPARACION ENTRE RECUPERACION DE INFORMACION Y RECUPERACION DE DATOS:

RECUPERACION DE INFORMACIÓN:
REQUERIMIENTOS: Probabilistico
LENGUAJE DE CONSULTA:Natural (Procesamiento de lenguaje natural)
RESPUESTA: Incompleta
IMPORTANCIA:Calidad

RECUPERACION DE DATOS:
REQUERIMIENTOS:
Deterministico
LENGUAJE DE CONSULTA: Artificial no ambiguo
RESPUESTA: Completa
IMPORTANCIA:Eficiencia

Objetivos
-La recuperación de los documentos
-Consultas en lenguaje natural
-Mecanismo idoneo para evaluar y ajustar las relaciones
-Cordenar con relevancia entre los documentos recuperados y la consulta formulada

Memorias de Clase No 6

15 de febrero2010
PRIMERA TUTORIA SOBRE LOS ANALISIS DE CONTENIDOS
En la clase se presentaron los puntos que se van a trabajar en la materia, y quedaron divididos de la siguiente forma:


1-ANALISIS DE CONTENIDOS Y DE COLECCIONES
Se definieron los siguientes puntos:
A-Que son los contenidos?
B-Como se comporta?
C-Tamaño de las carpetas
D-componentes esenciales
E-el contenido
F-El peso
G-Componentes
H-Los elementos que son genérales, y específicos
I –Frecuencia
J- Las palabras vacías

2- HERRAMIENTA ELECTRONICA
En la clase se instalo la herramienta Google Desktop Setup cuya finalidad es la buscar archivos de escritorio, esta fue instalada en la clase, y se debe buscar otra herramienta para la búsqueda de archivos de escritorio, se debe realizar los manuales de instalación y tener toda la documentación sobre las herramientas

3-EXPRESIONES A BUSCAR
Por cada colección se debe buscar 5 expresiones por cada colección, en total , 25 ejecutables en las dos herramientas.

Memorias de Clase No 5

CLASE 08/ Febrero /2010
En esta clase se continúo con las diapositivas de la clase anterior y plasmo un trabajo individual donde tocaba realizar un resumen de una página sobre la lectura “los documentos de texto y su estructura”, colocarlo en el Foro, utilizar una herramienta para generar un Archivo MP3 para grabar el texto creado con su voz, Agregarlo al Foro como un archivo anexo a su texto, y además preguntarse y argumentar: Si yo quisiera guardar sus archivos MP3, para luego recuperar por cualquier palabra de la que ustedes hablan en dicho archivo, ¿Cómo podría Hacerlo?, y hacer un glosario con mínimo 5 Términos y colocarlo en el Glosario de Moodle).
Para continuar el tema es el siguiente:

CONTENIDO DOCUMENTOS DIGITALES
NATURALEZA
ü Texto
ü Sonido
ü Video
ü Imágenes
ü Otros

CODIFICACION DIGITAL
ü Texto
ü Formato maquina
DOCUMENTO REFERENCIAL: Apunta a otro documento en si el contenido se encuentra en otro documento
DOCUMENTO DE CONTENIDO COMPLETO: El documento se encuentra completo
Diferencias entre
ü Termino: lenguaje normalizado
ü Encabezamientos de materia: vocabulario controlado, relaciones sintácticas
ü Descriptor: representan un texto (semánticas)
ü Palabra clave: extraer palabras de un texto (lenguaje natural)
ü Etiqueta: conjunto de palabras que proviene del lenguaje natural y representa un texto.

Memorias de Clase No 4

CLASE 05/ Febrero /2010

En esta clase el profesor Laureano explica unas definiciones básicas como son:

TIPOS DE INFORMACION que se divide en:
ESTRUCTURADA: Información con sentido claro en la organización (tiene valor real)
NO ESTRUCTURADA: Información que posee incertidumbre en su formulación
SEMI-ESTRUCTURADA: Información probabilística – estadística (incertidumbre con bases)
CAPTA (capere – tomar):
ü consiste en la selección manual o automática de información relevante
ü Información Relevante tomada a priori subjetiva - transparente
ü Supervivencia informacional
ü Prevenir infoxicación

CONOCIMIENTO: Apropiación, procesamiento, depuración etc. De la información hecha por el ser humano en estructuras mentales para realizar alguna tarea.
DOCUMENTO:
ü Memoria documental información
ü Cualquier fuente de información usable
ü Todo aquello organizado para permitir su observación, análisis y estudio
ü Información codificada en un formato y almacenada en un soporte

DOCUMENTO Cualquier cosa
Cualquier formato

DOCUMENTO ELECTRONICO: Es toda representación electrónica que da testimonio de un hecho, una imagen o una idea, requiere soporte material eléctrico, magnético u óptico.
Es aquel contenido en un soporte electrónico que para su visualización requiere de un dispositivo eléctrico.
Permiten disponer de una estructura no lineal.

DOCUMENTO DIGITAL: Es la representación en medio digital de un documento, contenido, textos, imágenes, sonidos, videos etc.
Es simplemente una secuencia de bits (unos y ceros) que puede representar cualquier tipo de información.
Permite almacenar en reducidos espacios grandes cantidades de contenido y distribuirlos o reproducirlos con facilidad.
ü No se degrada ni deteriora con el tiempo
ü Por su naturaleza, puede ser fácilmente reproducido y con frecuencia modificado.

DOCUMENTO VIRTUAL: Es un tipio concreto de documento digital, documento que se va construyendo de acuerdo a las necesidades particulares del usuario.
Es un documento para el que existe un estado no persistente y en el que algunas o todas sus instancias generan automáticamente en un lapso de tiempo.

COMPONENTES DE UN DOCUMENTO
Estructura Contenido Formato Contexto
Estructura: son las partes constitutivas del documento
Contenido: como está el documento frente a otros documentos
Formato: es el diseño, color, tamaño, tipo de letra etc.
Contexto: relación con otros documentos

Memorias de Clase No 3

3ra clase 12 de Febrero de 2010
En esta clase nos entregaron las colecciones para el trabajo durante el semestre, se trata de una carpeta denominada SRI, la cual contiene cinco subcarpetas con la siguiente información:
1. Una carpeta de correos electrónicos
2. Documentos de la Revista CODICE
3. Noticias
4. Información Institucional – varios
5. Claves bases
Se nos dan las especificaciones para realizar el análisis de corpus textual en cada una de las carpetas, con el fin de determinar los términos de búsqueda, para ello es importante tener en cuenta los criterios de evaluación mencionados a continuación: peso, tamaño, estructura, jerarquía, extensión, promedio de archivos entre otros.

Memorias de Clase No 2

2rª clase 01 Febrero de 2010
En esta clase se dio inicio formal a la materia, el docente expuso mediante presentación en ppt una introducción a la materia, se habló un poco de infoxicación, se presentaron algunas graficas con estadísticas de consulta de Internet en Sur América, acerca de dominios y sitios web.
También vimos un video acerca de una noticia en el Diario El tiempo sobre IPad, en donde se hablaba de el nuevo producto que saco Apple, se trata de una tableta que creó Steve Jobs. Pero no una tableta cualquiera. El consejero delegado de Apple creó el iPad, un nuevo tipo de producto en sí mismo. Con sus virtudes. Con sus defectos. Llamado a revolucionar el mundo de la tecnología. Ese dispositivo de 10 pulgadas (25 centímetros) tiene ahora ante sí una tarea de titanes: impulsar el mercado de los libros digitales, hacer de la prensa online un negocio rentable y atraer a las generaciones adultas a las nuevas tecnologías. Se le atribuyen todo tipo de bondades.

Memorias de Clase No 1

1rª clase 29 Enero de 2010
En está primer sesión de la materia R.I, se realiza la presentación del docente Laureano Felipe Gómez y del syllabus con los contenidos correspondientes durante el semestre.
Se mencionan las temáticas programadas por semanas y algunos de los software que se trabajarán.
También es importante resaltar que todos los trabajos deben ser elaborados en una plantilla especial y deben estar licenciados para su uso, para ello nos dan la opción de trabajar con Creative Commons 2.5 o el que la persona elija.
El docente solicita al grupo, realizar las lecturas del diario El Tiempo para cada lunes, específicamente la sección de tecnologías, en harás de estar enterados de los últimos avances tecnológicos y como aporte a los contenidos de cada clase.
Nos informan que para la entrega de trabajos, manejo de inquietudes y demás, será a través del MOODLE o plataforma institucional, para ello se nos da la dirección de ingreso:
http://uvirtual.lasalle.edu.co/sallevirtual25
Además se realizan algunas aclaraciones por parte del docente, respecto de los siguientes casos:
1. El manejo del celular, debe estar siempre en vibrador.
2. Prohibido el manejo de correo electrónico, chat, facebook y/o páginas similares durante la clase, pues se arriesga el estudiante a un 1.0 en la clase.

jueves, 4 de febrero de 2010

R-Studio

R-Studio es una familia de programas poderosa y rentable de reestablecimiento y recuperación de datos. Dotado con nuevas tecnologías únicas de recuperación de datos, es la solución de recuperación de datos más exhaustiva para recuperar archivos de FAT12/16/32, NTFS, NTFS5 (creados o actualizados por Windows 2000/XP/2003/Vista), HFS/HFS+ (Macintosh), variantes de formatos Little y Big Endian de UFS1/UFS2 (FreeBSD/OpenBSD/NetBSD/Solaris) y particiones Ext2FS/Ext3FS (Linux). Funciona en discos locales y de red, aun si tales particiones están formateadas, dañadas, o han sido eliminadas. Los ajustes flexibles de parámetros le dan control absoluto en la recuperación de datos.

recuperacion de informacion

La recuperación de información, llamada en inglés information retrieval (IR), es la ciencia de la búsqueda de información en documentos, búsqueda de los mismos documentos, la búsqueda de metadatos que describan documentos, o, también, la búsqueda en bases de datos, ya sea a través de internet, intranet, para textos, imágenes, sonido o datos de otras características, de manera pertinente y relevante.
La recuperación de información es un estudio interdisciplinario. Cubre tantas disciplinas que eso genera normalmente un conocimiento parcial desde tan solo una u otra perspectiva. Algunas de las disciplinas que se ocupan de estos estudios son la psicología cognitiva, la arquitectura de la información, diseño de la información, el comportamiento humano hacia la información, la lingüística, la semiótica, informática, biblioteconomía y documentación.
Los buscadores, tales como Google, Lycos y Copernic, son algunas de las aplicaciones más populares de la recuperación de información. Básicamente hay que construir un Vocabulario, que es una lista de términos en lenguaje natural, un algoritmo que incluya las reglas lógicas de la búsqueda {Tabla de verdad} y una valoración de los resultados o cantidad de información lograda o posible. Este motor de búsqueda es pues el que permite plantear una pregunta con no menos de dos términos (en algunos casos pueden ser menos de dos términos) y mostrar los resultados mínimos y el logaritmo natural de las interacciones será alrededor de 3.
Algunos de los estudiosos más destacados dentro de esta subdisciplina son Gerard Salton, W Bruce Croft, Karen Spärck Jones, Keith van Rijsbergen y Ricardo Baeza Yates.
A veces se plantean ciertos problemas a la hora de recuperar información provocados por el uso del lenguaje natural (entre otras razones) como el silencio (debido a la sinonimia), el ruido (debido a la polisemia), homografía, ambigüedad, etc.
Bibliografía [editar]
Baeza-Yates, Ricardo; Ribeiro-Neto, Berthier: Modern Information Retrieval. New York : ACM;Harlow, Essex: Addison-Wesley Longman, 1999.
Salvador Oliván, José A.: Recuperación de Información. Buenos Aires : Alfagrama, 2008.
Salton, Gerald; McGill, Michael J.: Introduction to Modern Information Retrieval. New York : McGraw-Hill, 1983.
Obtenido de "http://es.wikipedia.org/wiki/Recuperaci%C3%B3n_de_informaci%C3%B3n"

tomado de wikipedia