Cristina Caballero: Web visible/Web invisible

Existe un alto volumen de información en la red cuyo contenido no se puede localizar con los motores de búsqueda convencionales, a esto se le llama web invisible. Hablamos de información y contenidos recogidos en bases de datos, catálogos, repositorios, bibliotecas digitales entre otros, para los que es preciso interrogar las páginas previamente, algo que los buscadores convencionales no pueden hacer.

La web invisible es todo el contenido de Internet que no forma parte de las páginas indexadas por las redes de los motores de búsqueda. La mayoría de información que podemos encontrar en la web invisible está escondida en sitios que se generan dinamicamente por lo que a los motores de búsqueda se les hace complicado hallarla. Múltiples organismos la han calificado como un refugio para la delincuencia debido al contenido ilícito que poseen.

Si los buscadores pudieran acceder a toda la información que contiene la web invisible se reduciría considerablemente la magnitud de ésta. Según los expertos, los motores de búsqueda cada vez tienen menos limitaciones, algunos de ellos como Google pueden acceder a estas páginas aunque con alguna restricción que otra. Sin embargo es imposible que pueda acceder a las que necesitan clave y contraseña.

Motivos por los que los buscadores no son capaces de indexar la web invisible:

1. Sitios web protegidos con contraseña

2. Los documentos en formatos no indexables

3. Páginas que el buscador decide no indexar, debido a que la demanda para el archivo es baja en comparación con los archivos de texto HTML que son más difíciles de indexar

4. Sitios en los que dentro de su código poseen archivos que impiden indexarlo al buscador

5. Sitios que usan base de datos

6. Diccionarios, enciclopedias en las que es necesario interrogar a la base de datos para acceder a la información

7. Sitios con mezcla de archivos no clasificables (web opaca)

8. La información es efímera o poco valiosa para indexar

9. Sitios que contienen un alto número de audios, imágenes o vídeos

10. Sitios aislados sin ligas que los vinculen con otros sitios

La web visible por el contrario es aquella parte de la red en el que el contenido puede ser indizado y por tanto los motores de búsqueda pueden recuperarlo. Los buscadores tradicionales a través del rastreo, almacenan únicamente el título de la página web, descripción, autor, URL, y las palabras clave siendo recuperada a través de una consulta a sus formularios de búsqueda.

Está formada en su mayoría por páginas web estáticas, páginas o archivos con URL fija y accesibles desde otro enlace.

Características:

Libre acceso
Información no contenida en base de datos
No requiere proceso de registro para acceder a su información

Bibliografía:

http://bvs.isciii.es/mono/pdf/BNCS_01.pdf
https://es.wikipedia.org/wiki/Internet_profunda
http://docdigital.typepad.com/servicio_de_alerta/2014/06/la-web-visible-la-invisible-y-la-oscura.html

Cristina Caballero

martes, 13 de octubre de 2015

Web visible/Web invisible

No hay comentarios:

Publicar un comentario