Para
buscar bien, es imprescindible tener en cuenta, que además de los buscadores
convencionales, hay disponibles otras fuentes específicas de información.
Los
buscadores tradicionales sólo ofrecen acceso a una pequeña parte de lo que
existe online, lo que se ha comenzado a llamar la Web superficial o
visible. Lo que resta, la Web profunda o invisible, es un amplio banco de
información ubicado en catálogos, revistas digitales, blogs, entradas a
diccionarios y contenido de sitios que demandan un login (aunque sea gratuito)
y otros tipos de contenido que no aparecen entre los resultados de una búsqueda
convencional.
La
Web Superficial o visible
La
Web Superficial comprende
todos aquellos sitios cuya información puede ser indexada por los robots de los
buscadores convencionales y recuperada casi en su totalidad mediante una
consulta en sus formularios de búsqueda.
Las
características principales de los sitios de la Web visible son:
1. Su información no está contenida en bases
de datos.
2. Es de libre acceso.
3. No se requiere la realización de un
proceso de registro para acceder a la información.
4. Mayoritariamente
está formada por páginas Web estáticas, es decir páginas o archivos con una URL
fija y accesibles desde otro enlace.
Internet profunda
¿Qué
es eso de la Internet
profunda o Internet invisible? ¿Se trata de una especie de
triangulo de las bermudas donde solo pueden entrar y salir unos pocos elegidos
o es una especie de mito como el de la Atlántida?
La
verdad es mucho más sencilla y simple. La Internet profunda es aquella que
simplemente no está indexada por los motores de búsqueda o directorios. Es
decir son páginas o mejor dicho repositorios de información, generalmente bases
de datos dinámicas, cuyo contenido no puede ser revisado por los buscadores y
por lo tanto incluido en sus resultados de búsqueda.
Al
contrario que otras páginas web, estas bases de datos no son accesibles porque
necesitan un usuario o contraseña para acceder a ellas o bien son páginas
dinámicas, es decir solo sirven información y resultados cuando se rellenan una
serie de variables y en ese momento se crea la tabla de datos y no antes.
Por
lo tanto no son accesibles a un buscador corriente.
La Internet profunda es la que está
compuesta por toda la información y bases de datos a las que los motores de búsqueda
y directorios no tienen acceso directo.
De hecho es más que probable que ya la estés usando
o la hayas usado sin darte cuenta.
¿Cuál es el tamaño de la
Internet profunda?
Nadie sabe cuál es el tamaño
exacto de la Internet profunda o web invisible.
Según un artículo de
wikipedia sobre Deep Web:
En el año 2000 se estimaba
que el tamaño del Internet invisible era de 7.500 Terabytes de datos en unos
550.000 millones de documentos.
Para comparar se estima que en aquella época
la Internet superficial ocupaba 167 Terabytes y el contenido de la Biblioteca
del Congreso de Estados Unidos tenía unos 3.000 Terabytes que no eran
accesibles por los motores de búsqueda.
Estimaciones basadas en la
extrapolación de un estudio de la Universidad de California en Berkeley
especula que actualmente el Internet Profundo debe tener unos 91.000
TeraBytes.
A decir verdad el tamaño
poco importa. La idea principal es tener claro que aproximadamente el 95% de
toda la información que existe en Internet está sin indexar por ningún
buscador.
¿Por qué es importante la
Internet profunda?
Así pues, podemos estar
seguros de que existe mucha más información de la que éramos conscientes al
principio.
De esta forma para localizar
determinada información de calidad necesitamos adentrarnos en la web invisible
y sacarle partido.
Recursos científicos de la
Internet profunda o Internet invisible
- La web del conocimiento: es una de las mayores bases de datos de citas del mundo con más de 54 millones de registros
- Elseiver: es un repositorio con más de 2000 revistas de medicina y salud
- Science Direct: más de 2.500 revistas científicas y más de 11.000 libros
- Pubmed: es el motor de búsqueda de medline. Contiene más de 22 millones de documentos de investigación en biomedicina
- Ingenta: contiene revistas de más de 12.000 publicaciones
- Us PTO: es un buscador de patentes y marcas de Estados Unidos de América
- Espacenet: es un buscador de patentes de los países Europeos
- Latipat: Bajo la plataforma de espacenet agrega resultados de patentes de países de Latinoamérica, España y Portugal
Recursos estadísticos de la
Internet profunda o Internet invisible
Recursos sobre datos
financieros de la Internet profunda o Internet invisible
- Bureau Van Dijk: bases de datos de los registros mercantiles de países de la OCDE
- Duns and Bradstreet: informes financieros de todas las empresas del mundo
- e-informa y Axesor: datos financieros de empresas españolas y listados de marketing
Recursos de comercio
internacional de la Internet profunda o Internet invisible
- Comtrade: base de datos de la ONU sobre datos de import-export y códigos HS
- Cameradata: base de datos española sobre los daos de importación y exportación
- Market access database: datos sobre tarifas arancelarias en los distintos países de destino a las exportaciones
- Organización mundial de comercio: recoge informaciones legales sobre el comercio internacional.
Recursos sobre legislación
de la Internet profunda o Internet invisible
- Eurolex: incluye toda la información legal y disposiciones sobre la legislación y tratados europeos
- FDA: es la agencia de alimentación de EEUU aquí puedes encontrar todas las regulaciones acerca de pesticidas, conservantes y aditivos autorizados.
Es justo señalar que gran
parte de los recursos auditados de la web profunda provienen de bibliotecas y
centros de investigación universitarios y que por lo tanto la información es de
gran calidad y valor para la comunidad científica y de investigación.
Uno de los datos más
curiosos respecto a la Internet invisible es que los contenidos de la
Biblioteca del Congreso de los Estados Unidos, la más grande del mundo, así
como el Diccionario de la Real Academia de la Lengua Española (RAE), no son
indexables, lo que significa que son únicamente accesibles desde los buscadores
de cada uno de estos portales, convirtiéndolos así en parte de la Internet
profunda, aun cuando el propósito de ambos sitios es promover el acceso a la
información que alojan.
En relación con la Sociedad
del Conocimiento, lo fundamental de la web invisible es su potencial de abrir
las puertas a información de alta calidad y especialidad temática. Así, las
bases de datos de las grandes universidades y centros de investigación, que
reúnen tesis, artículos analíticos, publicaciones de libre acceso, planas,
gráficas y similares, existen y están abiertas para que sean consultadas y
aprovechadas de acuerdo a sus términos de uso.
Fuentes:







