sábado, 20 de agosto de 2016

Web Superficial y Web Profunda



Para buscar bien, es imprescindible tener en cuenta, que además de los buscadores convencionales, hay disponibles otras fuentes específicas de información.

Los buscadores tradicionales sólo ofrecen acceso a una pequeña parte de lo que existe online, lo que se ha comenzado a llamar la Web superficial o visible. Lo que resta, la Web profunda o invisible, es un amplio banco de información ubicado en catálogos, revistas digitales, blogs, entradas a diccionarios y contenido de sitios que demandan un login (aunque sea gratuito) y otros tipos de contenido que no aparecen entre los resultados de una búsqueda convencional. 

La Web Superficial o visible 



La Web Superficial comprende todos aquellos sitios cuya información puede ser indexada por los robots de los buscadores convencionales y recuperada casi en su totalidad mediante una consulta en sus formularios de búsqueda.

Las características principales de los sitios de la Web visible son:


1. Su información no está contenida en bases de datos.
2. Es de libre acceso.
3. No se requiere la realización de un proceso de registro para acceder a la información.
4. Mayoritariamente está formada por páginas Web estáticas, es decir páginas o archivos con una URL fija y accesibles desde otro enlace.
 

Internet profunda



¿Qué es eso de la Internet profunda o Internet invisible? ¿Se trata de una especie de triangulo de las bermudas donde solo pueden entrar y salir unos pocos elegidos o es una especie de mito como el de la Atlántida?

La verdad es mucho más sencilla y simple. La Internet profunda es aquella que simplemente no está indexada por los motores de búsqueda o directorios. Es decir son páginas o mejor dicho repositorios de información, generalmente bases de datos dinámicas, cuyo contenido no puede ser revisado por los buscadores y por lo tanto incluido en sus resultados de búsqueda.

Al contrario que otras páginas web, estas bases de datos no son accesibles porque necesitan un usuario o contraseña para acceder a ellas o bien son páginas dinámicas, es decir solo sirven información y resultados cuando se rellenan una serie de variables y en ese momento se crea la tabla de datos y no antes.

Por lo tanto no son accesibles a un buscador corriente.

La Internet profunda es la que está compuesta por toda la información y bases de datos a las que los motores de búsqueda y directorios no tienen acceso directo.

De hecho es más que probable que ya la estés usando o la hayas usado sin darte cuenta.

¿Cuál es el tamaño de la Internet profunda?

Nadie sabe cuál es el tamaño exacto de la Internet profunda o web invisible.

Según un artículo de wikipedia sobre Deep Web:

En el año 2000 se estimaba que el tamaño del Internet invisible era de 7.500 Terabytes de datos en unos 550.000 millones de documentos.

Para comparar se estima que en aquella época la Internet superficial ocupaba 167 Terabytes y el contenido de la Biblioteca del Congreso de Estados Unidos tenía unos 3.000 Terabytes que no eran accesibles por los motores de búsqueda.

Estimaciones basadas en la extrapolación de un estudio de la Universidad de California en Berkeley especula que actualmente el Internet Profundo debe tener unos 91.000 TeraBytes.

A decir verdad el tamaño poco importa. La idea principal es tener claro que aproximadamente el 95% de toda la información que existe en Internet está sin indexar por ningún buscador.

¿Por qué es importante la Internet profunda?

Debemos considerar que Google y los demás buscadores se rigen por algoritmos y estos no pueden ser perfectos, además del hecho de que existen bases de datos y páginas dinámicas, pues nos encontramos con la limitación de que una sola herramienta no puede indexar toda la información. Simplemente es imposible.

Así pues, podemos estar seguros de que existe mucha más información de la que éramos conscientes al principio.

De esta forma para localizar determinada información de calidad necesitamos adentrarnos en la web invisible y sacarle partido.

Algunos recursos de la Internet profunda

Recursos científicos de la Internet profunda o Internet invisible

  • La web del conocimiento: es una de las mayores bases de datos de citas del mundo con más de 54 millones de registros
  • Elseiver: es un repositorio con más de 2000 revistas de medicina y salud
  • Science Direct: más de 2.500 revistas científicas y más de 11.000 libros
  • Pubmed: es el motor de búsqueda de medline. Contiene más de 22 millones de documentos de investigación en biomedicina
  • Ingenta: contiene revistas de más de 12.000 publicaciones
  • Us PTO: es un buscador de patentes y marcas de Estados Unidos de América
  • Espacenet: es un buscador de patentes de los países Europeos
  • Latipat: Bajo la plataforma de espacenet agrega resultados de patentes de países de Latinoamérica, España y Portugal
Recursos estadísticos de la Internet profunda o Internet invisible

  • Eurostat: fuente estadística de todos los países europeos
  • Usa.gov: fuente estadística de EEUU
Recursos sobre datos financieros de la Internet profunda o Internet invisible

Recursos de comercio internacional de la Internet profunda o Internet invisible

  • Comtrade: base de datos de la ONU sobre datos de import-export y códigos HS
  • Cameradata: base de datos española sobre los daos de importación y exportación
  • Market access database: datos sobre tarifas arancelarias en los distintos países de destino a las exportaciones
  • Organización mundial de comercio: recoge informaciones legales sobre el comercio internacional.
Recursos sobre legislación de la Internet profunda o Internet invisible

  • Eurolex: incluye toda la información legal y disposiciones sobre la legislación y tratados europeos
  • FDA: es la agencia de alimentación de EEUU aquí puedes encontrar todas las regulaciones acerca de pesticidas, conservantes y aditivos autorizados.
Es justo señalar que gran parte de los recursos auditados de la web profunda provienen de bibliotecas y centros de investigación universitarios y que por lo tanto la información es de gran calidad y valor para la comunidad científica y de investigación.

Uno de los datos más curiosos respecto a la Internet invisible es que los contenidos de la Biblioteca del Congreso de los Estados Unidos, la más grande del mundo, así como el Diccionario de la Real Academia de la Lengua Española (RAE), no son indexables, lo que significa que son únicamente accesibles desde los buscadores de cada uno de estos portales, convirtiéndolos así en parte de la Internet profunda, aun cuando el propósito de ambos sitios es promover el acceso a la información que alojan.

En relación con la Sociedad del Conocimiento, lo fundamental de la web invisible es su potencial de abrir las puertas a información de alta calidad y especialidad temática. Así, las bases de datos de las grandes universidades y centros de investigación, que reúnen tesis, artículos analíticos, publicaciones de libre acceso, planas, gráficas y similares, existen y están abiertas para que sean consultadas y aprovechadas de acuerdo a sus términos de uso.


Fuentes:





martes, 16 de agosto de 2016

Busqueda Avanzada



Búsqueda por palabras clave

Cuando realizamos una búsqueda en Internet, comenzamos por un concepto y lo vamos acotando a medida que encontramos información.
La mejor manera de obtener buenos resultados en nuestras búsquedas de información en Internet es seleccionar las palabras claves correctas, ya que de ellas dependen enteramente los resultados obtenidos.



Búsquedas simples

Observaciones que hemos de tener en cuenta:


  1. Se omiten palabras y caracteres comunes, como las preposiciones “el, la, y, de, etc.”
  2. No tiene en cuenta el orden en el cual están escritas las palabras
  3. No distingue mayúsculas de minúsculas
  4. No distingue acentos (tildes)


Búsqueda por palabra

Cuando se está introduciendo una palabra Google de forma automática busca palabras que empiezan por esas letras, en el caso de que Google no muestre los resultados hay que terminar de escribir la palabra para que el motor de búsqueda se actualice. Pulsando Intro, Google nos ofrece todos los resultados con la palabra de búsqueda.

Búsqueda por palabras

Si lo que queremos es acotar nuestra búsqueda tan solo tendremos que introducir más palabras en el cuadro de búsqueda de forma que Google nos mostrara aquellas páginas que contengan todas las palabras, en primer lugar Google mostrara aquellas páginas que contenga todas las palabras que hemos introducido y a continuación las páginas donde aparezcan algunas o alguna de ellas.

Búsqueda avanzada



Las búsquedas avanzadas nos van a permitir el poder limitar aun más la búsqueda que queramos realizar; las opciones que nos proporciona la búsqueda avanzada son las siguientes:

Mostrar resultados: A la hora de mostrar los resultados Google tiene distintas opciones a la hora de realizar la búsqueda, bien: con todas las palabras (en la cual introduciendo las palabras en el cuadro de búsqueda, nos mostrara las páginas que contengan todas las palabras buscadas, pudiendo considerar como la búsqueda que realizamos normalmente, funciona como el operador lógico AND), con la frase exacta (nos va a mostrar páginas que contenga la frase tal y como la hemos escrito en el cuadro de búsqueda. Esta opción equivale a poner el texto entre comillas), con alguna de las palabras (nos va a mostrar páginas que contenga algunas de las palabras que hemos escrito en el cuadro de búsqueda, funciona como el operador lógico OR, y finalmente sin las palabras (nos va a mostrar páginas que no contengan las palabras escritas en el cuadro de búsqueda)

Número por página: Nos permite elegir el número de resultados que queremos obtener por página (10, 20, 30, 50 y 100 resultados)

Idioma: Podemos elegir el idioma en el que queremos que aparezcan nuestras páginas de búsqueda. Por ejemplo si elegimos el español, las páginas mostradas aparecerán solo en español.

Región: Nos permite elegir el país en el cual queremos que muestre la información buscada. Por ejemplo si queremos que la información que buscamos nos muestre las páginas del Reino Unido seleccionaremos este país.

Formato de archivo: A partir de dos menús desplegables podemos el tipo de archivo que queremos encontrar.
El primer menú desplegable nos permite elegir si solamente queremos ese formato o no.
El segundo menú desplegable nos permite elegir el tipo de archivo que queremos que nos muestre.
Así por ejemplo si seleccionamos “Solamente mostrar resultado en formato Adobe Acrobat PDF (.pdf)”o “No mostrar resultado en formato Miscrosoft Word (.doc)” discriminará los resultados en formato word.

Fecha: A partir de un menú desplegable nos permite seleccionar que páginas queremos que se nos muestren en función de determinadas fechas, a partir de la última en la cual fueron actualizadas.

Presencia: Nos permite seleccionar a partir de una menú desplegable en que parte de la página queremos que se realice la búsqueda.

Dominios: A partir del menú desplegables nos permite el poder discriminar o bien limitar la búsqueda a un dominio o sitio web.
Así por ejemplo, si escribimos www.ite.educacion.es y el cuadro de búsqueda de mostrar resultados escribimos terremotos, solo nos mostrará las páginas que contengan la palabra terremoto y estén en el sitio web que hemos indicado.

Derechos de uso: Podemos elegir que los resultados que nos muestre se puedan compartir o modificar.

Safe Search: Esta opción nos permite cambiar la configuración del navegador aplicando filtros para evitar contenidos para adultos que aparezcan en los resultados de búsqueda

Búsquedas de imágenes




Una de las opciones de las que dispone Google es la búsqueda de imágenes, tan solo tenemos que hacer clic sobre el vínculo imágenes, automáticamente Google cambia la interfaz, escribiremos en el cuadro de búsqueda la palabra clave asociada a la imagen y pulsaremos sobre “Buscar imágenes”.
Si seleccionamos la imagen posicionándonos sobre ella podemos ver el nombre del archivo y su extensión, tamaño de la pantalla, URL donde se encuentra la imagen, otras similares y más tamaños. Si no encontramos una imagen podemos recurrir a la búsqueda avanzada.
En la búsqueda avanzada de imágenes podemos elegir como queremos que nos muestren los resultados, si bien todas las palabras, bien con la frase exacta, algunas de las palabras o bien con no relacionadas las palabras. El tipo de contenido, tamaño, tamaño exacto, formato, tipo de archivo, coloración, dominios, derechos de uso y Safe Search.

Búsqueda de videos




Google también dispone de la búsqueda de videos, para acceder a la búsqueda de videos seleccionaremos el vínculo de Videos, en el cuadro de búsqueda escribiremos el nombre del video que queramos buscar. Por ejemplo vamos a buscar videos de terremotos. La página dispone de un menú en la parte izquierda que nos va a permitir elegir la web, duración, la ordenación por importancia, la calidad, la fuente, etc.
Si queremos la búsqueda más precisa de un video seleccionaremos la búsqueda avanzada, esta nos va a permitir seleccionar como buscar los resultados, el idioma, la duración, el dominio, si queremos que busque libros con subtítulos, como queremos que aparezcan ordenados los resultados así como los resultados por página.

Búsqueda de libros




Google nos permite localizar un amplio catálogo de libros en una amplia variedad de idiomas de forma sencilla, para acceder a la búsqueda tan solo tenemos que seleccionar el vínculo Más y elegir en el desplegable Libros. Funciona de igual forma que una búsqueda Web, al entrar en la página podemos buscar libros por temas.
El objetivo que se persigue con la búsqueda de libros en Google es el de descubrir libros, y no leerlos en línea. Hay algunos libros que tiene restricciones impuestas (copyright) y limitan el número de páginas que nos muestran, en cambio hay otros en la que los usuarios pueden descargarse la versión en PDF.
También dispone de una búsqueda avanzada la cual nos va a permitir: elegir el modo en el que nos va a mostrar los resultados, donde buscar, el contenido, idioma, título, autor, editor, fecha de publicación, ISBN, ISSN.

Google Académico




Google Académico permite la búsqueda de bibliografía de temas académico de forma sencilla. Podemos localizar libros, documentos, tesis, resúmenes, artículos científicos, material de editoriales de múltiples disciplinas: ciencias, literatura, geografía, etc. Para realizar la búsqueda tan solo tenemos que seleccionar Google Académico que se encuentra en el vínculo; Más. Una vez que hemos accedido a la página escribiremos en el cuadro de búsqueda el título del libro, articulo, manual, etc., que queremos localizar.
Si lo que queremos es buscar documentación de una determinada disciplina, escribiremos en el cuadro de búsqueda el nombre de la disciplina académica y Google Académico nos mostrará los resultados. Para afinar la búsqueda podemos utilizar los operadores antes mencionados o recurrir a la búsqueda avanzada.
Google Académico también dispone de una Búsqueda avanzada que nos va a permitir el poder acotar los resultados.
La búsqueda avanzada de Google Académico nos va a permitir: Buscar artículos, bien con todas las palabras, con la frase exacta, con al menos una de las palabras, sin las palabras, donde las palabras aparezcan, de la misma forma que la búsqueda en la web. Podemos hacer uso de las comillas. Autor: con frecuencia para localizar una obra, artículo, etc., recurrimos a la búsqueda mediante el autor, para localizar dicho documento mediante el autor escribiremos el nombre del autor entre comillas incluso también podemos usar iníciales para realizar la búsqueda. Podemos también realizar la búsqueda escribiendo el nombre de donde ha sido publicados o bien el año de su publicación. También nos permite configurar el número de resultados que queremos que aparezcan por página.

Conclusiones

Las tecnologías de la información y la comunicación requieren de nuevas destrezas y conocimientos entre ellos el aprender a buscar y seleccionar información a través de los buscadores. El buscador Google como hemos dicho anteriormente permite acotar las búsquedas a través de sus múltiples herramientas, por lo que el saber utilizar los buscadores se convierte en un objetivo de la enseñanza-aprendizaje.

Fuente: