Investigue en Internet Como un Profesional

0 52

Judy West se impuso un desafío cuando se definió a si misma como un as para bucear y encontrar en el vasto universo de la Internet, además afirma que el 99.9%” de la gente no lo hace.

¿El desafío? Queremos que ella respalde sus declaraciones. Ya que la mayoría de los consumidores y gente de negocios recurren a Internet en busca de algún dato (¿y quien no los necesita de vez en cuando?) pueden realmente beneficiarse con algunos “consejitos” que les permitan ubicar lo que estan buscando en una sola búsqueda. Después de todo, Internet es una herramienta. Hagamos uso de ella.

Deseosa de colaborar, Judy nos muestra como se sumerje en Internet a la búsqueda de libros, datos o candidatos para algunas de las corporaciones que usualmente la contratan (American Airlines, EDS, Texas Instruments y Sprint, entre otras).

Sistemática y sin pausa

West embiste la Web navegando sistemáticamente y sin pausa a través de buscadores y bases de datos mucho más profundamente de lo que la mayoría de la gente se imaginaría.

Usa herramientas que están a disposición de cualquiera, como operadores buleanos, “modificadores avanzados” y algunos otros comandos y tácticas.

Sólo que ella actúa como una especie de malabarista en las máquinas de búsqueda y manipula diferentes comandos para auscultar un servidor con “rayos x”, dar vuelta un dominio y, en general, “pelar la red” (un-layered the net). Procedimientos que Judy se apura a declarar no son ilegales, son legítimos y no tiene nada que ver con hackear.

Para comenzar, va y viene en 20 máquinas de búsqueda diferentes. “No estoy satisfecha con menos” declara.

Sus cinco preferidas para la investigación son:

Para quienes se pregunten, las máquinas de búsqueda difieren conceptualmente unas de otras.
Algunas son poderosos directorios accionados por seres humanos, como por ejemplo LookSmart. Otros se basan en los datos recogidos por softwares denominados arañas que recorren Internet visitando los diferentes sites, tal es el caso de Google y HotBot/Lycos, y que tienen sistemas de rankings determinados por algoritmos (la tecnología de búsqueda de todos ellos difieren).

Un ejemplo del sistema de ranking lo hemos explicado en la nota sobre cómo buscar en Google que publicáramos semanas atrás. Tenemos todavía un tercer tipo que es una combinación de los dos nombrados anteriormente, como, por ejemplo, MSN y Yahoo!.

Como resultado de lo anterior, las máquinas de búsqueda indexan los sites de un modo diferente y, por lo tanto, los resultados de las búsquedas difieren de buscador en buscador. Y esto es el motivo por el cual Judy West usa 20 buscadores diferentes, incluyendo MSN y Yahoo! (Note que la mayoría de las máquinas de búsqueda ofrecen una opción “búsqueda avanzada” que guía al usuario através de una serie de pasos para optimizar la búsqueda. Vea por ejemplo, la opción búsqueda avanzada de MSN)

“Pelando” la red

Pero West, quien usa la Web casi exclusivamente para escribir “Los secretos del reclutamiento más celosamente guardados del Cyberespacio (“Cyberspace Jealously Guarded Recruiting Secrets”) y “I-piphany” (ambos disponibles en su Web site), dice que el uso de esa metodología la ha llevado mucho más allá de los buscadores.

“Las máquinas de búsqueda tradicionales tienen acceso a sólo el 1% del contenido de la web,” dice. “Unos 500 billones de páginas permanecen invisibles para las máquinas de búsqueda”. Su objetivo es cavar lo más profundo que pueda en toda esos datos para obtener lo que busca.

A continuación no vamos a presentar la lista completa de los trucos que usa Judy pero al menos pasaremos revista a algunos para que se haga una idea.

1. Tenga un objetivo de investigación serio o no tendrá motivación para hacer todo este trabajo. Este es el consejo número 1: “Motivación” es la palabra clave aquí. ¿Está escribiendo un libro? ¿Una investigación? ¿Una conferencia? ¿O tratando de localizar el mejor servidor de bases de datos SQL para su compañía? Si no tiene un objetivo serio, no tendrá el deseo de “cavar” muy profundamente.

2. Marque (Bookmark) las páginas Web y reúnalas en carpetas temáticas. Necesitará marcar muchos de los sitios que encuentra mientras busca y vuelve a buscar.
Utilice el tabulador “Organizar favoritos” (“Organize Favorites”) de su navegador preferido, para organizar sus máquinas de búsqueda preferidas, sus sites de referencia, grupos de discusión , asociaciones industriales, artículos y demás.

3. Defina sus palabras claves (keywords). Eso lleva trabajo. Pero para profundizar en Internet, penetrar diferentes aspectos de un tema, exprima las páginas Web que cubra esos temas – y luego elija las palabras y frases que representan el tema. Por ejemplo, West investigaba para una publicación médica “thalamic pain,” una aflixión poco conocida. Investigó en Internet en los 3 principales diccionarios médicos y encontró “central pain syndrome,” “posterior thalamic syndrome” y otras 10 combinaciones de palabras claves que determinó que le daría amplitud a la búsqueda. Nota: muchos buscadores requieren que cuando se utilizan varias palabras juntas, estas deben colocarse entre comillas, minúsculas y utilizar correcta puntuación y ortografía.

4. Use operadores Booleanos. Esto puede realmente desatar el poder de la red. Note que palabras como “AND” y “AND NOT” deben estar todas en mayúsculas. Le presentamos los operadores más comunes.

  • + AND (Y) : Le dice al buscador que busque todas las palabras claves indicadas (Por ejemplo: thalamic AND pain + stroke)
  • - NOT, AND NOT (NO, Y NO): Le indica al buscador que excluya la palabra detrás de “NOT” o de “-” (Por ejemplo: java -coffee encuentra programadores de Java pero elimina las referencias sobre coffee)
  • OR (O) : Ie indica al buscador que busque uno o lo otro, pero no ambas keywords (Por ejemplo: thalamic O retrolenticular O posterior O “central post”)
  • “”: Ie indica al buscador que busque todas las palabras en forma conjunta (“Sociedad Hemlock”, “gimnasios en Buenos Aires” y no Sociedad por un lado y Hemlock por el otro)
  • ( ): Ie indica al buscador que es una búsqueda compleja (thalamic AND pain OR “posterior thalamic”)
  • *: comodín, también conocida como “wildcard”, este símbolo Ie indica al buscador que acepte toda la información antes o después del término (title:assoc* Y pain)

5. Use modificadores avanzados. West usa más de 30. A continuación le presentamos 5 de los más usuales.

  • title: Ie indica al buscador que escanee en el código HTML la línea del título de las páginas de cada página Web (Por ejemplo: title:thalamic AND pain, dará como resltados todas las páginas en cuyo título figuren esos términos)
  • url: Ie indica al buscador que restrinja la búsqueda a sólo el contenido de un tipo de una dirección web en particular (url:.com AND thalamic OR retrolenticular OR posterior OR “central post”) También pruebe: .net, .gov, .org y .edu.
  • domain: Ie indica al buscador que encuentre páginas dentro de un dominio específico. (domain:.ca AND “retrolenticular syndrome” busca “retrolenticular syndrome” sólo en dominios canadienses)
  • host: Ie indica al buscador que busque en un computador/servidor (host:.com AND “thalamic pain”)
  • linkdomain: Ie indica al buscador que busque sólo en un dominio en particular (linkdomain:nombre del dominio.com AND “retrolenticular syndrome”)

Algunos comandos funcionan mejor en una máquina de búsqueda que otros.
Por favor vea la tabla sobre operadores y buscadores.
Permiten realizar una búsqueda en forma internacional desde el escritorio. Cuando hablamos de temas médicos, esto significa buscar información en países que pueden estar más avanzados que el nuestro en el tratamiento de una enfermedad en particular.

6. Use el comando “title:” para ubicar instituciones específicas en el tema de su interés. Por ejemplo para ubicar asociaciones relacionadas con nuestro tema de Thalamic Pain, por citar un ejemplo, West utiliza AltaVista y tipea:

title:association AND thalamic
title:assoc* AND pain
title:member + “thalamic pain”

También hay que probar con “support group” en el lugar de “association”, como también: directory, roster, press release, paper, article y “white paper,” entre otros términos.

Para ubicar información relevante más rápidamente, vaya al menú “Edit” de la caja de herramientas, luego “Find” y escriba sus keywords. Pruebe diferentes combinaciones.

7. Use el comando “url:” para ubicar dominios específicos. Siguiendo con su ejemplo, tenemos url:aol.com AND thalamic en AltaVista.
Una búsqueda exitosa incluirá múltiples nombres de dominios relacionados con el tema al igual que varias keywords. ¡Experimente! sugiere Judy.

Use la característica “Find on page” (encontrar en la página). Por último, pero no menos importante, emplee una técnica llamada “stripping back”, o sea descortezar la URL. Es con esta técnica que encontramos mucho material interesante: lista de staff, listas de miembros de asociaciones, etc.
Un ejemplo de esta técnica: http://members.aol.com/drpainn/review.htm puede ser “pelada” y tenemos http://members.aol.com/drpainn, etc.)

8. Use el comando “domain:” para excavar el dominio entero y obtener resultados. Pruebe diferentes buscadores, y experimente con la caja de búsqueda y la alternativa de “búsqueda avanzada”. Los resultados pueden ser dramáticamente diferentes. Por ejemplo:

domain:.com AND thalamic
domain:.com AND assoc* AND “thalamic pain”
domain:.com AND assoc* AND title:thalamic

9. Use el comando de búsqueda “host:” para “radiografiar” un servidor.
Puede administrar este comando para encontrar miles de directorios o listas de miembros, archivos, asociaciones, etc.
Por ejemplo: host:*.com AND association AND “thalamic pain”.

Pruebe con .net, .edu, .gov, y .org. Trate “press release”, roster, member, list y directory, y cambie las palabras claves. Esta técnica es conocida como “radiografiar.” Le permite al buscador seleccionar cada una de las páginas contenidas en un servidor.

10. Finalmente el comando “linkdomain:” restrinje la búsqueda a páginas que contienen enlaces a dominios específicos. Esta técnica, en el lenguaje de l internet, se denomina “dar vuelta” ( “flipping,”). Siguiendo con nuestro ejemplo, West, tomó una de las URLs relacionadas con el tema “thalamic pain,” y la desarmó hasta encontrar el nombre del dominio principal, en este caso, “merck.com,” la compañía farmacéutica. Luego, desde HotBot buscó, linkdomain:merck.com AND thalamic y ubicó cada uno de los enlaces a los sites de los principales laboratorios que trabajan en el tema de su investigación.

Tal cual West dice, los operadores y los modificadores avanzados trabajan mejor en algunos buscadores. A continuación les presentamos una guía de referencia basada en las recomendaciones de Judy y en las de SearchEngineWatch.

Comando Definición Funciona mejor en
AND
Incluido Alta Vista, HotBot/Lycos, MSN, Northern Light
+
Incluido AltaVista, Go/Infoseek, Google, HotBot/Lycos, MSN, Northern Light, Yahoo!
OR
O AltaVista, Google, MSN, HotBot/Lycos, Northern Light
NOT
Excluido HotBot/Lycos, Northern Light
-
Excluido AltaVista, Go/Infoseek, Google, HotBot/Lycos, Northern Light, Yahoo!
“”
Frase exacta AltaVista, Go/Infoseek, Google, HotBot/Lycos, Northern Light, Yahoo!
*
Comodin AltaVista, HotBot/Lycos, Northern Light, Yahoo!
title:
Busca en la línea de título AltaVista, HotBot/Lycos, MSN, Northern Light
url:
restrinje la búsqueda a esa dirección solamente AltaVista, Go/Infoseek, HotBot/Lycos, Northern Light
domain:
encuentra páginas dentro de un dominio determinado AltaVista, HotBot/Lycos
host:
encuentra páginas dentro de una computadora dada AltaVista, Yahoo!
linkdomain:
busca en un dominio específico HotBot/Lycos