Outils et moteurs de recherche sur le web invisible
Turbo10
Turbo10, le métamoteur britannique, utilise des moteurs de recherches spécialisés permettant de rechercher dans des bases de données ou des documents du "web profond" dans des domaines spécialisés. Turbo10 offre en effet la possibilité de se connecter à plus de 1000 moteurs spécialisés ou généralistes. Turbo10 interroge par défaut altavista.com, dogpile.com, google.com, hotbot.com, lycos.com, metacrawler.com, search.msn.com et yahoo.com, donc des moteurs plutôt anglophones.
Vous pouvez choisir de rajouter, grâce au module "My Collection", les moteurs figurant dans une liste assez impressionnante (1170 à ce jour). Vous pouvez choisir un moteur généraliste comme voila.fr ou des moteurs spécialisés. Ce qui permet à Turbo10 d'explorer (un peu) le "web invisible" ou "web profond" (l'équipe a même déposé la marque Deep Net !). Car cette liste propose des moteurs internes de portails, de vastes bases de données universitaires ou sites de e-commerce : zdnet.com, amazon.com, europages.net (annuaire de sociétés), imdb.com (cinéma), dictionary.com (dicos et thésauri), eea (european environment agency), encyclopedia.com, findarticles.com (archives d'articles depuis 1998), etc…Une fois constituée votre collection de moteurs, celle-ci apparaîtra dans un menu déroulant à droite de votre boite de requête.

Google
Encore lui ? Google, moteur étonnant, à part, indexe des formats de documents de plus en plus nombreux et même certaines pages "confidentielles" oubliées par les webmasters sur le net (débat de novembre 2001)
Parmi les formats de documents indexés par Google : le PDF, les documents Words, Excel.
Pour une requête sur un format précis, tapez filetype: suivi de l'extension du type de document recherché. Exemple : pour rechercher des documents au format Excel contenant le mot "bilan", tapez : filetype:xls bilan. Plus d'infos dans Astuces et Fonctions Google.

> Liste des formats indexés par Google

Xrefer
Moteur de recherche britannique spécialisé dans les ouvrages de référence : encyclopédies, dictionnaires, thesauri & recueils de citations. Thèmes : art, santé, langues, philosophie, musique, sciences, technologies, géographie et littérature anglaise...
Profusion
Le métamoteur Profusion (d'Intelliseek) propose notamment de rechercher des résultats dans le "web invisible" c'est à dire des bases de données de texte, sons, images, articles, magazines, livres…). Profusion propose de sélectionner les sources d'information et moteurs parmi des thématiques verticales (gouvernement, emploi, science, santé, juridique, enseignement, technologies, voyages, finance, art, business…). Ainsi, par exemple, vous pouvez choisir d'effectuer une recherche au sein d'encyclopédies (Encarta, Encyclopedia.com, InfoPlease, Internet Public Library, References) ou de bases de données et publications dédiées à la biologie (BioLinks, Discover Magazine, NBII …).
Adobe PDF Search
Permet de rechercher parmi plus d'1 million de documents au format Adobe PDF (Portable Document Format)
Wondir
Wondir associe les possibilités d'un métamoteur et d'un service de recherche humain. Wondir est différent des autres outils de recherche. D'abord parce qu'il est géré par une organisation à but non lucratif. Le but de cette fondation est de fournir de l'information de haute qualité à tous.
Ensuite parce que Wondir combine la technologie d'un métamoteur à des technologies propriétaires qui permettent d'utiliser les ressources du web invisible.
Lorsque l'on tape une requête, la page de résultats se divise en plusieurs parties :
- les résultats web
- les résultats issus des newsgroups (forums de discussion) et mailing lists (listes de diffusion)
- les propositions de service d'experts de la communauté Wondir pouvant potentiellement répondre à votre question
- des questions et leurs réponses en relation avec la requête
- des dépêches d'actualités liées au domaine de la requête.
Wondir dispose en effet d'une communauté de volontaires qui répondent aux questions trop complexe pour le moteur de recherche.
C'est pour cela que Wondir a besoin de votre aide. Vous pouvez mettre votre savoir et vos connaissances à disposition en répondant aux différentes questions qui défilent sur le bandeau "question ticker". Ce bandeau déroulant permet de montrer à tous les visiteurs quelles sont les questions posées par les internautes. On peut y répondre par messagerie instantanée, par mail ou sur un forum. En répondant à une question, vous pouvez gagner des prix.
Les possibilités et la puissance de Wondir augmenteront donc avec le nombre d'internautes utlisateurs.
Thunderstone web site catalog
Thunderstone permet de rechercher des sites via son moteur ou les catégories de son annuaire thématique. Thunderstone privilégie la qualité à la quantité : l'essentiel y est : Politique, Sciences, Economie,Commerce, Santé, Loisirs, Société, Culture, Art, Informatique, Internet, Actualités et Médias...Pour chacune de ces rubriques s'affichent des sous-catégories à la droite de l'écran.
IncyWincy, The Invisible Web Search Engine
Incy Wincy de la société LOOP improvments utilise l'Open Directory Project. En crawlant à l'intérieur des sites de cet annuaire, le moteur Incy Wincy construit un index de milliers de moteurs de recherche internes rencontrés. Exemple : Une requête sur la "CIA" permettra de détecter, sur les sites proposés par l'ODP, le moteur de l'United States Intelligence Community. Une recherche sur "Chimie" affichera, parmi les résultats les moteurs internes du Bottin de la Chimie et de l'Ecole Nationale Supérieure de Chimie de Rennes. On peut ensuite réutiliser ces moteurs par un simple click pour préciser la recherche. Une démarche originale.
 Source:
Intelligence Center