Internet
est une source dinformation plus quabondante et
mise à jour régulièrement. Tout le monde
peut stocker sur ce réseau des informations accessibles
par tous. François JEANNE-BEYLOT, vous propose une
visite guidée de cette bibliothèque virtuelle.
Co-fondateur et Directeur Général de TROOVER,
société spécialisée dans la recherche
dinformation structurée et la veille sur Internet,
il vous propose une initiation avec les différents
outils facilitant les requêtes et la veille sur le Net.
Chercher,
rechercher, veiller
Imaginons
une bibliothèque dont les murs seraient sans cesse
repoussés pour accueillir une quantité d'ouvrages
toujours plus importante. Elle regrouperait tous les sujets
imaginables dans toutes les langues du monde, de l'histoire
ancienne jusqu'au fait divers de la veille, et ce sous toutes
les formes. Il y aurait même une cafétéria
où les visiteurs discuteraient, donneraient leur avis,
échangeraient leur culture, interrogeraient des experts.
Ajoutons à celà qu'une grande partie des ouvrages
disponibles seraient mis à jour, non pas par un bibliothécaire,
mais par plusieurs centaines de millions de visiteurs
S'il
nous parait difficile de passer à coté de cet
étrange édifice, il ne nous reste, une fois
rentrés dans cette bibliothèque, plus que deux
solutions : flâner dans les couloirs à la recherche
confuse d'information ou s'installer dans l'allée qui
nous intéresse et y surveiller tous les mouvements,
non seulement des ouvrages, mais aussi des lecteurs et des
visiteurs. Un tel rassemblement de connaissances serait l'endroit
rêvé d'un homme avide de savoir, en quête
d'information ou tout simplement curieux.
Ce
rêve, vous l'avez deviné, est à quelques
clics de souris de chacun d'entre nous et, si la bibliothèque
est virtuelle, l'information y est bien présente :
un milliard de pages en ligne, 93 millions de sites Internet
et près d'un million de nouvelles pages par jour le
tout visité par quelques 380 millions de personnes.
Nous sommes connectés, nous sommes donc visiteurs et
acteurs, choisissons notre stratégie de recherche,
le sens de notre visite dans les allées du savoir.
Pour
une requête précise, les outils de recherche
(moteur et annuaires), véritables documentalistes de
la Toile, nous guideront vers l'ouvrage, le site approprié.
Ces robots visitent de manière quasi instantanée,
l'ensemble des allées de la bibliothèque, à
l'affût du moindre ouvrage relatif à notre recherche.
Ils vont non seulement chercher sur les titres mais aussi
scanner tous les index et les pages pour y retrouver nos mots-clés.
Si notre champ de recherche s'agrandit, si notre investigation
recoupe plusieurs domaine, comme c'est souvent le cas, l'utilisation
de plusieurs outils accroît les chances de réussite
; on choisira un outil généraliste doublé
d'un annuaire ou d'un moteur spécialisé. Des
recoupements nous permettrons d'affiner notre requête
afin de supprimer les doublons et réduire le nombre
d'ouvrages aux plus pertinents et donc d'optimiser le temps
de lecture. Enfin, nous avons recueilli la liste des documents
contenant l'information recherchée, il ne reste plus
qu'à les analyser.
Mais
avouez que, vue l'architecture de notre bibliothèque
et sa tendance à l'enrichissement perpétuel,
il serait dommage de s'arrêter là ! Maintenant
que l'on a identifié les sources, il serait intéressant
d'être informé des changements et des nouveautés
sur le sujet, et pourquoi pas de connaître et échanger
avec d'autres personnes, expertes ou non.
Nous allons
donc passer de la recherche à la veille.
Nous
pourrions revenir dans quelque temps et refaire la même
recherche ; par comparaison avec la première, nous
obtiendront les changements. Afin d'être averti de ces
changements au plus près de leur parution, il convient
de répéter cette tâche le plus souvent
possible. Pour ce faire, Internet offre des outils d'automatisation
des actions de recherche qui vont, à intervalles réguliers
lancer leurs robots pour parcourir à nouveau l'ensemble
du réseau. Mieux encore, certains logiciels "push"
permettent de se tenir informé en cas de changements,
en l'occurrence des nouveaux entrants, sur un domaine d'intérêt.
Comme une caméra fixée dans l'allée de
la bibliothèque qui nous intéresse, ils nous
préviendront dès qu'un nouvel ouvrage rejoindra
le rayon. Une fois paramétrés, ils nous enverront,
le plus souvent par mail, les références des
nouveaux documents.
De
même, on trouvera des aspirateurs de sites permettant
de comparer le contenu des pages d'une requête à
l'autre ; comme sur deux photographies, ces outils nous permettent
de suivre les évolutions des sites et leurs mises à
jour. Ils offrent également la possibilité d'enregistrer
le contenu d'un site Web. Cette fonctionnalité peut
se révéler fort utile, car, il faut l'avouer
notre bibliothèque virtuelle connaît encore quelques
défauts, et notamment celui de ne garder que la dernière
version d'un document. En effet, lorsqu'un webmaster apporte
des corrections à une page Internet, une fois celle-ci
mise en ligne, il vous sera très difficile, voire quasiment
impossible de retrouver la version précédente.
Pis encore, s'il supprime une de ces pages, à l'adresse
indiquée répondra une page "404 NOT FOUND"
et vous rencontrerez les plus grandes peines du monde pour
la retrouver. Ainsi, les aspirateurs de sites apportent une
solution, encore faut-il avoir aspiré la page avant
les méfaits du webmaster !
Vous
l'aurez compris, on ne peut, faute de place sur nos disques
durs, aspirer le web entier, il convient donc de faire une
sélection méticuleuse lors de la première
recherche et ne s'arrêter que sur les sites dignes d'un
réel intérêt. On pourra par exemple, surveiller
de cette manière le site d'un concurrent ; on lancera
un logiciel en "push" pour se tenir informé
de l'arrivée de nouveaux concurrents ou pour instituer
une veille référentielle sur son propre site
Internet, ainsi le robot interrogera régulièrement
les moteurs de recherche et annuaires et enverra uniquement
les nouveaux résultats.
François
JEANNE-BEYLOT
TROOVER.Com
fjb@troover.com
|