Canalblog
Editer l'article Suivre ce blog Administration + Créer mon blog
Publicité
Numeridoc BDAN
Numeridoc BDAN
  • Blog de bibliothéconomie et de documentation sur le thème des collections numériques. Comprend : - des fiches de lecture détaillées, - des grilles d'analyse de collections numériques en ligne.
  • Accueil du blog
  • Créer un blog avec CanalBlog
Publicité
Archives
26 janvier 2006

Fiche de lecture n°8

Moteurs de recherche et bibliothèques numériques


Références bibliographiques :
LE CROSNIER, Hervé. Moteurs de recherche et bibliothèques numériques [en ligne]. Site de l’association VECAM, 2005.

Disponible sur < http://www.vecam.org/article.php3?id_article=461 >

Sujet :
Définition des notion de « moteur de recherche » et de « bibliothèque numérique », ainsi que des modes de fonctionnement de ces deux outils d’accès aux ressources numériques.

Mots-clés :
moteurs de recherche / bibliothèque numérique

L’auteur :
Ancien bibliothécaire, Hervé Le Crosnier est maître de conférence en informatique à l’Université de Caen.

Résumé :

Ce texte constitue l’introduction d’une table ronde consacrée aux enjeux des moteurs de recherche pour les bibliothèques. Hervé Le Crosnier précise quelques notions nécessaires à la compréhension des enjeux du débat actuel.

Dans une première partie, l’auteur précise la notion de « moteur de recherche » qui, au-delà de l’aspect technique, représente véritablement un « nouveau média ». Il définit un moteur de recherche comme un ensemble de procédures qui permettent de proposer à un lecteur une liste classée de documents répondants à un critère de recherche composé de plusieurs termes ou mots-clés. Puis il s’attarde sur les 3 composants qui forment un moteur de recherche :

-          le robot d’exploration, qui parcours le Web et rapporte les documents, représentés par leur URI (Uniform Ressource Identifier) dont le plus connu est l’URL. Sont également évoqués les nouveaux identifiants uniques (DOI et ARK) ;

-          le système d’indexation, qui extrait de tous les documents rapportés par le robot des mots-clés permettant la recherche. L’outil d’indexation est un outil à la fois linguistique (utilisation des mots présents dans le document), statistique (prise en compte de la fréquence ou de la place du mot dans le document) et social (prise en compte de la notoriété sur le réseau) ;

-          l’interface de recherche, qui utilise les termes demandés par le lecteur afin de classer les documents selon leur pertinence. L’auteur signale que ce classement peut être influencé par des critères externes au document lui-même tels que l’achat de mots-clés ou la notoriété.

La deuxième partie explique que la réalisation d’un moteur de recherche est un processus complexe et long, ce qui fait qu’il existe peu de moteurs de recherche généralistes. Les entreprises qui dirigent ces outils sont de grandes structures capitalistiques qui répondent à des logiques économiques. En cela, on peut parler de « nouveau média global » et d’une concurrence entre les différents moteurs de recherche.

Une dernière partie démontre la différence entre un moteur de recherche et une bibliothèque numérique, dont la fonction est de mettre en place des collections limitées, coordonnées et catégorisées.  L’auteur en propose une définition puis décrit les trois phases de la constitution d’une bibliothèque numérique :

-          la numérisation ;

-          l’indexation des versions numériques, qui se traduit par l’ajout de métadonnées et par une indexation probabiliste et sociale pour chacune des « pages » du document numérisé ;

-          l’ouverture à la consultation par le public, qui pose de nombreuses questions techniques et sociales parmi lesquelles celles de concevoir une navigation intuitive et de définir des autorisations d’accès ; 

-          la prise en compte des réutilisations possibles des documents (recherche documentaire et impression notamment).

Pour finir, l’auteur prévoit l’émergence d’un mode mixte et d’une coopération entre bibliothèques numériques offrant un accès contextualisé et moteurs de recherche lançant des robots pour explorer les bibliothèques numériques et intégrer leur contenu dans leur flux médiatique.

Avis critique :

L’intérêt de ce texte réside dans le fait qu’il définit très précisément les notions de « moteur de recherche » et de  « bibliothèque numérique », notions qui sont souvent assez mal cernées, mais également dans sa mise ne évidence des « déviances » auxquelles sont soumis les moteurs de recherche, ce qui nous incite à adopter un regard plus critique sur ces outils soit disant neutres dans la sélection et l’indexation des documents. En parlant de « nouveau média de l’Internet », Hervé Le Crosnier nous ouvre les yeux sur la subjectivité des moteurs de recherche et sur la nécessité d’appréhender l’information fournie avec une certaine prudence, tout comme on le ferait avec un autre média.

Publicité
Publicité
Commentaires
Publicité