Skip to content

La recherche dans les bases de données bibliographiques

Auteur: Donald FYSON (2015)

Une fois prise la décision de plonger dans une base de données bibliographiques, l’étape suivante est celle de la recherche. La formulation générale du sujet de la recherche se fait selon les mêmes critères que pour les bibliographies classiques. Ainsi faut-il identifier un sujet, un cadrage spatio-temporel, une orientation de l’enquête, des mots-clés, etc., bref, avoir une idée assez claire de ce que la bibliographie à rassembler devra contribuer à documenter.

Quelques différences importantes distinguent toutefois la recherche dans les bases de données bibliographiques de celle dans les bibliographies classiques. Les mêmes principes de base s’appliquent aussi, mutatis mutandis, aux autres moyens de recherche discutés dans la section suivante, tels que les catalogues des grandes bibliothèques nationales, mais étant donné que les bases de données bibliographiques sont conçues expressément pour la recherche bibliographique, il est sage de commencer l’apprentissage avec elles.


1) Les particularités de la recherche dans les bases de données bibliographiques

D’abord, la recherche dans la plupart des bases de données bibliographiques se fait le plus aisément en utilisant des mots-clés. Très peu d’interfaces de bases de données bibliographiques sont conçues pour permettre au chercheur de parcourir des sections thématiques de façon continue et complète. L’identification des mots-clés s’avère donc encore plus importante que pour les bibliographies classiques. Pour être réussie, cette opération suppose que l’utilisateur sait ce qu’il cherche avec une précision assez grande.

De plus, dans le cas des bases de données bibliographiques rédigées dans une langue autre que le français (la plupart sont en anglais ou permettent une interrogation en anglais), le chercheur a tout intérêt à bien s’assurer de la traduction de ses mots-clés et concepts. Inutile, par exemple, de chercher uniquement « Église » dans une base de données dont les résumés sont en anglais; l’utilisation de « Church » est alors impérative.

Enfin, la logique d’élaboration d’une bibliographie à partir d’une base de données bibliographiques est souvent l’inverse de celle de la recherche bibliographique traditionnelle dans les bibliographies imprimées :

  • Avec les bibliographies imprimées, le problème était souvent de trouver suffisamment de références pertinentes dans un délai raisonnable. La confection d’une bibliographie complète était un processus laborieux qui nécessitait un grand investissement de temps. Les bibliographies sélectives ne donnaient souvent que les ouvrages les plus importants, alors que les bibliographies exhaustives comprenaient de multiples volumes et index qui devaient être consultés un par un; de plus, chaque référence devait être copiée individuellement et avec exactitude. La tentation après plusieurs heures de recherche était alors de dire « Ça suffit … »
  • Avec la recherche dans les bases de données bibliographiques, quelques requêtes peuvent produire des bibliographies immenses; les notices complètes, y compris les résumés s’il y a lieu, sont alors rapidement transférables vers l’ordinateur du chercheur. Mais que faire avec ces dix mille références sur la Révolution industrielle ? Les examiner une par une s’avère un processus pénible; mieux vaut limiter les résultats de la recherche dès le début. Souvent, le défi n’est donc pas de trouver suffisamment d’études mais de limiter le nombre d’études retenues en rationalisant mieux le processus d’enquête.

2) Les modalités de la recherche

Les principes de base de la recherche dans les bases de données bibliographiques ne sont pas compliqués. Il suffit d’identifier les mots-clés qui décrivent le mieux le sujet, pour ensuite les saisir au bon endroit dans le formulaire de recherche, et enfin lancer la requête. Les commandes spécifiques varient d’une interface à l’autre mais sont généralement bien expliquées par la fonction d’aide. Toutefois, pour bien démarrer la recherche et pour éviter la surabondance des résultats, le chercheur doit élaborer une stratégie de recherche qui permette de raffiner et préciser son questionnement.

Les interfaces des bases de données bibliographiques permettent généralement deux types de recherche :

  • La recherche plein-texte. Ceci permet de rechercher un mot-clé dans le texte complet de toutes les notices comprises dans la base de données (y compris les résumés, le cas échéant). L’avantage est de trouver toutes les notices qui contiennent un mot-clé particulier. Le désavantage est le même : de trouver toutes les notices qui contiennent un mot-clé particulier, même celles qui n’ont aucun rapport avec le sujet de l’enquête. En effet, selon le mot-clé utilisé, les notices retenues sont parfois fort nombreuses et pas toujours pertinentes. Une recherche plein-texte pour « État », par exemple, risque fort bien de trouver toutes les notices qui discutent l’« état de la question » …
  • La recherche par champ. Les bases de données bibliographiques sont divisées en notices; dans la plupart des cas, les notices sont à leur tour divisées en champs. Ces champs correspondent aux différentes catégories d’informations qui peuvent apparaître dans une notice : auteurtitrerésumésujet, etc. La recherche par champ permet de chercher un mot-clé dans un champ spécifique de toutes les notices emmagasinées dans la bibliographie. L’avantage est de distinguer, par exemple, entre les ouvrages de « Fernand Braudel » (recherche limitée au champ auteur) et les ouvrages dont les notices mentionnent « Fernand Braudel » (recherche plein-texte). Le désavantage est le risque de rater des notices pertinentes en limitant la recherche des mots-clés à un champ particulier : par exemple, des ouvrages dont le titre ne correspond pas directement au sujet principal.

De plus, pour préciser une recherche, le chercheur peut :

  • combiner plusieurs mots-clés. Les interfaces des bases de données bibliographiques permettent généralement d’utiliser les termes de la logique dite « booléenne » : etousauf, etc. (ou leurs équivalents anglais : andornot, etc.). Ainsi, une recherche plein-texte pour « État ET Gramsci » ne produit que les notices qui contiennent les deux mots, parmi lesquelles se trouveront les ouvrages portant sur les théories de Gramsci sur l’État. Certaines interfaces offrent aussi d’autres moyens de restreindre la recherche : par exemple, le terme adj, qui ne trouve que les mots adjacents (« État ADJ providence »exclut les notices qui discutent l’état de la question de l’utilisation du concept « providence ») ou l’utilisation des guillemets anglais pour chercher des séquences de mots (« « État providence » » ou son équivalent anglais « Welfare State » »).
  • utiliser plusieurs champs. Les interfaces des bases de données bibliographiques permettent généralement d’interroger plus d’un champ à la fois et même de combiner une recherche plein-texte avec une recherche par champ. De cette façon, on peut limiter une recherche par période, par aire géographique, par date de parution, par langue du document, etc. Ainsi, lorsque l’interface le permet, une recherche plein-texte pour État peut être combinée avec une recherche pour 1700-1799 dans le champ période (qui indique la période historique dont il est question) et pour 2000- dans le champ date de publication pour ne retenir que les écrits récents sur l’État au XVIIIe siècle.

Parfois, le chercheur désire élargir la recherche. La plupart des interfaces des bases de données permettent, entre autres :

  • d’utiliser le terme booléen ou (or) : État OU étatisation OU étatique;
  • de tronquer les mots au besoin au moyen de symboles qui représentent une ou plusieurs lettres; ainsi, dans certaines bases de données, État* trouve État, états, étatisation, étatique, etc. Les symboles de troncature ? (qui remplace une seule lettre) et * (qui remplace une série de lettres) sont les plus courants, mais la syntaxe précise peut varier d’une interface à l’autre; on consultera au besoin le menu d’aide de l’interface.

Le chercheur doit aussi prendre en compte les particularités de la recherche dans les différentes bases de données, qui peuvent modifier sensiblement les résultats d’une recherche. Entre autres :

  • certaines interfaces ignorent les mots trop fréquents (les articles, les prépositions, etc.) dans la langue de la base de données (normalement l’anglais);
  • certaines interfaces ignorent aussi les chiffres dans les champs qui contiennent normalement du texte (titre, auteur, résumé, etc.);
  • la plupart des interfaces ignorent la capitalisation et les signes diacritiques (ÉtatEtatetatétat et même étàt produisent donc le même résultat), mais ce n’est pas toujours le cas;
  • dans certaines interfaces, le trait d’union est considéré comme un espace; États-Unis devient alors deux mots, trouvés par une recherche pour États;
  • une syntaxe spécifique doit parfois être utilisée pour certains champs (par exemple, une façon particulière d’indiquer les dates dans le champ Période ou l’obligation d’indiquer le nom avant le prénom, avec ou sans virgule, dans le champ Auteur).

Généralement, c’est une combinaison de méthodes de recherche qui s’avère la plus efficace. Avant tout, se rappeler que rien n’est coulé dans le béton; si une stratégie de recherche ne semble pas fonctionner, le chercheur n’a qu’à la modifier et essayer de nouveau. Il faut également faire preuve de jugement : si une recherche pour un sujet assez large ne produit aucun résultat, peut-être s’agit-t-il simplement d’une erreur dans la formulation de la requête (par exemple, un nom mal orthographié ou une syntaxe de recherche non respectée). Vérifier et recommencer …

Dans la plupart des interfaces des bases de données bibliographiques, les notices qui correspondent aux critères de recherche (les résultats de la stratégie de recherche) sont présentées de façon systématique et facilement consultable. Toutefois, même avec une stratégie de recherche bien adaptée, le travail n’est pas fini; le chercheur doit maintenant s’appliquer à transformer ce qui se trouve sur l’écran en fichier bibliographique.


3) La sélection des notices pertinentes

Une étape très importante ne saurait en aucun cas être escamotée : la sélection des notices pertinentes parmi la masse des notices trouvées. En effet, la recherche informatisée des notices ne remplace pas le processus intellectuel de leur évaluation individuelle. N’importe quel utilisateur d’une base de données bibliographiques peut confectionner une bibliographie immense à partir de quelques mots-clés; avec une réflexion plus approfondie, un chercheur peut réduire cette masse de notices en utilisant une bonne stratégie de recherche, mais l’identification des notices appropriées requiert que le chercheur examine attentivement et évalue chaque notice.Retenir une publication, c’est y reconnaître un apport significatif à un programme de lecture bien structuré au service d’une quête documentaire clairement définie.


4) La confection du fichier bibliographique

La dernière étape de la recherche dans une base de données bibliographiques est la confection du fichier bibliographique, à partir des notices retenues. Là se trouve évidemment l’un des grands avantages des bases de données bibliographiques : la capacité de créer rapidement et automatiquement des fichiers bibliographiques à partir de l’information fournie par la base de données. Dans le cas des bases de données comprenant des résumés, l’avantage est encore plus grand car la notice complète, avec indications bibliographiques et résumé, peut être extraite avec facilité.

Les façons de procéder à la sauvegarde des notices bibliographiques varient selon l’interface et les modalités d’accès. Toutes les interfaces des bases de données bibliographiques sur Web affichent leurs résultats sous forme de documents HTML qui peuvent être manipulés comme tous les autres documents semblables (sauvegardés, copiés/collés, etc.). Certaines permettent la sauvegarde dans des formats de logiciels de gestion bibliographique largement utilisés, comme EndNote ou Zotero, ou encore l’affichage et/ou la sauvegarde dans des formats bibliographiques standards (MLA, Chicago Manual of Style, etc.). Les avantages sont la capacité de manipuler par la suite les résultats et le fait que dans la plupart des cas, la procédure est gratuite, peu importe le nombre de notices. Le désavantage est que la manipulation efficace des notices nécessite souvent une certaine familiarité avec l’informatique – par exemple, la capacité d’importer les données dans un logiciel de gestion bibliographique, ou la capacité de reformater de manière semi-automatique les notices copiées dans un document Word, etc. Certaines interfaces de bases de données bibliographiques sur Web permettent à l’utilisateur de faire envoyer les résultats d’une recherche à n’importe quelle adresse de courriel, à partir de laquelle on peut sauvegarder les résultats dans un fichier. Cela offre comme avantage additionnel le fait de pouvoir transmettre ces fichiers à partir de n’importe quel ordinateur ayant accès à la base de données (par exemple, des ordinateurs situés dans une bibliothèque ou dans un laboratoire informatique), même lorsque ceux-ci ne permettent pas facilement de transférer les fichiers sur une clé USB ou autre dispositif de stockage (ou si on a malencontreusement oublié sa clé USB !), pour les récupérer ensuite sur son propre ordinateur.

Diverses procédures supplémentaires peuvent également alléger le processus de confection du fichier bibliographique. Par exemple, la plupart des interfaces permettent la personnalisation des champs à afficher et/ou à sauvegarder (à noter que par défaut, plusieurs ne sauvegardent pas le champ résumé, qui est pourtant essentiel dans la confection d’un fichier bibliographique). Il est souvent possible de marquer les notices à retenir parmi les résultats d’une recherche, voire parmi plusieurs recherches différentes. Cela permet entre autres d’éviter les doublons et par la suite, ces notices peuvent être imprimées, sauvegardées ou envoyées avec une seule commande, ou encore stockées dans un dossier personnalisé pour consultation ultérieure. Certaines interfaces permettent également la sauvegarde des critères de recherche pour une utilisation future, comme l’activation d’un système de notification par courriel pour signaler l’ajout dans la base de données de nouvelles notices correspondant aux critères sauvegardés. Les possibilités offertes et les procédures à employer varient d’une interface à l’autre et sont généralement décrites en détail dans les rubriques d’aide en ligne.

Enfin, de plus en plus de bases de données bibliographiques offrent un accès direct aux articles répertoriés. Cette facilité découle en partie de la vague de consolidation dans le monde de la publication savante, qui fait que certains grands éditeurs contrôlent à la fois des bases de données bibliographiques et de grandes collections d’études scientifiques. Tel est le cas par exemple des bases de données bibliographiques essentielles pour les historiens que sont Historical Abstracts et America : History and Life. À l’origine des produits de l’éditeur spécialisé ABC-Clio, ils sont maintenant la propriété de la compagnie EBSCO, qui détient également les droits de reproduction sur les articles d’un très grand nombre de revues scientifiques. Un lien mène donc directement à partir des notices bibliographiques à l’article en question. Mais tel n’est pas toujours le cas : tout dépend de la collection (numérique et papier) de sa propre bibliothèque universitaire. Si aucun lien ne permet d’accéder directement à l’article à partir de la base de données que l’on consulte, il faut alors le chercher selon les moyens habituels de recherche des articles et, notamment, en se fiant au catalogue de sa bibliothèque universitaire.