Que faire des mots clés aujourd’hui ?

1 | (actualisé le )

Le titre est délibérément provocateur. Tous les professionnels de la recherche documentaire savent évidemment ce qu’il convient de faire de ces fameux mots clés qui sont un des fondements de l’analyse du sujet et de la recherche assistée par ordinateur. Toute la réflexion qui suit repose plutôt sur une question d’actualité : où en sommes-nous en tant qu’expert de la recherche documentaire dans notre usage des mots clés ? Question essentielle face à des moteurs de recherche qui intègrent de plus en plus (et corrigent mécaniquement) des requêtes beaucoup plus floues que celles que nous prescrivons en tant qu’enseignants ? La réflexion ne se limitera pas à envisager les modes opératoires en matière de requêtes mais s’appliquera à examiner ce que la didactique documentaire – dans son actualité notionnelle - dit en matière d’analyse du sujet.

Examinons (rapidement) dans un premier temps le discours que nous tenons sur les mots clés.

Mots clés...
Nous partons du mot clé compris d’abord comme un moyen synthétique non normé de caractériser le contenu d’un énoncé (cf. Vocabulaire de la documentation. INTD-ER. ADBS). Dans un second temps nous envisageons son intérêt en matière d’indexation ou de recherche sur un corpus indexé, comme par exemple un index de pages web, pour les moteurs de recherche en ligne ou une base de données locale, pour le logiciel documentaire (cf. Dictionnaire encyclopédique des sciences de l’information. LAMIZET, SILEM. Ellipses).

Il y a donc deux temps pour le mot clé, le temps de l’analyse et le temps de la requête.

Le temps de l’analyse...
Il a été très opportunément précisé que le mot clé choisi à des fins d’analyse des énoncés actualise une démarche intellectuelle de type rétrospective. C’est-à-dire que l’intelligence qui est à l’origine de la synthèse travaille la langue dans un souci de détermination du sens de l’énoncé. Le mot est alors appréhendé relativement à un environnement sémantique qui le catégorise en le classant par enchâssement générique ou spécifique selon le moment. On a pu parler alors d’un mouvement d’abstraction qui oscille selon les usages entre hypéronymie ou hyponymie (catégorie de niveau hiérarchique supérieur ou inférieur). Par exemple : à quoi renvoie le mot choisi, à quel domaine du savoir puis quelles sont ses subdivisions ?

F. BERTEN, professeur de français à l’Institut Saint-Joseph, à Saint-Hubert, Membre de la Commission "Français et Informatique " (FESeC). cf. La notion de "mot-clé" et sa difficile application pédagogique
ou encore DUPLESSIS, Pascal. Petit dictionnaire des concepts info-documentaires
Approche didactique à l’usage des enseignants documentalistes. Mot clé
.

Le temps de la requête...
Dés lors qu’il s’agit d’explorer des index, le mot clé devient opérateur dans la mesure où on attend de lui qu’il participe à l’accomplissement d’une action : collecte de pages par exemple. Un usage raisonné implique alors la connaissance du fonctionnement technique de l’outil utilisé pour anticiper le traitement informatique du mot clé/opérateur (chaîne de caractère, codage, transmission, décodage, segmentation, base de données, fichier inverse, butineur, algorithme, etc.). On peut alors parler de démarche prédictive. La démarche prédictive dans ce cas est lexicographique (et non plus sémantique comme la démarche rétrospective). C’est-à-dire que l’unité qui discrimine n’est plus une unité de sens mais un uniterm.

Ce souci de prédiction, d’anticipation est négligé par les utilisateurs novices pour plusieurs raisons. La technique des outils d’interrogation est très largement méconnue, non seulement dans ses procédés basiques mais encore plus dans ses avancés ou expérimentations les plus récentes. Il faut dire qu’il s’agit souvent de procédés soumis à brevet et jalousement protégés par les entreprises qui les commercialisent (exemple de Googlebot difficile à suivre).
Néanmoins il semblerait que la tendance actuelle des moteurs soit d’observer les usages des internautes pour s’adapter à leur façon d’interroger l’outil et non plus de faire la publicité d’un « bon usage » (bon usage souvent rendu obsolète en raison de l’évolution constante des techniques). Nous sommes encore loin du moteur intelligent capable de s’adapter à un profil de chercheur spécifique mais les outils « anticipent » déjà et interprètent nos requêtes. Par exemple Google « sait » que les requêtes ne comportant qu’un seul mot clé manifestent majoritairement des besoins d’ordre définitionnels. En conséquence les premiers résultats associés à ce type de requêtes sont souvent des liens de type encyclopédiques ou lexicaux (dictionnaires en ligne).

Un travail autour de la lisibilité de l’outil est à mettre en place pour que les élèves entrevoient la puissance et les limites de leur « meilleur ami du web ».
Mais en parallèle à notre positionnement dans le domaine du dévoilement de la technique (la « magie » de l’outil) ce qui doit nous préoccuper en tant que professeur documentalistes renvoie à l’examen de la démarche cognitive à l’oeuvre au cours d’une recherche. Que pouvons-nous spécifiquement apporter (que les autres enseignants n’apportent pas) dans le domaine de l’analyse et celui de la requête ?

Un problème professionnel...
Les professeurs documentalistes à travers de nombreux référentiels de formation ont longuement insisté sur les étapes de la recherche documentaire. L’ultime étape, celle consacrée au traitement de l’information, est toujours mentionnée comme une finalité dépendant de la bonne détermination d’un besoin d’information, d’une bonne connaissance de la structure du document et de la maîtrise de techniques de prise de notes. Pourtant nous sommes nombreux y compris dans d’autres champs disciplinaires à constater que le prélèvement de l’information est une étape qui pose problème. La masse documentaire collectée reste souvent sous-exploitée, on ne retrouve pas suffisamment dans les travaux d’élèves les informations de qualité correspondant aux documents trouvées. Il est alors fréquent d’entendre des enseignants déçus se plaindre que les élèves ne lisent pas les documents, on diagnostique même un manque de culture générale voire de curiosité comme autant de barrières dressées devant la lecture documentaire.

Les origines possibles du problème...
Laissons (cavalièrement) de côté ce qui a trait à de réelles difficultés de lecture ou de compréhension pour apprécier quel pourrait être notre champ d’intervention.

André Tricot nous a habitué à envisager la recherche d’information comme une série non-linéaire (plutôt circulaire me semble-t-il) d’évaluations successives.
Examinons donc une phase d’évaluation possible. Un énoncé est appréhendé : des mots clés sont isolés, catégorisés dans un système complexe de relations sémantiques (hyperonymie, hyponymie).

Une première évaluation portera donc sur le degré de compréhension atteint à la suite de cette série d’opérations. Or il arrive souvent que cette étape essentielle de détermination du besoin d’information disparaisse ou soit finalement peu exploitée pour la suite de la recherche. Il est certain qu’elle doit progressivement s’effacer (sous cette forme) en fonction de l’avancée du travail pour laisser place à une démarche plus globale. Pourtant l’expérience montre que les élèves, ou disons certains élèves, semblent gênés par ce qu’il convient d’appeler une segmentation du questionnement en petite unités qui ne font plus sens. Le découpage imposé par un traitement numérique entre en contradiction avec un esprit qui est à la recherche d’une synthèse. Il semblerait que l’esprit soit rétif à abandonner une cohésion nucléaire absolue au profit d’une distinction en segments relatifs. Et si les mots clés introduisaient du désordre là où c’est un ordre qui est recherché...

Dans ce sens je m’interroge également sur l’efficacité réelle du fameux questionnaire dit « de Quintilien » (à ce moment là du questionnement). Finalement on se demande quelle est sa visée ? Relativement au sujet qui nous préoccupe est-il opérant pour favoriser la détermination de mots clés ? Ce questionnaire révèle souvent aux élèves l’ampleur de leur méconnaissance, l’étendue de la tâche à accomplir et ne favorise pas la motivation. Son découpage introduit parfois de la distraction. Peut être est-il intéressant de le réserver pour une étape ultérieure de la recherche ?

Je crois plus sûrement à l’opportunité d’un questionnement qui prend en compte un projet d’écriture et de restitution.

On ne cherche pas pour le plaisir...
... ou du moins pas seulement.
Dès la mise en situation de recherche le chercheur conçoit, même de manière obscure, un projet d’écriture. Il sait qu’il lui faudra garder une trace des énoncés qu’il va croiser au cours de son parcours de recherche.

Ce qui est premier...
On cherche pour écrire. C’est peut-être une évidence sur laquelle il convient de revenir. Il faut comprendre ici l’écriture comme conservation et trace. La mémoire est aussi une écriture. Une image mentale est une forme d’écriture, une manière de fixation, une réservation pour soi avant d’être restitution pour autrui.

L’écriture issue d’une lecture documentaire s’apparente à la constitution d’un ordre au sein du désordre, comme une stase sur le parcours d’un flux. Quel est la nature de cet ordre que nous sollicitons auprès de nos élèves ? Pour nous enseignant c’est une évidence : il s’agit en fait de construire un texte structuré selon des codes de restitution.
Or dans un cadre scolaire les prescripteurs (les professeurs) ont des schémas mentaux de restitution installés par l’école elle-même, les lectures et les travaux universitaires. Traditionnellement les différentes disciplines se sont efforcées de penser cette écriture dans le cadre d’une prescription « méthodologique » : comment composer une bonne discussion ? Comment réaliser un plan de dissertation en thèse, antithèse, synthèse ? , etc. Il est question ici de grands exercices historiques mais qu’en est-il d’autres types d’écriture beaucoup moins prestigieux mais tout aussi industrieux : la réponse à une question, la prise de note pour un débat, la prise de notes pour un dossier synthétique, la citation, etc.

Beaucoup d’élèves ne disposent pas encore ou imparfaitement de ces schémas de production, ne maîtrisent pas tous ces codes de communication écrite.
Doit-on conclure que la question est décidément trop dépendante d’autres contextes d’apprentissage ?
Je crois quant à moi que nous avons à y regarder de plus prés. J’espère montrer qu’un travail préparatoire sur la question de la production demandée pourrait nous amener à repenser la recherche par mots clés. Et je suis convaincu que c’est aux professeurs documentalistes d’investir cet espace.

Un exemple...
Prenons l’exemple de la production dans le cadre de l’ECJS au lycée.

Les textes officiels sont lapidaires sur la question de la production attendue :
« Organisation du travail préparatoire au débat avec division du travail, travail de groupes et coordination. On peut mobiliser des techniques variées selon le sujet abordé : dossier de presse, recherche de documents historiques ou juridiques, recherche sur cédérom ou sur l’Internet, enquête avec visites ou entretiens, contact avec des personnes qualifiées, rédaction d’argumentaires, etc. »
Extrait de Éducation civique juridique et sociale. BO HS n°6 du 31 août 2000.

Concernant la production préparatoire préalable à l’animation du débat conclusif il est fait mention de « techniques variées » : techniques de restitution (dossier de presse) et techniques de recherche ou d’enquête. S’il s’agit bien de techniques, elles doivent pouvoir être transmises sous la forme d’un enseignement. Comment enseigne-t-on la technique du dossier de presse ?
Suffit-il de montrer de quoi il s’agit sous la forme de recettes à appliquer pour réaliser un bon dossier de presse. Ne s’agit-il pas plutôt pour l’enseignant impliqué dans l’Ecjs qui définitivement ne saurait restreindre son action aux aspects techniques, de décrire ce type de production pour amener les élèves à en comprendre l’intérêt, la portée, les limites ?

Dans ce cas ou pourrait imaginer des séances qui listeraient certains modes de restitution possibles en ECJS en explicitant les points suivants : une restitution quelle qu’elle soit est un point de vue qui porte la marque d’une organisation intellectuelle obéissant à une logique discursive (choix d’argumentation, de description, de fiction, etc.) et articulant entre eux d’autres discours empruntés.

Pour parler simple : pour réaliser son travail d’écriture de quoi l’élève a-t-il besoin ?
D’informations certes mais de quelle nature ? Il doit travailler le sens du sujet mais également (et dès le début) envisager le type d’écrit qu’il produira. C’est à cette condition qu’il pourra anticiper la nature des discours qu’il doit explorer et manipuler. Les questions qui se posent prennent alors cette forme : quelle est la valeur d’une donnée chiffrée dans le cadre d’une argumentation en Ecjs ? Qu’elle est la valeur et l’intérêt d’un témoignage ? Quelle est la portée d’un texte de loi ? Qui produit ces discours et pourquoi ?, etc...

En fait ce travail revient à imaginer ce qui permet de progresser dans la détermination de l’objet observé (ici un fait social). Ce qui revient également à envisager l’organisation intellectuelle de l’information du côté du néo-scripteur cette fois et non du côté du document premier (lecture documentaire). Se pose également la question de l’intention du discours à produire : démontrer, convaincre, évaluer, etc.

Or de manière générale au lycée les élèves savent seulement qu’il faut introduire son sujet, commencer par expliquer de quoi on parle puis envisager quelques déclinaisons et conclure. Ces consignes sont trop floues pour être réellement usuelles. En tant que professionnels du document et de la lecture documentaire nous savons que la définition d’un objet passe par une série d’étapes qu’on peut résumer comme suit :

Un premier niveau de définition du sujet serait diachronique :
- analyse de la structure de l’objet
- mise en perspective spatiale
- mise en perspective temporelle
- recherche de contiguïté
recherche de ressemblance ou d’oppositions

Un second niveau plus synchronique renvoie à ces deux principes :
- recherche d’exemplification
- recherche d’authentification, de confirmation

Ces principes de rédaction assurent la mise en valeur d’un thème dans un texte de nature documentaire. Merci à QUET, François. Les écrits non littéraires au collège, de la classe au CDI. CRDP de Grenoble, 1995 (36)

Dans le cadre d’une réflexion à laquelle les élèves seront associés on peut être amené à construire ce programme d’écriture :
Comment examiner une question en ECJS ?

  • Poser le problème
    • évoquer le sens commun
    • poser les limites de l’investigation (de la recherche)
  • Prouver l’existence du problème
    • Prouver qu’il s’inscrit dans : une histoire/une actualité
    • Prouver son étendue, sa fréquence
    • Prouver ses implications humaines, sociales
  • Comprendre le problème
    • évoquer des causes probables
  • Montrer les tentatives de résolution, les solutions
    • Résolutions de la part des institutions > législateur : ex. lois, campagnes d’information/prévention
    • Résolutions hors institutions > citoyens : ex. associations
  • Montrer les limites de ces tentatives
    • Bilans des lois, des actions, des campagnes
  • Envisager d’autres possibilités de résolutions
    • ex. Projets de loi

Le choix marqué de verbe d’action est important pour indiquer qu’il s’agit de tâches à accomplir ou à envisager.

À la suite de ce programme d’écriture vont se poser des questions d’ordre strictement documentaires : quels sont les discours qui vont nous aider à construire notre propre document ? Quel dialogue vais-je pouvoir installer avec eux ? Quelles fonctions vont-ils assumer au sein de ma production ? Et secondairement où trouver de tels discours, de tels adjuvants ? Quel pourrait être le document capable de prouver ce que j’avance ?

Plusieurs intérêts...
Cette réflexion commune menée avec les élèves présente plusieurs intérêts :

  1. Les enseignants présents peuvent mesurer l’état des connaissances en matière de restitution et évaluer l’ampleur de l’implicite et du non-pensé en ce domaine.
  2. Les élèves disposent à présent d’outils de recherche d’une autre visée que celle des seuls contenus, une visée liée à la nature de l’information escomptée. D’autres mots clés émergent comme : statistiques, textes de loi, législation, témoignages, sondages, enquête, etc. Les résultats renvoyés par les moteurs y gagnent en pertinence et la requête en logique. Le logiciel documentaire se révèle infiniment supérieur à Google puisque ce type de requête valorise une indexation humaine capable de qualifier l’information décrite (c’est notre travail de médiateur qui est valorisé ici).
  3. Mais plus encore, quand le document pertinent est trouvé, ce programme d’écriture va faciliter la sélection et surtout la répartition des discours empruntés tout au long de la chaîne démonstrative. Par exemple les données quantitatives chiffrées sont à réserver pour la preuve et la mesure des effets, les commentaires qualitatifs envisagent les causes ou pointent les dysfonctionnement, etc. Ce programme peut s’avérer être un outil de médiation efficace puisqu’il installe entre l’élève et l’enseignant un débat sur la hiérarchie des discours.
  4. On peut commencer à construire une culture de la validation : quelles sont les sources suffisamment solides pour garantir un statut de preuve ? D’où viennent les chiffres ?
  5. Les élèves sont mis en situation de hiérarchiser une typologie des discours qui contribue à asseoir une véritable culture de l’information.

Notions abordées...
Les notions sont nombreuses mais celle qui intègre les autres est la détermination du besoin d’information.
Autres concepts à travailler : Mise en scène de l’information/structuration/évaluation de l’information/sélection de l’information/hiérarchisation des discours/sources, etc.

Pour conclure...
Le projet d’écriture de l’élève, aussi modeste soit-il, est toujours déjà en relation, en communication avec d’autres projets existants qui sont également en relation entre eux. Dès l’énoncé de la recherche les élèves sont déjà placés au coeur d’un situation d’intertextualité.
cf. Les relations transtextuelles selon G. Genette. Fabula.org.

Dès lors dès le questionnement inaugural, dès la première tentative de détermination des mots clés le travail de recherche pourrait porter la marque d’un questionnement portant sur la nature de la relation qu’on entend instaurer avec d’autres textes.
« Je ne cherche pas une information sur... mais un discours sur... parce qu’il est nécessaire à la création de mon propre discours. »

On voit qu’en posant la recherche en ces termes il n’est plus seulement question d’évoluer dans un espace euclidien d’information mais d’introduire d’autres dimensions, une profondeur. Quand un chercheur expert entame une recherche il sait qu’il va devoir rapidement aller vers une rencontre. Il va établir une relation complice (même dans la contradiction) avec une autre intelligence qui à travers un certain discours manifeste sa vision du réel.

Je ne cherche donc pas une information sans tête mais un discours incarné qui m’aidera à consolider ce que je sais ou croyais savoir... qui m’aidera à me construire.
Si nous parvenons à sensibiliser les élèves au fait qu’un discours externe est l’adjuvant de son futur discours on pourra peut être commencer à combattre efficacement le plagiat .
Le professeur documentaliste doit se faire le champion du dialogue des intelligences.

P.-S.

Par Frédéric Rabat, professeur documentaliste
Mis en forme et en ligne par Ghislain Chasme