CHWP B.9 Wooldridge, Ikse-Vitols, Nadasdi, "Le Projet CopuLex"

4. Le système vs. la compétence de l'utilisateur

Dans tout dictionnaire, il convient d'opposer ce qui relève du système utilisé par le lexicographe et ce qui revient à la compétence du consulteur, cette dernière devant compléter ce que le premier ne donne pas explicitement ou ne peut pas donner. Avant Féraud, on peut parler d'un manque de systématisation; par la suite, d'une limite pratique. Nous allons maintenant examiner de près deux situations qui demandent une interprétation des données du texte. Dans le premier cas (Trévoux 1743), il s'agit d'ambiguïté; dans le second (Lexis 1975), de structures implicites.

4.1. La mise en paragraphes

Notre étude se propose d'examiner la mise en paragraphes comme outil de structuration des informations. Le but précis de cette analyse est de voir comment cette technique peut être employée pour améliorer la consultabilité d'un dictionnaire. Après avoir examiné quelques emplois possibles de la mise en paragraphes, nous passerons à l'examen d'un dictionnaire en particulier, le Trévoux de 1743, afin de voir s'il respecte des règles régissant l'emploi efficace d'une division en paragraphes. Nous tiendrons surtout compte des contradictions entre la mise en paragraphes et l'information que ces segments contiennent.

Le choix du Trévoux se motive par le fait qu'à l'époque où ce dictionnaire a été réalisé, les outils typographiques exploités dans l'articulation des unités d'un dictionnaire étaient peu nombreux. Bien qu'on y trouve l'italique et même deux tailles de majuscules, le Trévoux n'a aucun système pour indiquer les divisions importantes à part la mise en paragraphes. Ainsi, l'utilisateur du Trévoux se trouve obligé de se fier aux seules divisions en paragraphes. Ceci fait qu'une mise en paragraphes cohérente de la matière lexicale du Trévoux serait primordiale pour la consultation de ce dictionnaire.

4.1.1. Emploi cohérent de la mise en paragraphes

Passons maintenant à ce qui constitue une mise en paragraphes cohérente. Après avoir amassé toutes les informations relatives à un mot-vedette donné, le lexicographe se trouve devant un bloc de données qu'il est censé organiser. Pour que le dictionnaire puisse être considéré comme un ouvrage de consultation, ce bloc doit être organisé systématiquement de sorte que l'usager puisse accéder facilement à l'information qu'il cherche. L'avantage d'une mise en paragraphes cohérente est qu'en principe elle permet à l'usager de prévoir la structure de chaque article. Ainsi, l'utilisateur pourra éviter les sections non pertinentes et aller directement à ce qui l'intéresse. Par contre, si la structure n'est pas cohérente, il sera obligé de lire chaque paragraphe, ce qui alourdira sa tâche.

Examinons d'abord quelques mises en paragraphes ayant une structure prévisible, c'est-à-dire qui améliore la consultabilité d'un dictionnaire. La Figure 1 présente trois exemples d'une mise en paragraphes bien structurée.

Le modèle A démontre qu'on peut se servir d'un changement de paragraphe pour indiquer qu'on traite d'une nouvelle occurrence d'un même type de structure complexe; il s'agit notamment de traiter des sens différents d'un même mot-vedette dans des paragraphes distincts. Dans ce type de structure, les exemples, les synonymes, l'étymologie, etc. se trouveraient, éventuellement, à l'intérieur de chaque paragraphe pour un sens donné. On peut dire que la structure A augmente la consultabilité d'un dictionnaire parce qu'elle permet à l'usager de prévoir où il trouvera les différentes parties du traitement sémantique du mot-vedette.

Dans B, la division en paragraphes sert à séparer des catégories d'information différentes; par exemple, traitement sémantique, syntagmes, synonymes, étymologie, emplois figurés, etc. Pour que ce genre de mise en paragraphes fonctionne bien, il faut que dans chaque article le même ordre soit respecté; chaque paragraphe doit aussi être étiqueté (genre "Syntagmes"), pour qu'une éventuelle absence de catégorie (synonymes, emploi figurés, par exemple) soit évidente.

La mise en paragraphes du modèle C démontre qu'on peut avoir une combinaison des deux premières structures, à condition qu'il y ait une filiation logique entre les paragraphes; c'est-à-dire qu'on peut avoir une suite de paragraphes tous reliés à un même traitement sémantique, suivie d'autres groupes de paragraphes fonctionnant de la même manière. L'avantage d'une telle organisation est qu'elle permet à l'utilisateur de trouver des groupes d'informations qui forment une unité.

Les trois types de mise en paragraphes que nous venons de décrire peuvent être employés pour favoriser la consultation d'un dictionnaire parce qu'ils sont tous systématiques et récurrents. Ils permettent à l'usager de trouver les informations particulières sans avoir à tout lire. Il est vrai que l'usager doit prendre le temps de s'y habituer, mais une fois habitué au système établi il pourra prévoir la structure de chaque article. Dans le Trévoux, on trouve des traits de chacune de ces structures, sans qu'aucune ne soit respectée systématiquement, c'est-à-dire qu'elles ne sont pas récurrentes. Ceci fait que l'utilisateur ne peut pas s'y fier pour prévoir la structure de paragraphe d'un article donné.

4.1.2. La mise en paragraphes dans le Trévoux

Examinons trois articles du Trévoux: GAGNER (20 paragraphes), LOIN (6) et QUE (5). La Figure 2, la Figure 3 et la Figure 4 donnent le texte intégral,[3] avec les numéros d'ordre des paragraphes et, en fin de paragraphe, des codes indiquant la nature du composant global de chaque paragraphe et son appartenance à la microstructure.[4] Dans les codes, le point d'interrogation signifie que le statut d'un paragraphe est particulièrement difficile à cerner.

Chacune des structures A, B et C est violée, ce qui mène à des contradictions entre la mise en paragraphes et l'information que ces paragraphes contiennent. Cela peut s'expliquer comme étant une contradiction entre la lecture verticale (où l'oeil s'arrête) et la lecture horizontale (ce qu'on y trouve). Nous allons distinguer ici trois contradictions principales. Chaque contradiction correspond à une violation des structures des modèles présentés à 4.1.1.

Comme nous l'avons déjà dit, la mise en paragraphes peut améliorer la consultabilité d'un dictionnaire si on se sert de ces coupures pour indiquer des acceptions différentes d'une même vedette. Nous constatons que, bien que cette technique soit exploitée par le Trévoux -- par exemple les paragraphes 4 et 5 de GAGNER présentent des sens nouveaux --, son utilisation est occasionnelle et donc imprévisible. Chaque paragraphe d'un article présente des informations variables: un sens précis (par exemple, G#1, G#4, G#5, G#11);[5] des informations étymologiques (G#2); une qualification d'emploi (G#10, G#12); une sous-vedette (G#3, G#17, G#19); une division grammaticale (L#3, L#6; Q#2, Q#3) ou bien un simple syntagme (G#13, G#16).

De plus, deux paragraphes successifs du Trévoux peuvent correspondre non seulement à deux sous-ensembles discrets (deux sens, deux emplois syntaxiques, etc.), mais aussi à deux parties du traitement d'un même sous-ensemble. Prenons à titre d'exemple le passage de G#8 à G#9. Bien qu'on trouve ici deux paragraphes distincts, le contenu nous révèle qu'il s'agit d'un même sens: "GAGNER, s'emploie aussi neutralement en ce sens". Le passage à la ligne correspond, dans ce cas, non à un changement sémantique, mais à un changement de fonctionnement syntaxique. De même, le traitement du syntagme que si, que non est réparti sur deux paragraphes (Q#4 et Q#5), le second servant à introduire un emploi nouveau ("est aussi un substantif").

Prenons l'étymologie et les emplois dits proverbiaux. Dans l'article GAGNER, l'étymologie est donnée dans le deuxième paragraphe, comme c'est le cas pour d'autres articles, tels que BEC, LONG, LOYAL. Sa place varie cependant d'un article à l'autre: troisième paragraphe pour LOT, quatrième et cinquième pour BANDE, absente d'un grand nombre d'articles, dont LOIN et QUE. Les emplois proverbiaux de gagner sont regroupés dans le dernier paragraphe consacré à la forme gagner (G#18); en revanche, dans l'article LOIN la rubrique "On dit proverbialement" est placée dans l'avant-dernier paragraphe consacré à la forme loin.

Le troisième type d'incohérence vient d'un manque d'enchaînement logique des paragraphes. Si les syntagmes de G#6 se rattachent clairement au traitement sémantique de G#7, les syntagmes gagner les devans (G#13) et gagner sa vie à filer/chanter (G#16) n'ont aucun lien avec les paragraphes (G#12, G#15) qui précèdent leur présentation. Le passage de G#8 à G#9 offre un exemple d'une filiation sémantique explicite: "s'emploie aussi neutralement en ce sens"; cependant, la charnière de filiation sémantique se réduit le plus souvent, soit à une formule énumérative -- type "se dit aussi pour", "on dit aussi" --, soit à une formule à valeur connective zéro -- type "on dit", "se dit en parlant du temps".

En fait, il est évidemment vain de faire ce genre d'exercice anachronique, de vouloir superposer sur un système venu en droite ligne des compilations cumulatives des siècles antérieurs une matrice d'organisation qui ne commence à se définir, dans la lexicographie française, qu'avec le Dictionaire critique de l'abbé Féraud. Dans le Trévoux, le paragraphe a encore la même fonction simple que dans la prose non métalinguistique, celle de former une certaine unité de pensée et de composition. Le 'sens' des articles du Trévoux est à chercher dans la genèse du dictionnaire; sur les vingt paragraphes de l'article GAGNER, par exemple, #1, #5, #8, #10, #11, #12, #13, #14, #15, #18, #19 et #20 correspondent, à quelques modifications près, aux douze paragraphes de l'article GAGNER-GAGNÉ de Furetière 1690, ouvrage duquel les différentes éditions du Trévoux constituent la continuation, et dans le même ordre.

4.2. Séquences à fonction double dans Lexis 1975

L'exemple d'emploi a pour rôle principal d'illustrer le mot-adresse; comme tel, il est le prédicat d'un énoncé lexicographique dont le sujet est le mot-adresse:

    "Le mot A peut s'employer dans l'exemple B"

Les choses ne sont pas aussi simples dans Lexis. Dans les sections des quatre macro-articles GAGNER correspondant aux emplois contemporains transitifs, intransitifs et pronominaux du verbe gagner, il y a quelques 81 séquences imprimées en italique et présentées comme actualisations du mot en contexte. Sept séquences sont marquées, étant des exemples signés de noms d'auteurs; toutes les autres ont été forgées par le lexicographe. Malgré l'absence d'étiquettes ou de distinctions typographiques, on peut constater que ces séquences forgées se situent à différents points de l'axe discours <--> langue: phrase libre (Cette nouvelle mise en pages nous fait gagner un paragraphe.), phrase lexicalisée (Il l'a bien gagné.), syntagme canonique concret (gagner un lot), syntagme canonique virtuel (gagner quelque chose). Exemples donc autant potentiels que réels. Qu'ils soient unités de langue ou unités de discours, ils sont le plus souvent suivis de compléments d'information -- marques de niveau de langue, paraphrases ou synonymes; par exemple:

    1) Gagner quelque chose (moyen de subsistance, récompense), l'acquérir par son travail:
    2) Gagner son biftek (pop.) [= gagner tout juste sa vie].
    3) Gagner le Pérou (= des sommes énormes).
    4) Gagner le maquis (syn. PRENDRE).
    5) C'est toujours ça de gagné (fam.) [= c'est toujours ça de pris].
    6) Il ne gagne pas lourd (= peu).
    7) Je suis sorti par ce froid, j'ai gagné un bon rhume (syn. plus usuels: ATTRAPER, PRENDRE, fam. CHIPER).

4.2.1. Cycle et recyclage

À un premier niveau (cycle 1), l'exemple/syntagme est prédicat d'énoncé:

    "Un emploi possible de gagner au sens d''acquérir' est C'est toujours ça de gagné."

À un deuxième niveau (cycle 2), l'exemple/syntagme passe du côté du sujet ou adresse d'énoncé:

    "C'est toujours ça de gagné signifie 'c'est toujours ça de pris'."

Ce qui peut être représenté de la façon suivante:

    Cycle 1: A --> B
    Cycle 2: B' --> C

En fait, B ne change pas de côté; c'est un élément de B -- B' -- qui acquiert la fonction de sujet d'énoncé. Reprenons les items 1-7 en dégageant cette fois l'élément de l'exemple/syntagme qui correspond à l'adresse de l'énoncé définitoire ou synonymique du cycle 2.

    8a) Gagner quelque chose (moyen de subsistance, récompense) [...]
      --> quelque chose = moyen de substance, récompense
    8b) Gagner quelque chose [...] l'acquérir par son travail:
      --> Gagner quelque chose = l'acquérir par son travail
    9) Gagner son biftek [...] [= gagner tout juste sa vie].
      --> Gagner son biftek = gagner tout juste sa vie
    10) Gagner le Pérou (= des sommes énormes).
      --> le Pérou = des sommes énormes
    11) Gagner le maquis (syn. PRENDRE).
      --> Gagner = PRENDRE
    12) C'est toujours ça de gagné [...] [= c'est toujours ça de pris].
      --> C'est toujours ça de gagné = c'est toujours ça de pris
    13) Il ne gagne pas lourd (= peu).
      --> ne... pas lourd = peu
    14) Je suis sorti par ce froid, j'ai gagné un bon rhume (syn. plus usuels ATTRAPER, PRENDRE, fam. CHIPER).
      --> j'ai gagné = ATTRAPER, PRENDRE, CHIPER

4.2.2. Le travail analytique requis de la part de l'utilisateur

Pour extraire B' de B, le consulteur doit faire preuve d'une compétence métalinguistique et linguistique sophistiquée. Il ne lui suffit pas de déterminer quelle partie de B correspond au sujet de C; il doit aussi dans beaucoup de cas tenir compte de différents types de transformation. Pour les exemples/ syntagmes de gagner dans Lexis, nous avons trouvé les types de transformations syntaxiques suivants.

    15) Gagner quelque chose [...], l'acquérir par son travail:
      --> quelque chose = l'
    16) Gagner quelqu'un, l'envahir progressivement.
      --> quelqu'un = l'
    17) Gagner quelqu'un, gagner la sympathie, l'affection, les bonnes grâces, etc., de quelqu'un, se rendre cette personne favorable, se concilier sa sympathie, etc.
      --> quelqu'un = de quelqu'un... cette personne... sa
    18) Gagner des témoins, gagner ses gardiens, les corrompre, les acheter pour se les réconcilier.
      --> des témoins... ses gardiens = les... les... les
    19) Y gagner [...], avoir du bénéfice, de l'avantage à quelque chose.
      --> Y = à quelque chose
    20) Il l'a bien gagné ([...] syn. fam. IL NE L'A PAS VOLÉ).
      --> l' = L').

Remarquons: pour l'item 18, que se aussi est une reprise anaphorique du sujet de verbe virtuel; pour 19, que y est anaphorique dans le texte potentiel d'où est extrait y gagner; pour 20, que l' est une anaphore lexicalisée, donc vide sur le plan syntaxique.

    21) Je suis sorti par ce froid, j'ai gagné un bon rhume (syn. usuels ATTRAPER, PRENDRE, fam. CHIPER).
      --> j'ai gagné = ATTRAPER, PRENDRE, CHIPER
    22) J'ai été gagné par son amabilité (syn. CONQUÉRIR).
      --> J'ai été gagné = CONQUÉRIR
    23) Il n'a gagné que du ridicule dans cette équipée (syn. RAPPORTER).
      --> Il... a gagné = RAPPORTER

Remarquons: que dans 23, l'analyse est compliquée par la négation.

    24) Gagner son biftek [...] [= gagner tout juste sa vie].
      --> son biftek = tout juste sa vie
    25) Il gagne gros (= beaucoup d'argent).
      --> gros = beaucoup d'argent
    26) Y gagner, gagner à (et un nom), à ce que (et le subj.), avoir du bénéfice, de l'avantage à quelque chose.
      --> Y... à + nom... à ce que + subj. = à quelque chose
    27) Il ne gagne pas lourd (= peu).
      --> ne... pas lourd = peu
    28) Il l'a bien gagné ([...] IL NE L'A PAS VOLÉ).
      -->: bien gagné = NE... PAS VOLÉ
    29) Le temps nous gagne (= va plus vite que nous).
      --> gagne = va plus vite que

4.2.3. Cycles complexes, ou Séquences à fonction multiple

Considérons les séquences suivantes:

    30) Gagner quelque chose (moyen de subsistance, récompense), l'acquérir par son travail:
    31) Gagner quelque chose (compétition, lutte), remporter la victoire:
    32) Gagner quelque chose (maladie, événement fâcheux), l'acquérir involontairement [...]:

Dans chacun de ces items, le cycle 2 se réalise en deux temps:

    Cycle 2a:B' --> C
    Cycle 2b:B" --> D

Il y d'abord une mise en équivalence entre "quelque chose" et un complément de verbe plus spécifique représentant une restriction sémantique (moyen de subsistance, récompense, compétition, lutte, maladie, événement fâcheux): "gagner quelque chose, quand quelque chose = moyen de subsistance ou récompense", etc. Dans le cycle 2a, B' est plus petit que B: B' < B. "Gagner quelque chose" ayant été qualifié dans le cycle 2a, il est ensuite défini dans le cycle 2b: "gagner quelque chose, c'est-à-dire gagner un moyen de subsistance, gagner une récompense, signifie 'l'acquérir par son travail'", etc. Dans le cycle 2b, B" est plus grand que B: B" > B.

4.2.4. Lecture cyclique

Si l'on a opposé de façon théorique une lecture verticale à une lecture horizontale du texte dictionnairique pour décrire la tendance du consulteur à faire une lecture plus ou moins rapide, il convient ici de postuler un phénomène que l'on pourrait appeler la lecture cyclique, qui serait une lecture hyperhorizontale. Nous avons vu cinq types d'analyse syntaxique que le consultateur doit pouvoir faire pour arriver à l'information désirée. Il est nécessaire de considérer qu'ici déjà la lecture horizontale est plus qu'une tendance. Mais c'est surtout dans le cycle complexe qu'il faut abandonner l'idée qu'en dégageant l'information ainsi présentée la lecture pourrait retenir un élément vertical quelconque. L'information acquise à une première étape dans la réalisation du deuxième cycle (B --> B') doit être réappliquée par le consulteur dans la réalisation de la deuxième étape (B --> B").

[Retour à la Table des Matières] [Suite]


Notes

[3] La mise en paragraphes de l'original a été respectée, mais non la mise en lignes. Nous avons omis de l'article LOIN trois citations en vers.

[4] Et = étymologie; G = catégorisation grammaticale; Qe = qualification d'emploi; S = traitement sémantique, sens; St = syntagme; Sv = sous-vedette; 1, 2, etc.: S1 = sens 1, G1 = catégorie grammaticale 1; -- = subordination: x--y = y est subordonné à x.

[5] G#1 = GAGNER, para. 1; L#1 = LOIN, para. 1; Q#1 = QUE, para. 1.