CHWP B.6 Caron, Dagenais, Gonfroy, "L'informatisation du Dictionaire de Féraud (1787)"

2. La représentation informatique de l'original

Nous évoquerons successivement:

2.1. Le système de référence

Nous pouvons évidemment penser pour les références à un système qui s'appuie exclusivement sur la disposition matérielle, typographique de l'original: l'article, la page, la colonne, la ligne. Mais il nous semble que, l'ordre alphabétique du dictionnaire étant pratiquement autoréférentiel, il y a là une sorte de redondance et que nous pouvons chercher à motiver davantage le système de référence en tentant de discerner à l'intérieur de l'article une syntaxe des composants ou chaînes de prédicats.

L'avantage de cette option tient à ce qu'on peut savoir instantanément dans lequel des composants se trouve la chaîne de caractères recherchée et travailler par exemple sur un seul des composants. La dernière édition 4.4 de WordCruncher rend désormais possible cette opération, comme le fait TACT.

Pour les besoins de WordCruncher, que nous utilisons actuellement, nous avons donc provisoirement défini pour chacun de nos fichiers un premier niveau de référence constitué par la lettre de l'alphabet à laquelle correspond la lettre initiale de la première adresse du fichier. Ce choix provisoire laisse le premier niveau disponible; dans l'éventualité d'un thesaurus généralisé de dictionnaires, il deviendra le niveau D.C.

Le deuxième niveau s'impose de lui-même: il s'agit de l'article qui, à de rares exemples près dans le D.C., circonscrit un lieu de référence indiscutable.

Pour le troisième niveau, la question s'est posée de savoir si une syntaxe de l'article autorisait la délimitation de composants récurrents à propriétés constantes, faute de quoi le repérage matériel par article, page, colonne et ligne devenait par défaut préférable. Ces composants devaient ainsi:

propriétés largement vérifiées sur un échantillon important du D.C.

À l'usage, la structure suivante paraît constante:

-- Niveau 1: lettre de l'alphabet et numéro d'ordre du fichier (remplacement ultérieur possible par D.C.)

-- Niveau 2: article dont le nom correspond à la vedette inscrite dans le D.C. en grandes capitales, romaines ou italiques.

-- Niveau 3: composants d'articles:

Attardons-nous sur ce troisième niveau de structuration, et d'abord sur les bornes de ses différents composants car, si les composants 3.1 et 3.2 sont bien circonscrits, les frontières des composants 3.3 et 3.4 sont discutables.

Le composant définitionnel commence le plus souvent après la fermeture du crochet droit (qui clôt le composant phonético-graphique) ou, par défaut, lorsque cesse le discours phonético-graphique, mais où s'arrête-t-il? Et notamment ne faut-il pas envisager un composant Remarque facultatif qui correspondrait aux fréquents marqueurs "Rem." dans les articles? (Figure 1c.)

On peut répondre à cette proposition:

Bref, il n'y a pas de syntaxe constante à partir du moment où l'on quitte le composant phonético-graphique. Il faut donc considérer qu'hormis pour le composant Renvoi dont nous parlerons plus loin, les prédicats métalinguistiques qui suivent le composant phonético-graphique ne constituent qu'un seul composant que nous appelons définitionnel au sens étymologique du terme, en ce sens qu'il énonce, outre les divers interprétants possibles du mot, des restrictions d'usage (fréquence, distributions préconisées ou proscrites, niveau de langue, genre, situation de communication) dotées de leurs exemples.

Le découpage plus fin du composant définitionnel se heurte aussi à des complications supplémentaires parce que le D.C. présente des articles à plusieurs adresses dont les prédicats ne sont pas ordonnés: le premier mot en adresse n'est pas forcément le premier traité (Figure 1e).

Féraud peut également créer un tronc commun prédicatif en donnant ou non ensuite les traits distinctifs des adresses ainsi regroupées ou même de mots absents de la liste d'adresses; par ex.:[1]

          ÉCHAUFAISON , ÉCHAUFÛRE , s. f.
      [ Echofézon , fûre ; Ire é fer. 3e è moy. au
      Ier , lon. au 2d. ] La Touche remarque qu'ils
      se disent également bien , suivant l'Acad.
      Il croit pourtant le Ier plus usité. Dans sa
      dern. édit. l'Acad. paraît y mettre quelque
      diférence. Elle dit le Ier , d'un mal causé
      par une chaleur excessive , et qui parait par
      une ébullition ; et le 2d , d'une petite rou-
      geur , d'une petite élevûre qui vient sur la
      peau dans une échaufaison. Mais les exem-
      ples qu'elle done paraissent les confondre.
      » Ce n'est qu'une échaufaison ; ce n'est qu'une
      échaufûre.
          ENCÂVEMENT , s. m. ENCAVER , v. a.
      [ Ankâveman , : 3e e muet au Ier , é fer.
      au 2d. ] Ils expriment l'action de mettre en
      câve du vin , ou d'aûtres boissons. -- On dit
      aussi encaveur , celui qui encâve.

Ces caractéristiques interdisent un découpage plus fin du composant définitionnel.

Reste à évoquer le composant renvoi dont la caractéristique est la suivante: il y a composant Renvoi lorsque l'article est pratiquement vide aux trois premiers composants du niveau 3 et qu'il se borne à renvoyer à un autre article; par ex.:[2]

          EMPYRIQUE , EMPYRISME. Voy. EM-
      PIRIQUE
      , EMPIRISME.
          ÉMULE. Voy. ÉMULATEUR.

Nous avons donc adopté le protocole de saisie suivant: séparer chaque article à l'aide d'un triple retour-chariot puis chaque composant d'article par un double retour chariot. Lorsqu'un composant est vide, nous procédons de la même façon mais en y inscrivant le signe @. Les retours-chariot permettent ensuite, par une recherche-remplacement sous WordPerfect, l'ajout des balises de référence reconnues par WordCruncher, qui incrémente ensuite chacun des composants de niveau 3.

[Retour à la Table des Matières] [Suite]


Notes

[1] NDLR: La distinction grandes capitales ("ÉCHAUFAISON", "ENCÂVEMENT", puis plus loin "EMPYRIQUE", "ÉMULE") vs. petites capitales ("ÉCHAUFÛRE", "ENCAVER", puis plus loin "EMPYRISME", "EMPIRIQUE", "EMPIRISME", "ÉMULATEUR") est faite par certains navigateurs, neutralisée par d'autres.

[2] NDLR: La distinction grandes capitales ("EMPYRIQUE", "ÉMULE") vs. petites capitales ("EMPYRISME", "EMPIRIQUE", "EMPIRISME", "ÉMULATEUR") est faite par certains navigateurs, neutralisée par d'autres.