CHWP B.6 Caron, Dagenais, Gonfroy, "L'informatisation du Dictionaire de Féraud (1787)"

2.2. Le traitement des auxiliaires typographiques

Pour le traitement des auxiliaires typographiques, notre équipe s'est trouvée placée devant des choix assez délicats. L'ouvrage de Féraud présente en effet un appareillage typographique dont nous avons déjà parlé et que nous rappelons pour mémoire:

    1. Un système complexe de marques disjonctives:
    2. Un jeu complexe de caractères:

Parmi ces auxiliaires graphiques, certains peuvent passer tels quels dans le texte sans transposition; par ex., le système numérique ou le crochet droit, qui existent dans la table ASCII. En revanche la barre horizontale simple ou double nécessite un transcodage: nous les transcrivons respectivement par un trait de soulignement et un signe égal, tous deux précédés et suivis d'un espace. Nous tenons également compte des paragraphes et des retraits du D.C. dans le fichier WordPerfect.

Restent les corps et les polices. Sur ce point nous avons adopté une position intermédiaire qui essaye de sauvegarder toute l'information de l'original sans trop surcharger la saisie:

    1. Ne pas en tenir compte chaque fois que l'information apportée par l'auxiliaire typographique est prise en charge par un autre support (système de référence ou codage):
    2. Négliger les variantes typographiques non pertinentes:
    3. Conserver l'opposition de police italique/romain dans le corps de l'article parce qu'elle nous paraît incontournable. Les italiques balisent en effet un mot ou un syntagme parfois discontinu afin de le matérialiser:

Ce n'est malheureusement pas la seule fonction de l'italique dans le composant définitionnel, puisque certains des interprétants sont également en italique; il nous est cependant apparu impossible d'entrer dans une opération de désambiguïsation qui risquait fort d'être périlleuse. Nous codons donc systématiquement l'italique dans tous les cas où un autre codage ne récupère pas l'information.

En outre, le rappel de l'adresse dans le corps d'un article est typographiquement matérialisé de façons variées, tantôt par l'italique, tantôt par la majuscule romaine de corps moyen (Figure 1f). Il était impossible de conserver cette diversité et nous avons décidé de ramener ces deux variantes typographiques à une variante unique: l'italique.

Les codes d'italique, après avoir été transférés dans le texte machine en balises ASCII et traités comme délimiteurs, seront ultérieurement transcodés de façon à restituer les italiques à l'écran.

[Retour à la Table des Matières] [Suite]