CHWP A.33 McGillivray, “Statistical Analysis of Digital Paleographic Data: What Can It Tell Us?”

Abstract

Manuscript transcription in the Cotton Nero A.x. Project is at a graphetic level and captures each distinguishable glyph used by the scribe. When the transcription is organized as a series of XML entities within a codicological DTD a search-and-count algorithm can be appied to the database of graphetic information. Initial statistical analysis of the data reveals dramatic changes in the scribe's writing system at two points in the manuscript that are roughly coincident with quire boundaries (and also textual boundaries). Hypotheses that will guide further investigation of this phenomenon include the possibility that substantial gaps of time separated the scribe's work in copying the four Middle English poems that make up the manuscript.


Résumé

Dans le projet Cotton Nero A.x. la transcription se fait au niveau des graphèmes : on saisit chaque glyphe distinct du scribe. Quand on organise la transcription comme une série d'entités XML définies dans une DTD codologique on peut appliquer aux données graphémiques un algorithme de recherche et de décompte. L'analyse statistique préliminaire des données indique qu'il y a des changements dramatiques dans le système d'écriture du scribe se produisant à deux points particuliers : grosso modo, aux frontières des cahiers (et également aux frontières textuelles). L'hypothèse qui informera la recherche future sur ce phénomène inclura la possibilité que des lapses de temps importants séparent le travail du scribe sur chacun des quatre poèmes en anglais moyen qui constituent ce manuscrit.

[Return / Retour au texte]