CHWP A.1 Siemens, "Lemmatization and parsing"

Abstract

This paper aims to provide a context for those intending to parse and lemmatize electronic texts using the preprocessing programs provided with TACT: PreProc, MakeDCT, TagText, and SatDCT. It outlines some recent thought on computer-assisted parsing and lemmatization, it discusses relevant controversies and concerns within the field with specific (though not exclusive) reference to texts in English, and it hopes to offer a practical orientation to the operation of the TACT programs.


Résumé

Cet article a pour objectif de fournir un contexte à l'analyse syntaxique et à la lemmatisation des textes électroniques faites à l'aide des logiciels de préindexation de TACT : PreProc, MakeDCT, TagText et SatDCT. Il donne un aperçu des réflexions récentes sur l'analyse syntaxique et la lemmatisation assistées par ordinateur, il passe en revue les querelles et les préoccupations à ce sujet, notamment en ce concerne les textes anglais, et il se veut un guide pratique pour le maniement des logiciels de TACT.