La Faculté des Lettres
PAS building room 2401
Read in English
Nous avons utilisé le langage XML (extensible markup language) pour encoder le texte. Notre série de balises est dérivée d'éléments proposés par la TEI (Text Encoding Initiative) mais nos balises sont abrégées et simplifiées pour faciliter l'entrée de données des manuscrits à ce niveau du projet. Dans l'étape suivante du projet, alors que nous affinerons nos données, nous réviserons notre série de balises pour nous conformer aux normes de la TEI, ainsi que pour rendre la base de données plus conforme au langage XML. (Pour plus de détails sur la TEI et XML, veuillez suivre ce lien sur la TEI)
Les balises XML, insérées entre les signes < et >, sont utilisées pour identifier la structure des données, qui est organisée par ordre hiérarchique. Les plus petits éléments sont imbriqués au sein des éléments plus grands. Les balises XML peuvent aussi prendre un nombre d'attributs définis par l'utilisateur pour mieux caractériser ou décrire la structure.
Nos données ont été balisées pour les éléments structurels au niveau du manuscrit (ou du codex) et à l'intérieur du texte.
Nous avons encodés les éléments codicologiques ainsi :
A cet élément balisé nous ajoutons différents attributs, comme par exemple :
Le manuscrit est divisé en folios identifiés par :
La structure hiérarchique des éléments codicologiques se présente donc ainsi :
<manuscript> | ||
<pgtop> | ||
<coltop> | ||
</coltop> | ||
</pgtop> | ||
</manuscript> |
(Par convention, les balises de début et de fin </tag><tag> peuvent être réduits à une seule balise de borne <tag/> comme dans <pgtop pn="n"/>)
Les éléments textuels sont encodés ainsi :
<work> est utilisé pour indiquer les différents ouvrages dans le manuscrit. | ||||
<work> a les attributs suivants : | ||||
T (Titre), | ||||
short.title (références abrégées du titre), | ||||
aunam (nom de l'auteur), comme dans l'exemple suivant : | ||||
<work T="La Vie saynte Elizabeth" short.title="S. Elizabeth" aunam="Nicole Bozon"> |
A l'intérieur de <work> on retrouve :
Les plus communs, bien sûr, sont <v> et <s> qui prennent aussi des attributs indiquant le numéro de la strophe et du vers. Chaque vers a également un sigle identifiant l'œuvre (voir Sigles dans la barre de menu) :
Les principales caractéristiques de copistes notées sont les corrections et les suppressions dans le texte. Un nombre limité de balises utilisées est donné ci-dessous (une liste complète sera donnée dans la deuxième phase du projet, en attendant la révision de nos balises pour accommoder les complexités des pratiques des copistes dans les sources manuscrites) :
Les ajouts faits par le premier copiste en écrivant sont encodés ainsi :
Les suppressions sont encodées ainsi :
Les simples suppressions faites en écrivant sont encodées ainsi :
Les corrections faites par un deuxième copiste médiéval et que nous jugeons être des corrections non nécessaires sont encodées ainsi :
Les variantes des copistes (c'est-à-dire quand un texte parallèle est donné, généralement introduit par uel dans le manuscrit) sont encodées ainsi :
Quand la formule d'abréviation est invariable, les résolutions des abréviations sont encodées ainsi :
Quand deux formes différentes d'abréviation sont utilisées, l'encodage les distingue en utilisant des balises comme :
(pour distinguer l'abréviation pour com/cum/cun/con qui ressemble au chiffre 9 avec un jambage sous la ligne, de la forme qui ressemble au chiffre 2).
Les signes diacritiques (é=é, ç=ç) et une partie de la ponctuation sont également encodés afin de pouvoir être recherchés. Cela inclut les guillemets simples ou doubles d'ouverture et de fermeture (&osq;, &csq;, &odq;, &cdq;), et l'apostrophe ('), utilisée pour indiquer les lettres élidées.
Les lettres sujettes à une normalisation sont également encodées :
Quand les lettres peuvent être interprétées de différentes manières, une série de deux lettres peut être utilisée, par exemple :
Les majuscules utilisées pour distinguer les différentes parties du texte sont encodées ainsi : &lgA4(2); = A majuscule, prenant l'espace de 4 lignes, avec un jambage ou une fioriture descendant sur deux autres lignes.
Les sections et les sous-sections du texte indiquées par ces lettres sont aussi étique ées <sec/> (pour section) ou <sec1/>)(pour sous-section).
La Faculté des Lettres
PAS building room 2401
The University of Waterloo acknowledges that much of our work takes place on the traditional territory of the Neutral, Anishinaabeg, and Haudenosaunee peoples. Our main campus is situated on the Haldimand Tract, the land granted to the Six Nations that includes six miles on each side of the Grand River. Our active work toward reconciliation takes place across our campuses through research, learning, teaching, and community building, and is co-ordinated within the Office of Indigenous Relations.