PROTOCOLE ÉDITORIAL

M. Jules Bonnet ne normalise dans son édition de la correspondance française de jean Calvin que l'orthographe des mots : s long (ſ) pour les s réguliers, y compris la dissimilation des i et j, ainsi que l'ajout des signes de ponctuation de base sous forme d'apostrophes et de tirets pour la plupart. Par conséquent, le texte source est un texte « normalisé » en ce qui concerne la normalisation des formes de lettres variantes et de la ponctuation de base, le développement des abréviations et des majuscules. Le seul autre trait moderne constitue l'accent grave sur la préposition à pour la distinguer de la conjugaison du verbe avoir, le développement de la nasalisation des voyelles en remplaçant le tilde par la consonne nasale correspondante, et la substitution du z final dans les mots, standard en français du XVIe siècle, par le s (e.g., nouvellez devient nouvelles). Concernant le reste du texte, il reste en ancien français selon les pratiques du XVIe siècle en termes d'orthographe, de vocabulaire et de tournures de phrases, qui sont généralement plus lourdes et plus complexes, et le ton est habituellement plus formel par rapport aux normes modernes. Il y a aussi l'utilisation des temps verbaux, comme le passé parfait et l'imparfait au mode subjonctif et la deuxième forme du conditionnel passé, qui sont obsolètes et rarement utilisés en français moderne.

Pour la traduction en français moderne, l'objectif est de rester aussi fidèle que possible au texte original. Par conséquent, seule l'orthographe sera complètement normalisée selon les normes modernes, y compris l'ajout de tous les accents, par exemple, ayde devient aide, oster devient ôter, soubz devient sous, bruict devient bruit, etc. Quant au vocabulaire et aux tournures de phrases, ils ne seront pas touchés pour la plupart, sauf dans les cas où l'équivalent moderne peut être nécessaire pour éclairer une phrase ou un passage obscur et permettre une meilleure compréhension. Par exemple, partement devient départ, avoir/être mestier devient avoir besoin, tant y a devient pour conclure.

Une liste de modèles de modernisation de base a été établie afin de faciliter le processus global d'encodage. Après analyse, je suis arrivé à la conclusion que ces modèles de base correspondent aux pronoms, aux mots de liaison et aux marqueurs de discours, et dans ce corpus spécifique, à certaines formes verbales fréquemment utilisées dont l'orthographe a changé au cours des siècles, comme être, prendre, vouloir, voir, connaitre et leurs dérivés lexicaux, ainsi que la forme morphologique de l'imparfait qui a également changé - passant de la terminaison -ois ou -oi(en)t à la terminaison moderne -ais ou -ai(en)t, selon la personne de la conjugaison. Par exemple, estoit pour était–.

En ce qui concerne la traduction vers l’espagnol, elle restera strictement fidèle à l'original dans la langue, le ton et le style. Vous serez traduit par usted et conjugué en conséquence, puisque c'était la pratique habituelle dans le monde hispanophone de l'époque, ce qui correspond au ton utilisé par Jean Calvin dans la correspondance. Les noms de personnes et de lieux géographiques, les pseudonymes et autres ne seront pas modifiés, sauf s'ils ont déjà un équivalent largement reconnu en espagnol ; c'est le cas de Jean Calvin (Juan Calvino en espagnol, John Calvin en anglais), Genève (Ginebra en espagnol, Geneva en anglais).

Les notes contextuelles se trouvent généralement dans la lettre où le terme a été mentionné ou sous-entendu, mais certaines notes importantes peuvent également être indexées. Les fragments de latin que Calvin aime parfois tant utiliser dans sa correspondance seront traduits respectivement en français moderne et en espagnol. Des notes éditoriales et des notes du traducteur pourront être ajoutées le cas échéant, en particulier lorsqu'il s'agit de choix concernant une phrase, une expression ou un paragraphe spécifique. Ces derniers seront indiqués comme tels par une mention de note éditoriale ou de note du traducteur dans la langue applicable de la version en question.

L'encodage TEI suit en tout point les directives globales standard afin d'atteindre un niveau d'interopérabilité des données aussi élevé que possible.

Les balises persName incluront les attributs @type et @ref lorsque seule une partie du nom apparaît, comme le nom de famille, et que la personne peut être identifiée. Exemple :

Si ces conditions ne s'appliquent pas, la balise persName ne comprendra aucun attribut :

Les fragments de texte qui doivent être mis en évidence, tels que les mots dans une langue étrangère comme le latin, les titres de livres, les références et les citations, doivent être encodés comme suit :

Quant aux exposants, ils doivent être encodés en donnant la valeur superscript à l'attribut @rend :

Les notes doivent être encodées comme suit pour que la feuille de style XSLT fonctionne correctement :

Les balises choice peuvent être incluses n'importe où dans le corps, sauf à l'intérieur des balises de notes.

TRAITEMENT DES LETTRES

En ce qui concerne le traitement des lettres, il s'est agi d'une série de décisions à prendre afin d'être aussi efficace et exhaustif que possible, tant dans l'approche que dans les pratiques des Humanités Numériques. Le texte source a dû être analysé et les manuscrits originaux localisés pour que l'objectif de cette édition soit entièrement atteint.

Une fois que la Bibliothèque de Genève a confirmé que tous les documents seraient librement accessibles en ligne, la tâche la plus immédiate a été de terminer le processus de recensement et de tri des manuscrits et copies existants que j'avais commencé à la Bibliothèque de Genève. L'objectif était de disposer d'un catalogue des sources originales disponibles tant sur place à la bibliothèque et en ligne ailleurs.

Une fois que j'ai eu un catalogue assez précis de toutes les lettres dont le manuscrit original ou la copie manuscrite était disponible, il était temps de faire une sélection, car je savais que je n'aurais pas le temps de les traiter toutes en quelques mois. J'ai privilégié celles dont les manuscrits originaux étaient facilement accessibles et prêts à être exposés. Or, sur les 66 manuscrits originaux comptabilisés, plus de 40 lettres comportaient deux destinataires récurrents : M. et Mme de Falais ; et c'était encore trop. Je me suis donc contenté de dix originaux et de cinq copies manuscrites répartis sur la période du premier volume de l'édition de Jules Bonnet - de 1538 à 1554 - et comportant des destinataires différents tels qu'Edouard VI, le roi d'Angleterre à l'époque et fils d'Henri VIII, la duchesse de Ferrare ainsi qu'un curé qui lui avait écrit pendant une période de peste à Genève, et des événements importants tels que la dernière lettre à M. de Falais dans laquelle il met fin à leur association et leur amitié de plusieurs années.

L'idée était de trouver un moyen d'automatiser le processus autant que possible, de pouvoir produire plusieurs sorties, notamment une sortie HTML pour le site web et un format PDF imprimé, à partir d'un seul fichier encodé en XML.

Au début, j'ai pensé utiliser OxGarage - un service web qui gère la transformation de documents entre une variété de formats ; principalement, dans ce cas, de Word (.docx) à des formats interopérables tels que TEI (XML-TEI) et/ou HTML, mais aussi CSV et JSON-, et ensuite Oxigen, qui est l'un des meilleurs éditeurs XML disponibles (et celui qui est utilisé dans le programme de master), car il fournit un ensemble complet d'outils de création et de développement pour gérer et nettoyer le fichier résultant de la transformation.

Cependant, je me suis rendu compte que l'utilisation de cette solution serait plus désordonnée et prendrait plus de temps que l'utilisation d'un modèle XML-TEI à être « nourri » avec les données. Habituellement, la transformation d'un document Word en un format codé est assez générique et le résultat peut ne pas être uniforme pour tous les fichiers ; il inclut également des informations de style qui n'étaient pas souhaitées à ce stade. Le fichier XML doit être le fichier d'origine, open-source et réutilisable à partir duquel d'autres formats et versions peuvent être générés grâce à un code dynamique comme celui du moteur de publication Max développé par le Pôle Document Numérique.1

En bref, je voulais un moyen plus efficace ainsi qu'un contrôle sur ce que je faisais. Ce qui s'est avéré indispensable par la suite lorsque j'ai créé le modèle XML-TEI à travers l'encodage de la première lettre de la collection. Lorsque j'ai essayé d'utiliser OxGarage pour effectuer la transformation en HTML, le résultat n'était pas satisfaisant et l'édition prenait beaucoup de temps. De plus, tant pour le format HTML que pour le format PDF, les balises opener, salute et closer développées par le Consortium CAHIER n'étaient pas prises en compte par les scénarios de transformation d'OxGarage. J'ai donc pris les choses en main : J'ai créé mes propres feuilles de transformation XSLT et j'ai trouvé le code dynamique qui permettait de faire apparaître la sortie HTML directement sur l'entrée du billet, là où je le voulais. Désormais, le contenu du site Web change de façon dynamique dès que la version actualisée du fichier XML est téléchargée sur le serveur. Et la version PDF est réalisée en imprimant le contenu via les options du navigateur. En fin de compte, chaque nouvelle modification ou détail édité est effectué une fois dans le fichier XML et les deux sorties mises à jour sont immédiatement disponibles sur le site Web dès que la page est rechargée ; il n'y a aucune surcharge de fichiers supplémentaires sur le serveur.

Une fois que j'ai eu le modèle pour les fichiers encodés et le code fonctionnel pour l'ensemble de l'interface comparative, j'ai organisé les données en fonction des formats d'entrée et de la structure encodée nécessaires : JavaScript pour la visionneuse OpenSeadragon utilisée pour afficher les fac-similés des manuscrits sur le site web par le biais de liens ARK (Archival Resource Key) - qui permettent d'appeler l'image directement à partir des serveurs du site web de la bibliothèque via un URL, et HTML pour les notices bibliographiques de la bibliothèque, dont des segments ont été extraits des sites web des bibliothèques elles-mêmes, puis enrichies avec les informations du catalogue de la bibliothèque.

PROCESSUS ÉDITORIAL ET OUTILS NUMÉRIQUES

Cette édition critique utilisera une série d'outils éditoriaux, de traduction et numériques pour obtenir les résultats envisagés.

Le texte source, le premier volume de l'édition de 1854 de Jules Bonnet de la correspondance française de Calvin, fourni par Gallica, l'une des principales bibliothèques numériques accessibles gratuitement en ligne, peut être téléchargé dans différents formats, dont le texte brut. Ce texte brut est automatiquement généré par un programme de reconnaissance optique de caractères (OCR) dont le taux de reconnaissance est estimé à 97%. Les lettres sont ensuite traitées et corrigées selon une procédure similaire à celle d'une transcription diplomatique par rapport à la copie scannée au format PDF, qui sera également utilisée dans la version finale du site de l'édition comme texte source.

Ensuite, la transcription régularisée par Bonnet des manuscrits et des copies originales du XVIe siècle est traduite en français moderne en les encodant directement dans l'éditeur Visual Studio Code selon le modèle XML-TEI tiré de l'éditeur Roma ODD (One Document Does It All). Le modèle a ensuite été adapté pour inclure les balises correspDesc et correspContext développées par le Consortium CAHIER pour la correspondance ainsi que d'autres balises de métadonnées qui vont dans le teiHeader. Dans le corps, les balises opener, salute et close, également du Consortium CAHIER, sont ajoutées pour compléter la structure de la lettre encodée.

Ensuite, le texte de la lettre ainsi que les données de date, de lieu et de destinataire sont introduits dans le modèle, y compris les notes, aussi bien celles de l'édition de Jules Bonnet que mes propres notes enrichies. La modernisation est encodée dans des balises choice avec la balise orig correspondante pour le texte original et la balise reg pour le mot ou la phrase régularisé ou modernisé.

La structure générale de ce qui a été expliqué ci-dessus ressemble à ceci :

Tant la modernisation que la traduction vers l'espagnol sont réalisées à l'aide de dictionnaires et de documentation en vieux français tels que le DMF: Dictionnaire du moyen français, le portail Cairn.info, le Dictionnaire Littré, le Petit Robert et quelques autres articles et outils en ligne.

Le DMF est l'un des outils les plus utiles parmi eux, notamment en ce qui concerne l'ancien français. Ce dernier est produit et publié par l'ATILF, un laboratoire public de recherche en sciences humaines et sociales spécialisé dans les sciences du langage qui fait partie du CNRS (Centre national de la recherche scientifique) et de l'Université de Lorraine. Ce dictionnaire dispose d'une base de données massive de termes français anciens, comprenant des exemples et un corpus de textes. Il trouvera le lemme du mot saisi ainsi que les différentes versions ou formes de celui-ci au fil des ans et des contextes selon le corpus textuel incorporé dans une base de données contenant 219 textes en accès libre et un corpus de 388 textes médiévaux antérieurs à 1550 nécessitant un abonnement2. Parmi ses principaux outils, on trouve un formulaire de lemmatisation, une plateforme de lemmatisation et une recherche de corpus.

L'encodage de la version française moderne dans l'environnement d'encodage est quelque peu accéléré par l'utilisation d'une liste de termes récurrents déjà encodés :

En utilisant l'outil de recherche et de remplacement de l'éditeur de code, plusieurs instances d'un mot ou d'une phrase récurrente peuvent être effectuées en une seule fois. Bien sûr, le reste des modifications qui ne sont pas conformes au modèle et qui représentent de nouvelles instances sont faites manuellement. Cependant, la liste des « modèles de balises choice » - comme je l'appelle - peut être enrichie et constamment mise à jour au fur et à mesure du traitement et de la traduction des lettres, puisque de nouveaux modèles, communs à certaines lettres, apparaissent de temps en temps.

Une fois que les lettres ont été traduites en français moderne, elles sont ensuite traduites en espagnol tout en conservant le registre et le style originaux. Le traducteur en ligne Deepl est utilisé à ce moment-là pour traiter la majeure partie du texte pour ensuite réviser et corriger manuellement la traduction assistée par ordinateur afin de produire un rendu de qualité, fidèle aux manuscrits originaux des lettres françaises de Calvin, pour les hispanophones.

La traduction en espagnol, une fois prête, sera introduite dans le même modèle d'encodage que celui utilisé pour la modernisation, sans les balises choice.

La transformation au format HTML pour le site web est faite automatiquement par un morceau de code JavaScript que j'ai adapté de W3School3 pour transformer XML en XHTML dans le navigateur. Le code prend essentiellement le fichier XML et le fichier XSLT et applique les spécifications de transformation contenues dans le fichier XSLT pour l'afficher dans l'élément HTML indiqué sur la page. J'ai créé trois fichiers XSLT –qui sont fondamentalement les mêmes, à l'exception de différences très subtiles– : un pour la version propre en français moderne, un autre pour la version où l'on peut voir le processus de modernisation (les modifications apportées) et un autre pour la traduction vers l’espagnol. Cela permet un processus semi-automatique qui produit deux formats de sortie à partir d'un seul fichier XML – le PDF peut être produit en cliquant sur le bouton pour agrandir la version de la lettre que l'on veut imprimer de manière à ce qu'elle occupe tout l'écran afin de l'imprimer avec l'option d'impression que possède tout navigateur.

Capture d'écran de l'interface du site web pour chaque lettre. Les boutons permettant d'agrandir la section pour imprimer sont entourés.

L'édition critique est hébergée sur un serveur fourni par l'Université de Franche-Comté, notamment par le master Rare Books and Digital Humanities. Le site de l’édition fonctionne sur un système de gestion de contenu (CMS) WordPress.

Tous les fichiers XML et de transformation XSLT sont téléchargés sur le serveur pour que le contenu soit publié, comme expliqué ci-dessus, une fois le processus susmentionné terminé. Le fichier XML source peut être téléchargé. Les conditions de réutilisation du contenu sont indiquées sur la page Mentions légales.

En outre, chaque lettre sera accessible à partir de différents endroits du site web, c'est-à-dire par le biais d'une série d'index et d'outils de visualisation tels que TimeLineJs et StoryMapJs développés par le Knight Lab de la Northwestern University.


Références

1 « Outils | Maison de La Recherche En Sciences Humaines, » consulté le 23 juin 2022, https://www.unicaen.fr/recherche/mrsh/document_numerique/outils.

2 « Dictionnaire Du Moyen Français (1330-1500) Les Textes. » n.d. Dictionnaire électronique. Dictionnaire Du Moyen Français (1330-1500). Consulté le 21 août 2021. http://zeus.atilf.fr/dmf/.

3 « XSLT on the Client, » consulté le 23 juin 2022, https://www.w3schools.com/xml/xsl_client.asp.

Source : Yanet Hernández Pedraza. “New Digital Critical Edition of John Calvin’s Collection of French Correspondence (Selection).” Mémoire de master, Université de Franche-Comté (2022), 34.