-
pruizf authored71bcb30e
Objectifs
Le théâtre dialectal en alsacien représente une tradition dans laquelle les genres populaires et humoristiques sont prédominants. Quelles sont les tendances majeures de cette tradition en termes de technique dramatique et types de personnages ? Quels sont les lieux géographiques pertinents ? Dans quelle mesure les pièces permettent-elles de documenter les pratiques sociolinguistiques de leur époque?
Afin de répondre à ces questions et d’effectuer des analyses quantitatives, un corpus de grande taille représentatif de la tradition est requis, ainsi qu’une annotation du corpus qui reflète les variables à étudier : origine géographique des pièces et auteurs, lieux où se déroulent les pièces, période et genre dramatique. Concernant les personnages, des attributs comme leur profession, position sociale, origine, sexe ou âge doivent être disponibles. Il est également nécessaire de formaliser la structure des pièces, en indiquant les divisions en actes ou scènes, les répliques et les personnages, et les didascalies.
Notre projet vise à créer un corpus possédant de telles caractéristiques, encodé en format TEI (Text Encoding Initiative), dont le module Performance est adapté à ces besoins. Nous travaillons sur un ensemble représentatif de pièces, récemment numérisées par la Bibliothèque Nationale et Universitaire de Strasbourg, dont nous avons commencé l’océrisation et encodage TEI.
Un corpus de ce type permettra une approche de distant reading ou macroanalyse sur le théâtre alsacien. Ces approches ont été appliquées aux principales traditions dramatiques européennes, comme en témoigne le numéro monographique sur ce sujet dans la Revue d’Historiographie du Théâtre (2017). Or, elles ne sont pas possibles à l’heure actuelle pour l’alsacien, en raison du manque du corpus approprié. Le projet MeThAL cherche à combler ce vide.
À cette fin, nous appliquerons des techniques de traitement automatique des langues et de représentation documentaire ainsi que des technologies web qui contribueront à la navigabilité du corpus.
Défis
L’énorme variation orthographique de l’alsacien présente, comme pour toute langue peu dotée, des défis spécifiques en Traitement automatique des langues (TAL). Ces défis soulignent des besoins imparfaitement couverts par les outils d’analyse textuelle existants, orientés prioritairement vers les langues majoritaires. Dans ce sens, le projet exploitera et contribuera aux ressources du projet RESTAURE pour les langues régionales de France.
Productions
Publications et communications
-
Pablo Ruiz, Carole Werner, Delphine Bernhard, Pascale Erhart, Dominique Huck. (2021). MeThAL : Ressources numériques pour une relecture du théâtre en alsacien. Poster présenté à 10 ans avec CAHIER: Des corpus d’auteurs pour les humanités numériques à leur exploitation numérique (Cahier10), juin 2021, Bordeaux, France. ⟨10.5281/zenodo.4908212⟩ ⟨10.5281/zenodo.4908212⟩. ⟨hal-03255403⟩
-
Pablo Ruiz, Carole Werner. (2021). Exploration du théâtre alsacien à travers ses listes de personnages pendant la période 1870-1940. Humanistica 2021 :27-29, Rennes, France. ⟨10.5281/zenodo.4762732⟩ ⟨hal-03226579⟩ [slides]
-
Pablo Ruiz, Delphine Bernhard, Carole Werner. (2020). Création d’un corpus FAIR de théâtre en alsacien et normalisation de variétés non-contemporaines. 2èmes journées scientifiques du Groupement de Recherche Linguistique Informatique Formelle et de Terrain (LIFT) : 32-43. Montrouge, France. ⟨10.5281/zenodo.4323301⟩ ⟨hal-03047152⟩ [slides]
-
Pablo Ruiz, Delphine Bernhard, Pascale Erhart, Dominique Huck, Carole Werner. (2020). MeThAL : Vers une macroanalyse du théâtre en alsacien. Humanistica 2020, Bordeaux, France. ⟨10.5281/zenodo.3788019⟩. ⟨hal-02564694⟩
Corpus
-
methal-sources: Les pièces encodées sont graduellement mises à disposition sur les dépôts Git de l’Université : https://git.unistra.fr/methal/methal-sources
Présentations
-
Au séminaire thématique de LiLPa, Décembre 2019 : [pdf]
Participants
Les participants au projet sont membres du laboratoire LiLPa : Pablo Ruiz (responsable du projet), Delphine Bernhard, Pascale Erhart, Dominique Huck et Carole Werner.
Nous sommes également en lien avec le Datalab de la BNU et le projet a fait l’objet d’un premier examen par GIS Corpus de la BNU.
Nous remercions particulièrement les nombreux.ses stagiaires de plusieurs filières et parcours (Master Technologies des langues et Sciences du langage, Licences LLCER, LEA et Informatique) que nous avons l’occasion d’accueillir dans le projet. Parmi les étudiant.e.s Unistra : Lena Camillone, Hoda Chouaib, Valentine Jung, Salomé Klein, Audrey Li-Thiao-Te, Kévin Michoud et Vedisha Toory. Au-delà : Andrew Briand (Université de Washington, via IFE Strasbourg) et Barbara Hoff (Université d’Édimbourg).
Ailleurs sur le web
-
Le carnet de recherche de la BNU parle du projet
-
La plate-forme DraCor (Drama Corpora) a accepté d’accueillir les pièces encodées, rendant ainsi des premières analyses disponibles :
-
dracor.org/als : Lecture des pièces encodées, réseaux et relations entre les personnages
-
shiny.dracor.org : Visualisation de différentes métriques d’interaction entre les personnages. P. ex. la matrice d’interaction ci-dessous pour les personnages de Der Pfingstmontag (Arnold, 1816).
-
Rejoignez-nous
Vous êtes intéressé.e à l’encodage TEI, application de technologies linguistiques à l’alsacien, édition électronique, ou à la linguistique et littérature alsaciennes ?
Vous avez une autre question sur le projet ?
Contactez-nous !