-
pruizf authored5a0e1b5b
Objectifs et défis
Le théâtre dialectal en alsacien représente une tradition dans laquelle les genres populaires et humoristiques sont prédominants. Quelles sont les tendances majeures de cette tradition en termes de technique dramatique et types de personnages ? Quels sont les lieux géographiques pertinents ? Dans quelle mesure les pièces permettent-elles de documenter les pratiques sociolinguistiques de leur époque?
Afin de répondre à ces questions et d’effectuer des analyses quantitatives, un corpus de grande taille représentatif de la tradition est requis, ainsi qu’une annotation du corpus qui reflète les variables à étudier : origine géographique des pièces et auteurs, lieux où se déroulent les pièces, période et genre dramatique. Concernant les personnages, des attributs comme leur profession, position sociale, origine, sexe ou âge doivent être disponibles. Il est également nécessaire de formaliser la structure des pièces, en indiquant les divisions en actes ou scènes, les répliques et les personnages, et les didascalies.
Notre projet vise à créer un corpus possédant de telles caractéristiques, encodé en format TEI (Text Encoding Initiative), dont le module Performance est adapté à ces besoins. Nous travaillons sur un ensemble représentatif de pièces, récemment numérisées par la Bibliothèque Nationale et Universitaire de Strasbourg, dont nous avons commencé l’océrisation et encodage TEI.
Un corpus de ce type permettra une approche de distant reading ou macroanalyse sur le théâtre alsacien. Ces approches ont été appliquées aux principales traditions dramatiques européennes, comme en témoigne le numéro monographique sur ce sujet dans la Revue d’Historiographie du Théâtre (2017). Or, elles ne sont pas possibles à l’heure actuelle pour l’alsacien, en raison du manque du corpus approprié. Le projet MeThAL cherche à combler ce vide.
À cette fin, nous appliquerons des techniques de traitement automatique des langues et de représentation documentaire ainsi que des technologies web qui contribueront à la navigabilité du corpus.
Défis
L’énorme variation orthographique de l’alsacien présente, comme pour toute langue peu dotée, des défis spécifiques en Traitement automatique des langues (TAL). Ces défis soulignent des besoins imparfaitement couverts par les outils d’analyse textuelle existants, orientés prioritairement vers les langues majoritaires. Dans ce sens, le projet exploitera et contribuera aux ressources du projet RESTAURE pour les langues régionales de France.
Productions
Publications et communications
-
Delphine Bernhard, Pablo Ruiz. (Accepté). ELAL: An emotion lexicon for the analysis of Alsatian theatre plays. Accepté à LREC 2022, Language Resources and Evaluation Conference. ⟨hal-03655148⟩
-
Pablo Ruiz, Carole Werner, Delphine Bernhard. (Accepté). The benefits of increasing the digital availability of Alsatian theater. Accepté à Digital Humanities 2022. ⟨hal-03660481⟩
-
Pablo Ruiz, Carole Werner. (2022). Théâtre alsacien : Personographie en TEI et navigation du corpus selon les attributs sociaux des personnages. Humanistica 2022. ⟨hal-03660506⟩
-
Pablo Ruiz, Carole Werner, Delphine Bernhard, Pascale Erhart, Dominique Huck. (2021). MeThAL : Ressources numériques pour une relecture du théâtre en alsacien. Poster présenté à 10 ans avec CAHIER: Des corpus d’auteurs pour les humanités numériques à leur exploitation numérique, juin 2021, Bordeaux, France. ⟨10.5281/zenodo.4908212⟩. ⟨hal-03255403⟩
-
Pablo Ruiz, Carole Werner. (2021). Exploration du théâtre alsacien à travers ses listes de personnages pendant la période 1870-1940. Humanistica 2021 : 27-29, Rennes, France. ⟨10.5281/zenodo.4762732⟩ ⟨hal-03226579⟩ [slides]
-
Pablo Ruiz, Delphine Bernhard, Carole Werner. (2020). Création d’un corpus FAIR de théâtre en alsacien et normalisation de variétés non-contemporaines. 2èmes journées scientifiques du Groupement de Recherche Linguistique Informatique Formelle et de Terrain (LIFT) : 32-43. Montrouge, France. ⟨10.5281/zenodo.4323301⟩ ⟨hal-03047152⟩ [slides]
-
Pablo Ruiz, Delphine Bernhard, Pascale Erhart, Dominique Huck, Carole Werner. (2020). MeThAL : Vers une macroanalyse du théâtre en alsacien. Humanistica 2020, Bordeaux, France. ⟨10.5281/zenodo.3788019⟩. ⟨hal-02564694⟩
Corpus
Une interface pour explorer le corpus est sur https://methal.eu/ui/ (lecture des pièces, filtrage selon les caractéristiques des pièces et des personnages).
Concernant les sources TEI :
-
Elles sont mises à disposition dans le dépôt methal-sources à mesure que l’encodage avance
-
La publication pérenne (avec DOI) s’effectue à travers une collection sur la plateforme Nakala
À part des pièces encodées, une personographie en TEI décrivant plus de 2 350 personnages issus d’environ 230 pièces a été publiée ; les personnages y sont décrits avec des variables sociales comme leur âge, genre, activité professionnelle ou classe sociale
Présentations
-
À la journée d’études « Le théâtre alsacien hier et aujourd’hui », mai 2022, Unistra
-
Au séminaire thématique de LiLPa, décembre 2019 : [slides]
Ailleurs sur le web
-
Le carnet de recherche de la Bnu en parle :
-
Lancement du projet
-
Travaux sur la distribution des personnages des pièces
-
Publication des premières 25 pièces encodées en TEI
-
-
La plate-forme DraCor (Drama Corpora) a accepté d’accueillir les pièces encodées, rendant ainsi des premières analyses disponibles :
-
dracor.org/als : Lecture des pièces encodées, réseaux et relations entre les personnages
-
shiny.dracor.org : Visualisation de différentes métriques d’interaction entre les personnages. P. ex. la matrice d’interaction ci-dessous pour les personnages de Der Pfingstmontag (Arnold, 1816).
-
Participants
Les participants au projet sont membres du laboratoire LiLPa : Pablo Ruiz (responsable), Delphine Bernhard, Pascale Erhart, Dominique Huck and Carole Werner.
Nous sommes également en lien avec le Datalab de la Bnu et le projet a fait l’objet d’un premier examen par GIS Corpus de la Bnu.
Nous remercions particulièrement les nombreux.ses stagiaires de plusieurs filières et parcours (Master Technologies des langues et Sciences du langage, Licences LLCER, LEA et Informatique) que nous avons l’occasion d’accueillir dans le projet. Parmi les étudiant.e.s Unistra : Nathanaël Beiner, Lena Camillone, Hoda Chouaib, Audrey Deck, Valentine Jung, Salomé Klein, Audrey Li-Thiao-Té, Kévin Michoud et Vedisha Toory. Au-delà : Andrew Briand (Université de Washington, via IFE Strasbourg), Barbara Hoff (Université d’Édimbourg), Qinyue Liu et Heng Yang (Université Grenoble Alpes).
Rejoignez-nous
Vous êtes intéressé.e à l’encodage TEI, application de technologies linguistiques à l’alsacien, édition électronique, ou à la linguistique et littérature alsaciennes ? Intéressé.e par un stage autour de ces sujets ?
Vous avez une autre question sur le projet ?
À propos du site
-
Ce site web est géré par Pablo Ruiz Fabo (Université de Strasbourg)
Hébergement
-
Le site est hébergé par l’Université de Strasbourg
Licence
-
Le contenu dont l’URL commence par https://methal.pages.unistra.fr est sous licence CC-BY-4.0
-
Les licences pour le contenu disponible sur l’interface d’exploraton du corpus (https://methal.eu/ui/), également accessible ici depuis les options Explorer le corpus et Interface du menu, sont spécifiées sur https://methal.eu/ui/about