:doctype: book
:toc: left
:toc-title: Navigation
:toclevels: 1
:last-update-label: Avec le soutien de l'Université de Strasbourg (IdEx Attractivité 2020). Mis à jour le
:imagesdir: img
:favicon: ./img/favicon.ico
:stylesdir: styles/
:stylesheet: fedora-custom.css
//:linkcss:
//:linkattrs:
include::header.adoc[]


[discrete]
= MeThAL{nbsp}: Vers une macroanalyse du théâtre en alsacien

== Objectifs

Le théâtre dialectal en alsacien représente une tradition dans laquelle les genres populaires et humoristiques sont prédominants. Quelles sont les *tendances majeures* de cette tradition en termes de technique dramatique et types de personnages ? Quels sont les lieux géographiques pertinents{nbsp}? Dans quelle mesure les pièces permettent-elles de documenter les pratiques sociolinguistiques de leur époque?

Afin de répondre à ces questions et d’effectuer des *analyses* quantitatives, un corpus de grande taille représentatif de la tradition est requis, ainsi qu’une annotation du corpus qui reflète les variables à étudier{nbsp}: origine géographique des pièces et auteurs, lieux où se déroulent les pièces, période et genre dramatique. Concernant les personnages, des attributs comme leur profession, position sociale, origine, sexe ou âge doivent être disponibles. Il est également nécessaire de formaliser la structure des pièces, en indiquant les divisions en actes ou scènes, les répliques et les personnages,  et les didascalies.

Notre projet vise à créer un *corpus* possédant de telles caractéristiques, encodé en format link:https://tei-c.org/guidelines/[*TEI*,role=external,window=_blank] (Text Encoding Initiative), dont le module link:https://www.tei-c.org/release/doc/tei-p5-doc/en/html/DR.html[Performance^] est adapté à ces besoins. Nous travaillons sur un ensemble représentatif de link:https://www.numistral.fr/services/engine/search/sru?operation=searchRetrieve&exactSearch=false&collapsing=true&version=1.2&query=(colnum%20adj%20%22BNUStr058%22)&suggest=10&keywords=[pièces^], récemment numérisées par la Bibliothèque Nationale et Universitaire de Strasbourg, dont nous avons commencé l’océrisation et encodage TEI. 

Un corpus de ce type permettra une approche de _distant reading_ ou *macroanalyse* sur le théâtre alsacien. Ces approches ont été appliquées aux principales traditions dramatiques européennes, comme en témoigne le numéro monographique sur ce sujet dans la link:https://sht.asso.fr/revue/etudes-theatrales-et-humanites-numeriques/[Revue d’Historiographie du Théâtre^] (2017). Or, elles ne sont pas possibles à l’heure actuelle pour l’alsacien, en raison du manque du corpus approprié. Le projet MeThAL cherche à combler ce vide.

À cette fin, nous appliquerons des techniques de traitement automatique des langues et de représentation documentaire ainsi que des technologies web qui contribueront à la navigabilité du corpus. 

== Défis

L’énorme variation orthographique de l’alsacien présente, comme pour toute *langue peu dotée*, des défis spécifiques en Traitement automatique des langues (*TAL*). Ces défis soulignent des besoins imparfaitement couverts par les outils d’analyse textuelle existants, orientés prioritairement vers les langues majoritaires. Dans ce sens, le projet exploitera et contribuera aux ressources du projet link:http://restaure.unistra.fr/[RESTAURE^] pour les langues régionales de France.

== Productions

=== Publications et communications

* Pablo Ruiz, Carole Werner, Delphine Bernhard, Pascale Erhart, Dominique Huck. (2021). MeThAL : Ressources numériques pour une relecture du théâtre en alsacien. Poster présenté à _10 ans avec CAHIER: Des corpus d'auteurs pour les humanités numériques à leur exploitation numérique (Cahier10)_, juin 2021, Bordeaux, France. link:https://doi.org/10.5281/zenodo.4323301[⟨10.5281/zenodo.4908212⟩,role=external,window=_blank] ⟨10.5281/zenodo.4908212⟩. ⟨hal-03255403⟩

* Pablo Ruiz, Carole Werner. (2021). Exploration du théâtre alsacien à travers ses listes de personnages pendant la période 1870-1940. _Humanistica 2021_{nbsp}:27-29, Rennes, France. link:https://doi.org/10.5281/zenodo.4762732[⟨10.5281/zenodo.4762732⟩,role=external,window=_blank] ⟨hal-03226579⟩ link:docs/methal_humanistica_2021.pdf[[slides\],role=external,window=_blank^]

* Pablo Ruiz, Delphine Bernhard, Carole Werner. (2020). Création d'un corpus FAIR de théâtre en alsacien et normalisation de variétés non-contemporaines. _2èmes journées scientifiques du Groupement de Recherche Linguistique Informatique Formelle et de Terrain (LIFT)_{nbsp}: 32-43. Montrouge, France. link:https://doi.org/10.5281/zenodo.4323301[⟨10.5281/zenodo.4323301⟩,role=external,window=_blank] ⟨hal-03047152⟩ link:docs/methal_gdr_lift_2020.pdf[[slides\],role=external,window=_blank^]

* Pablo Ruiz, Delphine Bernhard, Pascale Erhart, Dominique Huck, Carole Werner. (2020). MeThAL : Vers une macroanalyse du théâtre en alsacien. _Humanistica 2020_, Bordeaux, France. link:https://dx.doi.org/10.5281/zenodo.3788019[⟨10.5281/zenodo.3788019⟩,role=external,window=_blank]. link:https://hal.archives-ouvertes.fr/hal-02564694[⟨hal-02564694⟩^]

=== Corpus

* link:https://git.unistra.fr/methal/methal-sources[methal-sources]: Les pièces encodées sont graduellement mises à disposition sur les dépôts Git de l’Université : link:https://git.unistra.fr/methal/methal-sources[https://git.unistra.fr/methal/methal-sources]

=== Présentations

* Au séminaire thématique de LiLPa, Décembre 2019 : link:./docs/methal_lilpa_sem.pdf[[pdf\],role=external,window=_blank]

== Participants

Les participants au projet sont membres du laboratoire LiLPa : link:http://lilpa.unistra.fr/fdt/membres/chercheurs/ruiz-fabo-pablo/[Pablo Ruiz,role=external,window=_blank] (responsable du projet), link:http://lilpa.unistra.fr/fdt/membres/chercheurs/bernhard-delphine/[Delphine Bernhard^], link:http://lilpa.unistra.fr/gepe/membres/chercheures/erhart-pascale/[Pascale Erhart^], link:http://lilpa.unistra.fr/gepe/membres/chercheures/huck-dominique/[Dominique Huck^] et link:http://lilpa.unistra.fr/gepe/membres/doctorantes/werner-carole/[Carole Werner^]. 

Nous sommes également en lien avec le Datalab de la BNU et le projet a fait l’objet d’un premier examen par GIS Corpus de la BNU. 

Nous remercions particulièrement les nombreux.ses stagiaires de plusieurs filières et parcours (Master Technologies des langues et Sciences du langage, Licences LLCER, LEA et Informatique) que nous avons l'occasion d'accueillir dans le projet. 
Parmi les étudiant.e.s Unistra : Lena Camillone, Hoda Chouaib, Valentine Jung, Salomé Klein, Audrey Li-Thiao-Te, Kévin Michoud et Vedisha Toory. Au-delà : Andrew Briand (Université de Washington, via IFE Strasbourg) et Barbara Hoff (Université d'Édimbourg).


== Ailleurs sur le web

* Le link:https://bnu.hypotheses.org/5343[carnet de recherche de la BNU^] parle du projet

* La plate-forme link:https://dracor.org/[DraCor,role=external,window=_blank] (Drama Corpora) a accepté d’accueillir les pièces encodées, rendant ainsi des premières analyses disponibles{nbsp}:

    - link:https://www.dracor.org/als[dracor.org/als^] : Lecture des pièces encodées, réseaux et relations entre les personnages
    - link:https://shiny.dracor.org/[shiny.dracor.org^] : Visualisation de différentes métriques d’interaction entre les personnages. P. ex. la matrice d’interaction ci-dessous pour les personnages de _Der Pfingstmontag_ (Arnold, 1816).
    
image::pfingstmontag-matrice.png[Pfingstmontag,width=450,align="center"]

== Rejoignez-nous

Vous êtes intéressé.e à l'encodage TEI, application de technologies linguistiques à l’alsacien, édition électronique, ou à la linguistique et littérature alsaciennes{nbsp}?

Vous avez une autre question sur le projet{nbsp}?

Contactez-nous{nbsp}!

// Disable figure caption to avoid "Figure X" counter (block title still renders as caption)

:!figure-caption:

// Block image title (starts with period) allows links in caption title

.Couverture pour _D'r Candidat_. Source: link:https://archive.org/details/lethtrealsac00schouoft/page/164/mode/2up[Internet Archive^]
image::dr_candidat_r.png["D'r Candidat",width=400,align="center"]