Séances Recherche d'information (UE Algorithmes du texte)
Fichiers pour les séances, incluant le TP
-
annotation
- nerc-fr : Outil d'annotation d'entités nommées qui peut remplacer SpaCy
- tag_entities.py : Script pour exploiter ses sorties
-
config_solr : configSet Solr d'exemple, adapté à l'exploitation d'annotations TAL dans l'index
-
pre-traitement : Scripts de conversion de documents au format d'update Solr
-
templates : Templates Velocity
- velocity_modifie : Adaptés à l'affichage de facettes TAL, comme vu dans le cours
- velocity_original : Templates par défaut, pour comparer avec les modifiés